LEARN & EXPLORE

keep moving to see the new world

Naive Bayes

朴素贝叶斯是一种分类方法,计算量小可以用于实时决策,同时适合多分类问题。算法的性质决定了他广泛应用于文本分类,垃圾过滤,情感分析以及推荐系统等。根据名称就知道他的数学背景是贝叶斯理论,我们肯定是先要弄明白贝叶斯理论了。贝叶斯这套东西很神奇啊,他会给人莫名的一种靠谱的感觉,就觉得这东西说的有道理。统计学上还有贝叶斯学派和频率学派之争,唉,贵圈真乱~这里有小短文一篇,讲了下二者的区别。下面就开始...

Logistic Regression

我们这回来谈论下分类问题,跟回归问题不同,它的输出是离散值,以表征属于哪一类,而不同于回归的输出连续域的值。那如何判定属于哪一类呢,可以通过概率来给出结果。对于简单的二分类问题,如果属于正类的概率 $P_+$ 大于负类的概率 $P_-=1-P_+$,那么可以断定它属于正类,输出1,反之则输出0。 首先从几何角度来理解下将输入空间分成两类,假设只有两个输入变量,且边界函数如下 现有一个...

Python 数组的基本操作

向量化计算在数据分析中很常用,与数学公式最为相近,又可简化代码。Numpy是Python的一个扩展库,支持高阶维度数组和矩阵运算,Numpy的array 类称为ndarray,也被称为array。这里对其运算进行简单的介绍做为学习与查询之用。 import numpy as np 一维数组 lst = [3, 1, 4, 1, 5, 9, 2] # list vec = n...

Linear Regression

线性回归背景 回归分析是对客观事物数量依存关系的分析,是处理多个变量之间相互关系的一种数理统计方法.线性回归是通过线性预测函数来建模,其模型参数由数据估计出来。 线性回归应用范围很广,主要应用可以划归为如下两类: 如果目标是预测,线性回归可以通过观察数据集 $y$ 和 $X$ 的值来拟合出预测模型。之后对新增的数据 $X$ 就可以预测出对应的 $y$ 值。 给定变量 ...

Example Post Formatting

Introduction to Machine Learning in Python. Heading 1 Heading 2 Heading 3 Heading 4 Heading 5 Heading 6 Aenean lacinia bibendum nulla sed consectetur. Morbi leo risus, porta ac consectetur a...