机器学习
定义计算机无需明确编程便可进行能力学习
机器学习常用的的两种算法:
监督学习
非监督学习
监督学习训练者给出正确答案用于学习 ,在监督学习中,数据同时带有输入x和标签y
回归算法预测一个数字,会有无限多可能的输出
分类算法输出一个分类,可能的输出是有限的
无监督学习不提供标签,没有标准答案,在无监督学习中,数据仅带有输入。将没有标签的数据自动分组到集群中
聚类算法
异常检测找到不正常的数据
数据降维压缩数据集,去掉不重要的维度
线性回归模型x称为输入,f为模型,y-hat 代表对y值的预测
成本函数fwb(x) = wx + b
m:数据总量
J(w,b) = (1/2m)*求和((yi-hat - yi)^2)
等同于
J(w,b) = (1/2m)*求和((fwb(xi) - yi)^2)
最终目标为找到使得J变小的w和b