定义

计算机无需明确编程便可进行能力学习

机器学习常用的的两种算法:

  • 监督学习
  • 非监督学习

监督学习

训练者给出正确答案用于学习 ,在监督学习中,数据同时带有输入x和标签y

  • 回归算法
    预测一个数字,会有无限多可能的输出
  • 分类算法
    输出一个分类,可能的输出是有限的

无监督学习

不提供标签,没有标准答案,在无监督学习中,数据仅带有输入。将没有标签的数据自动分组到集群中

  • 聚类算法
  • 异常检测
    找到不正常的数据
  • 数据降维
    压缩数据集,去掉不重要的维度

线性回归模型

x称为输入,f为模型,y-hat 代表对y值的预测

成本函数

fwb(x) = wx + b

m:数据总量

J(w,b) = (1/2m)*求和((yi-hat - yi)^2)

等同于

J(w,b) = (1/2m)*求和((fwb(xi) - yi)^2)

最终目标为找到使得J变小的w和b