引言
机器学习中的关键组件
首先介绍一些核心组件。无论什么类型的机器学习问题,都会遇到这些组件:
- 可以用来学习的数据(data);
- 数据长度不固定(图像、音视频等)
- 海量数据
- 正确的数据,具有目标特征数据(Garbage in, garbage out)
- 如何转换数据的模型(model);
- 学习输入数据特征转换成对应输出
- 一个目标函数(objective function),用来量化模型的有效性;
- 训练数据集用于拟合模型参数,测试数据集用于评估拟合的模型。
- 调整模型参数以优化目标函数的算法(algorithm)。
- 基本方法–梯度下降(gradient descent)
各种机器学习问题
监督学习
监督学习(supervised learning)擅长在“给定输入特征”的情况下预测标签。 学习过程一般可以分为三大步骤:
- 从已知大量数据样本中随机选取一个子集,为每个样本获取真实标签。有时,这些样本已有标签(例如,患者是否在下一年内康复?);有时,这些样本可能需要被人工标记(例如,图像分类)。这些输入和相应的标签一起构成了训练数据集;
- 选择有监督的学习算法,它将训练数据集作为输入,并输出一个“已完成学习的模型”;
- 将之前没有见过的样本特征放到这个“已完成学习的模型”中,使用模型的输出作为相应标签的预测。

无监督学习
无监督学习(unsupervised learning)通常要在没有标签的数据情况下,模型尝试从数据中找出潜在的结构或规律。
- 聚类(clustering)问题;
- 主成分分析(principal component analysis)问题
- 因果关系(causality)和概率图模型(probabilistic graphical models)问题
- 生成对抗性网络(generative adversarial networks)
强化学习
智能体(agent)在一系列的时间步骤上与环境交互。 在每个特定时间点,智能体从环境接收一些观察(observation),并且必须选择一个动作(action),然后通过某种机制、将其传输回环境,最后智能体从环境中获得奖励(reward)。

