引言

机器学习中的关键组件

首先介绍一些核心组件。无论什么类型的机器学习问题，都会遇到这些组件：

可以用来学习的数据（data）；
- 数据长度不固定（图像、音视频等）
- 海量数据
  - 正确的数据，具有目标特征数据（Garbage in, garbage out）
如何转换数据的模型（model）；
- 学习输入数据特征转换成对应输出
一个目标函数（objective function），用来量化模型的有效性；
- 训练数据集用于拟合模型参数，测试数据集用于评估拟合的模型。
调整模型参数以优化目标函数的算法（algorithm）。
- 基本方法–梯度下降（gradient descent）

各种机器学习问题

监督学习

监督学习（supervised learning）擅长在“给定输入特征”的情况下预测标签。学习过程一般可以分为三大步骤：

从已知大量数据样本中随机选取一个子集，为每个样本获取真实标签。有时，这些样本已有标签（例如，患者是否在下一年内康复？）；有时，这些样本可能需要被人工标记（例如，图像分类）。这些输入和相应的标签一起构成了训练数据集；
选择有监督的学习算法，它将训练数据集作为输入，并输出一个“已完成学习的模型”；
将之前没有见过的样本特征放到这个“已完成学习的模型”中，使用模型的输出作为相应标签的预测。

无监督学习

无监督学习（unsupervised learning）通常要在没有标签的数据情况下，模型尝试从数据中找出潜在的结构或规律。

聚类（clustering）问题；
主成分分析（principal component analysis）问题
因果关系（causality）和概率图模型（probabilistic graphical models）问题
生成对抗性网络（generative adversarial networks）

强化学习

智能体（agent）在一系列的时间步骤上与环境交互。在每个特定时间点，智能体从环境接收一些观察（observation），并且必须选择一个动作（action），然后通过某种机制、将其传输回环境，最后智能体从环境中获得奖励（reward）。