机器学习 - 概念
定义
机器学习是人工智能的一个子领域,致力于研究如何通过数据驱动的方法,使计算机能够自动从经验中学习和改善其性能。
技术
- 监督学习(数据和标签):通过标注数据训练模型,使其能够对新的、未标注的数据进行预测或分类。常见算法包括:线性回归、支持向量机(SVM)、决策树等。
- 无监督学习(没有标签的数据):没有标签的数据,模型尝试从数据中找出潜在的结构或规律。常见算法包括:K均值聚类、主成分分析(PCA)等。
- 半监督学习:结合了监督学习和无监督学习,部分数据是有标签的,其他数据是无标签的。
- 自监督学习(Self-supervised Learning):是一种特定类型的无监督学习,它通过构造伪标签(pseudo-labels)来指导模型学习。这种方法通常用于预训练阶段,在不需要人工标注的情况下让模型学习到有用的表征。
- 强化学习:通过与环境互动,学习到如何通过行动来最大化长期回报。
- 迁移学习(Transfer Learning):它关注如何将一个或多个源任务中获得的知识有效地转移到目标任务的学习中。在深度学习的背景下,迁移学习通常指的是使用在一个大型数据集上预训练好的神经网络模型,并将其应用到相关但不同的任务上,以减少新任务所需的数据量和计算资源。
监督学习和迁移学习是最常见的两种学习类型
应用
- 推荐系统:如Netflix和Amazon的个性化推荐。
- 垃圾邮件检测:基于历史数据训练分类器,识别垃圾邮件。
- 金融预测:如股票市场预测和信用评分系统。
