算法:有监督学习、无监督学习、半监督学习、强化学习。
数据有特征、目标值,即数据要有标签。
数据没有标签。通过样本间相似性进行数据集聚类。
小部分数据集有监督学习,其他无监督学习。降低学习成本。
实行多轮学习流程(比如反复问答),通过奖励机制提高学习质量。
有监督学习,主要处理两类问题:分类问题、回归问题。
分类问题:目标值是不连续的。比如:目标值是等级(高、中、低)。
回归问题:目标值是连续的。比如:目标值是数值区间(价格)。
| 输入 | 输出 | 目的 | 案例 | |
|---|---|---|---|---|
| 有监督学习 | 有标签 | 有反馈 | 预测结果 | 房价、收入等 |
| 无监督学习 | 无标签 | 无反馈 | 发现潜在规律、结构 | 图片、视频、音频等处理 |
| 半监督学习 | 部分有标签,部分无标签 | 有反馈 | 降低数据标记难度 | 医学方面应用等 |
| 强化学习 | 决策流程与激励制度 | 一系列行动 | 获得长期的效益 | 对话机器人等 |