深度学习+迁移学习+强化学习的区别分享-伙伴云

深度学习+迁移学习+强化学习的区别分享

网友投稿 994 2022-05-29

一. 深度学习：

深度学习的成功和发展，得益于算力的显著提升和大数据，数字化后产生大量的数据，可通过大量的数据训练来发现数据的规律，从而实现基于监督学习的数据预测。

基于神经网络的深度学习主要应用于图像、文本、语音等领域。

2016年的 NIPS 会议上，吴恩达给出了一个未来AI方向的技术发展图：

监督学习（Supervised learning）是目前商用场景最多，成熟度最高的AI技术，而下一个商用的AI技术将会是迁移学习（Transfer Learning），这也是 Andrew 预测未来五年最有可能走向商用的AI技术。

二. 迁移学习：

迁移学习：用相关的、类似数据来训练，通过迁移学习来实现模型本身的泛化能力，是如何将学习到知识从一个场景迁移到另一个场景。

拿图像识别来说，从白天到晚上，从冬天到夏天，从识别中国人到识别外国人……

借用一张示意图（From：A Survey on Transfer Learning）来进行说明：

迁移学习的价值体现在：

1.一些场景的数据根本无法采集，这时迁移学习就很有价值；

2.复用现有知识域数据，已有的大量工作不至于完全丢弃；

3.不需要再去花费巨大代价去重新采集和标定庞大的新数据集；

4.对于快速出现的新领域，能够快速迁移和应用，体现时效性优势；

关于迁移学习算法的实践总结：

1. 通过原有数据和少量新领域数据混淆训练；

2. 将原训练模型进行分割，保留基础模型（数据）部分作为新领域的迁移基础；

深度学习+迁移学习+强化学习的区别分享

3. 通过三维仿真来得到新的场景图像（OpenAI的Universe平台借助赛车游戏来训练）；

4. 借助对抗网络 GAN 进行迁移学习的方法；

三. 强化学习：

强化学习：全称是 Deep Reinforcement Learning（DRL），让机器有了自我学习、自我思考的能力。

目前强化学习主要用在游戏 AI 领域，最出名的应该算AlphaGo的围棋大战。强化学习是个复杂的命题，Deepmind 大神 David Silver 将其理解为这样一种交叉学科：

实际上，强化学习是一种探索式的学习方法，通过不断 “试错” 来得到改进，不同于监督学习的地方是强化学习本身没有 Label，每一步的 Action 之后它无法得到明确的反馈（在这一点上，监督学习每一步都能进行 Label 比对，得到 True or False）。

强化学习是通过以下几个元素来进行组合描述的：

对象（Agent）

也就是我们的智能主题，比如 AlphaGo。

环境（Environment）

Agent 所处的场景－比如下围棋的棋盘，以及其所对应的状态（State）－比如当前所对应的棋局。

Agent 需要从 Environment 感知来获取反馈（当前局势对我是否更有利）。

动作 (Actions)

在每个State下，可以采取什么行动，针对每一个 Action 分析其影响。

奖励 (Rewards)

执行 Action 之后，得到的奖励或惩罚，Reward 是通过对环境的观察得到。

说明：此文章为AI学习笔记，部分内容参考/转载于互联网。

AI开发平台ModelArts EI企业智能 AI

学习 笔记20170601">【PMP】学习 笔记20170601

994 2022-05-29

深度学习+迁移 学习+强化学习的区别分享

学习 笔记20170601">【PMP】学习 笔记20170601

AI创想秀，邂逅“华为云ModelArts”征文大赛——第一次收官

【TensorFlow】01 TensorFlow简介与Python基础

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

定制家居数字化管理模式：提升品质、智能化和个性化的未

友情链接

深度学习+迁移学习+强化学习的区别分享

微信扫一扫：分享

学习笔记20170601">【PMP】学习笔记20170601

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

友情链接