关于机器学习的三个阶段
723
2022-05-30
2.3.4 人工智能的四***展要素
人工智能发展所处的信息环境和数据基础正在发生深刻的变化。日益海量化的数据、持续提升的计算能力、不断优化的算法模型、不断扩展的应用场景已构成相对完整的闭环,成为图2-12中推动新一代人工智能发展的四大要素。
图2-12 新一代人工智能发展要素
(1)人机物互联互通成为趋势,数据量呈现爆炸性增长——“大数据”是基础要素
如图2-13所示的IDC研究预测2025年全球数据量将达到163ZB,
其中20%的数据蕴藏有颠覆性潜力,注重数据价值的时代已经来临。
目前,人工智能正从监督学习向无监督学习演进升级。在这一过程中,人工智能算法模型需要从各行业、各领域的海量数据中不断积累经验、发现规律、持续优化。可以说,数据是智能发展的基础。
人工智能时代的大数据和传统意义上的海量数据是有一定区别的,这个区别主要从两方面体现。第一,智能时代里大数据的本质是大连接。传统意义上的大数据更多的是指其数据体量大,数据处理复杂,数据属于结构化或非结构化。但在智能时代,我们更关注数据的内在关联性。数据之间的关联性越强,意味着数据背后蕴藏的价值越大。第二,智能时代大数据的重要指标是标注性。目前,机器学习和深度学习主要集中于监督学习,标注数据对于模型训练意义非凡。在弱人工智能阶段,AI能力输出的背后通常有大量人工成本在支撑着规模惊人的数据集的建造。毫不夸张地说,只有当人类变成投喂机器的流水线工人时,AI才能顺势崛起。当然标注好的数据集和训练好的模型都可以反复应用,这节省了之后分类或回归阶段所需的人工成本。但是,原始数据的标注仍是不可避免的。
图2-13 2025年数据增长趋势示意图
这里以人工智能巨头Google为例:Google刚刚开源的Google Open Image Datasets中含有900万张图片,YouTube-8M中包含了800万段被标记的视频,而ImageNet作为最早的图片数据集,目前也有超过1400万张被分类的图片。除Google外,随着人工智能的飞速发展,Amazon、苹果、Facebook、IBM、微软等顶尖科技公司也都开始在数据标注上花费大量财力、人力,以支撑其AI版图的扩张。这些公司通常选择自己的劳务众包平台或者使用第三方服务来完成数据标注工作。海量的标注数据集是顶尖公司AI算法模型生产力的重要保障之一。
(2)数据处理技术加速演进,计算能力实现大幅提升——“大计算”是前提条件
前面我们讨论的是基础数据,接下来谈谈计算能力。
计算能力是这一波人工智能浪潮的主要推动力。事实上,深度学习算法、神经网络是20世纪七八十年代就被提出来的概念,为什么一直到最近深度学习才有了飞跃式的发展?从技术角度来看,主要原因是原来的计算能力不够。所有深度学习、神经网络里用到的训练过程都可被归结为矩阵运算范畴,而传统的CPU并不能满足计算能力及效率的需求。近年来,更适于矩阵运算的GPU、云、GPU集群的出现,使得使用海量数据训练一个庞大的模型真正成为可能。目前,Amazon、Google、百度、阿里都已经开始提供基于GPU的计算机集群服务。
此外,芯片的发展也为计算能力的提升做出了不可磨灭的贡献。
(3)深度学习研究成果卓著,带动算法模型持续优化——“大算法”是关键要素
作为人工智能发展的核心要素,从20世纪80年代开始到现在,“算法”一直在不断地更迭、演进。AI领域的算法分为三种流派:符号主义流派、贝叶斯流派以及联结主义流派。目前,人工智能算法也已经广泛应用在自然语言处理、语音处理以及计算机视觉等领域,并在某些特定领域取得了突破性进展。在未来,上述三种算法流派的融合将成为主要发展趋势。
随着算法模型的重要性进一步凸显,全球科技巨头纷纷加大布局力度和投入,通过成立实验室、开源算法框架、打造生态体系等方式推动算法模型的优化和创新。OpenAI、CaffeOnSpark、DMTK等多家公司已开源了深度学习基础计算框架以及专用领域算法框架(如人脸识别等),希望通过多方参与、资源共享进一步推动技术创新。
(4)资本与技术深度耦合,助推行业应用快速兴起——“大应用”是发展导向
在技术突破和应用需求的双重驱动下,人工智能技术已走出实验室,向产业的各个领域渗透,产业化水平大幅提升。在此过程中,资本作为产业发展的加速器,发挥了重要的作用。一方面,跨国科技巨头以资本为杠杆,展开投资并购活动,不断完善产业链布局;另一方面,各类资本对初创型企业的支持,使得优秀的技术型公司迅速脱颖而出。美国技术研究公司Venture Scanner的调查报告显示,截至2017年12月,全球范围内总计2075家与人工智能技术有关的公司的融资总额达到65亿美元。同时,美国行业研究公司CB Insight公布了对美国人工智能初创企业的调查结果,这类企业的融资金额约是2012年的10倍。图2-14综合展示了人工智能的产业链分布情况,可以看出人工智能已在智能机器人、无人机、金融、医疗、安防、驾驶、搜索、教育等领域得到了较为广泛的应用。
图2-14 人工智能产业链分布示意图
数字化营销 数字化办公
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。