【行业研究】从听说读写到思考决策，深度学习如何“+”人工智能？

2016-08-10 15:32 全部

变革家，专注创业项目分析，帮股权投资者把好第一关！过去 3 年，深度学习在各个领域取得较大突破，比如计算机视觉领域的物体识别、场景分类，语音分析等，并且其技术推广和应用的速度超过人们预期，比如 Google 的广告系统已经开始使用深度学习盈利，Twitter 也通过深度学习改善App 图片及视频内容服务体验。

不可否认，深度学习正改变越来越多的人工智能领域。一方面，深度学习在图像和语音识别等领域快速渗透，比如图像处理类应用、视频归纳、智能客服，以及延伸的服务机器人领域、车载助手等等。随着训练方法和网络结构的优化，相比 15 年前，视觉神经网络模型的价格便宜了5到10倍，处理的参数少了15倍，但却表现更好；而越来越多的开源算法也使得深度学习的门槛大大降低，行业投资逻辑进入应用场景深化结合阶段。

另一方面，在日益增多的多结构数据问题中，深度学习都逐渐得到广泛应用，比如 Deep Instinct 将其应用于安全领域等。未来，神经网络可能会成为 NLP、机器人任务的标准解决方案，并在各个领域扮演重要角色，比如基因行为预测、数据挖掘、翻译机、机器人、网络安全等等，就好像一个软件工具包。

但过于专注深度学习，也可能无法解决错综复杂的计算机视觉问题。在近期召开的计算机视觉国际顶尖会议 CVPR2016 上，深度学习无疑再次成为会议的热点。不过，也有学者指出，目前的计算机视觉领域太过关注深度学习，且大部分人将目标聚焦在搭建更复杂和精密的神经网络框架，且这些框架基本都是不可扩展的。其实早在 2015 年的 CVPR 会议上， Yann LeCun 就曾谈及深度学习存在的问题，比如缺乏理论和论证等。而人们过于聚焦深度学习，导致的一个现象是目前计算机视觉研究理论深度变浅。

计算机视觉问题是一系列错综复杂的问题，不仅是判定图像特征或运动状态等问题，在保证一定深度的同时，更需要达到足够的广度。那么，如果只沿着深度学习这条路走下去，且更多地追求搭建更大、更复杂的神经网络，会否出现后续基础理论支撑跟不上，效率提升在达到某个程度后遇到瓶颈，最终无法解决各种各样的计算机视觉问题？这就让时间来检验吧。

从人工智能发展的阶段来看，深度学习在人工智能领域的应用，可以划分为计算智能、感知智能和认知智能。

在“听说读写”识别类的应用方面：从基本的人工智能技术来看有文本识别、语音识别、语义分析、图像识别、视频分析等。具体应用上则表现为文字识别仪、语音控制产品、机器翻译、智能在线客服、人脸识别应用以及智能安防产品等。

在“思考决策”类的应用方面：主要可以对散落在不同场景下碎片化、非结构化的文字、图片、声音、视频等数据应用深度学习方法，对目标对象的特征进行刻画。例如可以了解消费者其当前需求甚至挖掘潜在需求，推荐相应的产品或服务，实现精准营销；或者监控大型复杂设备的实时状态并对未来的状态进行预测，实施预测性维护保养等。

一、金融：深度学习融入量化分析，人脸识别助力身份验证

人工智能目前在金融领域的应用主要集中在身份验证、客户服务、市场分析、客户关系管理、内容分析、风险控制和商业智能等。人工智能在金融领域的已有应用。

量化分析：在传统的投资研究中，基金经理及研究员对财务、交易、市场等数据进行建模，利用回归分析等传统方式作出交易策略，而在人工融入量化分析之后，这些工作均由计算机完成。而人工智能运用于量化投资，在规避市场波动下的非理性选择、回避非系统性风险、获取确定性收益方面等更胜一筹。

深度学习和图像识别推动人工智能进入量化分析领域。人工智能在量化分析领域的应用主要分为两种模式：第一，深度学习算法建立模型或模仿专家决策辅助预测，代表公司主要有 Rebellion Research、Castilium 和Alpaca；第二，图像识别辅助分析外汇交易图表，代表公司主要有 Alpaca。

人脸识别支付：人脸识别支付系统是基于脸部识别系统的支付平台，，支付时不需要钱包、信用卡或手机，只需要面对 POS 机屏幕上的摄像头，系统会自动将消费者面部信息与个人账户相关联。

二、无人驾驶

深度学习在无人驾驶领域的应用主要包括几个环节：

1、人车交互：自然语言处理（包括语音识别、语义理解等）

目前，深度学习算法已经在语音识别领域得到广泛应用，目前语音识别的准确率高达 90%以上，甚至接近 100%，主要得益于深度学习算法的应用。而深度学习在语音处理领域的应用主要在于机器翻译以及语义挖掘等方面。我们认为，深度学习算法的应用加快人与车高效交互的实现。而目前我们已经看到四维图新联手普强已经开发出一款前装语音助手产品。普强的汽车语音产品基本经历了三个阶段：第一步实现车内自然语音识别和理解；第二步成为更接近自然对话的语音助手，可以多轮对话和随机打断；第三步做多模态人机交互。

2、环境感知环节：计算机视觉

视觉摄像头通过不断获取周围环境图片来实现对环境的感知，而对图片的计算处理能力的提升很重要的一个途径就是采用深度学习的算法，目前卷积神经网络算法（CNNs）已经大规模应用在图像识别领域，算法已经相当成熟。另外，通过其他传感器获取的环境大数据，同样可以使用深度学习算法来提高数据计算能力，这也是 IBM 沃森在无人驾驶中重大价值体现。

3、路径规划&路况处理：机器学习让汽车像人一样思考

人们追求的无人驾驶最终效果是，车辆能够像车主一样在面对复杂路况、复杂交通环境时，做出像正常车主一样的理性判断和处理。这就需要无人驾驶系统具备自我学习能力，不断根据与外界交互的数据进行自我反馈、自我学习，最终达到真正的无人驾驶。而这需要无人驾驶车辆不断积累各样的交通状况数据、不停的学习各种突发状况的处理。例如，谷歌的无人驾驶汽车目前每天都在接受训练，目前已经累计行驶 265 万公里。除此之外，谷歌也会通过本身数据中心资源，以软件形式让无人车系统持续以模拟路况方式学习正确驾驶模式，以及在不同状况如何迅速应对等。

三、医疗：深度学习助力制药与治疗，图像识别融入医学影像

人工智能在医疗健康领域的应用分为八类，分别是健康管理、医疗风险分析、虚拟护士助理、药物挖掘、诊断、医学研究和营养学。从 2015年医疗健康领域人工智能的投资分布来看，健康管理、医学影像、医疗风险分析是人工智能与医疗健康融合最受资本关注的三大领域。

药物挖掘：深度学习助力药物挖掘。人工智能与药物挖掘的结合极大地提高研发效率，降低企业成本。目前在北美地区已经出现了数家技术领先的初创企业借助深度学习，与默克等传统药企及医药研究机构合作，在心血管药物、抗肿瘤药物等多领域取得新突破。

医学影像：医学影像领域人工智能的核心技术为图像识别，即利用人工智读懂医学影像的内容。借助图像识别技术，医师可以更高效地做出专业判断，患者能够更快速地获得医疗服务，而医疗机构也可节省成本。在分级诊疗的大背景下，人工智能与医学影像的市场空间在不断增长。

虚拟医生：自然语言处理与深度学习使虚拟医生成为可能。2015 年 12月，生物制药公司诺和诺德将与 IBM 旗下沃森健康(Watson Health)合作为糖尿病人开发“虚拟医生”，为患者提供胰岛素用量等治疗建议。2016年初，谷歌 Deep mind 首席执行官向英国的初创公司“巴比伦”投资 2,500万美元。巴比伦正在开发医生或患者说出症状后，在互联网上搜索医疗信息、寻找诊断和处方的人工智能 APP。

本文内容来自蓝驰创投BlueRun（lanchichuangtou）。了解更多决策参考信息请添加变革家小秘书（添加时请注明“姓名-公司-职务”方便备注）或直接点击会员链接：http://lxi.me/f1v4r；转载请注明作者姓名和“来源：变革家”；文章内容系作者个人观点，不代表变革家对观点赞同或支持。

337527139132339520