云手机网页版 解析卷积神经网络的应用
当下,人们对于那种性能强悍并且结构繁杂的计算机已然是见怪不怪了。借助跟手机以及蓝牙音响进行对话,我们能够获取到环境敏感信息的反馈;在驾驶某些汽车之际,我们能够双手离开方向盘,让电子设备引领我们前行;只要触碰某个按钮,我们便能够同世界任何地方的任何人分享信息以及图片。
有一个领域,至今仍处在初步的那段时期,那就是计算机“视觉”。我们的口袋里,装着性能很棒的相机,然而要切实去明白这个世界,这些设备相对而言就显得不那么突出了。设备能够清晰地把世界的画面捕捉到,可是却没办法理解画面当中所蕴含的意义。
比如说,要是您向一个三岁的小孩子展示一张有着人与大象同时出现在画面里的照片,他能够清晰明了地讲出照片里所呈现的内容,然而要是需要计算机去做相同的这一件事情kiayun手机版登录app游戏登录入口.手机端安装.cc,那可是颇具挑战性的。
只有当使用图像数据集对计算机进行训练后,其方可识别对象
不过,情况有了改变。近些年来,有个被叫做“深度学习”的数据领域,极大地扩展计算机领悟眼中事物的水平能力。深度学习所采用的卷积神经网络,特别是其运用,并非仰仗传统图像处理技术。但它却给予计算机理解世界的能力,并且在这方面已经收获了重大的技术进展成果成效。
最早能够追溯到的卷积神经网络,是在20世纪80年代末,它的创建是基于20世纪60年代早期的人工神经网络,也就是ANN,还有多层感知器,即MLP,它们最初在设计的时候,意图是去模拟人脑的工作方式,当然了,为了能够像人脑那样把工作做好,就得使用大量的数据来开展训练。
2005年,GPU开始崛起,随后CNN开始变得广为人知,并且被大量投入使用,这是由于,GPU处理重复性任务的速度让CNN的使用成为了现实。
2012年,计算机视觉智能领域的运转有了显著的进展,Alex Krizhevsky凭借神经网络在ImageNet挑战赛中获胜。ImageNet挑战赛是一个由普林斯顿大学李凯教授于2007年搭建的庞大图像数据库,其中存有海量的图像数据。该数据库为计算机给予了充裕的训练数据,让计算机能够像孩童学习那样去进行学习。通常情况下,ImageNet挑战赛被视作计算机视觉领域一年一度举办的奥林匹克盛会,它是基于精选出来的图像,去测试计算机了解并明白所看到对象的速度究竟有多快,从而得出失误数值,失误越少,最终的比分也就会越高。

在2012年那个时段,AlexNet CNN迅速地让图像识别性能得到了提升,进而产生了重大层面的影响。
那时,Krizhevsky可把错误率由26%降至15%,这属于一项意义重大的改进,并且是借助运用卷积神经网络达成的。每一年,伴随创立团队打造出更优良的系统用以加快与提升设备认识图像的能力,因而这一进程也获得了持续不断的改进。

ImageNet CNN的性能近年来持续优化
但CNN如何在现实世界使用,它们又将产生怎样的影响?
辅助技术
在《2001:太空漫游》里,存在一个知名场景,宇航员大卫·保曼以及富兰克·保尔藏身在一个舱内,于这个舱中,飞船计算机HAL没法听到他们针对它古怪行为的交谈,可是,HAL却能够读懂他们的唇语。就现阶段而言,我们清楚,HAL会运用CNN去破译他们所说的话。唇读计算机有着更多的使用情形,像是从音频无法获取的视频内容里得到副本,记者获取政客或者名人更为真实的言论等。
1968年被拍摄的电影《2001:太空漫游》具备,其中的HAL9000呈现出读唇术这一能力。
有一组来自牛津大学的研究人员,已提出采用CNN来进行唇读,另外有一篇提交给IEEE的论文,指出了怎样运用CNN“减少物体摇晃以及面部特征提取模糊所造成的负面影响”,在这里,生成了一个词,其识别率高达71.76%,这要远比传统的方法优胜。
目前还是这样的情况,你能够凭借手中持有的设备去体会CNN的强大之处。存在一款称之为AIPoly的APP,依照这款APP的设计,能够助力视力存在缺陷的人士,在使用了Imagination PowerVR GPU的智能手机上面,借助摄像机来识别物体,并且以语音的方式反馈信息。
全自动驾驶汽车
与全自动驾驶汽车密切相关的CNN,其用于驱动全自动驾驶汽车仍处于开发之中。康奈尔大学的论文探讨了怎样有效运用CNN去识别汽车牌照,此方式较传统方式效果更好。车牌不像移动物体那般难以预测,然而有一篇论述CNN的论文表明,运用CNN相较于传统方法效率更高。
说起移动着的物体,人们下意识地觉得,在ADAS以及汽车全自动视觉系统里被运用的最为关键的算法CNN,会在全自动驾驶汽车范畴起到重大的功效。CNN在剖析场景这块极为高效,它把场景划分成能够识别的对象,一直到场景里的物体、行人、汽车、卡车、路肩、路标在摄像机系统里能够被识别。借助投入大量的训练数据,卷积网络能够“学习”在实时驾驶之际怎样从场景里实施信息识别与提取。比如说呀,借助CNN的各个层次,能够发觉拐角或者弯道,紧接着是环路、路标,最终是路标的意义。这些信息随后传送给传感器,并且跟其他传感器像激光雷达或者雷达里的数据进行融合,这般就能够理解更大范围的图景,并且通过多媒体交互系统发出闪光警示或者控制刹车或者转向,凭借这个对场景作出反应。
CPU 上能使用 CNN,也可在能利用 GPU 计算的设备上运用,如此会更具成效,成效方面至少能将效率提升 10 倍,或者借助硬件加速来达成,最终以最低的功耗以及硅占用面积获取最高水准的性能。
医疗应用
本质而言,CNN极为擅长发现,此特性让其相当适配医疗环境。如同在Nature.com发表的论文所探讨的那般,CNN能够有效地提升癌症识别精确度,且已被运用于检测“原发性乳腺癌、神经胶质瘤及上皮与基质分割”;高效率意味着它们能够削减医学专家的工作量。论文总结称,“深度学习”在“提高前列腺癌和乳腺癌分期诊断疗效上面应当会具备巨大的潜力”。

与上述情况相同,康奈尔大学所发表的论文表明,运用CNN来辅助乳腺癌筛查,在对采样训练数据进行操作时,能够对图像保真度产生影响,所以建议务必维持图像的分辨率,以此来保证性能处于最佳状态。
工业领域
如果您对于计算机自我构建存在忧虑,那么您产生忧虑并非毫无缘由,可以这么说。半导体行业一直以来都将目光聚焦于借助深度学习去对先进集成电路展开辅助设计以及制造工作。一般而言,大家觉得CNN特别适合用来解决某些制造方面的问题。跟对癌症进行识别相类似的情况是,在光刻工艺开展的过程当中,CNN的识别模式能够被充分加以利用,从而极大程度地削减了制造缺陷,进而提高了生产产量。
首先,CNN被广泛应用于食品识别,其次kia云手机版登录,有论文讨论利用那CNN进行自动饮食识别,进而使专家能够发现不健康的饮食模式,再者,还有几篇论文也对CNN的这种功能进行过描述,然后kiayun手机版登录入口,它们指出,计算机的“深度饮食”可以辅助饮食评估,最后,改善人们的健康状况、延长寿命。
社交媒体领域
使数字图像的显示成效达至最优,这属于一项技能,众多人借助运用图像修复工具且耗费了大量精力,期望达成这一理想成效,源自Adobe以及康奈尔大学的一项称作“深度照片风格转移”的实验正尝试凭借应用人工智能来达成这一成效,这款应用能够按某种风格拍摄一张照片,还能自动把此种风格施加于另一张照片上,成效颇为显著。
Facebook等网站已广泛应用CNN,Facebook说明了他们于深度文本方面对CNN的运用情况,所谓“深度文本”,乃是基于深度学习的文本理解引擎,它能够借助一种类似于接近人类的那种准确性这种水准,每秒去完成几千个帖子文本内容的理解工作,并且其理解范围横跨超过20种语言。
总结
一直以来,Imagination都在密切留意着加速推理引擎运用的方式,它们只要在数据集上完成全面训练,便能够在设备上运行CNN,就像去年我们发布的PowerVR Rogue GPU那样,相较于CPU,其运行效率的提升以原有的运行效率为基准涨了3倍,性能提升到原来的12倍,而新发布的具有PowerVR Furian架构能展现出更强大的性能以及功效。
最近的博文中,我们突显展露了这一领域的工作,还有我们怎样率先运用OpenVX CNN扩展,也就是计算机视觉的开源标准API。
我们会持续开展该领域相关工作,Imagination的保罗·布莱斯莱特近期于嵌入式视觉峰会发表了名为“训练CNN用于高效推理”的演讲,在他的此次演讲当中,讲述了Imagination于硬件之上运行CNN来提高效率的办法,硬件功率以及面积方面的限制是重点关注内容,像移动设备或者全自动驾驶汽车的硬件等等。