摘要:对于那些不想建立自己的机器学习模型而是想要使用AI驱动的按需服务(例如语音,视觉和语言识别)的公司,Microsoft Azure在服务的广泛性方面脱颖而出紧随其后的是Google Cloud Platform,然后是AWS。三大公司(基于云的数据存储)都提供了所有必需的相关基础架构和服务,能够存储训练机器学习模型所需的大量数据,转换数据以准备进行分析的服务以及可视化工具清楚地显示结果,以及简化模型构建的软件。

在很高的层次上,人工智能可以分为两种类型:狭窄的AI和通用AI。

狭窄的AI是当今我们在计算机中所看到的一切:已经教过或学会了如何执行特定任务而无需明确编程的智能化系统。

这种类型的机器智能在Apple iPhone上的Siri虚拟助手的语音和语言识别,自动驾驶汽车的视觉识别系统,推荐引擎(根据购买的产品来推荐您喜欢的产品)中很明显以往。与人类不同,这些系统只能学习或被教导如何执行特定任务,这就是为什么它们被称为狭窄AI。狭窄的AI可以做什么?

狭窄的AI有大量新兴的应用程序:从无人机解释视频输入,对基础设施(如输油管道)进行视觉检查,组织个人和企业日历,响应简单的客户服务查询,与其他智能系统配合以实现执行任务,例如在合适的时间和地点预订酒店,帮助 放射科医生发现 X射线中潜在的肿瘤,在线标记不当内容,从IoT设备收集的数据中检测电梯的磨损,等等。

一般AI可以做什么?

人工智能与众不同,它是人类发现的适应性智力的类型,是一种灵活的智力形式,能够学习如何执行截然不同的任务,从理发到构建电子表格,或推理各种各样的主题根据其积累的经验。这种AI在电影中更常见,例如2001年的HAL 或《终结者》中的 Skynet ,但如今还不存在,而且AI专家对它很快会变成现实的态度也存在分歧。

AI研究人员Vincent CMüller和哲学家Nick Bostrom在2012/13年度对四组专家进行的一项调查显示,到2040年至2050年,人工智能(AGI)的开发机会将达到50%,到2075年将上升到90%。该小组甚至走得更远,预测所谓的“ 超级智能 ”-被Bostrom定义为“在所有感兴趣的领域中大大超过人类的认知表现的任何智力”-预计在AGI实现后约30年。

就是说,一些AI专家认为,鉴于我们对人脑的了解有限,这样的预测是非常乐观的,并且相信AGI尚有数百年的历史。是什么推动了人工智能的复兴?

近年来,人工智能研究的最大突破是在机器学习领域,尤其是在深度学习领域。

这在某种程度上是由于数据的易用性所驱动,但更重要的是,由于近年来并行计算能力的爆炸式增长,在此期间,使用GPU集群来训练机器学习系统变得越来越普遍。

这些集群不仅为训练机器学习模型提供了功能更强大的系统,而且现在可以作为Internet上的云服务广泛使用。随着时间的流逝,主要的技术公司,例如Google和Microsoft,已经转向使用专门针对运行和最近培训机器学习模型的专用芯片。

这些自定义芯片之一就是Google的Tensor处理单元(TPU),其最新版本加快了使用Google TensorFlow软件库构建的有用的机器学习模型可以从数据推断信息的速度,以及他们可以被训练。

这些芯片不仅用于训练DeepMind和Google Brain的模型,还用于支持Google翻译和Google Photo中的图像识别的模型,以及允许公众使用Google的TensorFlow Research Cloud构建机器学习模型的服务。这些芯片的第二代产品已于去年5月在Google的I / O会议上亮相,其中的一系列新TPU能够训练用于翻译的Google机器学习模型,所需时间仅为前者的一半。端图形处理单元(GPU)。机器学习的要素是什么?

如前所述,机器学习是AI的一个子集,通常分为两大类:有监督学习和无监督学习。

监督学习

教学AI系统的常用技术是通过使用大量带标签的示例来训练它们。这些机器学习系统被馈入大量数据,这些数据已被注释以突出感兴趣的功能。这些照片上可能贴有照片,以表明它们是否包含狗或带有脚注的书面句子,并带有脚注以表明“低音”一词与音乐还是鱼类有关。经过培训后,系统便可以将这些标签罐应用于新数据,例如应用于刚刚上传的照片中的狗。

训练这些系统通常需要大量的数据,有些系统需要搜寻数百万个示例来学习如何有效地执行任务-尽管在大数据和广泛的数据挖掘时代,这越来越有可能。训练数据集庞大且规模不断扩大 -Google的Open Images Dataset拥有大约900万张图像,而其带有标签的视频存储库YouTube-8M链接了700万个带有标签的视频。ImageNet是此类早期数据库之一,拥有超过1400万张分类图像。该文件经过两年的编写,由近50,000人(其中大部分是通过Amazon Mechanical Turk招募的)汇集在一起的,他们检查,分类并标记了将近10亿张候选图片。

从长远来看,与庞大的计算能力相比,访问具有大量标记数据集的重要性可能不那么重要。

近年来,Generative Adversarial Networks(GAN)展示了向机器学习系统馈送少量标记数据的方式,然后可以生成大量新鲜数据来自学。

这种方法可能会导致半监督学习的兴起,在这种情况下,系统可以使用远远少于当今使用监督学习的培训系统所需要的标记数据来学习如何执行任务。

无监督学习

相比之下,无监督学习则使用另一种方法,即算法尝试识别数据中的模式,寻找可用于对数据进行分类的相似性。

一个例子可能是将重量相似的水果或发动机尺寸相似的汽车聚集在一起。

该算法并非预先设置为挑选特定类型的数据,它只是寻找可以根据其相似性进行分组的数据,例如Google News每天将相似主题的故事分组在一起。

强化学习

强化学习的粗略类比是当宠物在表演把戏时奖励其零食。

在强化学习中,系统会尝试根据其输入数据最大化奖励,基本上要经过反复试验的过程,直到获得最佳结果。

强化学习的一个例子是Google DeepMind的Deep Q网络,该网络 已被用于在各种经典视频游戏中实现最佳人类表现。系统从每个游戏中获取像素,并确定各种信息,例如屏幕上对象之间的距离。

通过查看每个游戏中获得的分数,系统会建立一个模型,该模型的动作将在不同情况下使分数最大化,例如,在视频游戏Breakout的情况下,应将球拍移至其中以拦截球。哪些AI服务可用?

所有主要的云平台-Amazon Web Services,Microsoft Azure和Google Cloud Platform-提供对GPU阵列的访问,以训练和运行机器学习模型,而 Google还准备让用户使用其Tensor处理单元 -自定义芯片其设计针对训练和运行机器学习模型进行了优化。

三大公司(基于云的数据存储)都提供了所有必需的相关基础架构和服务,能够存储训练机器学习模型所需的大量数据,转换数据以准备进行分析的服务以及可视化工具清楚地显示结果,以及简化模型构建的软件。

这些云平台甚至简化了自定义机器学习模型的创建,Google最近发布了一项名为AI Auto Cloud的服务,该服务可以自动创建AI模型。这项拖放服务可建立自定义的图像识别模型,并且要求用户不具备机器学习知识。

基于云的机器学习服务在不断发展,2018年初,亚马逊透露了一系列旨在简化机器学习模型训练流程的 AWS新产品。

对于那些不想建立自己的机器学习模型而是想要使用AI驱动的按需服务(例如语音,视觉和语言识别)的公司,Microsoft Azure在服务的广泛性方面脱颖而出紧随其后的是Google Cloud Platform,然后是AWS。同时,IBM除了更一般的按需产品之外,还试图出售针对特定领域的AI服务,从医疗保健到零售,将这些产品归类到IBM Watson旗下-最近投资20亿美元收购了The Weather解锁大量数据以增强其AI服务的渠道。哪些大型科技公司在AI竞赛中获胜?

在内部,每个科技巨头(以及Facebook等其他公司)都使用AI来帮助推动各种公共服务:提供搜索结果,提供建议,识别照片中的人物和事物,实时翻译,发现垃圾邮件-列表广泛。

但是这场AI战争最明显的表现之一就是虚拟助手的兴起,例如苹果的Siri,阿里巴巴的天猫精灵,百度的小度等等。

严重依赖语音识别和自然语言处理,以及需要庞大的语料库来回答查询,开发这些助手需要大量技术。哪些国家在AI领域处于领先地位?

认为美国科技巨头拥有AI领域是一个很大的错误。阿里巴巴,百度和联想正在从电子商务到自动驾驶等各个领域大力投资人工智能。作为一个国家,祖国正在执行三步走的计划,将人工智能变成该国的核心产业,到2020年,人工智能产业的价值将达到1500亿元人民币(合220亿美元)。

诸如百度,阿里巴巴和腾讯等大型公司的弱势隐私巨额投资,一致的数据收集以及大数据分析的结合,意味着一些分析师认为,在未来的人工智能研究方面,国内将比美国更具优势。一位分析师描述了中国领先美国的可能性 是500比1。

如果您还有小编不知道的观点,请在下方留言和小编一起探讨吧。对了,顺便点个关注呗!!

相关文章