谷歌的AI应用开发之道

摘要：\u003C\u002Fp\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp9.pstatp.com\u002Flarge\u002Fpgc-image\u002F8965025a6eaa48969fb170cab1551759\" img_width=\"1080\" img_height=\"625\" alt=\"谷歌的AI应用开发之道\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E最近则在难度上再升级，专门为语言障碍患者打造语音识别模型，取名\u003Cstrong\u003EEuphonia\u003C\u002Fstrong\u003E。\u003C\u002Fp\u003E\u003Cp\u003EJulie说5G的进展是很好，但对于谷歌AI的应用打造来说，“帮助有限”。

"\u003Cdiv\u003E\u003Cblockquote\u003E\u003Cp\u003E李根发自 Tokyo\u003C\u002Fp\u003E\u003Cp\u003E量子位报道 | 公众号 QbitAI\u003C\u002Fp\u003E\u003C\u002Fblockquote\u003E\u003Cp\u003E全球AI第一大厂，打造AI产品时有何指导思想？\u003C\u002Fp\u003E\u003Cp\u003E软件+硬件+AI。\u003C\u002Fp\u003E\u003Cp\u003E没错，这是谷歌CEO皮猜在Google I\u002FO大会上反复强调的，但这还不是全部。\u003C\u002Fp\u003E\u003Cp\u003E因为从2019年Google I\u002FO展现的新进展来看，谷歌几乎没有新推出什么软硬一体的AI新产品，反倒是各种基于手机的AI应用解决现实挑战。\u003C\u002Fp\u003E\u003Cp\u003E而在最近的谷歌AI东京座谈会现场，两位谷歌AI产品经理也集中表达了这样一种产品开发之道：\u003C\u002Fp\u003E\u003Cul\u003E\u003Cli class=\"ql-align-justify\"\u003E尽可能手机就能用，而且最便宜的智能手机都能使用。\u003C\u002Fli\u003E\u003Cli class=\"ql-align-justify\"\u003E尽可能本地化训练，不需要云边协同，若能完全实现AI模型本地化训练，对用户隐私更有利。\u003C\u002Fli\u003E\u003Cli class=\"ql-align-justify\"\u003E尽可能减少网络要求，甚至在无网络状态也能使用AI应用。\u003C\u002Fli\u003E\u003C\u002Ful\u003E\u003Cp\u003E总之，让AI福祉尽可能低门槛地惠及最多的人。\u003C\u002Fp\u003E\u003Ch1\u003E\u003Cstrong\u003EAI芯片让更多智能App成为可能\u003C\u002Fstrong\u003E\u003C\u002Fh1\u003E\u003Cp\u003E\u003Cstrong\u003ESagar Savla\u003C\u002Fstrong\u003E是谷歌AI研究组的产品经理，他之前参与了Pixel的相机、YouTube和Google Home等AI产品和应用打造。\u003C\u002Fp\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002Fd1607610d5454f9bb86beddfc52165cc\" img_width=\"1080\" img_height=\"720\" alt=\"谷歌的AI应用开发之道\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E最新成果则是一个名为Parrotron的语音转换模型，完全在手机上应用，语音能够实时完成速记转写，现场对于网络也没有特殊配置，但转写的速度和识别率令人惊讶。\u003C\u002Fp\u003E\u003Cp\u003E甚至还会有结合语境上下文的“修改”，比如同样一个名词，可以区分是否需要大写。\u003C\u002Fp\u003E\u003Cp\u003E谷歌AI博客也已经介绍了该应用全过程，产品立项起点，是希望能帮更多语言障碍患者实现更好交流。\u003C\u002Fp\u003E\u003Cp\u003E传送门：https:\u002F\u002Fai.googleblog.com\u002F2019\u002F07\u002Fparrotron-new-research-into-improving.html\u003C\u002Fp\u003E\u003Cp\u003E但完全做到手机实时转写，在模型训练和落地应用方面，着实下了一番功夫。\u003C\u002Fp\u003E\u003Cp\u003E我们也问Sagar，这样的应用是否考虑非英语版本，比如中文。\u003C\u002Fp\u003E\u003Cp\u003E他说其实他们也在推动普通话方面的打磨，目前挑战还在数据方面。\u003C\u002Fp\u003E\u003Cp\u003E但一经在台湾建立了专门技术团队推进，希望能让更多普通话用户也能使用。\u003C\u002Fp\u003E\u003Cp\u003ESagar表示，在谷歌内部，他们打造AI应用有两条思路，一是让更多人受惠，二是尽可能减少限制和要求。\u003C\u002Fp\u003E\u003Cp\u003E采访当天，我们展示了一款搜狗专门为速记转写打造的AI硬件产品，这引起Sagar极大兴趣。\u003C\u002Fp\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp9.pstatp.com\u002Flarge\u002Fpgc-image\u002F8717a83e683e4e46a40cfaf9bd79b035\" img_width=\"1080\" img_height=\"1292\" alt=\"谷歌的AI应用开发之道\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E他马上就拿起来研究，两眼放光，然后问我们这个产品谁出的、在什么地方可以买到，售价多少。\u003C\u002Fp\u003E\u003Cp\u003E但当我们问，谷歌是否会有类似的产品规划，比如专门为AI速记打造新硬件产品？\u003C\u002Fp\u003E\u003Cp\u003E回答是否定的。\u003C\u002Fp\u003E\u003Cp\u003ESagar称类似解决方案上，谷歌推出了一款App，只要带麦克风的安卓设备都可以用，装载后就能当做AI录音笔了。\u003C\u002Fp\u003E\u003Cp\u003E这位年轻的AI工程师还介绍，如果说今年有什么新技术进展让他激动，那可能会是手机芯片方面的进步：\u003C\u002Fp\u003E\u003Cp\u003E一方面是AI处理器正在普及，越来越多机器学习应用可以落户手机。\u003C\u002Fp\u003E\u003Cp\u003E另一方面是5G，可以预见的是，云和端之间的时延会大幅度降低，更多AI模型的响应和速度，都会得到提升，体验也会更好。\u003C\u002Fp\u003E\u003Ch1\u003E\u003Cstrong\u003E挑战纯本地、无网络\u003C\u002Fstrong\u003E\u003C\u002Fh1\u003E\u003Cp\u003E另一位谷歌AI产品经理则对5G有进一步补充。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003EJulie Cattiau\u003C\u002Fstrong\u003E，Google I\u002FO 2019上的“聋哑人打电话”项目——Live Transcribe就由她参与打造。\u003C\u002Fp\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002F9f2deac0a2a745efb187b76413f6c631\" img_width=\"1080\" img_height=\"720\" alt=\"谷歌的AI应用开发之道\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E当时主要是为耳聋或听力患者提供实时语音转文字、文字转语音，一个App支持70种语言。\u003C\u002Fp\u003E\u003Cp\u003EJulie说5G的进展是很好，但对于谷歌AI的应用打造来说，“帮助有限”。\u003C\u002Fp\u003E\u003Cp\u003E因为她们希望每一款AI应用，基本标准都是完全无网络、纯本地的，这样任何情况下，都不影响正常使用。\u003C\u002Fp\u003E\u003Cp\u003E之前Julie还参与了谷歌翻译App的打造，也是从一开始就朝着这个方向努力的。\u003C\u002Fp\u003E\u003Cp\u003E当然，如此思路，也是谷歌AI目前前进的大方向之一。\u003C\u002Fp\u003E\u003Cp\u003E因为Jeff Dean已经明确，随着AI技术不断开拓和落地，也随着用户隐私问题更加迫切，谷歌正在寻求\u003Cstrong\u003E联邦学习\u003C\u002Fstrong\u003E方面的突破。\u003C\u002Fp\u003E\u003Cp\u003E所谓联邦学习，简而言之就是本地化训练和学习AI模型，对于小数据学习的要求非常高，但这样也能最大化保证用户的隐私安全——毕竟数据不用离开终端。\u003C\u002Fp\u003E\u003Cp\u003EJulie也多次谈到AI应用开发中的数据挑战。\u003C\u002Fp\u003E\u003Cp\u003E她之前参与了一项濒危生物识别和保护的产品打造。通过收集濒危物种座头鲸的叫声，运用TensorFlow打造出这样一款特殊的语音识别应用，帮助动物保护组织更好发现和保护濒危的座头鲸。\u003C\u002Fp\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp9.pstatp.com\u002Flarge\u002Fpgc-image\u002F8965025a6eaa48969fb170cab1551759\" img_width=\"1080\" img_height=\"625\" alt=\"谷歌的AI应用开发之道\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cp\u003E最近则在难度上再升级，专门为语言障碍患者打造语音识别模型，取名\u003Cstrong\u003EEuphonia\u003C\u002Fstrong\u003E。\u003C\u002Fp\u003E\u003Cp\u003E与常见的语音识别不同，Euphonia的要求是解决“口齿不清”、“发音不准”，或者“语速极慢”等场景问题，并且最后准确识别和转录。\u003C\u002Fp\u003E\u003Cp\u003EEuphonia还加入了视觉识别模块，能够识别手势、眨眼等沟通方式，让诸多残障、患病或老年用户实现更顺畅交流。\u003C\u002Fp\u003E\u003Cp\u003EJulie说，类似AI应用开发过程中，数据样本非常重要，一方面数据本身很特别，另一方面还要考虑到这类人群的隐私需求。\u003C\u002Fp\u003E\u003Cp\u003E所以目前针对特殊群体的应用，他们更倾向于与公共组织合作，比如现在于加拿大、美国的公共卫生部门，都有展开合作。\u003C\u002Fp\u003E\u003Cp\u003E这也是她们AI落地的立项标准之一，首先是能让更多人享受AI福祉，其次是该领域的数据情况，以及是否有靠谱的合作方。\u003C\u002Fp\u003E\u003Cp\u003E而一旦项目启动，她们就会进一步沿着本地化、无网络化和个性化方向展开。\u003C\u002Fp\u003E\u003Cp\u003EJulie还说，目前AI产品训练还非常依赖云端，这也是她们需要解决的挑战之一，但完全本地化的AI模型训练，还给不出时间表。\u003C\u002Fp\u003E\u003Cp\u003E最后，Julie还分享了谷歌AI推进的另一大“法宝”：产学研紧密合作。\u003C\u002Fp\u003E\u003Cp\u003E她们的核心目标是把AI技术转换为产品，但一人一个团队和一家公司都能力有限，所以她们也乐于把最新研究进展向研究机构开放，等进一步成熟，则通过TensorFlow向工业界开源。\u003C\u002Fp\u003E\u003Cp\u003E开放和开源也会带来意想不到的收获，因为现实中AI可以优化、解决的问题，难以提前预料和枚举。\u003C\u002Fp\u003E\u003Cp\u003E所以谷歌AI团队也很谦虚，认为自己的工作，只是用某项技术\\方法抛装引玉，他们相信高手在民间，提供工具给高手，能让世界更美好。\u003C\u002Fp\u003E\u003Cp\u003E这大概也是谷歌理想主义旗帜始终飘扬的原因吧。\u003C\u002Fp\u003E\u003Cp\u003E在谷歌AI的全部交流中，谈论最多的是“如何让技术工具更好用”、“如何对社会有益”，“如何让世界\\地球更好”……\u003C\u002Fp\u003E\u003Cp\u003E没有一次，谷歌AIer谈论的话题里包含商业化、股价、市值和营收，一次也没有。\u003C\u002Fp\u003E\u003Cp\u003E于是所见所闻如斯，让人感慨，有时也让人隐隐担忧。\u003C\u002Fp\u003E\u003Cp\u003E但20岁的谷歌，创立以来依然在用最开始的方式证明自己，也激励更多创新者。\u003C\u002Fp\u003E\u003Cp\u003E就算是商业公司的战略抉择，或许也没有Right way和Easy way之分。正确的路，就是最简单的路。\u003C\u002Fp\u003E\u003Cp\u003E— 完 —\u003C\u002Fp\u003E\u003Cp\u003E诚挚招聘\u003C\u002Fp\u003E\u003Cp\u003E量子位正在招募编辑\u002F记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。\u003C\u002Fp\u003E\u003Cp\u003E量子位 QbitAI · 头条号签约作者\u003C\u002Fp\u003E\u003Cp\u003Eվ'ᴗ' ի 追踪AI技术和产品新动态\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E"'.slice(6, -6), groupId: '6718151019873698308

谷歌的AI应用开发之道

热门新闻

周热门

谷歌的AI应用开发之道

特斯拉今年或花费30亿到40亿美元 购买英伟达产品

加拿大贸易数据显示第二季度国内需求疲软

加拿大率先出手降息！“疯狂6月”要来了？

国脉文化(600640.SH)：暂未涉及人工智能旅游线上业务

英伟达飙涨或未结束！美银：能再涨24%，未来将主导计算市场

人工智能：对成人娱乐AI产品的担忧加剧

台积电拟对英伟达涨价 大摩称其他客户或也将跟进

苹果与 OpenAI 阿尔特曼合作，在 AI 领域迎头赶上

Siri联合创始人：苹果与OpenAI合作可能只是权宜之计

密度业内最高 美光出样全新GDDR7显存：能效提升50%

交银国际：科技行业下半年AI主题或将继续 半导体或持续分化

FTC盯上微软！交易疑似绕开反垄断审查

Salesforce拟在伦敦开设新的人工智能中心

中国电信刘志勇：将加快5G-A技术演进和商用落地

谷歌Pixel 9系列核心硬件曝光：搭载Tensor G4芯片 能效提升40%

热门新闻

周热门

特斯拉今年或花费30亿到40亿美元购买英伟达产品

台积电拟对英伟达涨价大摩称其他客户或也将跟进

密度业内最高美光出样全新GDDR7显存：能效提升50%

交银国际：科技行业下半年AI主题或将继续半导体或持续分化

谷歌Pixel 9系列核心硬件曝光：搭载Tensor G4芯片能效提升40%