新浪科技 郑峻发自美国硅谷

回来了,都回来了。疫情一页已经翻过,科技大厂的年度大会今年全面回归线下。继两周之前谷歌总部举办I/O开发者大会之后,微软Build开发者大会今天也在总部西雅图开幕。两周之后,苹果WWDC开发者大会也将在硅谷总部召开。

实际上,去年苹果WWDC就已经部分恢复线下举办,但今年的Build大会则是自2019年之后首次回归线下举办。此前两年在线收看主题演讲之后,今年微软生态平台的开发者可以再次回到西雅图,近距离聆听微软高管,并与技术专家交流。当然,门票价格也高达1525美元。

两周前的谷歌I/O大会,生成式AI成为了绝对主题。而以往的主角Android直到80分钟之后才姗姗来迟,而且是简要带过。两个小时的主题演讲,谷歌高管一共说了140多次AI。虽然谷歌只提到一次OpenAI,但所有人都清楚,今年I/O大会的最大目的就是证明谷歌依然拥有强大竞争力,可以应对ChatGPT和微软带来的冲击力。

今年的I/O已经成为了谷歌的AI汇报展示。谷歌连续发布了15款功能覆盖诸多领域的AI产品,其中最为重要的就是新的语言训练模型PaLM 2以及基于新模型提升功能的生成式AI Bard。谷歌以此对旗下几乎所有产品进行了AI体验改造:从搜索到地图到邮件到办公组件,诸如此类不胜枚举。

而今天的微软Build大会,AI同样也成为唯一焦点。微软CEO纳德拉一登台就高度聚焦AI,宣布为开发者带来50多项更新。今天发布的所有新品,都贯穿着明白无误的战略:微软正全力以赴推进自家AI,并将ChatGPT与自家产品全面打通,强化自己在生产力领域的优势,并在搜索领域对谷歌施加更大的压力。

今天微软Build大会宣布了哪些重大产品和更新?

打通ChatGPT插件

今天最重要的消息是微软宣布采用与OpenAI相同的开放插件Plugin标准,打通了ChatGPT和微软两个平台之间的互通与相互操作,实现了产品与服务的互通。未来开发者的插件都可以同时支持ChatGPT和微软的产品与服务。

这意味着微软庞大的开发者群体在Azure OpenAI企业服务上开发的AI程序,也支持同样的开发插件标准。开发者可以选择人类自然语言交互,作为其软件的互动方式。换句话说,他们的软件和应用都能得到生成式AI的体验。

而插件则是AI应用开发的关键一环,开发者需要通过API接口接入其他软件服务的实时信息与业务数据。插件能给AI带来新的计算能力。

在微软与OpenAI打通标准之后,开发者可通过“插件”将应用和服务接入Microsoft 365 Copilot。首批支持的插件包括ChatGPT、Teams信息扩展、Power Platform连接器等,开发者可以直接接入现有服务,也可使用Visual Studio Code和Visual Studio上的Microsoft Teams Toolkit开发工具,轻松开发新的Microsoft 365 Copilot插件。

开发者还可以将数据导入Microsoft Graph,通过近期发布的Semantic Index for Copilot语义索引功能构建关联性与行动信息,从而进一步拓展Microsoft 365 Copilot的功能。公测期间将首先提供超过50个来自Atlassian、AdobeServiceNow、Thomson Reuters、Moveworks、Mural等合作伙伴的插件,在Microsoft 365 Copilot正式发布时,将有数千个插件可供选择。

Windows 11加入AI助手

对消费用户来说,今天Build发布的最重要产品则是Windows 11引入生成式AI助手Windows Copilot。与此前的智能语音助手Cortana相比,Copilot不仅智能程度高出了一个级别,系统权限也得到了显著提升。

Copilot是微软今年发布的战略产品,又被翻译为“智能副驾”。微软和OpenAI深入合作,在Microsoft 365、Dynamics 365以及Power Platform等产品上推出了AI助手Copilot,这是基于大语言模型进行训练的,基于自然语言理解和生成的人机交互体验。

Windows 11的任务栏将接入Copliot图标。用户点击图标就会在屏幕右侧出现Copilot对话框,对当前正在使用的应用和网页内容进行分析解释归纳。当然,这个助手也可以完成用户的诸多指令,包括网络搜索订票等服务。

Windows Copilot目前还在测试阶段。微软计划6月开始正式公测,逐步推广给所有的Windows 11用户。目前Windows 10和11的全球月活设备超过了14亿部。

除了Copilot这一重大更新之外,Windows 11还加入10种新语言与方言的实时字幕支持,并且可以实时进行音频听抄处理。自然语言处理本身就是微软的技术强项。此外,Windows 11还支持了低功耗蓝牙技术Bluetooth lE,享受高品质音频的同时降低功耗。

首个AI支持浏览器

除了在Windows 11加入Copilot之外,微软还在Edge浏览器引入了365 Copilot功能。这是首个原生支持AI的浏览器。Edge浏览器的侧边栏会出现Copilot工具图标,对用户正在浏览的网页内容进行分析,帮助用户生成Word、Excel等Windows 365文档,或用于撰写Outlook邮件。

Edge for Business 商用浏览器支持更多企业管理、安全、隐私和生产力功能,以更好地满足混合办公的需求,面向托管设备的版本现已开启预览,非托管版本将在未来几个月内推出。此外,支持多用户协同工作的 Edge Workspaces 也将在几个月内结束预览,推出正式商用版本。

Statcounter的统计数据显示,今年4月Chrome浏览器的市场份额高达66%,而苹果Safari和微软Edge浏览器则以11%的市场份额并列二三位。微软希望与ChatGpt携手,将生成式AI带入Edge浏览器可以帮助Edge缩小与Chrome的差距,给谷歌带来真正的冲击。

Windows应用商店也迎来了AI体验升级,加入AI生成的用户评价总结。除了传统的用户评分之外,应用展示拦还会出现AI根据用户评价生成的概要。不过,微软并没有透露AI是否会过滤一些人为差评。

终端应用程序Windows Terminal也加入生成式AI功能,这是通过GitHub Copilot实现的。开发者使用GitHub Copilot就可以在Terminal上使用聊天机器人,要求AI推荐代码或者解释错误。微软还表示,WinDBG等其他开发工具也会通过GitHub Copilot加入AI聊天机器人。Windows Terminal是微软在2019年发布的虚拟终端应用程序,用户可以在Windows应用商店下载安装,或者通过Github下载代码自行安装。这一工具实现了PowerShell、CMD以及WSL三大环境的统一。

必应为ChatGPT联网

这是所有人意料之中的事情,微软今天正式宣布必应成为ChatGPT的默认搜索引擎。原本ChatGPT的训练数据就是由微软支持并在Azure云平台上进行的,但此前的训练数据只截止到2021年9月,这也是此前谷歌Bard相对于ChatGPt的最大优势。

从今天开始,ChatGPT Plus的用户会在生成式AI的回复过程中看到标明来自必应搜索引擎提供的内容。换句话说,ChatGPT已经实现了联网,可以提供实时和最新的内容。这是ChatGPT产品的一重大里程碑。

此外,必应还向更多的企业合作伙伴推出了插件支持。除了此前宣布的订餐平台OpenTable和专业搜索引擎WolframAlpha,今天新宣布的合作企业还有出行服务平台Expedia和TripAdvisor、外卖平台Instacart、地产交易平台Redfin和Zillow、信息提供商汤森路透等等。

在体验展示过程中,用户在必应中可以使用OpenTable的插件询问周边的餐馆信息,并让AI机器人为自己订桌。值得一提的是,必应移动端也会加入此类功能,这意味着iOS和Android用户也可以在必应应用体验到插件支持。

显然,微软正试图将越来越多的网络用户拉入自己的AI支持搜索阵营,以此与谷歌展开竞争。与服务无所不包的谷歌相比,微软最大的竞争优势是他们和这些垂直服务平台并没有直接竞争关系,因此这些商家也不需要担心微软偏向自己的服务。

更多AI开发工具

基于微软与OpenAI的深入合作,Azure OpenAI企业服务将ChatGPT、GPT-4等大模型以及Azure的企业服务整合在一起。目前已经有4500多家企业用户采用Azure OpenAI企业服务。微软今天也在Build大会上宣布了诸多新的AI开发工具,帮助开发者基于微软和OpenAI的服务开发自己的AI加持应用。

全新发布的Azure AI Studio,其能帮助开发者更便捷地将外部数据源整合到Azure OpenAI服务中,从而训练出基于自有数据的对话模型。新发布预览的Azure AI Content Safety能帮助开发者构建更安全的线上环境和社区,其内置模型能检测出文本或者图片中的不当内容,并通知人工监督员采取行动。这项原本用于GitHub Copilot等微软服务的功能,将内置于Azure OpenAI企业版服务开放给第三方开发者,从而以负责任的方式生成智能内容。

微软还发布了全新Azure Machine Learning工具,其中包括Responsible AI dashboard support for text and image data。在公众预览版中,该功能能够让开发者在构建、训练或评估模型阶段,评估使用非结构化数据来构建的大模型。这将有助于开发者在部署模型之前发现模型错误、公平性问题以及模型解释,从而实现更具公平性的高性能计算机视觉和自然语言处理 (NLP) 模型。

Azure Machine Learning prompt flow,让开发者可以借助如Semantic Kernel这样热门的开源提示词编排解决方案,高效构建提示词。在即将推出的预览版中,prompt flow为开发者提供了更加简便易用的提示、评估和调整大模型的方式。开发者能够快速创建连接到各种语言模型和数据源的提示工作流,并通过真实性等方式评估工作流质量,从而根据实际情况为其选择最佳的提示。

Prompt flow同时还集成了Azure AI Content Safety,帮助开发者检测并删除其工作流中有害的内容。此外,微软还宣布将在未来几个月内,在Microsoft Designer 和 Bing Image Creator中增加全新媒体来源功能。该技术使用加密方法对 AI 生成的内容进行标记和签名,其中包含有关其来源的元数据,从而帮助开发者验证图像或视频是否由 AI 生成。

微软OpenAI双赢组合

毫无疑问,与OpenAI深入合作是微软AI战略的核心,也是今天Build大会的主题。无论是打通与OpenAI的补丁边界,引入更多开发者开发拥有生成式AI体验加持的产品,还是将基于ChatGPT的Copilot AI助手引入自己旗下的诸多产品,都体现着两家公司密切不可分的战略合作。

投资OpenAI是微软CEO纳德拉最成功的投资,没有之一。微软不仅牢牢地将OpenAI绑定在自己的云服务平台,而且将ChatGPT与自己的AI产品结合,对旗下几乎所有产品进行AI体验改造,还迎来了弯道赶超谷歌的希望。

微软是OpenAI的最重要的战略股东。没有微软投资的几十亿美元和计算资源支持,OpenAI就不可能在过去几年加速AI落地商用,比谷歌更快推出更为智能的生成式AI产品,成长为一家估值300亿美元的AI新贵。ChatGPT去年年底的公测不仅改变了AI行业格局,也给原先的行业领先者谷歌施加了巨大的压力。

尽管马斯克在OpenAI创办过程中起到了关键的牵头作用,为这个开源非盈利研究机构吸引了足够的曝光度和人才吸引力,甚至OpenAI的名字也是他取的,但他对OpenAI的影响力也只限于前两年。从2018年开始,OpenAI的研发进展就和马斯克没有任何关系,马斯克以利益冲突为由彻底退出了OpenAI董事会。

当时的OpenAI只是一个非盈利开源技术组织,资金依赖诸多超级富豪和企业巨头的捐助,而AI领域的研发训练和人才招聘都需要巨额资金投入。如果不进行商业化重组引入战略投资,OpenAI根本无力和谷歌、Meta这样的企业巨头竞争。

2019年初,OpenAI重组成为有限盈利机构,开始引入战略投资。微软几乎是第一时间进入,宣布投资10亿美元,并且将OpenAI的AI训练引入自己的云服务平台。此后四年时间,微软累计三次向OpenAI投入数十亿美元。过去几年,OpenAI几乎所有的产品训练研发都是在微软的云平台上实现。

看到OpenAI与微软密不可分之后,马斯克成为了OpenAI最主要的批评者,连续抨击OpenAI已经被微软掌控,从一个开源非盈利机构沦为追逐利润的企业。但他的说法也遭到OpenAI CEO艾特曼和微软CEO纳德拉的公开反驳。

OpenAI在重组过程中设置了复杂的混合结构,包括非盈利的母公司OpenAI Inch和有限盈利子公司OpenAI LP。尽管微软向有限盈利子公司投资了几十亿美元,但他们并没有母公司OpenAI Inc的董事会席位,无法控制OpenAI的决策。而且ChatGPT并不是微软独享,也向其他诸多企业开放。

相关文章