機器之心報道

現在看來,拼第一槍,微軟贏了。

如今的谷歌,有點秦失其鹿的味道。

在微軟更新 ChatGPT 加持的必應搜索之後,大家都極爲關注谷歌 Bard 的首秀。怎知近日曝出的 Demo 大翻車,導致股票一夜之間暴跌 7000 億人民幣。而看微軟那邊,風景獨好。

前後腳發佈新一代 AI 搜索,人們的期待卻完全反過來,不知重新來過谷歌會不會還搶跑。

昨晚,谷歌舉行了‘Google presents : Live from Paris’大會。大家都在期待 Bard 的首秀,結果卻令觀衆大失所望。基本沒有多少 Bard 的展示內容。

在展示增強現實搜索功能時,演講人還把演示 Demo 的手機弄丟了,引來人們尷尬而不失禮貌的笑。不過谷歌在活動中仍然通過全面的多模態搜索能力展現了自己的實力。

圖:昨晚令人失望的發佈會

但發佈會過後,人們回過味來:我們現在要的是 ChatGPT 搜索。Bard 是現在在科技界爆紅、給谷歌搜索帶來巨大威脅的 ChatGPT 的競品,備受期待的 Bard 卻出師不利。

也許,這也是谷歌股價今天暴跌的主要原因。

谷歌 Bard 首秀 Demo 翻車

谷歌在廣告中表示,Bard 是一項實驗性對話式 AI 服務,由 LaMDA 模型提供支持。Bard 使用谷歌的大型語言模型構建,並利用網絡信息獲得知識,因爲模型體量相對較小,所以需要的算力更小,這意味着能夠服務更多的人。谷歌將其聊天機器人描述爲‘好奇心的發射臺’,有助於簡化複雜的話題。

但 AI 回答問題也要有準確性,谷歌 Bard 翻車在哪裏?僅僅是一個事實錯誤。

谷歌 Demo 的一 GIF 顯示,在回答問題‘關於詹姆斯韋伯太空望遠鏡(JWST)有哪些新發現,我可以告訴我 9 歲孩子哪些內容?’Bard 提供了三個要點,其中一個指出‘該望遠鏡拍攝了太陽系外行星的第一張照片。’

這就是 Bard 的首秀,包含一個事實錯誤。

然而,推特上的一些天文學家指出這是不正確的,第一張系外行星圖像是在 2004 年拍攝的。

天體物理學家 Grant Tremblay 在推特上寫道:‘我相信 Bard 的表現會令人印象深刻,但鄭重聲明:JWST 並沒有拍下我們太陽系外行星的第一張圖片。’

加州大學聖克魯茲分校天文臺主任 Bruce Macintosh 也指出了這個錯誤。‘作爲一個在 JWST 發射前 14 年拍攝系外行星的人,感覺你應該找到一個更好的例子?’

在跟進的推文中,Tremblay 補充說:‘我非常喜歡並感謝地球上最強大的公司之一正在使用 JWST 搜索來宣傳他們的大語言模型。非常棒!但是 ChatGPT 這些模型雖然令人印象深刻,但經常出錯,還非常自信。看到大模型進行自我錯誤檢查的未來將會很有趣。’

正如 Tremblay 所指出的,ChatGPT 和 Bard 等 AI 聊天機器人的一個主要問題是它們會一本正經的胡說八道。這些系統經常‘產生幻覺’—— 即編造信息 —— 因爲它們本質上是自動生成系統。

當前的 AI 不是查詢已證實事實的數據庫來回答問題,而是接受大量文本語料庫的訓練並分析模式,以推定任何給定句子中的下一個單詞出現的概率。換句話說,它們是統計性的,而不是確定性的 —— 這一特徵導致一些 AI 學者將它們稱爲‘廢話生成器’。

當然,互聯網上已經充斥着虛假和誤導性信息,但微軟和谷歌希望將這些工具用作搜索引擎,這可能會使問題更加複雜。在搜索引擎上,聊天機器人的回答幾乎會被認爲是全知機器的權威答案。

微軟昨天演示了全新人工智能必應搜索引擎,試圖通過用戶條款免責來規避這些問題。‘必應由 AI 提供支持,因此可能會出現意外和錯誤,’該公司的免責聲明稱。‘確保檢查事實並分享反饋,以便我們學習和改進。’

谷歌發言人告訴媒體:‘這凸顯了嚴格測試過程的重要性,我們本週將通過 Trusted Tester 計劃啓動這一過程。我們會將外部反饋與我們自己的內部測試相結合,以確保 Bard 的回應符合現實世界信息的質量、安全性和接地性的高標準。’

親身體驗微軟新必應:升級 ChatGPT 的第一步

那邊谷歌 Bard 首秀翻車,這邊有人給出了微軟新必應 AI 功能的詳細使用報告。ChatGPT 驅動的新版本必應能夠生成搞笑的辭職信、當下新聞事件以及錯誤的信息。那麼它的搜索功能和效果到底怎樣呢?

昨日, The Verge 花了幾個小時在微軟的 Edge 瀏覽器中使用這個新版本必應和其他 AI 功能,並感覺到了對 ChatGPT 的重大升級。

體驗者問 Edge 全新‘撰寫’功能的第一個問題:用幽默詼諧的語氣向老闆寫一封辭職信,原因是他覺得自己的工作正在被 AI 取代。結果顯示,該功能生成的辭職信令人印象深刻,而且真的很有趣:

Subject: I quit!

Dear Boss,

I regret to inform you that I am resigning from my position as a data analyst, effective immediately. The reason is simple: Al is replacing my job.

Yes, I know you told me that Al is just a tool to help me work taster and smarter, but I don’t buy it. I’ve seen the way you look at that shiny new machine in the corner, with its blinking lights and soothing voice. 

I’ve heard the rumors that it can do everything I can do, but better, cheaper, and without complaining. I’ve felt the cold shoulder you’ve given me ever since you installed it.

So, I’ve decided to save you the trouble of firing me and just quit. I don’t want to compete with a machine that can crunch numbers, generate reports, and make witty jokes at the same time. 

I don’t want to work for a boss who values Al over human intelligence and creativity. I don’t want to be part of a company that is willing to sacrifice its employees for the sake of efficiency and profit.

I’m sure you’ll be very happy with your new Al assistant. I hope it doesn’t turn against you and take over the world. 

I hope it doesn’t make any mistakes that cost you your reputation and customers. I hope it doesn’t get bored and start playing games with your data. I hope it doesn’t develop a personality and fall in love with you.

But if it does, don’t come crying to me. I’ll be too busy enjoying my life, pursuing my passions, and finding a new job that appreciates me for who I am.

Goodbye and good luck,

Your former data analyst

體驗者在 ChatGPT 中嘗試過同樣的詢問,但它從未創建過像這樣有趣和活潑的答案。然而一封有趣的辭職信並不會從根本上將微軟的 AI 功能與 ChatGPT 區分開來,但微軟 AI 模型的工作方式與 ChatGPT 存在一些更大的差異。

首先,微軟正在將實時新聞輸入其聊天版必應,讓你可以詢問剛剛發生或正在發生的事件。體驗者問它‘微軟在 Bing AI 活動期間宣佈了什麼?’,它根據涵蓋微軟 AI 驅動的必應相關公告的多份資料創作了一份新聞摘要。那僅僅是在微軟正式宣佈這一消息幾分鐘後。

但與 ChatGPT 非常相似,新必應並不總是準確。當必應出現問題時,旁邊會有一個‘dislike’按鈕,這個按鈕會將有關查詢的反饋和答案發送給微軟。

微軟還將聊天答案與必應中的傳統搜索結果一起顯示出來,並通過常用鏈接找到答案。必應和 ChatGPT 之間的最大區別在於微軟將這些聊天機器人的功能集成到其 Edge 瀏覽器中。Edge 現在有一個側邊欄,可以掃描整個網頁並允許你挑選信息或對網站運行聊天查詢。

在這個新的側邊欄中甚至還有一個組合選項卡,可以讓輸入參數變得更容易一些。這一選項卡爲用戶提供快速選項來指定語氣、格式和長度。你可以要求微軟 AI 模型在這裏寫任何東西,它可以直接被用於博客文章、電子郵件或簡單的列表。

你可以想象未來 Word 或 Outlook 有類似的集成來讓你創建文檔或電子郵件。從技術上講,現在只需在這個新的 Edge 邊欄旁加載基於 Web 的 Word 版本,就可以做到這一點。 

微軟表示,全新 AI 加持的必應應該比 ChatGPT 更擅長編寫代碼,很快就會有開發人員測試必應的編程能力。

當然,就像人們試圖找到 ChatGPT 的缺陷一樣,一定會有成千上萬的人想要破解新的必應。微軟表示他們有一些額外的保護措施來避免這種情況。

無論如何,微軟都非常大膽地在自己的搜索引擎中向公衆開放類似於 ChatGPT 的 AI 助手功能。微軟的目標顯然是搶走谷歌在搜索引擎領域的一部分市場份額,讓必應更強大,每個人都在等着看谷歌如何回應。

谷歌雖然推出了對標 ChatGPT 的 Bard,但從這兩天業界和機器學習社區的反應看,谷歌似乎不敵微軟。現在,谷歌又在自己 Bard 首秀的演示視頻中翻車了。

微軟認爲他們正在掀起搜索引擎的新一輪變革,而谷歌處於被動狀態。微軟能否撼動谷歌在搜索引擎領域的霸主地位,仍未可知。

相關文章