最近AI領域最爲爆炸的新聞,當屬OpenAI的最強競爭對手Anthropic推出Claude 3系列模型,新一代Claude 3模型擁有更快的響應性能、完整的視覺功能、以及更少的幻覺現象,並在基準測試上樹立了新的標準,性能超越了包括GPT-4在內的其他模型,可謂是徹底把GPT-4拉下了神壇。

值得一提的是,此次推出的Claude3共有三個模型,包括超大杯Claude 3 Opus、大杯Claude 3 Sonnet和中杯Claude 3 Haiku,三個模型均提供200k長度的上下文,並針對不同的用例進行了優化。

具體來說,超大杯Claude 3 Opus是三個模型中最爲先進且最爲強大的大模型,具有深度推理、高級數學和編碼能力,在高度複雜的任務上具有頂級性能。它可以非常流暢地導航開放式提示和新穎場景,包括任務自動化、假設生成以及圖表、圖形和預測的分析;大杯Claude 3 Sonnet在智能和速度之間實現了平衡,適用於絕大多數工作負載,速度比Claude 2和Claude 2.1快2倍,且智能水平更高。它擅長執行需要快速響應的智能任務,例如知識檢索或銷售自動化;中杯Claude 3 Haiku的優勢則在於速度和成本效益,這是一種快速緊湊的模型,具有近乎即時的響應能力。

基準性能方面,用Anthropic的話來說,Claude 3系列模型在推理、數學、編碼、多語言理解和視覺方面,都樹立了新的行業基準,其中最爲強大的Opus在人工智能系統的大多數常見評估基準上都優於包括GPT-4在內的大模型,包括本科水平專家知識(MMLU)、研究生水平專家推理(GPQA)、基礎數學(GSM8K)等,它對複雜任務表現出了高水平的理解力和流暢性,並且在處理複雜任務時,展現了幾乎與人類相媲美的理解和表達能力,稱之爲AGI領域的領跑者也不爲過。

視覺功能方面,Claude 3的三類模型均提供了視覺功能,可以理解不同格式的結構化和非結構化數據,不僅是語言,還包括圖像、圖表、圖表等。這使得企業能夠構建集成不同多媒體源並解決真正跨領域問題的生成式人工智能應用程序。例如,製藥公司可以查詢藥物研究論文以及蛋白質結構圖,以加速發現;媒體組織可以自動生成圖像標題或視頻腳本等等。

安全性方面,Claude 3系列依然貫徹了Anthropic“以更負責任的方式推進生成式AI”的初心,爲此Anthropic還專門組建了多個團隊,致力於從虛假信息、生物安全濫用、選舉干預等方面降低風險,並努力增強模型的安全性的透明度,同時減少隱私問題。具體來說,Claude 3模型通過憲法AI技術減輕幻覺現象,這些技術提供了對模型推理過程的透明度,並且提高了準確性。Claude 3 Opus在困難的開放式問題上比Claude 2.1顯示出2倍的預估準確性增益,降低了錯誤響應的可能性。隨着企業客戶依賴Claude跨越醫療、金融和法律研究等行業,減少幻覺現象對於安全性和性能至關重要。Claude 3家族爲可靠的生成式AI輸出樹立了新標準。

截至目前,Opus和Sonnet已經可以在claude.ai以及覆蓋159個國家的Claude API上使用了,Haiku也將很快推出。此外Claude 3 Sonnet已經可以通過Amazon Bedrock使用,Claude 3 Opus和Claude 3 Haiku也將很快在Amazon Bedrock推出。

爲什麼Amazon Bedrock成爲了率先支持Claude 3 Sonnet的託管服務?答案很簡單,亞馬遜雲科技不僅是Anthropic的雲服務提供商,二者在生成式AI方面的合作也十分緊密,如亞馬遜雲科技數據和AI副總裁Swami Sivasubramanian博士在最近的博客文章中所說的那樣,“回顧2021年,當Anthropic第一次開始在亞馬遜雲科技上構建時,沒有人能想到Claude系列模型會帶來多大的變革。自Amazon Bedrock於2023年9月28日全面上線以來的短短几個月內,已有超過10000名客戶使用它,其中許多客戶正在使用Claude。今天,下一代Claude——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku將登陸Amazon Bedrock,這是一個令人興奮的里程碑事件。”

作爲亞馬遜雲科技推出的全託管式生成式AI服務,Amazon Bedrock堪稱利用大模型構建和擴展生成式人工智能應用的最簡單方法。開發人員無需管理任何的基礎設施和配置,即可以雲原生的方式快速進行生成式AI應用的開發。各行各業的客戶已經在使用Amazon Bedrock重塑他們的用戶體驗、產品和流程,並將人工智能帶入他們的業務核心。這些都得益於Amazon Bedrock提供的獨特優勢,包括推出的模型評估功能能夠幫助客戶識別、比較和選擇最適合的模型;知識庫功能能夠簡化生成式AI應用構建並利用專有數據提供基於最新內容的定製化響應;模型調優功能支持對更多先進模型進行調優;代理功能可支持生成式AI應用在確保安全和隱私保護的情況下執行多步驟業務指令;Guardrails功能可更好地幫助實現負責任AI等等。

因此,在Claude 3 Sonnet登陸Amazon Bedrock後,企業能夠根據其業務和場景的特定需求,輕鬆使用Anthropic的最新模型進行構建。這不僅包括自然語言模型,還包括擴展的多模式人工智能模型,能夠跨文本、圖像、圖表等進行高級推理。

亞馬遜雲科技一直認爲沒有一種模型可以滿足所有需求,因此Amazon Bedrock與全球領先的大模型供應商合作,爲用戶提供領先大模型選擇,這也成爲了亞馬遜雲科技與大模型全球頂級玩家的差異化優勢。截至目前,Amazon Bedrock的大模型供應商共有AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI七家。其中Mistral AI的兩種高性能模型Mistral 7B和Mixtral 8x7B也已經在Amazon Bedrock正式可用,前者是Mistral AI推出的首個基礎模型,支持英語文本生成任務並具備自然編碼能力。而後者則採用當下備受關注的MoE(優質稀疏專家混合)技術,功能比Mixtral 7B更強大,可支持英語、法語、德語、西班牙語和意大利語文本生成任務並具備自然編碼能力,非常適用於文本摘要、問題解答、文本分類、文本完善和代碼補全等使用案例。

現如今,以人工智能爲代表的新一輪科技浪潮正在引領整個社會走向第四次工業革命,特別是生成式AI的火熱,正在爲各行各業帶來全面的重塑,創造更多的價值。不過對具體的企業來說,自身在生成式AI方面的需求實際上是隨着業務場景和行業屬性而變化的,所謂一個模型走天下的情況在現實世界幾乎不可能存在。模型選的太複雜,可能會大材小用,選擇能力不足的模型,則會白白浪費企業的成本投入。Amazon Bedrock本身就解決了相當一部分模型選擇的問題,而此次Claude 3 Sonnet的加入,無疑又爲那些想要通過基礎模型構建生成式AI應用程序的企業帶來了更多選擇。

相關文章