從商業化的角度考量,由於訓練數據的不同、算法的不同、法律規範的不同等原因,國內再去做ChatGPT一樣的產品是比較難的,但垂直類的行業大模型方面,卻有着更多發散性的機會。此前,業內就曾預計,未來通用大模型最終只會留存2-3家,但是垂類大模型會百花齊放,豐富的行業場景纔是ChatGPT最大的看點。目前,多家教育公司紛紛發佈了最新的教育類大模型產品,而教育成爲AI落地最快的場景之一。我們認爲,教育的行業大模型有三大看點:

1、 “教育是ChatGPT最容易落地的領域”一語成讖。

2、 在教育行業搶跑大模型的同時,我們也發現了一個新問題:那就是企業涉足大模型業務,到底是採用自研先行一步,還是等成熟後打通接口進行外採?從這國內第一波“百模大戰”來看,大廠們基本上都選擇了自研的路徑。

3、 ChatGPT風口之下,教育科技存在無限可能。

今天,2023年全國高考正式拉開大幕。而國內大模型的這場“高考備戰”,逐漸進入到了“垂類競逐”,教育行業已然搶跑。

近一個月來,網易有道、學而思、科大訊飛先後發佈了最新的教育類大模型產品。其中有道是基於“子曰”大模型開發的AI口語老師,學而思官宣數學大模型MathGPT的研發,而科大訊飛是基於星火認知大模型推出的AI學習機。最新的消息顯示,猿輔導以推出智能硬件——小猿學練機的方式涉足大模型,而作業幫也正在內測基於中國市場的教育大模型,涉及工具類App、智能硬件、圖書等業務。

正如OpenAI聯合創始人山姆·阿爾特曼曾表示,在ChatGPT支持下,會誕生極好的文案業務、教育服務或者其它公司。今天高考命題作文發佈之後,就有不少人嘗試用AI來寫高考作文。

那麼,在這場百模大戰的“高考衝刺”中,教育類企業率先交卷的背後,又有哪些看點?

01 看點一:“教育是ChatGPT最容易落地的領域”一語成讖

自ChatGPT發佈以來,AI大模型領域熱度持續。今年來,國內各大互聯網、人工智能公司甚至學界都接連宣佈進軍大模型領域。目前,百度、阿里巴巴、商湯科技等公司已相繼發佈了自己的大模型以及應用場景,但不論是百度的“文心一言”、阿里的“通義千問”、商湯的“商量”,還是復旦大學研發的大模型moss,這些都屬於對話式的通用大模型產品,截至目前都還未開放使用。

相比於通用大模型的高舉高打,一些垂類大模型則選擇小步快跑、加速落地,比如“教育是ChatGPT最容易落地的領域”就成爲年初以來熱議的話題。今年2月,網易有道、科大訊飛、學而思以及作業幫等一衆教育類公司均透露了ChatGPT相關的產品及技術佈局,而最近,這些公司也公佈了最新的研發進度和成果。

據媒體報道,5月5日,網易有道展示了基於“子曰”大模型研發的AI口語老師視頻,AI口語老師能提供多種練習場景,同時會根據用戶需求扮演多種角色,進而引導用戶進行多輪對話。隨後的5月6日,科大訊飛發佈訊飛星火大模型,並會落地在教育類智能硬件AI學習機等產品中。另外,學而思也宣佈自研數學大模型名爲MathGPT,作業幫則傳出正在內測基於中國市場的教育大模型,包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景。

當前“百模大戰”激戰正酣,並且掀起新一輪創業融資熱潮的同時,爲什麼此次教育行業統一搶跑呢?來咖智庫認爲主要有三點:

其一、從教育的目的來看,教育本身是人類獲取和學習知識的重要方式,而技術的進步能夠大大提升這種學習的效率。教育領域需要大量的知識儲備和傳遞,而ChatGPT作爲一個人工智能模型,可以快速地處理和整合這些信息,同時通過大量數據的訓練和學習,積累大量的知識和語言表達能力,最終實現對外的輸出。

這就像我們獲取知識方式的升級迭代。早期1.0階段,我們主要是通過閱讀和教師的講授,而2.0的互聯網階段,帶我們進入了信息爆炸的時代,現在以ChatGPT爲代表的3.0橫空出世,讓信息和知識的獲取更高效。從被動灌輸到主動獲取,再到精準互動,ChatGPT在教育領域的有着更實際的剛需。

其二、從教育的特點來看,教育本身具有很強的交互性,需要在這個過程中完成傳道、授業和解惑。ChatGPT可以提供更加自然的交流體驗,例如語音交互、圖像識別等,可以幫助學生更好地理解和記憶知識。比如AI口語老師,ChatGPT可以利用其自然語言處理能力和深度學習算法,分析學生的發音、語調、語速、語音流暢度等方面的問題,提供針對性的建議和訓練,幫助學生提高口語水平。而在中文作文批改上,ChatGPT也可以分析學生的作文內容、語言表達、語法結構等方面的問題,並且提出針對性的建議和指導。

基於這樣的行業屬性,ChatGPT與教育有着更強的匹配度。比如有道發佈的“AI口語老師”,從實際的發音體驗上,已經不是以往那種AI單調的機械發音,而更像是一位真實的“老師”在與學生對話,對話體驗真實有趣。當然,ChatGPT在AI口語老師和中文作文批改的應用上,其準確性和可靠性仍然還需要不斷地提高和優化。

其三、從教育的發展階段來看,隨着國內教育行業逐漸步入智能學習以及教育數字化的時代,教育類公司也需要找到新的奇點,而ChatGPT正是其中的突破口。尤其是以人工智能、大數據、5G等新一代信息技術爲驅動力,推動關鍵技術和教育場景的不斷融合及智能教育的深化發展,在線教育、AI教育、個性化教育進一步得到普及,這也是各大教育公司加大投入佈局的重要原因。

值得注意的是,在國外,ChatGPT已經開始重塑教育行業。根據國外Study.com的調查,國外已經有21%的老師開始用ChatGPT輔助教學工作了。最近美國教培上市公司Chegg也表示,在今年4月推出輔助學習平臺CheggMateAI後,已經影響到其原有業務的用戶增長,因爲學生對ChatGPT興趣大增,不再需要通過Chegg獲取相關學習資料。

02 看點二:自研先行還是外採以待?大模型的新命題

在教育行業搶跑大模型的同時,我們也發現了一個新問題:那就是企業涉足大模型業務,到底是採用自研先行一步,還是等成熟後打通接口進行外採了?

此前,就有不少網友質疑,一些公司蹭着熱點率先上線的自有大模型,其實都是基於OpenAI發佈的GPT的基礎上推出的,其自研程度存在很大的水分。有知乎網友直言:國內某團隊上線的服務似乎是直接大量使用了ChatGPT的問答數據來訓練自己的網絡,輸入問題和通過ChatGPT得到的回答高度相似。

而在外採模式上,國外的ChatGPT已經明確指向API、訂閱制和戰略合作(嵌入微軟Bing、Office等軟件)三種方式。比如在教育領域,Duolingo、Quizlet、可汗學院等產品主要和OpenAI合作,在GPT大模型上做微調和接口調用,增強原有的產品體驗。

從這國內第一波“百模大戰”來看,大廠們基本上都選擇了自研的路徑。

對於中國公司都選擇自研類ChatGPT的產品和技術這個問題,星圖比特創始人張炯曾分析表示有三個方面的原因:第一是市場端,目前ChatGPT對國內用戶是不開放的,國內的用戶沒法像海外用戶一樣隨心所欲的使用,而從市場層面必然會有一箇中國的ChatGPT出現;第二是技術端,目前市場上可見的大模型,例如ChatGPT的基礎模型GPT-3.5基本都是英語爲母語訓練的,中文基準的自然語言處理的效果還是稍遜於英語基準的,所以有個中文基準的模型出現會進一步提升用戶效果;第三是數據安全,AI的內容生成本身是基於大量數據訓練的結果,並OpenAI已經逐步從一個公益性的項目向市場化轉變,未來出於利益等因素可能存在不確定性,還有就是中國大陸要求所有的數據都是本地化保存,這點OpenAI在國內又沒有團隊,數據的本地化保存和維護就很難達到監管要求。

自研是好,但要做到卻並不容易。一般來說,通用人工智能的研發需要持續的資金與頂級人才投入,而且受限於算力、數據規格、歷史投入、頂尖人才、資金實力等方面的要求。據Business Insider估算,目前ChatGPT一個月的維護成本在300萬美元,考慮到人力成本,費用估計還要加倍。OpenAI的產品用的是微軟的Azure企業雲服務器,有投行分析員估算,一年的成本可能從2500萬美元到10億美元。與此同時,人工智能還面臨着投入週期長、產出時間慢的問題,比如OpenAI從公司成立到推出ChatGPT,其間整整花了7年時間。

而和通用型人工智能相比,基於自身在專業領域的積累,垂類人工智能或許可以跑得更快。此次的科大訊飛和有道,就在教育行業的AIGC技術自研路徑上率先落地,也印證了那句“沒有金鋼鑽,別攬瓷器活”的諺語。

比如,此前科大訊飛研究院院長劉聰就表示,訊飛基於多年來在深度學習算法、大模型技術、行業大數據、知識圖譜、多模態感知、系統工程等技術方面的深厚積累,同時依託於國家新一代人工智能開放創新平臺、認知智能全國重點實驗室、語言及語音信息處理國家工程研究中心三大國家級平臺,已具備認知智能大模型綜合研發和長期持續突破的底氣和能力。

對有道來說,同樣如此。一方面是有道已經覆蓋了從兒童到少年再到成人教育的終身學習內容,有足夠多的學習素材和用戶數據;另一方面在於有道本身在AI技術和應用的積累,比如擁有神經網絡翻譯引擎、計算機視覺、智能語音AI技術和高性能計算這四大核心技術,應用範圍覆蓋翻譯、教育、語音助理、寫作等多個領域,並且已搭載在有道詞典筆、學習機等明星產品上。

還有學而思,其是以數學課外輔導起家的,已經積累了20年的數學教學經驗,積累了龐大的數學相關數據,這些數據是進行MathGPT訓練的必備物料。還有猿輔導,早在2014年就成立了涵蓋視覺實驗室、自然語言理解實驗室、語音實驗室、音視頻實驗室和基礎支撐五個實驗室的AI研究院,這也爲其提供了足夠的技術支撐。

整體來看,自研和外採都各有優劣。對選擇自研路線的企業來說,其最大的優勢在於“量身定製”,能夠最大程度滿足和匹配自身業務的需求,但也要求企業擁有足夠強的綜合實力和積累,同時還得承擔一定的試錯成本,這不是一般小企業能玩得起的。而選擇外採的企業,其優勢在於成本低、選擇多,但劣勢在於特殊性需求不夠靈活、不夠定製,可能等自己用上了,同行已經領先一大截了。

可以說,在大語言模型不斷進化的浪潮下,不同的技術路線、不同的的應用方式的選擇孰優孰劣,目前仍有待討論和驗證,還需要在實踐中尋找答案。

03 看點三:ChatGPT風口之下,教育科技的無限可能

目前來看,ChatGPT等相關技術在教育領域的應用,主要集中在中英語口語和作文輔導上。這與ChatGPT背後基於海量數據生成的AI大模型息息相關,它把能獲取的人類書籍、學術論文、新聞、高質量的各種信息作爲學習內容,並根據人類反饋強化學習。該技術的突破也使得ChatGPT的對話更貼近人類,語段間邏輯關聯度顯著提升。

而且現階段的ChatGPT,還是被限制了實時更新數據能力的,顯然還封印了很多可回答問題的領域和規模,隨着技術的迭代更新,未來還有着更多的可能,這也給國內的ChatGPT提供了新的市場空間。

在教育領域,除了具體的學科練習和知識問答,ChatGPT還可以幫助學生和教師實現更加個性化、高效和智能化的學習和教學模式,包括智能輔導、智能答題系統、語言學習、聊天機器人、智能導師等應用場景上。

比如,在教學過程中,老師往往會面臨跨學科教學,學生的一些問題也需要老師長時間思考才能解答,但如果使用ChatGPT,它就可以第一時間爲學生提供快速簡便的問題答案,可以對學習成果進行互動式的“檢驗”,在線提問,或是隨堂小測之類的,通過用戶的反饋來評估學習效果,並進一步制定學習計劃;同時,一些重複性的問題,ChatGPT就可以直接代替老師回答,節省了老師大量的時間,讓老師在思想創造力上發揮更大價值。

另外,ChatGPT的應用還可以促進教育創新。傳統的教育模式往往是由教師單向傳授知識,而ChatGPT則可以與學生進行互動,激發學生的學習興趣,培養學生的自主學習能力。此外,ChatGPT還可以利用數據分析和人工智能技術,爲教師提供更加全面、準確的學生評估服務。這樣一來,教育可以更加科學地進行,學生的學習效果也可以更加明顯地提高。

值得注意的是,通過這種持續的模型訓練,ChatGPT還能和其他的教育培訓來整合在一起的,無論是學前教育、職業教育、考證還是培訓,這個模型都能夠幫助他們把培訓做得更好,把效率做的更高。

總之,以ChatGPT爲代表的教育科技應用,對於個性化教育、教育公平和教育創新都具有重要的意義。在未來,可以期待ChatGPT在教育領域的廣泛應用,爲學生提供更加智能化、便捷化、個性化的教育服務,同時也爲農村地區的學生帶來更加公平、便捷的學習機會,逐漸消除這種教育的“數字鴻溝”。

本文來自微信公衆號“來咖智庫”(ID:laikazk),作者:追辛,編輯:G3007,36氪經授權發佈。

相關文章