記者 | 查沁君

在科技圈掀起大浪潮的ChatGPT,最近也被教育公司盯上了。

日前,網易有道(NYSE:DAO)被傳其AI技術團隊已投入到ChatGPT同源技術AIGC(AI Generated Content人工智能自動生成內容)在教育場景的落地研發中。

2月9日,網易有道向界面教育證實了上述消息,並表示近年來一直在AIGC上有持續性投入。去年底嘗試AIGC在教育場景中的落地應用,包括但不限於AI口語老師、中文作文打分和評價等。

“產品的最終形態團隊還在討論中,需要匹配用戶需求來決定,智能硬件、在線課程都可能是考慮落地的場景。”網易有道稱。

AIGC被視爲繼專業生產內容(PGC)、用戶生產內容(UGC)之後的新型內容創作方式,目前AIGC已經從早期的輔助人類實現內容創造,發展到如今的獨立完成內容創作的新階段。如前段時間AI繪畫就成爲AIGC第一個破圈的落地應用。

網易有道還表示,其在學習和翻譯場景下積累了豐富的多模態數據和相關語料,一直通過有道智雲平臺向外輸出。

同日,界面教育自作業幫媒體交流會上獲悉,關於ChatGPT在教育領域的應用,該公司已經在做一些小樣測試,主要還是在原來作業幫的產品上,等產品成熟度較高後,會在聰明學系統裏進行應用。

作業幫表示,多年來其在預訓練語言模型中有持續投入,在教育相關場景下的多個垂類應用都有落地,包括題意理解、知識點分類、作文批改、智能質檢等。

“比如,行業之前做考試批閱的普遍做法是圍繞圖像比對來進行,現在我們已經能對一些數學題本身進行測算和深度理解、處理,這其實是相似的技術。”作業幫執行總裁蘇靜表示。

中公教育(002607.SZ)也來蹭了一波熱度,2月9日其在投資者關係平臺上稱,將根據ChatGPT發展帶動的崗位需求來增設相關的培訓課程。

相比上述公司的發聲,科大訊飛(002230.SZ)則直接披露產品的官宣日期。

該公司表示,已於2022年12月進一步啓動生成式預訓練大模型任務攻關。2023年5月6日,將進行產品級發佈,AI學習機將成爲該項技術率先落地的產品。其技術突破將在中英文作文輔導、中英文口語學習等方面帶來顯著提升。

上述消息的釋出,讓這些公司的股價在二級市場上掀起了一波小高潮。科大訊飛股價一度上漲30%,網易有道一度漲超18%。截至美東時間2月9日收盤,網易有道股價回落。2月10日午盤,科大訊飛上漲4.66%。

從目前披露的信息看來,ChatGPT等相關技術在教育領域的應用,主要集中在中英語口語和作文輔導上。這與ChatGPT背後基於海量數據生成的AI大模型息息相關。

它把能獲取的人類書籍、學術論文、新聞、高質量的各種信息作爲學習內容,並根據人類反饋強化學習。該技術的突破也使得ChatGPT的對話更貼近人類,語段間邏輯關聯度顯著提升。

以早年間的人工智能作爲對比,就能看出明顯差異。

2016年高考結束、滿分作文尚未出爐之際,人工智能小冰的兩篇命題作文被曝光。與之同臺比拼的還有80後作家安意如、專欄作家潘採夫、詩人廖偉棠等,按要求在規定時間內完成當年的高考作文。

最後的結果顯示,小冰的作文能力與不少網民想象中的人工智能存在不少差距,小冰的文字雖然不乏文藝氣息,但最爲集中的槽點是:字數不夠,竟然沒到規定字數800字的一半,多少有點不合常理。

從底層邏輯來看,當時的小冰擁有一個基於神經網絡的學習模型,這個模型以段爲基本單位,逐句閱讀文章,學習基於上文生成下文的語義規律,從而在給出題目後並由人工寫出每一個段落的首句後,模型自動生成剩餘的句子。

這意味小冰是個“半自動”的選手,一篇文章的好壞、文風,很大程度上還依賴寫首句的人。

“以前的機器學習更多屬於自動化的範疇,人工智能模型根據輸入的內容,可以去完成同樣的任務。而現在的大規模語言模型改變了這種模式。好比教一個孩子游泳,結果發現他會爬樹、踢足球,打乒乓……它有了自主學習的能力,或者說它從之前的語料學習過程中,獲得了承擔新任務的能力。”網易有道首席科學家段亦濤在近日的直播中稱。

段亦濤認爲,和之前能夠交互的模型非常不一樣,ChatGPT更像人了。這種技術突破是非常大的進展,“在這個技術成熟之前,我們都談不上人工智能,它出現之後,我們才摸到了人工智能的門檻。”

當人們驚歎於ChatGPT“上知天文、下知地理”的聰明時,也難以忽略它的昂貴。

據21財經援引業內人士消息,擁有1750億個參數的GPT-3因其巨大的每秒浮點計算量,單次訓練成本達到460萬美元。眼下最主流的英偉達A100芯片,單次訓練的使用量應達到數百片,成本在3000萬元左右。

這注定是一場只有巨頭纔有入門券資格的遊戲。那麼問題來了,教育公司如果想要入局分一杯羹,是否有能力或者說有必要再造一個大模型?還是說通過購買調取現有大模型,進行更偏自身業務屬性的調適?

段亦濤曾在上述直播中稱,“這次技術更新是一次顛覆性的創新,但在細分場景的應用過程中實際上並不需要這樣一個大而全的模型,更需要一些縱深向的探索。比如,有道正在探索ChatGPT同源技術AIGC在學習場景中的落地,這個過程加深了我們對於ChatGPT的進一步理解。”

西部證券在日前研報中指出,中國AIGC產業仍處於發展初期,最先興起的是AI寫作和語音合成模塊,虛擬人概念剛興起,底層技術較國外仍有較大差距。衆多國內廠商從內容佈局入手,目前商業模式不成熟,還停留在免費引流階段。

該機構認爲,AIGC目前主要客戶集中在B端,廠商話語權較弱,未來會向2B+2C方向發展,B端降本增效是根本訴求,C端的付費邏輯在於高效獲取信息,替代表達以及擴大用戶創造力。

“2023年有望成爲AIGC發展大年。類似ChatGPT的大模型作爲AIGC的底層平臺,將成爲核心資源。”西部證券稱。

科大訊飛在公開發言中,則透露了其有信心在預訓練認知智能大模型上代表中國實現突破。

在1月31日披露的投資者關係活動記錄表中,科大訊飛稱,自2018年起,預訓練模型範式就逐步開始在自然語言處理領域應用,包括谷歌、微軟、OpenAI、科大訊飛、智源、鵬城等單位陸續推出預訓練模型。

科大訊飛陸續開源了六大類、超40個通用領域的系列中文預訓練語言模型,開源三年模型庫月均調用量超千萬,並自稱是“業界最廣泛流行的中文預訓練模型之一”,在GitHub(面向開源及私有軟件項目的託管平臺)的中文預訓練模型的星標數達13346位列第一。

去年,該公司發佈了面向多模態領域的兩個輕量級預訓練模型,並表示“在參數量遠小於業界公開模型20倍以上的情況下,識別效果提升20%-30%”。

據自媒體數智前線援引業內人士觀點稱,整個互聯網的中文數據質量,相比於英文還是有明顯差距,需要做中英文不同語言之間的數據互補。目前全球還沒有能跟ChatGPT抗衡的大模型,業界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。

相關文章