來源:字母榜

在AI文生視頻這條熱門賽道,抖音旗下的剪映,正在被OpenAI的Sora越甩越遠。

近日,美國軟件巨頭Adobe宣佈,將在知名視頻編輯軟件Premiere Pro的新版本添加多款文生視頻AI工具。近兩個月震動全球科技圈的Sora,以及兩款同類產品Gen-2和Pika,都會在不久的將來加入“Adobe全家桶”。

有了Sora等第三方AI工具的助力,新版Premiere Pro除了編輯處理預先拍攝的常規視頻外,還能根據用戶輸入的文本即時生成AI視頻,並將兩者融爲一體。

Adobe放出了一條官方演示視頻:一個男人走向窗前,觀看整個城市的夜景。用戶無需拍攝實景,只需輸入一段文字,即可利用Sora生成一段城市雨夜的視頻,並與前面的視頻無縫銜接,效果幾可亂真。

Sora今年2月初次亮相,OpenAI放出幾段演示視頻,但並未公佈產品進展和上線時間。如今,Sora被Adobe接納,表明過去幾個月又有不小進步,距離開放使用更近。

另一邊,背靠抖音的視頻剪輯軟件剪映,同樣朝着AIGC(人工智能生成內容)方向前行。但截至目前,剪映尚未拿出令人驚豔的成績。

目前,剪映的AI玩法不少,包括一鍵成片、剪同款、AI克隆音色、數字人口播等,但並不具備根據文本直接生成視頻的能力。它的海外版本Capcut在2月底推出文生視頻功能,但效果距離Sora相去甚遠。

如今,Sora除了在技術和產品上領先剪映,還得到了Adobe的青睞。Adobe在全球擁有超3300萬付費用戶;Sora接入“Adobe全家桶”,有望獲取訂閱收入分成,從而初步構建商業模式。

這也意味着,仍在打磨AIGC能力的剪映,追趕Sora的難度將越來越大。

剪映被外界視爲抖音搭上AIGC時代快車的關鍵籌碼。得益於抖音的加持,剪映已成爲用戶量最大的手機視頻剪輯軟件之一,每天產出大量短視頻;在此基礎上更進一步,從UGC(用戶生產內容)邁向AIGC,似乎水到渠成。

今年2月7日,抖音功勳老將張楠辭去集團CEO職務,親自帶隊剪映。她在官宣職務變動的內部信中稱,AI圖像生成對她產生很大的觸動,潛力巨大,並決定“放下一切”,義無反顧地出發。

剪映的發展根基不可謂不好,抖音的重視程度也很高。但兩個多月過去,剪映依然沒有太大動靜,Sora反而繼續高歌猛進。

在AIGC時代,抖音及其背後的字節,似乎總是棋慢一着。

字節八年前佈局AI,成立了專門的實驗室,招募大批業內精英,但成果卻停留在內容審覈、自動翻譯、搜索服務等。2022年下半年,ChatGPT引爆行業;字節隨即增加大模型投入,一口氣推出AI聊天機器人等十幾款應用,卻遲遲沒有拿出震動行業的技術和產品。

今年1月底的年度全員會上,字節CEO梁汝波感嘆,字節“該有的大公司病全有了”。他特別點名AI業務,稱:“公司層面的半年度技術回顧,直到2023年纔開始討論GPT,而業內做得比較好的大模型創業公司,都是在2018年至2021年創立的。”

如今,在立身之本的視頻內容領域,OpenAI着着搶先,剪映乃至整個字節又雙叒慢了。

1

背靠抖音這顆大樹,剪映原本有很大機會在AI文生視頻領域的佔得先機。

剪映2019年上線,2021年推出PC端的專業版。它顯著拉低了UGC視頻的創作門檻,普通人只需準備好素材、點擊幾下,就能生成一段質量尚可的視頻,並一鍵發佈至抖音。

此外,作爲一款工具軟件,剪映還帶有一定的社區屬性。除了官方提供的視頻創作課堂外,用戶還可以參考達人制作的視頻模板進行創作,也就是“剪同款”。這有助於提高用戶留存率和活躍度。

依靠豐富的功能,以及與抖音深度綁定,剪映僅用了三年就獲得超1億月活躍用戶,躍升至同類軟件的第一名。

剪映海外版CapCut的增長同樣驚人。

Capcut上線於2020年,與TikTok關聯密切。移動應用分析平臺點點數據顯示,目前Capcut的月活躍用戶超2億。另據市場調研機構data.ai的數據,截至2023年8月,Capcut在iPhone和安卓端的用戶超4.9億,相當於TikTok全球用戶量的1/4。

除了用戶規模龐大,剪映在AI領域的另一個優勢是“近水樓臺先得月”,坐擁大量可用於AI大模型訓練的視頻數據。

數據、算法和算力是AI大模型的三大基礎要素,其中數據是根基。要想提升大模型的綜合能力,就需要不斷“投餵”多模態數據,主要是互聯網文本、圖像和視頻。

OpenAI、Adobe等公司都不直接掌握數據,必須從第三方付費獲取,成本不菲。據媒體報道,OpenAI每年僅採購版權新聞文章授權的費用,就高達100萬~500萬美元;Adobe爲了訓練自家的文生視頻大模型,以每分鐘3美元的價格,向另一個大模型服務Midjourney購買視頻片段。

相比之下,剪映在國內綁定抖音、在海外背靠TikTok,每天有大量用戶使用它剪輯和上傳視頻。這讓剪映能夠以相對低廉的成本,接觸到大量視頻內容,爲訓練大模型、探索AI文生視頻功能打下基礎。

但從2019年至今,剪映並未研發出強大的AIGC能力,反而早早啓動了商業化。

剪映很早就上線了VIP會員,用戶每月支付二三十塊錢,可以使用專屬素材、精選模板等,AI玩法也被列爲會員權益之一。根據官方介紹,AI玩法主要包括“無限創作”“無限運鏡”和“瞬息宇宙”,基於現有視頻素材進行AI美化編輯。

不難看出,剪映的AI玩法距離Sora這樣的文生視頻相去甚遠。此外,它的收費也並不低廉:會員每月可獲得1200積分,而使用一次“無限運鏡”就需要480積分。積分耗盡後,用戶可以選擇繼續充值,兌換比例爲1元:100積分。

剪映誕生之初的定位是,儘可能拉低短視頻創作門檻,促進抖音UGC生態的繁榮。過去五年,它的確完成了這一任務,大量抖音爆款視頻背後,都有剪映提供技術和模板。特別是那些趣味特效視頻、踩點視頻,抖音紅人發佈之後,大量用戶迅速羣起效仿、共同推高熱度;沒有剪映的幫忙,恐怕不易做到這一點。

但如今看來,抖音還是把剪映的天花板設定地太低了。它原本有機會成爲Sora這樣的劃時代產品,卻始終停留在視頻剪輯軟件的範疇。

今年以來,剪映開始奮起直追,但先機已失、對手已至,追趕難度也迅速增大。剪映被Sora甩開,字節在AI領域仍然沒能跳出“起大早、趕晚集”的怪圈。這也從側面印證了梁汝波此前批評的“平庸的重力”。

2

過度重視對業務的幫助,過早追求商業化,是剪映乃至整個字節AI板塊的難題。

剪映除了開設付費會員、將AI玩法納入權益包,還在APP內增加了不少廣告位。例如,用戶點擊“剪同款”,映入眼簾的除了手機照片和視頻素材,還有懸浮在素材上方、幾乎毫無關聯的橫幅廣告。

作爲一款用戶破億的工具軟件,剪映的常規投入和資金壓力並不會特別大。它之所以早早發展會員和廣告,或許與字節的做事風格和評判標準有關。

衆所周知,字節是一家超快節奏、高度內卷的互聯網巨頭。如果個人、團隊或業務無法迅速帶來肉眼可見的產出,就有可能被調整,甚至徹底出局。即使是需要長期投入的AI,也無法跳出這一隱形的評判標杆。

早在2016年,字節就設立了AI Lab人工智能實驗室,並引入多位學界和行業精英。彼時,OpenAI同樣初出茅廬,正朝着通用人工智能的願景前行,將自己視爲非營利組織。

相比之下,AI Lab雖然名爲“實驗室”,實際上仍然需要密切配合和服務業務。它的官網宣稱,其研究重點是開發爲字節內容平臺服務的新技術;具體領域則包括自然語言處理、數據挖掘、計算機視覺、機器學習等,且和抖音各業務板塊貼合緊密。

隨後幾年,字節拿出了一系列AI工具,比如提供翻譯服務的Byte Translator,AI寫稿機器人Xiaomingbot,以及頭條和抖音的搜索服務等。它們固然頗有價值,但算不上突破AI領域認知邊界、定義AI發展範式的創新產品。

直到2022年下半年,OpenAI多年磨一劍,ChatGPT席捲全球,生成式AI成爲全球科技公司競逐焦點,字節才把更多精力投入到這一新浪潮中。

已經淡出字節一線管理的張一鳴,對AI產生強烈興趣,並鼓勵團隊大舉投入。字節跳動無法錯過AGI(通用人工智能),它是抖音和TikTok在全球發現新的增長機遇不可或缺的夥伴。

創始人發話後,字節各業務部門聞風而動。從那時起,字節陸續上線十多款AI產品,如豆包、話爐、釦子、Gauth等,剪映、飛書等也增添了AI功能。

但在這一輪大舉投入中,字節以業務需求爲原點、對標競爭對手的做事邏輯被延續下來。豆包等產品均爲現有AI技術的場景化應用,而非對於AGI的原生探索。

例如,去年3月,微軟上線整合了GPT功能的365 Copilot,全球辦公軟件市場爲之震動。一個月後,飛書宣佈即將上線AI助手“My AI”,以對話形式提供多種功能,包括優化和續寫文字內容、創建日程、自動彙總會議紀要、搜索公司內部知識庫等。

一年後,GPT已經在微軟“全家桶”遍地開花,帶動後者股價從250美元一路上漲至400美元以上。飛書卻沒能依靠My AI完成逆襲,反而在3月底宣佈裁員。

又比如,Sora今年2月16日發佈演示視頻,CapCut一週後就宣佈推出這一功能,每人每天可免費生成5段視頻。CapCut的技術力顯然無法與OpenAI比肩,其文生視頻功能也較爲簡陋;倉促上線、對標Sora,不免帶有蹭熱點、強行完成KPI的味道。

從張一鳴點名AGI至今,字節AI又走過了一年,並未顯著拉近與OpenAI的差距,甚至有擴大的趨勢。字節AI向實用主義的過度傾斜,不僅讓它錯失了以往的機遇,也有可能拖累追趕的步伐。

3

對於AI板塊各自爲戰、圍繞業務打轉的局面及其危害,字節已經有所察覺。

2023年11月,字節抽調多個部門的精兵強將,組建AI部門Flow。TikTok技術負責人朱文佳、字節產品與戰略副總裁朱駿、字節技術副總裁洪定坤、飛書產品副總裁齊俊元均加入其中。人員的“高配”,顯露了字節通過Flow統籌AI發展、消除重複建設的意圖。

目前,字節曝光度最高的AI產品——豆包、釦子、話爐等,均由Flow部門負責。剪映、飛書、大力教育等雖然也有AI業務,但聲量已經逐漸被Flow蓋過。

另一方面,字節雲雀大模型已經打磨近一年時間,多模態大模型BuboGPT也取得進展,爲Flow批量產出AI應用奠定根基。假以時日,Flow有望扭轉字節AI總是慢人一步的局面。

不過,字節畢竟不是OpenAI,沒有微軟這樣的超級金主。AGI固然重要,但對於現有業務的拉動尚不明顯,需要更長時間的沉澱和打磨,才能釋放商業價值;字節對AGI的投入不可能無止境,必須考慮中短期的投入產出比。

短期來看,字節需要用錢、用人、用資源的地方很多,比如抖音貨架電商、生活服務等,都需要大量真金白銀。隨之而來的現象是,儘管Flow挑起了大梁,但字節AI依然呈現兼顧業務需求的傾向。

據Tech星球近日報道,抖音生活服務剛剛成立一支AI團隊,希望利用AI技術創造增量業務價值,且已開啓對相關AI產品的研發,包括搭建生活服務相關的內容創作平臺等。

抖音生活服務之所以拉起這樣一支隊伍,或許與競爭對手美團和餓了麼的動作有關。

美團近日開始小規模測試AI助手服務“問小袋”,可爲用戶推薦符合其需求的外賣商品,以及用餐建議。餓了麼則在4月初面向零售行業商家發佈“AI經營助手”,可爲商家智能生成各類經營關鍵報表和關鍵數據。

在此情況下,不讓美團餓了麼專美於前,或許是抖音生活服務入局AI的基本目標之一。

內外因素影響下,字節沒有條件像OpenAI那樣厚積薄發。既要追趕AGI潮流,又要具備快速落地、服務業務的能力,是字節AI的雙重目標。

在張一鳴和梁汝波的督促下,外界無需質疑字節做AI的決心。但倘若再過去一年、兩年,字節仍然跟不上OpenAI的節奏和水準,那麼它或許應該考慮另一種選擇:退回“賣水者”的角色,做AGI訓練素材提供商。

如前所述,數據是大模型的三大基礎要素之一,而字節麾下的今日頭條、抖音、TikTok等,已經積累了數以億計的文本、圖片和視頻。字節可以用這些數據訓練自家大模型,也可以考慮更進一步,在妥善解決安全和隱私問題的前提下,將其出售給OpenAI等第三方公司。

充當AGI時代的“賣水者”,其實是字節擅長的流量生意的變體。字節如今的現金牛——廣告和電商業務,都建立在流量變現的基礎上;如果把AI公司轉變爲新客戶,那麼字節心心念唸的第二增長曲線問題將迎刃而解。

另一方面,OpenAI既然能夠與微軟、Adobe合作,與字節合作也並非不可想象。畢竟,抖音和TikTok是Sora等AIGC服務最龐大的落地場景。倘若字節與OpenAI達成“競合”關係,那麼字節將跳出一步慢、步步慢的循環,在OpenAI的助力下搭上AI快車。

相關文章