AI偶像是怎麼生成的?

歡迎關注“新浪科技”的微信訂閱號:techsina

文/徐珊

來源/智東西(ID:zhidxcom)

如何在現有體系裏平衡虛擬人物和真實人物的關係,我們還有待探尋。

智東西6月23日消息,最近,韓國人工智能公司Pulse 9推出了一個完全由AI打造的韓國流行音樂女團,Eternity。Pulse 9通過該公司研發的“Deep Real”技術打造了11位AI女團成員,併發布了單曲MV“I’m Real”。該單曲在YouTube上的播放量達到67萬。

Deep Real是指將AI設計的人物圖像與數據庫裏的人類面部特徵相結合,生成全新的虛擬人物圖像。與Deepfake不同,它並不會與現實生活中人們的臉部圖像進行合成。虛擬人物市場正在興起,這些虛擬人物市場的背後,正是一代代技術的更迭。

本文福利:在人工智能、虛擬現實等新技術浪潮的帶動下,以虛擬主播、虛擬員工等爲代表的數字人成功進入大衆視野,並以多元的姿態在衆多領域大放異彩。推薦精品報告《虛擬數字人發展白皮書》。在公衆號聊天欄回覆關鍵詞[智東西197]獲取。

首個全員AI女團,AI偶像即將進軍影視業

2020年12月,Pulse 9發起了一個“令人激動人心的AI(AI heart-throb challenge)”的社交活動。人們在虛擬人物理想型測試中,從101位虛擬人物中選出最讓人心動的11位AI成員並組成AI女團。像國內的選秀節目《創造101》一樣,Pulse 9打造了一個AI世界的“選秀女團”。

Pulse 9成立於2017年,是一家人工智能技術開發公司。最初,Pulse 9專注於開展AI畫家的業務,但AI畫家業務受疫情影響難以展開。此後,他們將AI圖像生成的業務從繪畫、產品定製等擴展到娛樂業務。2021年4月,他們推出了Eternity女團,團名Eternity(永恆)含有“成爲與大衆永遠在一起的最佳虛擬偶像”的意思,每位AI角色都有獨特的設定。

此外,2020年12月,Pulse 9還與泰國Good Drama公司簽約了《AI偶像進軍泰國及進軍電視劇產業的諒解備忘錄》,希望打開AI偶像的泰國市場和AI偶像影視業業務。

泰國Good Drama公司計劃投資7.4億韓元(約爲420萬人民幣)製作一部名爲“我親愛的AI(My Dear A.I)”的電視劇。這部電視劇主要講述男主角AI偶像與人類女性之間的愛情故事,Pulse 9負責製作AI男偶像。

“在韓國,虛擬偶像與人類交談和互動的時代正在開啓”,Pulse 9的CEO Park Ji-eun表示,而她作爲創造者,將會賦予AI偶像更具幻想和更具創造性的特點。

同時她還表示,與真人偶像不同,AI偶像可以自由表達自己的觀點。因爲人們對AI偶像更具包容性,而AI偶像對人們的惡意評論和批評承受度也更強。

值得一提的是,Pulse 9製作的所有AI偶像都是虛擬人物,在現實世界中難以找到相同的樣貌,在一定程度上避開了肖像權糾紛。

與Deepfake不同,Deep Real打造的“臉”查無此人

Pulse 9通過該公司自主研發的Deep Real技術打造了11位AI女團成員。

Deep Real技術可以通過人工智能創建虛擬人、物體、室內空間、生物以及虛擬自然環境等。現有的虛擬偶像多數是動畫師長時間人工設計,逐幀創建圖像,打造AI視頻。但Deep Real技術擺脫了現有虛擬角色創作的面部設計和動作等限制作時間長,運營成本高等困境,使用AI模型來生成虛擬人物。

Pulse 9公司稱,他們通過Deep Real技術可調整虛擬偶像的眼神、面部表情、嘴角等各處細節,使其與真人的外貌、表情都達到高度相似。

Pulse 9先通過AI技術創建了新的虛擬人物圖像,然後他們通過AI模型將虛擬人物圖像與數據庫裏的參考人物圖像的面部特徵進行合成,得到了一個全新的虛擬人物圖像。由AI設計的虛擬人物圖像與真實世界的人不會重合。

Pulse 9強調,Deep Real不同於現有的Deepfake,因爲它以合理的成本創造了逼真的虛擬人物,而不是通過合成真人臉部。他們認爲,Deep Real技術的操作過程會更加複雜。

但該公司並沒有對其自研的Deep Real做更詳細地解釋,我們也難找到相關資料。

而她想要強調與之不同的Deepfake卻曾被全網號召“禁用”。

Deepfake是指一類深度僞造的換臉技術,將A的臉換到B身上。通過人臉互換,它可以讓A做出來自己從沒有做過的動作,說過一些沒說過的話,造成以假亂真的效果。

Deepfake以深度學習技術爲基礎。通過上傳被替換的“原圖”和合成後的“假圖”到生成對抗性網絡(GAN)模型中,當圖像的逼真度足夠高時,該圖像就會被輸出。然後,AI模型再通過提取視頻關鍵幀,人臉對齊等技術,讓人臉完美“融合”到原視頻。這類視頻仿真度高、欺騙性強,肉眼一般難以識別真僞。

2017 年底,一位名爲“Deepfake”的Reddit用戶,將神奇女俠女主角的臉成功替換到其他電影上,這個“逼真”的視頻轟動一時。隨後,有關人士將Deepfake的開源代碼發佈在Github上,其較低的技術門檻讓非專業人士也能快速掌握Deepfake。

Deepfake的出現,儘管會在聲音合成、視影音領域的修復上有所幫助,但具有較大的安全隱患。一段子虛烏有的視頻不但會讓有關人士名譽權受損,而且還會引起市場動盪,甚至威脅國家安全。

2019年11月,我國發布了《網絡音視頻信息服務管理規定》,該規定明確指出:網絡音視頻信息服務提供者應當部署違法違規音視頻以及非真實音視頻鑑別的相關技術方案。

同時,全球各地也都開始了抵制Deepfake的“戰鬥”。

2019年9月,Facebook宣佈了全球Deepfake檢測挑戰賽,旨在號召研究人員尋找“打假”的有效方法,提升鑑別假視頻的技術,維護和諧的網絡環境。隨後,Google AI 開源 Deepfake 視頻檢測數據集,希望能幫助研究者找到更好的鑑別假視頻的方法。

美國加州隨後也頒佈相關條令,禁止發佈、傳播Deepfake類視頻;禁止在大選期間,使用競選者圖像製造Deepfake類的假視頻。

儘管各方動作不斷,但事實上,由Deepfake製造的假視頻仍在各平臺屢禁不止,給人們帶來困擾。

與Deepfake的戰鬥,還一直在繼續。

虛擬偶像迭代3.0, 市場總額高達2000億元

愛奇藝發佈了《2019虛擬偶像觀察報告》顯示,中國二次元用戶規模達到4.9億,有3.9億人走在關注虛擬偶像的路上,2020年中國虛擬偶像市場總產量達到2000億元。

最早的虛擬人物通過歌唱軟件與機器人系統疊加形成能“唱歌的機器人”,從而衍生出電子音樂、鬼畜文化等多元文化。

隨後,2.0虛擬偶像文化全面爆發,洛天依、初音未來等通過合成軟件聲源和擬人化形象的虛擬偶像在二次元形成“現象級”出圈,開始以虛擬偶像的身份參與各類商業活動。虛擬人物行業初具規模。

目前,虛擬偶像迎來3.0時代,通過人物3D建模、AI合成技術,虛擬偶像們脫離之前的動漫人物、軟萌的卡通類的外表,逐漸被賦予一定學習能力和交互能力,像一個真正的“人”,Eternity正是如此。

此外,虛擬人物在其他領域也具有各展身手。

今年兩會期間,央視網的數字虛擬小編小C在兩會節目中作爲記者,與梁倩娟、馬慧娟等全國人大代表進行獨家對話。

虛擬小編的背後是百度智能云爲其提供技術支持,百度智能雲將數字人技術與雲計算技術相結合,支持“小C”使用AI驅動和人工監管雙重模式,希望給數字人賦予“人類溫度”。同時,百度第一次使用了4D掃描技術來進行高精度面部數據採集,並運用AI技術定進行了反覆的迭代調優,讓“小C”能夠更加活靈活現地與人交流。

三星在2020年也推出了虛擬人項目。該團隊通過Core R3技術,創造了Neon。項目負責人普脈·米斯特里(Pranav Mistry)發推文說,Core R3技術“現在可以自主創建新的表情,新的動作,新的對話,與原始數據完全不同。”

2018年11月7日,搜狗和新華社聯合推出了號稱“全球第一個全仿真智能虛擬主持人”的AI虛擬主播。AI虛擬主播是首先由真人主播面對鏡頭錄製播報1個小時的新聞,通過AI和人臉關鍵點檢測、人臉重構、脣語識別等多項技術重合,結合語音、圖像等信息聯合建模後,得到的人類“分身”。

據搜狗CEO表示,只要觀衆在現場輸入一句既有的新聞文本,屏幕上就會呈現一位虛擬的新華社新聞主播,他不僅會用和真人一樣的聲音進行播報,而且連脣形、面部表情也能完全吻合。

儘管人們對虛擬數字人技術一直抱有較高的期待,但目前的虛擬數字人仍有一定的不足之處。

目前,虛擬人物產業投入成本高,收入低,並且在仿真技術、內容互動等問題上都不夠成熟。大多數公司對虛擬人物投入,都難以盈利。

虛擬人物的時代還尚未完全到來。

結語:真與假界限模糊,虛擬和現實如何“和諧”相融

隨着AI和VR/AR技術的不斷提升,真與假之間界限已經逐漸模糊。許多軟件都非常希望收集各類人體生物數據,但卻難以保證用戶隱私安全。Deepfake的出現正是一個“警鐘”——無論是怎樣的世界,秩序安全都是必不可少的。

如果像Deepfake這般的深度僞造技術,人們都難以尋找到有效的方法解決。那麼,虛擬世界與現實世界的快速相融則會帶來更多的困境,讓人們逐漸失去對現實世界的信任感,從而進一步加劇社會孤獨。

如何在現有體系裏平衡虛擬人物和真實人物的關係,把握好現實和虛擬的界限,我們還有待探尋。

相關文章