LiveVideoStack對聲網視頻工程師吳曉然進行了採訪,他認爲實時通信場景的Codec需要考慮網絡情況才能做好。

文 / 吳曉然

整理 / LiveVideoStack

LiveVideoStack:吳曉然你好,能否向LiveVideoStack的讀者介紹下自己,以及目前主要的工作以及關注的技術方向?

吳曉然:大家好,我是來自聲網的視頻工程師吳曉然,已經有十年的多媒體從業經驗,從最初的多媒體用戶界面,多媒體中間件,到Codec的集成與優化,Codec驅動開發,我覺得多媒體和實時通信一直是我喜歡和關注的方向。

LiveVideoStack:能否介紹下聲網在視頻架構、編解碼、傳輸方面的探索?

吳曉然:聲網其實在多年以前就開始了對實時通信領域的探索,實時通信的兩個基礎就是網絡傳輸和編解碼,通過多年的積累,聲網已經建立了專爲實時傳輸設計的虛擬通信網絡,覆蓋全球超過200個國家,在視頻架構和編解碼方面,聲網也針對實時傳輸做了大量的創新及優化工作,根據不同的網絡類型,終端設備,應用場景,都會作出一些自適應的調整,這也是爲什麼我們的SDK可以很好的覆蓋所有平臺的原因。

LiveVideoStack:我注意到聲網開始探索新型的Codec,如AV1、VVC。是否可以分享一些您觀察到的Codec的應用的趨勢?另外,您判斷某一個Codec進入商用市場的標準是什麼?

吳曉然:是的,AV1已經呼之欲出,因爲Open Media聯盟的豪華整容,相信不久之後便會掀起一股熱潮。VVC作爲H.266應該還有一段時間,預計會在兩三年後推出,大家也可以拭目以待。新一代的編碼器帶來的壓縮效率提升是毋庸置疑的,但一個Codec能否進入商用,能否普及,是有很多因素共同決定的。H.264已經霸佔市場十多年,雖然H.265在壓縮效率上全面超越H.264,但依然無法撼動H.264的統治地位,一方面H.264是一個非常優秀的標準,很多開源的軟件和各種平臺的優化也加速了它的應用,另一方面,H.265高昂的專利費和部署成本也讓商家望而卻步。

LIveVideoStack:聲網是否使用了硬件加速做編碼/轉碼?

吳曉然:聲網的編碼器同時擁有軟件編碼和硬件編碼功能,會根據不同的平臺,場景及功耗等因素決定是否使用硬件編碼器。因爲實時通信需要Codec和網絡模塊結合,對抗網絡常見的丟包和抖動問題,軟件編碼器在靈活性方面更勝一籌,但硬件編碼器的低功耗也會讓它在一些場合有用武之地。

LiveVideoStack:未來5G會對網絡帶寬和質量有一定的改善,您如何看待5G帶來的機會和挑戰?聲網開始針對5G做了哪些準備和探索?

吳曉然:5G帶來的帶寬提升顯然可以提升終端用戶的使用體驗,我們可以編更大的分辨率提升清晰度,編更多的幀提升流暢度,但網絡的穩定性也是影響用戶體驗的一大因素,如果視頻經常卡頓,那再清晰也是無濟於事的,不同的網絡有不同的特點,有線,WiFi,4G/5G都有各自不同的網絡模型,聲網擁有自己的數據媒體後臺,會從大量的用戶數據中提取出不同網絡的特徵,建立網絡模型,針對性的進行算法改進。

LiveVideoStack:您是否看好VR或2K~8K視頻互動直播?

吳曉然:視頻互動直播是大勢所趨,有可能成爲年輕人以後主要的社交娛樂渠道,對於VR我不是很瞭解,據我所知,這塊市場目前並不成熟,從Google暫停了VR攝像機的開發可見一斑,而且現在的VR設備基本上都眼罩或者頭套,對用戶體驗還是有影響,相比之下,我更看好AR的市場前景。

LiveVideoStack:能否劇透下您在LiveVideoStackCon 2018分享的內容嗎?

吳曉然:這次LiveVideoStackCon大會,我想分享一些我們聲網針對QoE實時通信視頻的Codec的優化和探索。之前我們優化Codec,只是優化Codec本身,其實只是一個局部最優解,而且在實時通信領域,用戶的QoE纔是最終目標,這和很多因素相關,只有你的Codec優化適應了當前的網絡狀況,設備平臺,應用場景,用戶才能得到最佳的體驗,我們所要找的其實是全局最優解。

查看原文 >>
相關文章