聲網Agora爲開發者提供簡單易用、高度可定製和廣泛兼容的應用編程接口API,可以將實時音視頻能力嵌入到開發者的應用程序中,不需要研發技術開發者自己另外去構建底層基礎設施。聲網 Agora在全球開創了“實時互動雲”行業,這是一個快速成長的行業,聲網也迅速成爲全球市場份額第一的公司。

2020年3月單月,聲網Agora通過10,000多個活躍應用爲100多個國家的終端用戶提供了超過400億分鐘的實時互動使用時長,支持包括社交、遊戲、教育、物聯網、金融、醫療、企業培訓等在內的諸多行業。

面對近期爆發的新冠肺炎疫情,聲網與教育巨頭新東方合作,推出了“新東方雲教室”,僅用了7天時間就有超過100萬名學生和老師加入虛擬課堂。

本文來自微信公衆號: GGV紀源資本(ID:GGVCapital) ,作者:趙斌,編輯:張穎,本期內容編譯自GGV英文播客《Evolving for the Next Billion》2020年3月期,題圖來自:視覺中國

2013年,我創立了聲網。聲網是做什麼的?事實上,聲網實現的是實時音視頻互動功能,並以SDK (軟件開發包) 和API (應用程序接口) 的形式提供給應用軟件開發者。也就是說利用聲網的API,開發者可以快速在應用內構建多種實時音視頻互動場景,讓每個人都能輕鬆實現與其他人的實時連接和互動,並且能隨時隨地開展社交和商業活動。

聲網主要以免費+增值模式爲主來服務於開發者。我們也是一家對開發者十分友好的公司,原因是我自己曾經做過很長時間的開發者,而現在我依然是一名開發者。

因此,從一開始,我們就決定向所有的開發者提供每個月10000分鐘免費時長的API服務,目的是爲了讓所有開發者都可以用聲網來盡情發揮創意,探索出新功能。

從根本上來說,聲網是一個供開發者們測試、創造新應用場景和新服務的樂園。

聲網的設計包括軟件定義實時網SD-RTN™,它對傳輸路徑進行了優化,同時也有能力把所有人的傳輸路徑聚合到同一場會話中。所以聲網可以支持大量人員參與同一場會話,甚至可以支持百萬人級會話。

聲網的受衆遍佈全球,也曾經支持10萬人同時參與同一場直播。當遇到一些很紅的直播表演者時,我們的技術可以支持幾十萬粉絲直接進入直播,並且播放會很流暢。

一、疫情中突如其來的增長機會

過去幾個月,我們的團隊一直在幫助學生們在疫情這種特殊時期在線學習,特別是中國學生。

事實上我們面臨了很多挑戰,尤其在疫情剛剛爆發的時候。

我們服務的客戶裏包括新東方,當我們意識到疫情帶來的嚴重問題時,已經接近春節放假了:疫情時期的在家學習意味着線上流量的增加,而爲了支持新增的流量,我們需要更多的資源。但當時因爲放假,資源和供應鏈都暫時停掉了,要想實現技術支持,我們缺乏很多設施和設備。

幸運地是,我們之前搭建了超高彈性的網絡架構設計,通過緊急的資源調度,可以實現快速擴大規模,也依賴於之前搭建的一支成熟的服務團隊,幫助客戶積累了線上教學的經驗。最終我們發動了所有能夠利用的供應商,快速提高處理能力,一起解決了全球各地大量的學生在新東方上線上課所面臨的實際困難,也爲新東方在內所有具有特殊需求的客戶提供了優秀的服務。

二、艱難的成本抉擇

雖然完成了任務,但背後依然面臨着艱難的抉擇。

疫情期間,很多線下教育公司面臨停業,我們預判到這一狀況,開始動員團隊爲這些公司可能會轉入線上教育的潛在需求做好準備。

但這時候我們發現,如果試圖消化所有激增的客戶需求,我們需要採購更多新資源。實際情況是,當時因爲假期,很多設施都被封鎖了,很多供應商也都沒開工,資源非常稀缺,也很難拿到,還有很多其他公司也在“搶”資源。

最後,資源採購價格猛漲,我們只拿到了一些非常昂貴的基本資源。

在聲網,我們一直實行着以客戶爲中心的文化,這也意味着我們時時刻刻要爲客戶盡力做到最好。但線上流量的激增,帶來的也是高昂的成本。創業公司彈藥有限,面臨成本巨幅激增的挑戰,我思考的最大一個問題是:我們應該如何選擇呢?究竟是選擇犧牲我們可以爲教育行業客戶提供的服務,還是犧牲向客戶提供的服務質量?

所以, 當時我做了一個在現在看來很有挑戰性的決定:雖然我們還只是個初創企業,但我們最終還是決定不對客戶漲價,自己來消化驟增的成本。 我們將繼續原價爲大家提供服務,向客戶羣體提供品質有保證的服務,在資源方面不惜一切代價,保證資源充足,堅持我們對客戶的品質保證,堅持我們的原計劃。

除此以外,我們還決定向在線教育、在線醫療行業提供部分公益性服務,因爲受疫情影響,大家都不敢去外面和學校,基本所有線下培訓或者學校都關停了,很多孩子不能像往常一樣去上課,我們必須站出來幫助他們。

疫情期間,我們算了算,部分資源的最終採購價格是常規價格的五倍之多。我想,這也是我們經歷的具有挑戰性的決定之一。

截至目前爲止,高峯時期我們有超過100萬名用戶同時在線,同時上課。併發量相當大。這跟正常的線上課堂體驗類似。很多都是有10到40個學生在同一個教室,但是形式更多樣化,併發量更大,其中一場直播課有2萬多名學生參與。

三、實時互動雲技術和產品本身的難點在哪裏?

我在實時音頻視頻領域工作多年,深知這其中有諸多難點:

語音、IP、視頻和公共網絡中出現的質量問題,往往來自於公共互聯網的不穩定。公共互聯網本身就是一種“盡力而爲”型的網絡。對於所有的音頻數據包或實時數據包,公共網絡不僅不能保證按時把數據包傳送給接收方,甚至也沒法保證最終能不能送到或者會不會丟失。

爲了解決這個問題,我們研發了軟件定義網絡SD-RTN™,專門對實時流量進行優化,這被稱之爲軟件定義的實時網絡,確保我們的服務質量可以接近於專網或專線,以實現我們所需的整體服務穩定性。

而且我們在音頻編解碼、視頻編解碼等信號處理算法方面也有全球領先的深度技術創新,即便是在面臨低端設備或終端線路傳輸不穩定等困境時,我們依然可以爲用戶提供高質量的服務。

四、實時音視頻技術的機遇

實時音視頻技術會遇到哪些機遇呢?

在我看來, 第一個機遇是硬件上的。 智能手機是一個特別好的產品載體,也是特別好的機遇。

智能手機的廣泛應用,是讓實時音視頻技術和硬件結合的好時機。因爲智能手機本身就是個完整、現成的技術對接設備,它自帶兩個高質量攝像頭,現在甚至可能有三個、四個,而且它還自帶高質量麥克風,可以設計成有編程能力的通訊設備。

所以,在我看來,創造價值,應對挑戰,打造高質量實時音視頻技術,解決網絡不確定性,適應各種不同設備信號處理算法的發展空間很大。

第二個機遇是API服務,API作爲基礎設施,提供了很好的輔助作用。

我之所以決定做API服務,先是因爲我發現隨着智能手機不斷滲透,機遇隨之浮出水面,整個行業可能也會隨之而變。通過對比手機APP和PC時代的桌面軟件,我發現有一點不同:在電腦端時代,我們做出來的軟件不能去假設電腦自帶攝像頭,或者自帶高質量麥克風;但對於智能手機來說,你完全可以這樣既設。

在這個前提下,如果有人能夠提供可以簡單集成且支持實現相應功能的API,那麼應用開發者們就能輕鬆在其應用中使用實時音視頻,也可能會由此創造出很多應用場景。

既然有這樣一個新的可能性,作爲一個開發者,我自然會希望爲我們的客戶或消費者創造一些新的、有用的東西。所以最好的方式可能就是通過我們的API服務於開發者。這也是聲網的初心。

我們現在已經能看到平臺上應用場景不斷增加,目前已經增加到100多個應用場景。今年和過去幾年的關鍵應用場景出現在社交、教育、遊戲、播客甚至是企業協作、醫療領域,部分物聯網設備也開始迅速採用這項技術。

五、如何跨領域發展

1. 如何思考我們的產品路線圖?

首先,就像我剛纔談到的,我們肯定會優先考慮開發者的需求。所以這個決定很大程度上取決於開發者們真正想做的東西。截止目前,我們的平臺上確實呈現了很多類似社交、遊戲和在線教育領域的需求。

以在線教育產品爲例,雖然我們的產品可以專門針對傳統的基礎教育需求,比如學前至高中。但最有趣、最迫切的需求還是來自於非傳統在線教育,也就是社交或是休閒教育,我們的技術正在讓它們變得更有趣。

針對不同的需求,API的設計需要支持不同角度的實時體驗。在我們平臺上,在線合作需求量其實並不大,我們更多是支持嵌入式工作流,比如說很多客戶希望我們能應用到內網應用程序中,也就是要內置到他們的工作流中。這樣他們就可以自動接入通話,就像是身處同一個辦公室辦公,只要站起來就能交流一樣的輕鬆自然。我們注意到這方面的需求也在不斷增長,也更專注於提供這方面的服務。

2. 跨領域、跨地域:在其他領域行業的延伸

基於這些理論,我們的應用可以在多種領域上延伸,比如:

  • 在線問診:面對新冠肺炎病毒,大家都很害怕,甚至也不敢出門看病,於是有客戶利用我們的技術建立了一個在線問診平臺。比如說,之前一些感冒的人會有發燒之類的症狀,他們就會開始擔心,糾結是不是應該去醫院檢查。現在他們可以通過App在線看病,快速得到一些建議,比如像這種病只需要多休息、喫些常規藥物,就能快速恢復,而另外一種病要慎重對待,要去合適的醫院就診等等。

  • 在線心理醫療:我們在遠程醫療領域也有應用場景:對於遠程心理服務,我覺得是否支持遠程視頻其實很關鍵,心理患者的治療通常是跟治療師聊天,而遠程心理服務基本上就是通過服務器跟你聊天。患者會覺得這個環境很舒服,很放鬆,而且很多時候可以就在患者家裏進行,所以這樣的服務會令人感到更舒適,也更受一些患者的歡迎。 

  • 物聯網機器人:物聯網應用場景方面,其實很多公司會在機器人裏內置一些視頻聊天功能,這樣就能實現跟機器人聊天,或者跟站在機器人前面的人聊天。所以現在很多機器人供應商都在利用我們的技術來實現這個功能。這是一個非常好玩的應用場景,我們在召開開發者大會的時候,也會跟這些機器人玩,非常有趣。

  • 在線教育:我覺得東南亞地區對在線教育的需求也在不斷增長,雖然跟美國和中國相比,可能還有點滯後,但是它的增長速度非常快。有時候東南亞也會有一些很有趣的應用場景,比如他們會把實時音視頻技術用在宗教場景上,通過我們的平臺在線舉行一些宗教儀式性聚會。

  • 其他服務:我們其實一直需要研究湧向我們平臺的各種需求。首先是要以開發者的興趣爲主,如果我們發現很多開發者希望打造特定的社交應用場景,我們會更多關注應用場景的賦能,也會和開發者們共同去創新。當然,有時候還會關注更根本的東西,比如用戶體驗質量。所以我們纔開發了諸如“水晶球”等工具,讓他們能夠更直觀地瞭解體驗質量,更好地利用我們的技術和服務。

六、實時雲互動的未來

1. 實時互動能顛覆更多的垂直領域

事實上實時互動在日常生活裏可以有更多應用場景。如果你深入瞭解我們的現實生活,就會發現現實生活中充滿了各種互動,但是我們上網時的互動情形卻極爲有限,只有少數場景能實現實時互動。但是通過增加實時互動,應用就能輕鬆實現更自然、高效和更具吸引力的用戶體驗,能增加用戶黏性和參與度,往往能讓應用在垂直領域的競爭中脫穎而出。以Peloton爲例,它就是一種實時在家鍛鍊的硬件+視頻APP,改變了大家對健身器材的看法,也讓人們重新認識了這種技術的強大。

2. 5G、VR在未來是什麼樣子?

5G網絡無疑打開了更多的想象空間,讓很多過去不可能實現的事情變得有可能,我們也非常期待它最終的發展。

5G可以讓開發者能以更靈活的方式在無線設備上構建新的應用場景,最吸引人的可能會是實現更高保真的視頻和音頻體驗,比如提高視頻分辨率和畫面質量,在音頻溝通或者音頻路徑互動中添加更多的聲道,以此來提高用戶體驗。

VR技術的發展也是一種新思路,有些公司已經開始利用我們的平臺打造非常有吸引力的VR教育。儘管VR教育現在還處於早期發展階段,我仍然認爲這是一種足以改變整個行業的創新。比如用VR搭建一個語言學習課堂,你只要帶上VR設備,就會感覺自己置身於以你學習的語言爲母語的國家,然後做一些日常的事情,比如在商店買東西,去餐廳點餐或者去酒吧等等,然後你自然而然地就開始通過課堂在線練習這種語言。和老師站在白板前教你相比,這種方式要有趣和自然得多。

3. 5年後,實時互動會如何改變我們的生活?

我們總在暢想着未來,五年後肯定會有更多用戶接受、喜歡的應用場景。一些在今天看來很難做到的事情,在未來可能會變得很普通。

就像過去幾年,在線教育發展迅速,但還是更集中在大城市、一線城市,但是這個趨勢一定會繼續向偏遠地區擴散,讓欠發達地區或國家的學生也能享受到高質量的教學資源。老師不必長途跋涉,學生可以在家裏遠程上課,這對很多人來說一定會很有用。

再說說醫療場景,現在我們看病主要還是依賴醫生們的付出,但是如果我們能讓病人不盲目地全都湧向醫院,就能大大減輕醫生們的負擔。比如現在就可以通過視頻在線向醫生們諮詢,哪怕只有50%的人是輕症,醫院的看病效率也會提高很多。

實時互動還會改變更多行業,比如保險行業,如果你的車出現一些問題,或者遇到了一個小事故,何必需要專人到場檢查?視頻通話就能解決所有問題。從消費者到保險公司,效率都會大大提高。我相信這些在未來都會實現。

很多物聯網上的應用場景也能讓生活更便利。我們發現一個趨勢,很多公司都在嘗試把視頻通話內置到大屏幕電視裏,這樣用戶在出差或者出門在外的時候,也能很方便地通過智能手機連接到客廳電視,隨時和孩子聯繫。所有這些都可能在未來五年內實現,其中很多場景都可能成爲平常的生活體驗,而不再是新事物。

在我的想象裏,隨着網絡的成熟和萬物互聯的趨勢,再加上有我們這樣的技術爲所有場景賦能,大家在日常生活中不管想做什麼事情,都會有兩種方式可供選擇。一種是傳統方式,也就是在線下的現實世界中完成;另一種是藉助VR設備或者其他技術,在線完成所有事情,而且獲得與線下類似甚至更棒的體驗。線下也許還會有一些物理性限制,但網上世界將會是貨真價實的無拘無束。

我最近學到的最印象深刻的一件事,就是專注。少即是多,我覺得通過這些年,我越來越能理解隻言片語的建議有多可貴。專注可以無處不在,當然,只要你能深刻地理解它的含義就行了——正如我們數年如一日在實時互動雲這件事上的堅持。

*趙斌:聲網Agora創始人&CEO,曾任YY首席技術官。

本文來自微信公衆號: GGV紀源資本(ID:GGVCapital) ,作者:趙斌,編輯:張穎,本期內容編譯自GGV英文播客《Evolving for the Next Billion》2020年3月期

相關文章