来源:声网Agora,「创业最前线」经授权转载

据Gartner预测,2020年全球互联设备的规模将达到250亿台,是2015年的5倍之多。如此海量设备间的互联互动将是一个巨大的实时网络,API可以把所有设备、App连接起来,让用户进行真正实时的音视频、数据和观点的交流互动。

早在2014年,声网便看到了万物互联同实时音视频的巨大机会,并开创了面向全球的实时音视频云服务。

而作为实时音视频云服务的开创者和引领者,声网Agora也从未停止过上下求索、思变求进的步伐,在刚刚过去的2019年,声网实现多项产品、服务革新、新技术探索全面落地,并且推进了业务和服务的迅猛增长。

日通话分钟数超过6亿

150000+注册App使用声网API

服务覆盖10余个行业,100余种场景

全球50+新增数据中心

300%全网带宽容量上涨

中国区支持百万大频道动态扩展能力

海外大频道扩容时间缩短50%

支持 5G 网络下高清、大码率视频传输

移动端超分、感知视频编码、AI降噪等新技术落地

1、新技术探索全面落地

在与开发者、客户携手拓展新场景的同时,声网的技术根基也更加深固。在2019年落地了多项技术探索。

AI算法让视频更高清:业界首个商用移动端超分算法

声网Agora的视频超分辨率技术,可以将实时传输中的视频在原有分辨率的基础上实现两个方向的2倍同步放大,并获得显著的细节增强,全面提高原有视频分辨率。

声网Agora超分算法同时支持在云端和移动终端上实时运行,并可以在移动终端上达到非常出色的效果。这是行业内首个可实时运行于移动设备端上的超分算法模型。

AI算法助力音频审核、降噪

在音频方面,也有AI应用落地。一方面全新的AI降噪技术,可有效地处理喷麦、电流音等常见声音干扰;另一方面,利用AI丢包隐藏技术有效保证弱网情况下的有效沟通。

更节省宽带:编码更高效

声网在音频编码上做了如下3方面优化,来节省宽带使用。

  • 感知编码

可在画质不变的情况下,帮助用户节省更多的码率,能大幅节省使用带宽,或在一些场景下可以提升画面的流畅性。

  • H.265

已全面支持H.265,在传输同等质量的视频时,带宽占用只需H.264的一半。

  • 软编更高效

在传统的PRIM算法上进行了优化,在软件编码器上开启后,对图像运动相对简单的场景,可节省其20%的带宽。

高音质语聊房:声音美化接近专业调音效果

AgoraSDK 已全面支持20kHz高频谱、48kHz全频带高音质应用,可以全面保证频谱的丰富性、饱和度和高保真度。优化了弱网环境下的音频表现,在70%的丢包情况下,仍能获得流畅的高音质表现。并提供接近专业调音效果的声音美化功能。

“专线”级别传输质量

  • 进一步提升优质传输率

AgoraSD-RTN™ 作为承载RTC业务的实时传输网,在2019年也得到了进一步的优化。目前网内传输,通话送达率已达到99.9%。对东南亚、印度、南美等地区的传输覆盖进行优化,这些地区的优质传输率已经达到95%以上,进一步提升了泛娱乐、教育等多种场景的互动体验。

  • 降低“错分率”

通常来讲,国内传输的数据可能会遇到“运营商错分”问题,比如本应在电信网络内传输的数据,会因为个别中小运营商的服务器分配错误,导致跨运营商传输。

当出现这种情况时,通话的质量就会受到影响。声网在这一年中,针对这个问题进行了一系列的探索与优化,已将“错分率”降低到0.1%。

2、技术生态助力实时互动场景升级

在用户需求和市场环境变化的过程中,声网的服务也不断创新升级。我们已与全球40多个合作伙伴开启云市场,共同创建一个RTC实时互联网生态,帮助开发者加速集成开发,并针对不同实时互动场景的需求,推出多种场景化方案。

稳定支持在线教育全场景

声网面向1V1、小班课、互动大班课、双师课堂、超级小班课、AI互动课堂、音乐教学、游戏化教学等8大在线教学场景,均推出了相应解决方案。

在普通语音教学场景下支持8K或16K采样,在音乐教学场景下覆盖全频带的48kHz采样;最高可支持4K高清分辨率;融合声网Agora语音引擎与AI音频降噪算法,针对双讲现象进行了特别优化。

超低延时H5实时直播

声网在今年发布了推出H5实时直播解决方案,视频延时可低至200ms,纯音频可低至50ms。它基于AgoraWeb SDK 实现,既兼容大部分的Android机型、浏览器,又可以满足白板+H5直播对实时性的要求。

升级远程医疗解决方案

随着RTC技术不断在医疗行业中的渗透,视频急救、医学教学、远程问诊、电子处方等场景逐渐RTC化,医生与患者足不出户,即可在线上完成问诊、开药和教学交流。据某客户数据显示,今年有超过10w用户发起在线视频问诊。这一场景就是基于声网远程医疗解决方案实现的。

同时,结合声网RTMSDK、本地录制和云端录制服务,可满足医疗教学、电子处方等场景对屏幕共享、医学影像操作、病例实时共享等远程协作需求。

声网助力医视圈实现远程医疗协作

高可靠的低功耗智能设备解决方案

自从小天才视频手表基于声网AgoraSDK 实现了视频通话功能后,我们不仅推出了低功耗智能设备场景方案,并先后集成到了AR眼镜、智能摄像头、智能音箱等产品中。低功耗智能设备场景方案适用于基于ARM架构、Android系统平台的低功耗智能设备。

泛金融视频双录,数据安全,存储可靠

声网推出了泛金融视频双录场景方案。在满足企业网络安全要求的前提下,可以实现企业内外网音视频和信令信息互通,录制,加密等企业级需求。

全场景支持内容审核

声网在原有的实时语音互动直播的基础上,整合业界Top3 语音识别服务,推出了业界独有的一站式智能语音识别方案。开发者只需在应用中集成声网AgoraSDK,即可让音频在实时传输的过程中完成语音内容识别与审核。

视频会议实现实时双语字幕

AgoraSDK融合业界领先的语音识别和机器翻译技术,推出视频双向翻译转写功能,可实现在实时视频会议场景中“中译英”和“英译中”的同传工作,让视频会议也能拥有双语字幕。

3、产品革新,服务升级

实时消息全球部署低延时

实时消息(RTM)SDK在5月正式发布,系统容量提高了数倍并可随时拓展,支持单频道百万级并发在线及亿级消息并发。并提供丰富的功能支持语音聊天室、小班课、大班课等等不同业务场景,帮助国内、出海以及海外客户轻松构建实时场景。

RTSA开放SD-RTN™码流加速能力

RTSA实时码流加速SDK主要面向那些自己可以完成软硬件编解码或有特殊编码要求的开发团队的,RTSASDK 可以帮助他们解决复杂的实时网络传输问题,让他们的音视频数据也可以接入SD-RTN,获得覆盖全球的优质传输体验。

云端录制服务,30分钟即可快速集成

2019年中旬,声网正式推出云端录制服务。开发者通过5个RESTfulAPI 即可方便快速的开启和控制云录制功能。

推流3.0,可靠性全面提升

在今年对AgoraSDK 升级后,声网推流服务极大的提高了服务的可扩展性、可靠性和API的易用性,并且卡顿率和音视频质量得到了显著的改善。目前,推流成功率与CDN的握手成功率均超过99.99%。

“水晶球”每天提供3000亿数据点

水晶球(AgoraAnalytics)是声网发布的业界首个实时音视频全通话周期质量监控与分析平台。水晶球每天有3000亿数据点,从App端到SD-RTN™,从采集到渲染,为用户提供全链路的质量透明信息,让用户真正做到对自己应用中的实时音视频数据质量了若指掌,支持RESTfulAPI。

4、一切以开发者为中心

第五届RTC实时互联网大会

2019年6月旧金山、10月北京,两场RTC大会如约举行。在北京的第五届RTC2019实时互联网大会上,来自W3C、搜狗、阿里巴巴达摩院、字节跳动、美团、沪江CCTalk、bilibili等团队40多位技术总监、资深工程师,围绕AI、大前端、网络架构、编解码等话题分享了实践经验与前瞻理念。他们还与现场的数千位开发者一起度过了一个充满知识、欢笑的程序员节。

图:旧金山 allthingsrtc大会

图:北京RTC2019

行业首个RTC创新开发大赛

7月1日,声网发起了业界首个围绕RTC技术展开的创新开发大赛。大赛共三个赛道,包括编程创新挑战、超分辨率图像质量挑战和超分辨率算法性能挑战,共有150余人参加了编程创新挑战,760多支队伍参加了超分辨率的两项挑战赛,最后有9支团队脱颖而出赢得大奖。

2014年,从硅谷一个车库的几行代码开始,到2019年,声网每天为全球开发者提供超过6亿分钟的实时音视频技术服务。

支持新语言与开发框架

在2019年初,Flutter开始成为开发者们最关注的技术趋势之一。声网率先支持了Flutter,并推出AgoraFlutter SDK.

为了满足开发者们希望将实时音视频通话与人脸识别、图像识别、声纹识别或与其它Python库结合的需求,能玩出更多花样。声网发布了PythonSDK,并提供了集成TensorFlow进行图像识别的Demo。

目前,已推出超过120个Demo。在不断维护、更新代码的同时,声网也对大部分的集成文档进行了优化,让它们更加通俗易懂,降低大家的上手门槛。

Solo系列编解码技术的开源与演进

在今年的RTC2019 实时互联网大会上,声网正式开源了自研的语音抗丢包编解码器SOLO编解码器,它可以帮助所有正在做实时音视频的开发者,有效减少丢包对语音通话质量的影响。同时,下一代SOLO编解码器——SOLOX的技术演进步伐也未停歇。

在低码率下,SOLOX比Opus的抗丢包模式MOS分高出了0.7以上,且码流兼容Opus,即SoloX的码流可以被Opus正常解码。

国内首个WebRTC镜像与开源文档

在Demo以外,声网还为WebRTC开发者建立了国内首个WebRTC源码镜像,以及开放于Github上的WebRTC中文文档。开发者们不用再受限于网络,可以直接下载、编译WebRTC源码,还可以阅读或自行优化WebRTC中文文档。

这两个资源的地址,均已公开在RTC开发者社区(rtcdeveloper.com)中和Github中。

更易用的开发文档

为了给开发者更好的开发体验,声网对超过100位开发者进行了访谈,并根据建议全面优化了文档,包括重写了8个产品8个系统平台的Quickstart、文档搜索功能与搜索结果优化、重构了31篇高阶开发指南、优化了所有产品、平台Token的文档易用性等。

而且,在官方Github开源了所有开发文档,让开发者参与优化出更适合他们的文档。

声网Agora成立于2014年,是实时音视频云行业的开创者及领先者,也是全球最大的实时音视频专业服务商。在过去6年的全球化运营中,声网以实时音视频RTC技术为核心驱动了爆发式的业务增长。

截至2019年10月,声网的日均通话分钟数已经达到6亿,每年为企业客户、创新创业项目、开发者提供超过5.79亿分钟免费服务时长,全球范围有超过30亿台终端安装使用AgoraSDK的应用。

2014年成立至今,声网已经将RTC技术赋能到社交直播、教育、游戏、金融、医疗、企业协作、IoT、VR/AR等10余个行业,共计100余种应用场景。

声网Agora服务的国内外产品包括陌陌、斗鱼、虎牙、抖音、VIPKID、好未来、火花思维、小米、华为云、金山云、众安保险、TheMeet Group(美国最大的婚恋社交平台)、HikeMessenger(印度“微信”)、musical.ly(北美短视频平台)、LisPon(日本二次元音频社区)、StagerLive(日本直播平台)等。

相关文章