|  首页  |  资讯  |  评测  |  人物  |  活动  |  学院  |  新报  |  专栏  |  专题  |  
您现在的位置:硅谷网> 学院> 速记>

RTC 2018实时互联网大会之声网媒体沟通会实录

2018-09-08 17:21 作者:简弋 来源:硅谷网 HV: 编辑:GuiGu 【搜索试试

【硅谷网导语】北京时间2018年9月7日,RTC 2018实时互联网大会在中国北京举办,大会自2018年9月7日-9月8日,为期2天。RTC 2018亚洲站由声网Agora主办,极客邦科技、AllThingsRTC、CSDN联合主办,硅谷网提供全程媒体支持。作为全球首个也是最大的实时互动技术服务平台,声网Agora在RTC 2018实时互联网大会上宣布,其全球开发者数量逾20万,连接超过20亿终端用户。声网坚持以“赋能开发者”为使命,引领实时互动技术革新,激发行业场景创新。通过自建全球200多个数据节点的SD-RTN™ 软件定义实时网,独创音视频编解码技术,声网每日支持通话分钟数超过3亿。

官网:http://rtcexpo.org/

时间:2018年9月7日下午
地点:长城饭店二层

主持人: 非常感谢各位媒体朋友、各位声网合作嘉宾来到新闻发布会现场!

今年是一年一度声网主办的RTC现场,我们每年都会在大会第一天下午有一个机会,跟很久不见的媒体朋友们聊聊声网在过去一年有些什么样的进展。今年同样邀请到了来自声网的几位嘉宾,与大家一起分享在技术、业务、全球扩张方面有些什么心得。同时也邀请到全国各地各个行业的声网合作伙伴。

掌声有请声网形象代言人、创始人、CEO赵斌先生与大家分享!

赵斌: 感谢大家来到现场参加这个发布会。我跟大家分享一下过去一年多经营中碰到的业务状态和业务进展,也算是给各位媒体朋友介绍我们的成果。

声网从成立开始就希望自己成为全行业第一个专业的实时互动行业供应商,经过四年多、快五年的持续发展,很荣幸和很高兴的讲,我们今天成为全球范围最大这个领域的专业能力供应商。下面是一些数字,可以看到2015年开始,我们从几千个开发者项目在平台注册,今天已经超过10万个项目,随着这些项目的发布,把我们的设备带到全世界超过21个设备上,每天产生3亿分钟实时音视频通话互动。

在这些使用量背后是丰富的使用场景成长,穿透到娱乐、社交、游戏、教育、远程医疗、政务、公安等这些使用场景,并且这些使用场景促使使用量进一步膨胀。注册的应用项目数和使用分钟数都有快速膨胀。

从使用扩张的角度,最早的第一个用户是全球化用户,做的是语言交换,今天业务成长呈现了清晰的全球分布状态。从单纯区域统计的视角,海外用户使用规模是中国的2倍,所以全球市场总体上是非常均衡、普遍发展的。最近北美、中东、东南亚用户增长是明显提升的。在非洲、俄罗斯区域开始出现新的增长。

在前面主会分享中介绍到了为什么这些增长发生,增长发生的同时给行业使用场景和应用带来什么影响及变化。在社交领域最早发源长得比较多的是重构社交领域的沟通和交互方式,从使用量视角来说,它在各个平台上的分布更加分散化和成熟化,这种分散化也代表成熟化,尤其是比较突出的去年从Safari苹果开始支持WEBRTC之后,WEB上的使用量快速增长。

过去一年用户上网习惯开始从单纯靠免费WiFi向移动数据切换,一方面反映了基础设施规模的成长,另外一方面也反映了移动数据成本的下降,很多人的流量套餐降价很多,不太关心用的是移动数据还是WiFi流量,下一步5G到来会进一步促进流量使用成本降低和使用场景的扩张。

从使用模型来讲,开始时一对一音视频通话是主流使用方式,超过2个人的,3个人或者6-10人的使用量也在扩张,说明从单纯的一对一变成了群体交流的使用形态,这更符合线下互动模型。线下有很多多人互动场景,在业务和应用发展过程中,从大家一开始一对一交流有一个习惯的过程,到后面开始扩张到更多上下文、更多环境下交流,自然产生了多人使用场景。其中超过11人的在去年有过爆发式增长,因为狼人杀典型玩法是在12人时玩的,这个爆发之后逐渐回到恢复时产生了模型的使用量降低,但占不依然不小。

从使用方式来讲,音视频在欧美发达国家是主流,很大比例的使用量都是纯视频的,但中东、亚洲地区、中国的音视频占比很高,这反映了使用习惯、使用场景、用户心态的差异,希望我们看到的现象对行业业务了解有更好帮助。

设备的多样性是更加复杂的一个问题,从设备多样性的角度,一方面有历史原因,另外一方面,现在有更多IoT设备开始接入,比如像儿童手表或者摄像头、智能音箱设备接入进来,安卓设备的适配也增加了很多。

另外,业务进展过程中明显看到用户对质量的关注,用户对质量的关注反映在数据上,一些地区经过质量优化,可以明显看到没有其他交互或使用功能发生变化情况下使用分钟数的成长,这反映了质量始终是影响用户使用习惯和体验的最核心因素。这里也有比如社交领域业务用了视频之后对他们产生的帮助和业务改造,一个是在使用粘性和流量增长上,另外,对付费能力的影响也是非常明显的。

这几个是我们产品和运营工作里使用坚持的几个方向:交付高质量通话、让开发更加简单自由、加速开发工作带来业务成长。过去一年里,一是在全平台支持互通做了很多工作,这里有一些大家容易想象的平台,比如Linux的支持等等,也有一些是传统没有考虑更多的,比如Electron、小程序等等的支持,让开发者在任何使用场景下都能够方便的进行互动。

另外一个最近推出的产品,主要是在实时互动场景下碰到很多质量问题,在这些问题出现的时候对各种各样使用场景和业务方法都有影响,比如体验下降、用户满意度损失,或者应用的运营者搞不清楚技术怎么推,技术怎么才能用好,怎么用才能避免问题。去年和前年开始讲质量透明度问题,我们针对这个问题做了“声网水晶球”产品,希望大家知道任何一个呼叫通话里出现了什么状况,如果碰到体验上的损伤或者问题是什么原因带来的,来帮助场景下的用户,比如远程教学的如果发现是教师网络连接不太好,它有机会通过简单的推动教师网络改造或切换而去解决问题,从而把自己的业务做得更好。这样的产品能够帮助开发者和最终客户更好的使用这个技术去开展更好的业务设计,从产品推出以来得到更多客户的认可和喜爱,这是我们推出的一个里程碑式产品。它在实际使用上,最关键是保证数据的实时性、简单易用性、高可用、通过丰富数据,帮助每个开发者和应用运营者有效的分析和解决自己系统里存在的问题。

另外,我们在过去一年中持续改进和提高在音视频处理方面的能力,这是去年我们发布的AgoraSolo编码算法基础上的一个升级版,它最主要的价值是不光可以改造丢包对抗的能力,而且现在可以和WEBRTC默认标准的opus算法结合,帮助opus提高丢包对抗能力,并且可以用兼容能力与opus互通。比如浏览器上只能用标准的opus,在原创的Windows客户端等可以用其他的编码算法,当这两者要互通时是不是能够平滑切换和继续使用丢包对抗能力,通过AgoraSoloX就可以做到这个能力。

它能力质量的表现,如果是Solo场景下20%丢包,在同样测试周期里,对于丢包对抗最终PLCAPI的调用大概是1200左右,如果是原始opus的算法在20%的丢包情况下,它对丢包PLC调用达到6000次以上,用X算法把丢包损失需要补偿的需求降低了差不多百分之六七十的程度,说明其中差不多百分之六七十场景下用了AgoraSoloX以后不需要进一步补偿了,改进非常明显。

还有一个是我们近期推出的一个新能力,就是我们推出了百万人级别的实时大频道互动能力,使未来有机会使用很多创新应用场景创造新玩法,这些玩法将来在社交、娱乐和直播这些领域开创新的商业机会,可能会形成颠覆式的突破性的业务成长。怎样定义这样的业务?为什么它是非常创新的场景?今天在互联网上做视频直播并不难,而且即便做很大规模的视频直播也并不难,但这样的视频直播经常延迟非常长,在非常长的延迟下是没办法和主播或表演者进行任何互动的。

比如说线下活动的现场,哪怕是几万人的演唱会,也可以看到现场表演者和观众之间的互动,比如说观众兴奋的时候可以尖叫、鼓掌、做一些动作、挥舞荧光棒等等,这些对台上的表演者可以看到和听到甚至影响,有些表演者可以和观众互动,通过互动来加强现场氛围及人气,帮助现场观众有更好参与感和娱乐体验,这就要求有足够规模的情况下有很低的延迟,这个很低是多低?按照通讯标准是百毫米级。

现在传统直播大概是几十秒,最近这些互动直播只是演进到了3-5秒的程度,3-5秒程度可以进行图文互动,可以用文字来给反馈,体验时接到这个反馈不会觉得延迟很大,因为打字总是要花时间的,这是我们想象的互动速度。但是如果一个人鼓掌呢?表演之后过了5秒钟他才开始鼓掌,这个体验就很奇怪,观众必须在百毫秒或者至多1秒内收到反馈,这是相对可以进行实时音视频的互动,理想的是需要实时的,百毫秒下的延迟下去做互动。

这个规模本身并没有什么,但规模+延迟的绑定就是一个创新的能力,能够创新产生新玩法和使用场景。这是常见应用里的延迟,大家可以看到我们现在提供和推出的是一个超低延迟、准实时的大频道互动能力。

另外,在这样超低延迟大频道情况下要有最基本的质量保证,作为直播类应用的媒体质量更重要,从行业角度来说,规模、质量和延时这三者是互斥的特性,同时做到理想程度才能够支持百万级大频道的使用场景发生,并且在体验上有优势。

比如像这样大型演讲、培训活动、体育赛事、演唱会都有机会线上化,这个线上化并不是观众去看现场发生了什么事但完全没有参与感,而是通过自己的动作、声音、手势、工具去参与现场互动,表演者不是被动的,而是有参与感的,参与感会带来业务深度和盈利能力的空间。

这是早上讲过的场景爆发,比如:去年有多款狼人杀取得使用量和用户认可;今年在狼人杀基础上演进了更进一步的剧本杀;还有小游戏,以前4399这样的平台小游戏都是陌生人之间玩的,不需要通话,今年年初开始出现了有意思的现象,大家玩小游戏回归正常的线下行为,更多跟熟人或者准熟人玩小游戏,一边聊一边玩;开黑陪玩是在PC时代很火的玩法,现在丰富多彩的很多家都在做这种应用;语聊广场用到了很多场景下,去聊不同的话题,不是单纯限于社交这一个领域。

直播也在过去一年出现了很多玩法,比如去年这个时候去看直播行业,大概就嘉宾连麦或者观众连麦,现在一起KTV、跨直播间连麦、三人连麦主播、语音电台直播、直播答题、抓娃娃。答题体验还没有利用APP的交互能力创造更深的体验能力,但这都是会发生的。抓娃娃这个业务随着新鲜感的过去,进入了平稳和有限的空间,抓娃娃机都在流量入口。

设备上看到很多新的用法:智能音箱是大家耳熟能详,在行业里大火过;眼镜,过去看Google眼镜觉得酷,一直没有特别好的实际应用案例,但过去一年看到了厂商找到了有效使用案例,在高价值场景下发挥了独特的应用,业务进入了新的成长;智能门禁在今天越来越多得到普及;机器人场景也越来越丰富,在商场里见到机器人已经不觉得奇怪了;智能手表在以前只是打打电话,现在也开始做视频通话了。这些能力的穿透代表了IoT领域丰富的新场景发展。

在相对传统的行业里,比如金融、客服等等这些领域,在金融、保险等很多新的应用,进入公司服务的APP里。教育也有很多深度改造,其中一个是线上教育、线上课堂,在名师资源的普及上产生了很大的进展,尤其是把一些因为地域原因而不能匹配的教与学的需求通过线上匹配了起来,教育领域都在用这种能力做线上教学,比如音乐、编程、K12等等,很多领域都被线上教育改变了。

在政务和公安上也发生了很多变化,比如像安全上,我们两三年以前就预言了这种使用场景,今年看到真的发生了,在公安上一度成为讨论的热点,这会不会是安全事件里的关键解决方案。

在出海和全球化上已很多案例,一会儿海外的业务同事会具体介绍。

再次感谢全球的20万开发者和我们的合作伙伴,与我们一起帮助消费者享受更多互动能力,更直观和自然的参与到自己想参与的线上活动里。谢谢!

主持人: 谢谢赵斌先生的精彩分享!RTC技术是一个随着创新场景一起成长起来的技术,这个趋势并不只是在中国,我们海外的用户数已经是中国的2倍,所有这些都离不开海外运营团队和技术团队,接下来有请美国以及国际业务负责人ReggieYativ进行简单的分享。Re来自以色列,是犹太人,曾经在欧洲和硅谷的很多技术公司都工作过。

ReggieYativ (英文演讲)

主持人: 接下来请我们声网的首席科学家钟声,与大家分享技术流,像人工智能、加强学习算法在RTC领域的应用。

钟声: 我与大家分享一下声网在技术方面的构想和布局,声网从4年前成立是就是在硅谷的车库里发展起来的,从第一天开始就注定了技术是它的基因,而且我们深信:只有最好的质量,才能带来最大的需求,只有差异化的产品,才能够为我们的伙伴带来在赛道上的胜利。

有一个趋势,思科在2017年做了个预测:互联网上的视频从2017年到2021年会有4倍增长,在互联网上的占比也会持续增长,到2021年增长到87%。有几个热点:第一,实时互联网的视频将增长15倍,占整个视频流量的13%,也是超过整个互联网流量的11%;第二,在线游戏会增长11倍,占到整个消费者互联网流量的5%。第三,AR/VR虚拟现实和增强现实会增长20倍,因为它的基数比较低,只占1%,2021年之后这个赛道还会持续爆发性增长,尤其随着5G的到来,带宽的释放,这个行业还会持续增长。

到2021年时,以视频作为互联网上的活动,以观看视频为主的将达到19亿,它主要的娱乐来自于视频,每分钟将有100万小时的视频内容被下载、被分享。这么多的内容,没有任何一个人能够去消耗或观看完,除了人工智能机器可以快速去分析之外,人类没有办法。作为合作伙伴或者自创内容的提供者,怎样让自己的视频很容易被发现?作为服务或者内容提供商,怎样增加日活用户量,怎样增加用户的观看时长?基于广告的商业模式的厂商应该怎样让用户注意到广告,并且能形成转换。

作为一般性的原则,在应对这几个挑战时,主要是建立精准的基于内容的视频索引,以便于搜索、便于推荐,二是打造用户画像,根据他的观看时长、留存率、交互习惯,我们了解用户的需求、了解用户的喜好,并且根据场景和用户的画像一起来做语言推荐,甚至结合个人喜好和当时流行的视频内容。从用户的角度,用户体验是至关重要的,甚至决定一个用户能不能存留、满意度、观看时长的唯一因素就是用户体验,刚才在赵斌先生的介绍里也有质量提升多少百分比可以转换到用户时长增加多少,质量是释放需求的。

我们把握不住未来有什么风口和预测有什么黑天鹅出现,但是如果我们把握住“提高最好的质量,提高最大的差异化”,未来一定让我们的合作伙伴在他们的赛道上取胜,我们的合作伙伴有自己丰富的想象力和创造力,创造出很多新的风口和热点,我们把基础服务做好。归结到三个方向上:第一,优异的视频编解码质量以及传输技术,第二,支撑发现感兴趣内容的技术,第三,人机交互能力。现在线上虚拟化这个趋势已经不可扭转,虚拟的同时有现实需求,所谓的“虚拟现实”,有更好的交互能力、更好的表达能力,才能使得在虚拟上的社交通信互动变得丰富多彩和令人感兴趣。

在语音视频编解码追求更高的抗丢包特性,因为公共互联网会丢包,在丢包的情况下我们不能中断服务,这些地方有机会比电信服务做得更好,比如地铁里电话线一断了就不能恢复。基于互联网丢几个包或者丢包超过50%的高损伤情况下还能让我们的服务继续下去,这是我们追求的目标。2、传输网络更加友好,就像高速公路一样,适当对车辆进行管控,不能有一个车横冲直撞的在高速公路上跑,把整个秩序都扰乱了,传输也有类似的道理。3、对视频质量、编码效率和质量要提升。

在视频后处理,1、把模糊语音、图像更清晰化。2、把残缺语音、图像补齐补好。

因为我们是端到端的系统,中间涉及云和数据中心,在网络和数据中心,我们的任务是:1、精准估计带宽。2、智能数据中心。3、动态找到最短的、最可靠的那条传输路径。4、大数据挖掘。因为系统很复杂,一个环节出错会影响整体体验,我们及早的发现问题、及早的修复,甚至发现要变坏这个趋势,然后采取预防的措施,把问题消灭在萌芽之中,让我们的用户根本不会经历中断服务或者很差的体验。现在用户还有一个特点,耐心是很低的,因为我们都是碎片化的消费,任何时间、任何场景看一小段,如果你的服务不好,马上就换到另外一个地方去了,这些都是我们为生态伙伴们必须要考虑到的。

在视频前处理:1、风格转换,包括美颜、瘦脸,还有把视频、人脸和声音转换成另外一个人的脸、声音,风格变成印象派或者毕加索那种更前卫的风格。在新的社交媒体,大家交互时要有更强的表现能力。而且我们提供这种能力之后,用户的想象力和创新能力也得到极大的丰富,他跟远方心怡对象表示时可以做出很多有趣的东西,产生理想的效果。因为我们也有交友网站的客户,他们创新性的引入了这个视频,收到了非常良好的效果。2、人机交互。比如用动作手势比一个心型,就会识别出来,送几个颗过去。比如过年时做一个拜年的动作,就有虚拟礼物在飞等等。

简单汇报几个结果:这是视频编码方面取得的新进展,新算法跟产品中在用的算法相比有更高的效率,相同质量下只需要一半的码率,比如延迟只有4帧情况下,丢包率是60%,基本上码率只有原来的一半,负的50%意味着码率下降一半,同时编码的质量和复杂性没有本质变化。总的来说,新算法在高丢包率、低延时情况下,比现在的算法显示出更大的优势。

如果拿到很模糊的图像,我们有没有办法把它变得很清晰,尤其在低码率、低分辨率的时候?右边这幅图是基于传统办法做出来的多像位滤波、三次发差值等出来的,总体上比较模糊。用了深度学习算法之后,细节明显得到了比较大的提升,在比较挑战的网络条件下、带宽受限的情况下,我们收到的码率很模糊,但是仍然能够收到清晰的画质,在收视感官上有很大的提升。

深度学习有一个大问题,就是大模型、大数据、大平台上实现,我们的用户和伙伴基本都是拿着移动端,最多拿个PCpad,怎样实现这些算法是一个挑战,目前我们在此方面做了很多工作,比如在iPhone6上把一个放大9倍算力支持到每秒200帧,已经达到实时。

再展示一幅图,是我们把很多技术贯穿到一块,像降噪、美颜、肤色调整、对比度提升、细节提升等等,把低对比度、带噪声的图像变得更清晰、细节度更高。

在音频方面我们的Solo具有抗丢包特性,多个人在对话互动时对抗丢包性更高,与业界公共标准像WEBRTC是兼容的。给大家看一段视频,这是典型的直播秀场场景,处理前比较模糊,我们用人工智能深度学习的算法处理以后,图像和文字都清晰了很多。

这个是自然场景,把那层“朦胧的面纱”给揭开了,、山、鹅卵石、水波纹得到了比较大的提升。这是网上下载的视频,证明深度学习神经网络泛化能力比较强,因为这些都是没有训练过的图像。

谢谢大家!陆陆续续的会集成到我们的SDK里,希望大家尝试我们的SDK。

主持人: 我刚刚一直在点头,心里在想:哇,完全听不懂啊!但是最后放了两个生动的图像和视频,可以很说明得到了更高清和更好质量直播的现场体验,感谢专家背后的贡献。

接下来请上声网几位重要的合作伙伴:

海风教育CTO张建华先生;

宝岛台湾大宇(音译)咨询股份有限公司营运长廉建清(音译)先生;

步步高互联网技术部部长张春雨先生;

亮亮视野联合创始人马寅;

声网创始人赵总。

接下来请几位嘉宾跟我们一起见证未来声网和各位合作伙伴开启更多更深度的合作,有请各位嘉宾把手放在按钮上,让我们一起按下这个按钮,期待奇迹会发生!(启动)谢谢各位嘉宾,台下就座!这个标志是选择了一个像声音的声波,因为我们叫“声”。

感谢今天的媒体朋友和合作嘉宾来到现场,接下来进行问答环节。

提问1 我来自36氪。我对咱们的技术是没有什么质疑的,毕竟经过砺练。我对场景方面有问题,比如我了解到音视频这块更多是在教育、文娱、游戏落地,这都是之前场景、之前应用的新功能,比如小游戏里现在加了音视频,有没有新的增量市场?比如物联网之后会不会有爆发?这是我临时想的,可能不是特别专业,不知道各位有没有考虑过。

赵斌: 这个肯定是有的,刚才合作伙伴一起在台上见证了发布会,智能手表就算是IoT物联网方面的用法,还有亮亮视野的同事,智能眼镜的使用场景也是物联网的。还有很多没有在会议上介绍的,比如客户把我们的音视频能力接到机器手上用在生产线上,还有一些接在无人机上用于风力发电的检测,其实非常广。

提问1 物联网有很多端,需要在端上计算或者边缘计算,它和之前咱们自己布节点的架构会不会不是特别一样?

赵斌: 这点不会的,因为计算、通讯和互动是两种不同的东西,通讯是没办法在一个点完成的,通讯一定是个通道,我们总体架构是在各个通道的途径上去做优化和保障,这跟我们整体结构是一脉相承的。

提问1 咱们算是一个技术输出型的公司吗?可以这么定位吗?在不同的行业做解决方案,未来会不会自己做?还是一直跟合作伙伴?因为他们的落地也是跟代理商成立合资公司做落地,我们这的商业化是怎么想的?

赵斌: 我们一直专注技术服务和核心技术上,应该叫“技术服务公司”,技术服务内容包括与合作伙伴的深度合作,包括服务流程和效率的优化。在解决方案上我们会跟越来越多的合作方配合,同时会开发更多开源项目和架构设计,帮助合作伙伴及最终用户容易的在领域搭建使用场景,它不是真正意义上直接拿去用的,至少是可以帮助它很快得到相似能力的。

主持人: 我补充一下,刚才赵总提到一些场景,他们上午还有一个特别生动的场景,就是重庆的120急救会用视频,可以一键呼叫来帮助进行远程协作家属,这样的服务在政务和医疗都有很多应用。

提问2 除了像您刚才提到的这些场景之外,赵总提到了生产线,我特别想了解一下关于制造业、工业场景下的使用需求大不大。因为目前我感觉目前针对社交媒体、互联网行业对于声网的解决方案是主流的,未来制造业、工业行业是不是更大的需求?

第二个问题,咱们除了算法上的提升之外,对全球布局的节点是否有所增加?大概量是怎样的?

赵斌: 从场景来看,制造业肯定有明确需求,尤其是5G的落地会带来很多,智能制造、智能农业等等有很多场景利用新的工业物联网能力,或者新互联智能设备特定机制下的协作,这些协作有特定媒体音视频有关,有的未必跟媒体有关,但协作、互操作成份都需要类似实时互联网传输保证,所以工业工业肯定是有的。

另外,刚才说到全球布点,这是我们持续的一个工作,在我们对外发布的信息中可以看到,我们的布点数量是每年都有所成长的,一方面是使用量的扩张,另外一方面是各个地区使用的进一步优化带来分布点的加强。

主持人: 补充一下,我们在全球已经有超过200个数据中心,这个数字每年都会增加,但真正的优化不一定完全是依靠布点,还包括算法优化和很多终端优化都在里面。

提问3 我是来自CSDN的记者。在今天上午的演讲中,看到您分享了过去一年中RTC的重大事件,包括WEBRTC1.0和AV1标准的定稿,想请问您的是,综合这些重大的技术事件对于RTC意味着什么?接下来会带来哪些改变?

刚才看到钟老师说到的Solo音频编解码,想了解声网在视频方面的痛点和技术解决方案。

赵斌: WEBRTC的定稿是第一个行业标准,在功能和能力上最终固化,这肯定带来行业的标准统一,下一步是繁荣成长和互通互动能力的扩张,这是肯定的,代表了行业的新探索、进展速度和成果。新一代的视频编码是免费开源的能力开放,也会促进这个场景应用能力的膨胀,就像我们运营商每个月提供1万分钟的免费使用,给开发者和创业者提供很大的自由度,可以在没有成本顾虑的环境下去创新。

钟声: 音视频有相似之处,公共互联网有损的,会丢包,很多人一起冲到互联网上时它就变得拥堵了,这时候延时、丢包变得突然之间很大,往往出现卡顿等问题,甚至很长时间才收到,这是行业面临的技术上的挑战。我们的远景是想做到电信级别的质量,甚至很多场景下需要超过,这就需要我们从各个方面,音视频的编解码是一个重点工作,使得具有比较高的抗丢包能力,从有限信息里恢复尽量多有用的东西,这是我们目前会持续改进和提升的地方。虽然有新的标准出现,但新的标准往往是以更多复杂性、更多功耗来换取的,在现有的标准下如果能够通过算法改进来达到同样的效果,无疑是更可取的一条路,或者这个工作必须做,做完之后对AV1和未来的266都是能够应用上的。

提问3 是否可以分享一下声网在这些方面的技术研发动作?

钟声: 上午简单提到了SoloX已经基本准备好,能够布局到产品里去了,而且它跟WEBRTC刚定稿的标准是兼容的,我们有机会把它推到开源的WEBRTC项目里去,让业界享用到这个成果。

提问4 我是创业邦的,声网下一步海外市场的重点是哪些国家和市场?

Reggie :我们会在伦敦组建第一个在欧洲的团队,接下来还会关注亚洲的像韩国,以及南美的巴西等等,这些和我们使用场景有比较多流量及行业成熟度的市场进行拓展。我们在印度、南亚和东南亚地区都有比较多客户和使用场景,接下来我们还会在这些地区进行更深入的拓展。

提问5 从声网的应用场景来看,有社交、电商、呼叫中心,从我们自己的数据来看,哪些市场增长比较快的重要应用领域?另外,声网有一些YY的因素在里面,当时我们出来创业时的契机和今天相比,视频社交这块发生了哪些变化?和之前有什么不同?

赵斌: 从发展的角度,我们看到这个发展用一个成语来形容是“此起彼伏”,比如上半年娃娃机曾经很火,这证明需求的持久性和深度是不够的。后面像小游戏、社交一直很火,现在仍然有比较大的使用量。再往后是语音聊天室场景下,开始出现跟过去单纯的陌生人聊天完全不一样的在场景伴随下聊天场景。我们在单纯社交领域有很多持续变化和动态,它未必一直是这样的,比如过一个时期就会有新的成长出现。

所以我们的领域是因为使用场景的多元化,持续有这样的特征,会快速的出现新机会和推动。现在看到的这个特征,有的会持续一段时间,它并不会消失,比如在线教育的膨胀,去年一年是多学科扩张很明显,它并没有消失,正好变成了稳步业务持续前进。从我们这个行业的视角,会去关注再下一个突发式的改变行业业态的成长发生在哪,这是关于场景的。

社交上像我刚才说的场景在几年前是不存在的,刚才的分享提到“一起KTV”、“一起看电影”这些社交的上下文陪伴,像剧本杀、狼人杀这些都是过去没有的。而且我们今天跟4年、5年以前相比的话,移动的渗透和使用的普及是远远超过了当初的想象。这只是过去一年我们曾经打磨和帮助客户建立的使用场景。

提问6 刚才我看到了咱们的介绍,AI的美颜没有形成产品化,这个时间表是什么?技术上跟别人有什么区别?因为市场上类似的东西比较多。

钟声: 有两方面,第一,我们觉得效果会有持续提升的可能性,这个空间我们要去优化。第二,移动平台上的算法有另外一个维度限制,就是复杂度要降下来。我们碰到过SDK跟第三方绑在一块的时候两边都在抢资源。CPU、GPU占比很高,导致整个性能下来,所以怎么把算法做得很简单,而且达到效果,这是很挑战的问题,也是没有极限的。这两点就可以理解为什么要持续做。我们下一个SDK会把这些集成进去。

主持人: 今天的媒体沟通会就到此结束,非常感谢各位媒体朋友!

-----------------完--------------------

【对“RTC 2018实时互联网大会之声网媒体沟通会实录”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
相关推荐
·AGM X3 喜马拉雅新品发布会现场全程速记实录
·2018第一届SDC绿色发展国际论坛上午场速记稿
·2018迅雷全球区块链应用大赛媒体见面会实录
·2018中国创新创业成果交易会北京新闻发布会实录
·2018年SAS中国用户大会激发非凡媒体分论坛实录
·【硅谷速记】GMIC北京2018有米科技专场发布会
·GMIC北京2018:有米科技新营销论坛专访实录
·GMIC北京2018圆桌:如何看待AI和IOT驱动的世界?
广告推荐
头条推荐
·【硅谷速记】张小龙:全面阐述小程序来了!
图文推荐
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实
【硅谷速记】GMIC北京2018:知乎李大海演讲实录
【硅谷速记】GMIC北京2018:知乎李大海演讲
【硅谷速记】苏宁易购418家电3C狂欢节发布会
【硅谷速记】苏宁易购418家电3C狂欢节发布
【硅谷速记】2016罗振宇《时间的朋友》跨年演讲
【硅谷速记】2016罗振宇《时间的朋友》跨年
最新推荐
·RTC 2018实时互联网大会之声网媒体沟通会实录
·AGM X3 喜马拉雅新品发布会现场全程速记实录
·【硅谷速记】CMMI邓诺和胡伟建接受采访实录
·2018第一届SDC绿色发展国际论坛上午场速记稿
·Pico G2 小怪兽2代VR一体机新品发布会实录
热点推荐
·【硅谷速记】特朗普就职演讲全文(中英对照版)
·【硅谷速记】家园网马永才接受硅谷网等群访录
·【硅谷速记】中国移动计算联盟应用质量体验论
·“智变新金融”马上消费金融科技媒体沙龙实录
·硅谷速记:2017上半年TMT产业融合峰会之赵中
广告推荐
旧闻推荐
·【硅谷速记】360安全路由2017新品发布会实录
·硅谷速记:米多财富首批机构合伙人媒体沟通会
·2018年SAS中国用户大会激发非凡媒体分论坛实
·Pico G2 小怪兽2代VR一体机新品发布会实录
·【2017CCF青年精英大会】赵沁平:虚拟现实看
广告推荐
硅谷影像
RTC 2018实时互联网大会之声网媒体沟通会实录
RTC 2018实时互联网大会之声网媒体沟通会实录
【硅谷速记】GMIC北京2018:知乎李大海演讲实录
【硅谷速记】GMIC北京2018:知乎李大海演讲实录
【硅谷速记】GMIC北京2018上苏宁乔新亮演讲实录
【硅谷速记】GMIC北京2018上苏宁乔新亮演讲实录
【硅谷速记】UC光谱计划开放平台发布会实录
【硅谷速记】UC光谱计划开放平台发布会实录
【2017CCF青年精英大会】汤晓鸥谈人工智能明天
【2017CCF青年精英大会】汤晓鸥谈人工智能明天
【2017CCF青年精英大会】赵沁平:虚拟现实看科技
【2017CCF青年精英大会】赵沁平:虚拟现实看科技
AboutUs | 关于我们 | 联系我们 | 加入我们 | 赞助我们 | 投稿爆料 | 广告投放 | 网站地图 | TAGS标签 | RSS订阅
Copyright © 2007-2018 硅谷网 版权所有 网站热线:(+86)010-57255600
电脑版 移动版 WAP版 WWW.GUIGU.ORG All rights reserved. 备案号:京ICP备12003855号-2