百度云智峰会:关于视频,百度在想些什么?

在8月29日召开的百度云智峰会论坛上,百度在主论坛上发布了多款重磅新品。并且首次亮相了百度智能云的智能计算全景图,包括天工、天算等在内的六大工程平台覆盖了大数据工程、AI等细分领域。在当前视频行业火爆的当下,天像工程平台视频云平台自然而然地进入到我们的视野之中。

早在主论坛中,百度便针对视频剪辑领域发布了“4K视频处理方案”,这也是业内首个支持HDR(高动态范围)4K视频转码,视频码率压缩至60%以上的解决方案。百度同时指出,在视觉智能领域,百度智能云的视觉智能解决方案重点针对媒体、城市综合治理、工业的视觉能力进行了升级。现场百度更展示了众多合作伙伴的案例,包括央视AI编辑部运用百度智能云的媒体视频解决方案,以及精研科技工厂使用百度技术打造的智能自检设备等。

而在下午的“智能视频行业论坛”上,百度智能云视频多位负责人为我们进行了更近一步的说明。百度智能云智能视频总经理李旭就“新技术浪潮下的视频发展趋势”进行了一定总结,或许用他所说的“新兴技术重塑视频产业未来”再为合适不过。李旭认为视频领域生产加速下沉、内容创意爆发。随着技术发展,重塑的视频体验,将会更重交互,而物联网将带来多终端的跨屏体验。视频不再是信息单向传播,而是辅助的载体。

百度智能云视频云产品架构师孙丽则主要从云产品架构等方面进行了分析。首先,孙丽从流量规模、人们对视频的追求,例如从4K到8K、观看流畅度、效率提升等等,对现状进行了一定分析。其次对天像视频平台进行了讲解,覆盖视频的生产、处理、分发、消费等四个环节。在生产方面,百度推出了百度智能云AR拍摄器SDK,通过互动特效等让视频变得更为有趣;在视频上传方面,百度智能云对象存储BOS,拥有无限可扩展的智能存储中心,并且归档存储全网价格最低,低至0.015元/GB/月;此外,百度智能云视频转码MCT,带来极致超清的视频体验。百度智能云视频云还通过智能分析、理解等助力视频价值最大化。此外,百度智能云RTC实现了200ms端到端延迟、30%视频抗丢包、60%音频抗丢包,4K画面的实时互动。

与此同时,百度提供了6大视频场景解决方案,包括智能小/短视频解决方案、视频版权保护解决方案、智能生产解决方案、安防监控解决方案、视频营销解决方案、视频多模搜索解决方案等。而在这个发展过程中,百度智能云视频云实现了环比200%的收入增长,3倍的流量增长,4倍的规模增长。

如何使用最有效的方式传递最高视频质量的内容?百度智能云视频云架构师沈慧锋在现场主要介绍了智感超清视频转码处理技术。这项服务功能主要分为四个部分,包括视频转码、视频编辑、智能抽帧、版权保护。例如,音频的均衡化,实现统一的音频输出;AI特色功能编辑,自动检测去除Logo等;视频理解技术剪出精彩内容;提取视频指纹建立版权库。智感超清技术指的是智能转码、感观增强、超分辨率、高清晰度。最终想要实现的是低码高清的视频体验。

如何更有效利用和挖掘视频价值?百度智能云视频AI技术架构师王志鹏主要分享了做视频AI技术中台的原因以及构建思路。线上视频线下视频不同场景的视频生命周期不同。线下视频往往围绕视频解析和结构化分析。而当前视频行业面临的三大痛点则是:视频结构化、多模搜索(输入维度)、AI模型的规模化生产等。通过技术中台,基于中台的技术开发基本只需要一周时间,小样本训练精度则可以达到88%,小样本训练收敛时间可以在15分钟。

百度AIG增强现实技术部技术架构师马晓昕针对如何创作更为有趣的短视频进行了分享。除了贴纸、滤镜、音乐等元素外,他指出了百度更新的DuMix AR5.0平台。通常,AR需要一定的模型特效,再做虚实融合,运动跟踪等等。而最终内容显现要更为真实,最好能够让用户参与进来。百度除了人脸特效外,还有着环境特效等等。同时通过AI赋能,让视频的剪辑更为高效。

百度智能云多媒体工程师李永兴则主要就百度智能云实时音视频(RTC)方面作了演讲。他指出,主要依托百度CDN网络,为用户提供超低延时、高并发、高质量的音视频通讯服务。基于RTC产品,用户可以构建多人的通话服务,同时支持多路视频流的混流。除了把端到端延迟控制到200ms,还可以基于用户需求提供端到端的适配。在金融等诸多领域百度的RTC产品都有所应用。

事实上,智能视频行业论坛并非百度专场,百度其它一些合作伙伴也就视频行业进行了讲述。但我们有所着重的点出百度,是因为我们无疑对于这样一个有着大量视频分发的平台抱有极大兴趣:而这些,表明了百度成熟的技术与商业模式,对于B端用户来说,不失为一个选择。