魔飞2.0、 AIUI3.0、AIoT,科大讯飞又钢了?

“其实质疑科大讯飞的声音蛮多的,特别是有很多人说科大讯飞的盈利能力不行,但是我要负责任地告诉大家,科大讯飞的盈利能力被拖累的非常重要的一个点就是我们的开发者平台。”在昨晚科大讯飞深圳“AI·飞无界”的新品发布会上,讯飞CEO胡郁在致辞时如此说到。

尽管每年都在开发者平台上投入数以亿计的亏损性资源,胡郁还是表示做开发者平台“符合科大讯飞的价值观、文化,能够帮助很多人通过技术创新屹立在潮头之巅。”也是在昨天晚上,科大讯飞一口气发布了魔飞2.0、AIUI3.0、讯飞智能物联云AIoT、系统级解决方案iFLY OS。显然,这次发布会是冲着开发者而来的。也许是为了证明这些功能并非拍拍脑袋想出来的,科大讯飞甚至邀请了4名开发者在一个小时内使用新开发平台的功能打造个性化的技能。

科大讯飞回顾了过往历史,从开发者平台到接入的硬件设备,事无巨细地表现了过去一段时间的成绩。或许正如发布会的宣传那样,“前行·因为热爱”,在接下来讯飞一口气发布完了所有产品。

首先进入到了我们的视野中的是讯飞魔飞2.0。魔飞除了做成硬件产品外,如今软核化的提法让其能够以另外的形态存在于各类设备中。新的魔飞2.0,具备分布式+能量跟随,可以根据用户位置和声源移动方向动态调整波束方向,解除用户一次唤醒所有设备的尴尬,也让魔飞有着更多的想象空间;魔飞2.0支持全链路接口开放,开发者甚至可以通过合成接口播放任何想播报的内容;此外,讯飞也将声纹唤醒开放给了开发者。此外,云函数的开放,让魔飞能够具备更多的技能。

讯飞AIUI3.0的革新,包括:半监督优化、开放式对话、全链路打通&动态词汇等。

所谓半监督优化,是指用户在使用产品过程中,产品可能出现无法满足用户需求的情况;此时通过系统分析产品日志,能够帮助开发者不断跟进并对产品进行更新;

开放式对话,则让用户不再单单是与机器交互,而是可以做到以人为核心的交互方式,与此同时语义理解、消除歧义的难度也更大。比如回答“感觉身体被掏空”,到底是继续闲聊,还是告知附近餐厅,还是推荐产品,这多少是个问题。

全链路个性化交互则是把语音识别、语义理解以及语音合成全链路个性化网络,用以提升各个场景的识别率;基于场景的动态词汇,可以这样理解,当你查询一个地点,比如说“金拱门”,可能会弹出很多地点选项,这时你可能说在某某地标附近,机器便会理解并给出相应导航。此外,AIUI还具备更多识别模型,除了普通话还能识别方言、英语等,并且能够在更多领域使用。值得指出的是,只要是Wifi设备,都能使用AIUI。

面对不断增加的智能硬件终端,科大讯飞也不甘示弱。在发布会上,科大讯飞带来了讯飞智能物联云AIoT。讯飞的智能物联云AIoT具备两大能力:云能力与雾能力。本地的雾能力的雾计算使得系统不受互联网不稳定的影响。此外,科大讯飞还提供PaaS级开发平台,允许开发者定制开发,自由创造智能场景。

最后,科大讯飞发布了一个免费的系统级解决方案iFLY OS。支持语音唤醒、语音设别、语音合成、语义理解。并且联合咪咕接入了1300万手高清音乐、联合海豚有声接入了20万部有声书、并即将接入3万部院线大片。iFLY OS的API开放、端代码开源、并兼容AVS,而且现在已经开启内测。至此,整场发布会基本结束。但科大讯飞执行总裁胡郁的出现似乎在表明这仅仅是一个开始。胡郁颇具仪式性地穿上了8年前穿过的一套西装。对科大讯飞遭受质疑作了本文开头的陈述。面对炎热夏季的盛装,胡郁表示“2010年我们讯飞开放平台刚刚成立,在那年的发布会上,我穿的就是这套西装。可能很多小伙伴也发现了,这套西装的扣子和袖口已经磨损;但没有关系,正是因为那些过往的历史时刻,才成就了我们的今天。”

过往的历史时刻,成就了今天的科大讯飞。那科大讯飞昨日召开的发布会,意思也极为明显。这一次,科大讯飞似乎是又钢了一次。你觉得呢?