是什么吸引从业17年的顶级声学大牛冯津伟加入阿里巴巴iDST?

冯津伟,南京大学电子科学专业学士,南京大学声学硕士,南洋理工大学电子信号处理硕士,美国弗吉尼亚理工大学声学博士。曾任音视频会议行业领导企业宝利通(Polycom)声学设计和信号处理首席工程师,拥有十余项美国专利,世界级音频专家。

这位声学及信号处理领域不折不扣的大牛,最近也选择了加入阿里巴巴人工智能核心团队iDST(数据科学技术研究院),担任语音交互团队研究员。是什么吸引了这位从业17年的顶级声学大牛加入阿里巴巴iDST?要知道,对于这个级别的大牛来说,金钱已经不重要,他们希望的是迎接未知的挑战。斯卡利接受乔布斯的邀请加入苹果,是想“改变世界”,不想“卖一辈子糖水”。冯津伟加入阿里巴巴iDST,是看到了“下一代人机自然交互”的前景,语音自然交互是人工智能普及的重要一环。

冯津伟的老东家宝利通,曾经在音视频会议市场一度占据90%以上的市场份额,冯津伟为其开发的圆形麦克风阵列算法与音频信号分类器是沿用至今的业界标杆。然而,音视频会议即便达到网真级别又怎样,只不过是“白衬衫们”在办公室里交流的一个工具而已,难以真正融入普通人的生活。但是人工智能的崛起,让冯津伟看到了声学处理在下一代人机自然交互领域的价值。

2014年,亚马逊推出了搭载智能助手Alexa的智能音箱Echo;2016年,谷歌展示了智能语音助理Google Home;2017年,阿里巴巴发布了可以语音购物的智能音响天猫精灵X1。各大互联网巨头都开始以语音作为家庭人工智能的交互方式,谁能拿出最准确、最自然、最完整的语音交互技术,谁就能更迅速的占领家庭人工智能入口。

阿里巴巴之所以能够成功,是因为马云总是能够提前十年甚至更早看到未来的机会。2014年,阿里巴巴在硅谷成立iDST,阿里巴巴开始切换到技术与数据驱动的轨道上。阿里巴巴iDST的使命是“确立阿里巴巴集团在未来数十年的领先地位”,在阿里巴巴iDST成立之初,大数据、人工智能、深度学习就是最重要的研究领域。而且和当年为了研究而研究的施乐Palo Alto研究中心不同,阿里巴巴iDST更擅长前沿科技与商业应用的结合。

就以人工智能的语音交互为例,阿里巴巴iDST早在2015年就构建了完整的语音技术研究团队,并且逐渐在语音交互的三大模块——从声学设计、到前端信号处理、再到AI识别算法——构建了完整的研究链条。目前,阿里巴巴在北京、杭州、西雅图、硅谷、新加坡拥有五个独立而又联动的语音研究小组,也拥有天猫精灵X1这一语音学习入口。完整、全面、可验证、可落地的语音技术研究环境,这是每一个有理想的研究者梦寐以求的环境。冯津伟正是被这样的条件吸引,才会义无反顾地从已经功成名就的音视频会议行业,跳到了全新的人工智能领域。

据了解,冯津伟博士进入阿里巴巴iDST之后,将会主要研究声学设计与信号处理。目标是从源头保证声音数据的采集质量,从而大大降低后端AI算法的工作量,提高AI语音识别系统的准确性和响应速度。阿里巴巴iDST透露,冯津伟已参与一项秘密项目开发,项目在全球没有先例。也许很快,我们在和具备声纹识别功能的天猫精灵X1交流时,就可以使用更加自然的对话,不用刻意避免噪音,甚至让它通过声音确认我们所处的位置。

“天猫精灵,请帮我充下电。哦,不,是充话费……”