歪果仁还在羡慕移动支付?阿里已经开始在上海地铁里普及人工智能了

高铁、基建、美食、网购、移动支付、共享单车……这些令歪果仁羡慕嫉妒恨的中国成就,早已融入我们的生活,也让我们自豪无比。现在,我们的地铁又开始新的进化了。12月5日,语音购票、刷脸进站、智能客流监测等多项“黑科技”首度亮相上海。对着售票机说句话就能买到地铁票,歪果仁如果看到这些绝对会呆掉。

作为国际化大都市,上海的地铁一共有17条线路、367个站点,是全球里程数最长的城市地铁。别说外地人,就是本地人要到一个不熟悉的地方,都要查一会儿才知道怎么买票乘车。特别是自助购票的时候,你至少要知道目的地所处的线路和站点吧。如果不熟悉,还是老老实实去人工售票窗口吧。

加入人工智能以后,只要对着售票机说出目的地,比如“我要去东方明珠”,售票机就会自动推荐线路和站点,乘客只要扫码或者刷脸就能购票,整个过程不过数秒钟时间。而且和普通语音交互产品相比,乘客根本不需要说“你好,售票机!”,因为语音售票机能够自动检测乘客走近的行为,主动“醒过来”。目测很快我们就能在“油管”上看到大量调戏售票机的操作视频,各大主播也还有30秒到达现场……

其实,要给售票机加上语音交互没什么难度,关键的问题是:平时地铁站里都是这样的……地铁站里“People mountain people sea”,那么嘈杂的环境都能听清楚吗?

上海地铁语音售票机是由阿里巴巴人工智能核心团队iDST自主研发的,所以针对这个问题,我们专门咨询了阿里巴巴iDST资深人工智能专家鄢志杰。鄢志杰表示:“当前主流的远场语音识别技术在家居、办公室等比较安静的环境下能够很好地工作,但在公众场所嘈杂环境下,业界此前尚无可以达到大规模商用水平的远场语音交互整体解决方案。语音售票机是业内首个能在嘈杂的公共场所环境下,实现精准远距离语音交互的产品。”

iDST深度融合了语音信号处理和计算机视觉技术,解决了强噪声干扰问题。别看只是一台售票机,但是背后实际上融合了语音增强、声源定位、人脸和图像识别、远场语音识别、语音合成、自然语言处理、对话管理、多模融合人机交互等众多前沿科技。之前加盟阿里iDST的众多技术大牛,比如声学专家冯津伟博士、计算机视觉大牛任小枫,都在其中花费了大量的精力,这才有了这套“多模态智能语音交互解决方案”的诞生。

融合了人工智能的地铁系统不但能语音交流、刷脸购票,还能“刷脸进站”,以后出门连公交卡都不用带了。现在正在研发中的新型进站闸机上新增了一块屏幕,乘客经过时,屏幕只需要一秒钟就能利用阿里巴巴人脸识别技术完成人脸识别,自动开启闸机。按照之前在国际公开的人脸比对评测LFW中公布的数据,这套人脸识别系统的精度超过99.5%,1:1认证比对场景实测精度大于99%,1:3000身份识别场景实测识别率>95%。

这些还只是我们肉眼看得到的地方,如今上海地铁的后端也融入了人工智能,比如智能客流监测技术。它基于视频识别、数据分析和阿里云的数据可视化技术,替代肉眼,观察车站的客流速度、密度、拥挤指数等,同时结合地铁列车运营信息、外部天气信息数据,对未来流量进行预测,从而提前进行客流疏导、应急调度。要是能提前收到车站拥堵的通知,我们就可以利用等待的时间再加一会儿班了。

开不开心,兴不兴奋?