阿里巴巴说,人工智能现在的阅读理解能力已经超过人类了!

中国的科技崛起绝对不是空口吹嘘,特别是在最前沿的人工智能领域,以阿里巴巴、百度、科大讯飞为代表的中国企业已经开始进入领跑者阵营。刚刚过去的CES 2018上中国企业已经组团刷爆全球科技圈,而在另一项由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD(Stanford Question Answering Dataset)中,阿里巴巴也再次为中国代言,在最新排名中与微软并列第一。美国有微软、谷歌、Facebook,中国有阿里、百度、腾讯,这顶尖对决必须双击666!

SQuAD虽然并不为大众所熟悉,但是在专业领域却被称为“机器阅读理解界的ImageNet”(顺便说一句,堪称图像识别国际排位赛的ImageNet挑战赛也早已经被中国企业和团队刷爆了)。SQuAD通过抓取500多篇维基百科文章构建了一个大规模的机器阅读理解数据集,包含10万个不同的问题。人工智能在阅读完数据集中的一篇短文之后,需要回答若干个基于文章内容的问题,然后与标准答案进行比对,得出精确匹配(Exact Match)和模糊匹配(F1-score)的结果。

来自全球最顶尖的科技团队,包括科技企业如IBM、微软、谷歌、Facebook、阿里巴巴、腾讯,以及顶尖的科研院校如斯坦福大学、卡耐基梅隆大学、浙江大学、国防科技大学等都有参与。这并不是中国企业第一次在这一国际赛事中夺得第一,在去年年中科大讯飞与哈工大联合实验室(HFL)就代表中国本土研究机构首次取得该赛事第一名。

不过,这次的情况截然不同。在SQuAD榜单的第一排,是由斯坦福大学提供的人类阅读理解能力成绩,其两项成绩EM(Exact Match,精准匹配分数)和F1(F1-Measure,精确率和召回率的平均,模糊匹配分数)分别为82.304和91.221。而阿里巴巴最新模型SLQA+的得分分别为82.440和88.607,也就是说在精准匹配方面,阿里巴巴的人工智能模型已经超越了人类!这是一个标识性事件,也是走向奇点的一个里程碑事件。难怪SQuAD的负责人Pranav Rajpurkar会难掩兴奋,第一时间在社交媒体上宣布这个消息。

相隔一天,微软也拿出了同样优秀的成绩,与阿里巴巴并列第一。超越人类能力,微软也是上下沸腾,CEO纳德拉亲自发出炫耀贴。

据说,这次阿里巴巴之所以能够取得突破,源自中国的应试技巧功不可没。阿里巴巴自然语言处理研究团队提出的“基于分层融合注意力机制”的深度神经网络模型,能够模拟人类在做阅读理解问题时的一些行为,包括结合篇章内容审题、带着问题反复阅读文章、避免阅读中遗忘而进行相关标注等。在捕捉问题和文章中特定区域关联的同时,借助分层策略,逐步集中注意力,使答案边界清晰;另一方面,为了避免过于关注细节,采用融合方式将全局信息加入注意力机制,进行适度纠正,确保关注点正确。看到这段介绍,有没有忽然回忆起当年英语考试做阅读理解题目?

机器阅读理解是人工智能全面融入生活的关键环节,它和语音识别、图像识别等共同构成了人机交互的完整信息流。认识、理解、思考,这是人工智能的发展方向。负责此项目的阿里巴巴自然语言处理首席科学家司罗表示,对于解决wiki类客观知识问答,机器已经取得非常好的结果,我们将继续向对通用内容的“能理解会思考”的终极目标迈进。

事实上,阿里巴巴已经将这项技术运用到了阿里小蜜上,每年双十一的海量顾客咨询,背后就有人工智能提供支持,经常上淘宝的买家们应该都和人工智能亲密接触过了。根据阿里巴巴官方提出的数据,其AliNLP自然语言技术平台每日调用1200亿+次,Alitranx翻译系统提供20个语种在线服务日调用量超过7亿+次。

实践是检验真理的唯一标准,既然这套人工智能系统已经可以顶住中国数亿淘宝买家的轮番轰炸,看来确实是有真功夫滴……