深度

阿里巴巴说，人工智能现在的阅读理解能力已经超过人类了！

作者

Frank.C.

2018年1月17日

中国的科技崛起绝对不是空口吹嘘，特别是在最前沿的人工智能领域，以阿里巴巴、百度、科大讯飞为代表的中国企业已经开始进入领跑者阵营。刚刚过去的CES 2018上中国企业已经组团刷爆全球科技圈，而在另一项由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD（Stanford Question Answering Dataset）中，阿里巴巴也再次为中国代言，在最新排名中与微软并列第一。美国有微软、谷歌、Facebook，中国有阿里、百度、腾讯，这顶尖对决必须双击666！

SQuAD虽然并不为大众所熟悉，但是在专业领域却被称为“机器阅读理解界的ImageNet”（顺便说一句，堪称图像识别国际排位赛的ImageNet挑战赛也早已经被中国企业和团队刷爆了）。SQuAD通过抓取500多篇维基百科文章构建了一个大规模的机器阅读理解数据集，包含10万个不同的问题。人工智能在阅读完数据集中的一篇短文之后，需要回答若干个基于文章内容的问题，然后与标准答案进行比对，得出精确匹配(Exact Match)和模糊匹配(F1-score)的结果。

来自全球最顶尖的科技团队，包括科技企业如IBM、微软、谷歌、Facebook、阿里巴巴、腾讯，以及顶尖的科研院校如斯坦福大学、卡耐基梅隆大学、浙江大学、国防科技大学等都有参与。这并不是中国企业第一次在这一国际赛事中夺得第一，在去年年中科大讯飞与哈工大联合实验室（HFL）就代表中国本土研究机构首次取得该赛事第一名。

不过，这次的情况截然不同。在SQuAD榜单的第一排，是由斯坦福大学提供的人类阅读理解能力成绩，其两项成绩EM（Exact Match，精准匹配分数）和F1（F1-Measure，精确率和召回率的平均，模糊匹配分数）分别为82.304和91.221。而阿里巴巴最新模型SLQA+的得分分别为82.440和88.607，也就是说在精准匹配方面，阿里巴巴的人工智能模型已经超越了人类！这是一个标识性事件，也是走向奇点的一个里程碑事件。难怪SQuAD的负责人Pranav Rajpurkar会难掩兴奋，第一时间在社交媒体上宣布这个消息。

相隔一天，微软也拿出了同样优秀的成绩，与阿里巴巴并列第一。超越人类能力，微软也是上下沸腾，CEO纳德拉亲自发出炫耀贴。

据说，这次阿里巴巴之所以能够取得突破，源自中国的应试技巧功不可没。阿里巴巴自然语言处理研究团队提出的“基于分层融合注意力机制”的深度神经网络模型，能够模拟人类在做阅读理解问题时的一些行为，包括结合篇章内容审题、带着问题反复阅读文章、避免阅读中遗忘而进行相关标注等。在捕捉问题和文章中特定区域关联的同时，借助分层策略，逐步集中注意力，使答案边界清晰；另一方面，为了避免过于关注细节，采用融合方式将全局信息加入注意力机制，进行适度纠正，确保关注点正确。看到这段介绍，有没有忽然回忆起当年英语考试做阅读理解题目？

机器阅读理解是人工智能全面融入生活的关键环节，它和语音识别、图像识别等共同构成了人机交互的完整信息流。认识、理解、思考，这是人工智能的发展方向。负责此项目的阿里巴巴自然语言处理首席科学家司罗表示，对于解决wiki类客观知识问答，机器已经取得非常好的结果，我们将继续向对通用内容的“能理解会思考”的终极目标迈进。

事实上，阿里巴巴已经将这项技术运用到了阿里小蜜上，每年双十一的海量顾客咨询，背后就有人工智能提供支持，经常上淘宝的买家们应该都和人工智能亲密接触过了。根据阿里巴巴官方提出的数据，其AliNLP自然语言技术平台每日调用1200亿+次，Alitranx翻译系统提供20个语种在线服务日调用量超过7亿+次。

实践是检验真理的唯一标准，既然这套人工智能系统已经可以顶住中国数亿淘宝买家的轮番轰炸，看来确实是有真功夫滴……

阿里巴巴说，人工智能现在的阅读理解能力已经超过人类了！

大家都在看

难道只有我觉得1900X...

拆了惠普Zbook 17...

英特尔8代i7-8550...

这就是所谓的最佳VR视频...

为什么我会认为，走到第三...

独家 | 这家中国AR眼...

隔空评测三星Note8 ...

12核CPU选谁？据说壕...

【零镜评测室】暴风魔镜白...

绝地求生外挂太多，本以为...