亚马逊云科技语音识别服务Amazon Transcribe在中国区域上线实时流式转录

日前,亚马逊云科技宣布通过与光环新网和西云数据的紧密合作,在北京区域和宁夏区域正式上线Amazon Transcribe Streaming实时流式语音转录功能。Amazon Transcribe是一项自动语音识别(ASR)服务,可为用户提供方便快捷的语音转文本服务,使用场景包括转录客服电话、自动添加字幕、生成会议纪要,以及为媒体资产生成元数据、创建完全可搜索的存档等。Amazon Transcribe根据转录的音频时长、按实际使用量付费,客户无需花费昂贵的转录费用,便能让开发人员轻松地为其应用程序添加语音转文本功能。

Amazon Transcribe能够快速准确地将语音转换为文本,用户只需投入很少的时间和费用,便可以达到几乎与手动转录相媲美的转录效果。用户可以将它应用于实时音频流或批量音频内容,创建包含音频文件内容的应用程序。Amazon Transcribe采用深度学习功能自动添加标点符号和格式,生成时间戳;并且,用户可以通过转录控制台自定义词汇列表和语言模型,从而为特定领域的词和词组生成更准确的转录,例如产品名称、技术术语等。此外,Amazon Transcribe可以识别和修订敏感的个人身份信息来保护用户隐私安全,并通过词汇表筛选掩蔽或删除转录结果中不文明用语,为客户提供更好的转录效果和用户体验。

目前,Amazon Transcribe支持多种语言,在批量音频内容处理中支持多达31种语言,在实时流失转录场景下支持包括中文普通话、澳大利亚英语、英国英语、美国英语、法语、加拿大法语、德语、意大利语、日语、韩语、巴西葡萄牙语和美国西班牙语等在内的12种语言。

首汽约车是首汽集团为推动传统出租车行业转型升级而打造的网约车出行平台。在首汽约车的“智能语音解决方案”项目中,亚马逊云科技帮助客户一起建立了语音降噪和导航音分离算法模型,先是利用Amazon SageMaker机器学习服务进行模型构建、训练、调优和部署,再利用Amazon Transcribe人工智能语音服务将行程录音自动转化为文字,从而实现通过场景化的关键词识别分析触发安全预警,结合后台安全监控人员的人工判断,让实时的行程安全监控从“可能”变成“现实”。首汽约车副总裁闫磊表示“我们与亚马逊云科技技术团队紧密合作,利用Amazon SageMaker、Amazon Transcribe等服务,实现了智能语音解决方案,将客服人工审核工作量降低了35%、客服人工听音审核时长缩短了20%,且智能客户投诉处理的准确率达90%以上,改善了司乘体验和满意度,提高了企业运营效率。”

美国全国运动汽车竞赛协会 (NASCAR) 是一家美国汽车竞赛审批和运营公司,以赛车而闻名。NASCAR 发展部高级总监Patrick Carroll表示:“我们选择使用 Amazon Transcribe,在我们覆盖195个国家或地区以及29 种语言的多站点网站上为 NASCAR 的点播内容提供字幕。利用 Amazon Transcribe,我们建立了一个自动化的系统,这个系统几乎不需要我们的团队进行操作,同时让我们能够自定义自己需要的语音识别功能。应用了 Amazon Transcribe 之后,我们为 99% 的点播内容自动添加了字幕,并且费用比我们最初的估计少97%。”

Audioburst 是一家拥有超前思维,极富创新力的技术提供商,他们让谈话音频的发现、分发和个性化发生了转变,Audioburst 联合创始人兼首席技术官Gal Klein说:“每天,我们分析225,000 分钟的实时电台访谈,以形成数以千计的关于播放列表和搜索的短主题片段。我们选择 Amazon Transcribe 是因为它作为出色的语音识别引擎,可帮助我们转录实时视频内容,用于下游内容制作工作流。”