依图在全球权威声纹识别竞赛中夺冠

来源：依图科技 2019/09/11 11:39:30 已浏览：次

近日，在国际声纹识别竞赛VoxSRC上，依图算法夺得*，等错误率降到0.0098、大幅越第二名。

并且，依图团队(参赛队伍名为logicworld)在使用数据的情况下取得了优于其他团队使用不限数据得到的结果，表明依图声纹识别技术已达世界前沿水平。

(竞赛的任务是判断两段音频是出自同一个人还是两个不同的人，算法的输出结果用等错误率(Equal Error Rate，EER)来衡量，EER越小系统性能越好)

0.0098的等错误率意味着什么？

首先，日常生活应用基本能够满足，笔记本电脑和汽车的声纹锁功能越来越可靠，智能硬件上的虚拟助理将不会被他人用同样的关键词唤醒，成为真正属于你的个人助理。

在社保远程身份验证、反电信*等公共服务领域，*的声纹识别技术也将更好地降本增效、服务民生，不需要再“居住异地，千里奔波”，更避免“九旬老人社保年审，家人抬着爬上三楼”。

声纹识别拥有广阔的应用前景。不仅如此，将语音识别与声纹识别、语义理解相结合，就能知道 “是谁因为什么说了什么”，将大幅增强智能语音个性化服务，实现真正意义上的交互。

VoxSRC是由英国牛津大学、韩国互联网巨头Naver、斯坦福国际研究和麻省理工学联合发起的全球声纹识别竞赛，被誉为“声纹识别界的ImageNet竞赛”。

本次比赛采用的数据集基于开源数据集VoxCeleb，由牛津大学团队于 2017 年发布，后来逐渐扩充，现在是声纹识别领域规模*、标注*完备的开源数据集。

VoxCeleb来自YouTube名人采访视频，包含了7000多个来自不同种族、口音、职业和年龄的说话人，过100万段的说话声，2000多小时的音频和视频，且基本都含有背景噪音、笑声、说话声重叠及其他杂音，非常考验算法的实战水平。同时，本次比赛测试数据不含标注，无法用来训练或调整系统，确保了结果的公正与公平。

今年的VoxSRC吸引了来自海内外多支队伍参与，包括约翰霍普金斯大学、法国*信息与自动化研究所、清华大学、中山大学等高校和研究机构，以及平安科技、NEC等大型企业。

成立7年来，依图在视觉感知、自然语言处理、语音识别、智能决策等多技术领域发展，这次参赛VoxSRC是依图在语音领域的一次新尝试。

未来，依图将在多算法领域持续投入，推进多模态技术融合、软硬件协同开发，将世界前沿的人工智能算法与行业场景深度结合，推动人工智能应用落地。

来源：依图科技

关注本网官方微信公众号随时阅读专业资讯
征稿邮箱：info@testmart.cn

版权与免责声明

凡本网注明“来源：仪器仪表交易网”的所有作品，均为仪器仪表交易网合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：仪器仪表交易网”。违反上述声明者，本网将追究其相关法律责任。
本网转载并注明自其它来源（非仪器仪表交易网）的作品，目的在于传递更多信息，并不代表本网赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品第一来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。

资讯

INFORMATION

依图在全球权威声纹识别竞赛中夺冠

您认为该新闻

版权与免责声明