清华大学|信息学院|国家实验室|English Version

语音与语言中心成功举办第二届“东方语言语种识别竞赛(OLR 2017)”

12月14日,由我院语音和语言技术研究中心和海天瑞声公司联合举办的第二届东方语种识别竞赛(Oriental Language Recognition Challenge)在吉隆坡举办的2017亚太信息与信号处理峰会(APSIPA ASC 2017)上宣布了比赛结果,并在当天的晚宴上举行了颁奖仪式。这是继2016年成功举办第一届后,又一次成功的OLR Challenge。

与OLR 2016相比,OLR 2017需要识别的语言从7种增加到10种,包括汉语普通话、粤语、日语、韩语、俄语、越南语、印尼语、藏语、维吾尔语、哈萨克语。数据总量从去年的70小时增加到116小时,包括697名发音人,约10万条语音。数据集中的7种语言由海天瑞声公司提供,3种语言(藏语、维吾尔语和哈萨克语)由清华大学、西北民族大学、新疆大学共同承接的国家自然科学基金重点课题“多语言少数民族语音识别”项目(M2ASR)提供。

OLR 2017的竞赛设置更加合理,包含1秒识别、3秒识别和整句识别三项识别任务。短语音识别任务更为困难,但也更符合实际应用场景。信研院语音中心提供了基线系统的构造脚本,使得参赛者可以轻松复现i-vector和深度神经网络两种标准语种识别系统。

语音中心王东老师、汤志远博士和海天瑞声公司的陈清总监在12月14日上午的“Multilingual Speech and Language Processing”特殊主题会场上共同宣布了比赛结果。参赛队伍按综合识别结果和短语音识别结果两个标准进行排名。综合识别结果评价参赛队伍在语种识别上的总体科研实力;短语音识别结果反映参赛队伍在1秒语音这种极度困难任务上的科研攻关能力。

本次OLR比赛的参赛队伍共有31支,最终提交结果并参与排名的有19支,分别来自中国大陆(11支)、新加坡(1支)、澳大利亚(1支)、中国台湾(1支)、中国香港(2支)、印度(3支)。

1.jpg

最终,最佳综合识别结果奖由新加坡国立大学(NUS)、新加坡科技研究局通信研究所(I2R)和新加坡南洋理工大学(NTU)联合团队获得;最佳短语音识别结果奖由澳大利亚新南威尔士大学(University of New South Wales)获得。在当天晚宴上,OLR 2017的组织者向这两支队伍颁发了证书和奖品,奖品包括由Roobo公司提供的400美元奖金和清华大学提供的精美纪念品。

取得佳绩的队伍还包括:台北科技大学、中国科技大学、北京理工大学、厦门大学、灵伴科技等。

2.jpg

NUS、I2R和NTU获奖团队上台领奖

3.png

新南威尔士大学获奖团队上台领奖

4.png

Roobo公司为获最佳结果奖的队伍提供400美元奖金

 

以下是综合排名前六的团队及结果(超过基准系):



以下是短语音性能前十名的团队及结果(超过基准系统):




 

【发布时间:2017-12-22】【浏览次数:793】