您当前的位置 : 浙江在线 > 浙商网 > 浙江经济报道 > 原创新闻 

同盾“声纹识别建模大赛”落幕 助力智能语音产学研用联合发展

2018-10-23 19:22:16 来源: 浙江在线 通讯员 孔郁华

10月22日,由同盾科技发起的“声纹识别建模大赛”完美收官。经过数月角逐,来自浙江大学的河姆渡团队夺得大赛冠军。

image.png

  浙江在线10月23日讯(浙江在线通讯员 孔郁华)AI技术正在以各种方式全面渗透入我们的生活。而作为人工智能相关技术中与用户接触最为直接的部分——语音技术也正在通过各种终端硬件潜移默化地改变我们的生活方式。

  10月22日,由同盾科技发起的“声纹识别建模大赛”完美收官。经过数月角逐,来自浙江大学的河姆渡团队夺得大赛冠军,南京大学的咖喱棒团队与东南大学的SeuTao团队夺得亚军,北京航空航天大学的HelloKitty团队、厦门大学Cehn团队以及C-baseline团队获得季军。

  据了解,本届声纹识别建模大赛于8月1日启动,共吸引了386人报名参赛,成功组建队伍260支,案例提交总数超过2946次。其中近60%参赛人员来自国内顶尖高校在校学生,40%参赛人员为各企业团队和AI极客,近80%的参赛选手拥有研究生及以上学历。浙江大学计算机学院人工智能研究所教授、博士生导师、浙江大学计算机学院前院长庄越挺,清华大学教授、清华大学语音和语言技术中心主任、博士生导师郑方,Rokid网络安全部门负责人白嘎力等担任决赛路演评委。

  大赛全程以一线实战经验为素材,参赛者基于给定的训练数据建立模型,从而可对任给定的两段语音数据,模型输出这两段语音是由同一个人说的概率。大赛的训练数据随机从希尔贝壳中文普通话语音数据库中抽取,数据量与难度随着赛程的推进呈指数增加,评审最终根据EER值来判断分类模型的精确程度,并依据排行榜名单竞选出前十支队伍。据了解,决赛路演的这十支队伍,测评榜成绩平均分达到了0.0052222(成绩越接近0,越接近满分),而第一名的模型精确度高达0.0011111分,已经达到甚至超越声纹识别工业级水平。

  目前,随着深度学习的引入以及在此基础上派生的各类模型的组合,语音识别准确率得到了大幅度提升,智能音频设备也呈现出多样化和日常化。这些产品虽然大大普及了公众对语音交互的认知和使用,但实际上由于真实场景使用下的复杂、不同设备体积限制对算力的要求等因素,语音产业的发展仍然受技术瓶颈的限制尚处在起步阶段,业界依然共同面临许多技术难题。

  “同盾推动声纹识别建模大赛,与我们自身战略是高度统一的。本届大赛正是同盾科技联合社会各界对智能语音领域人才挖掘、人才培育、人才输出的一次新模式的探索。”同盾科技副总裁、同盾金融科技研究院院长顾威表示,作为国内智能风控和分析决策服务提供商,同盾科技也已开启了智能语音的战略布局。此前,同盾已将智能语音技术应用到金融行业,创新研发了逾期管家和逾期精灵两款产品,通过智能语音识别、语音合成、语义理解以及交互话术共同形成高度智能化、精准化的催收策略,解决金融机构催收业务的合规、合法、效率等问题。

  据了解,除了这次举办的声纹识别建模大赛,同盾还与国内顶级高校展开紧密合作,陆续与浙江大学、西北工业大学达成合作,组建智能语音技术联合实验室,联合培养新一代语音智能人才。

责任编辑:
相关新闻
分享到:
版权说明
凡注有"浙江在线·浙商网消息"的稿件,均为浙商网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线·浙商网消息",并保留"浙江在线·浙商网消息"的电头。联系电话:0571-85311044
新闻热线:0571-85311044 业务热线:0571-85310557