欢迎来到我们的网站!

     中国科学院语言声学与内容理解重点实验室于2002年在中国科学院知识创新工程的支持下成立,隶属于中国科学院声学研究所。同年入选中科院百人计划的颜永红教授加盟实验室,凝聚并形成了具有规模的核心研发团队。实验室专注于语言声学、以音频信息处理为主的数字媒体内容理解技术研究。拥有一支以中青年为骨干的一百余人的核心研发团队,其中“百人计划”入选者3人、国家杰出青年基金获得者1人、“新世纪百千万人才工程”国家级人选1人、科技支撑项目首席科学家1人、研究员11人、副研究员19人, 其中海外留学归国人员12人,硕士博士研究生40余名,主要研究人员都拥有在海外一流大学、研究机构和外企研究院的研发经验。

     许多世界知名的研究学者加盟实验室为客座教授,其中有Hynek Hermansky教授(IEEE院士,美国俄勒冈研究院教授)、程伯中教授(香港中文大学工学院院长)、张宏江博士(前微软亚洲工程院院长)、洪小文博士(微软亚洲研究院院长)、宋謌平博士(微软亚洲研究院语音组主任)等等。

    实验室累计获得授权发明专利47项、软件著作权登记100余项,有40余项发明专利正在审查中。已在高水平国际国内期刊和国际会议发表论文300余篇。获得省级科技进步一等奖2项、中国科学院杰出科技成就奖1项。在国内绝大多数语音技术评测中均获得第一名,例如实验室获得了2003和2004年度的国家863语音识别技术评测第一名、2004年国家****中心的语音关键词识别评测第一名;2003年在美国NIST语种识别评测中取得第三名;2006年至2009年,连续在国际音乐检索比赛MIREX中取得多项评测指标第一名;2010年在国家****中心语音识别评测中获得第一名;2012年、2013年国家某部委举办的特种语音技术评测中连续两年成绩第一;在2013年某部委组织的特种语音技术评测中再次取得第一名;在2014年中央网信办举办的第一届特定音视频分析系统评测大赛中,中科院声学所是唯一一家入围全部音频测试项目的单位,并在关键词、说话人、语种等项均获得第一名。

     实验室主要研究方向包括:多语种语音识别、关键词检索、说话人识别、语种识别、音乐检索、音频DNA、传声器阵列语音增强、音频水印、发音质量评价和口语理解等。实验室承担了国家自然科学基金重大、国家863、国家973、国家网络与信息安全中心、中科院知识创新工程和中科院百人计划等项目;具备了具有国际水平、国内领先的音频/语音信息分类和处理平台,主要包括:非特定人大词表连续语音识别系统、语种识别系统、说话人识别/确认系统、识别置信度评价及关键词检测系统、基于哼唱的音乐检索系统、固定音频检测系统、语音音色变声系统、噪声消除系统、音频水印编解码系统等。

     实验室的语音核心技术在移动互联网、电信、广电、终端等行业得到广泛应用,先后给百度、腾讯、阿里巴巴等企业提供语音识别核心引擎。特种语音技术已实际应用于相关领域的多个国家级工程中。