6月24日,国家科学技术奖励大会在北京隆重举行。安徽省共有10个项目荣获2023年度国家科学技术奖。其中安徽省主持完成的4项,参与完成的6项。
由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学、华为终端有限公司、中移(杭州)信息技术有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。这是深度学习引发新一代人工智能浪潮以来人工智能领域首个国家科技进步奖一等奖。
多语种智能语音技术对于支撑人机交互、人类语言互通及国家安全等需求具有重大战略意义,产业前景十分广阔,是当前国际科技竞争核心焦点之一。
智能语音面临三大关键技术挑战:一是如何突破复杂场景语音技术大规模实用门槛;二是如何实现语音技术的多语种覆盖;三是如何基于自主可控的平台、实现国产软硬件的语音产业链自主可控。
围绕上述挑战,科大讯飞联合各单位、企业持续攻关十余年,取得了技术突破:通过提出复杂语音信号解耦建模技术(注:“解耦”指将原始说话人语音拆分成多个维度的成分特征或音频成分),实现了内容、韵律、音色等多种属性充分解耦,使得复杂场景下语音识别准确率和语音合成表现力得到重大突破,语音转写准确率首次超过专业速记员水平;通过提出多语种共享建模技术,解决小语种知识匮乏、训练数据稀缺的难题,实现多语种语音技术打破国外垄断;通过语音语义联合建模,使得语音交互、翻译的深层次理解得到重大突破;通过提出国产异构硬件平台训练及推理加速技术,首次实现智能语音在国产芯片上的训练和推理性能达到国际主流芯片水平,构建形成自主可控的智能语音技术体系。
航拍的科大讯飞股份有限公司。(王世保 摄)
该项目技术多次获得国际权威竞赛的冠军,达到国际领先水平:在语音合成技术上,从2006年到2019年,连续14年获得blizzard challenge 国际语音合成大赛冠军;在语音识别技术上,2016-2023年,连续获得国际多通道语音分离和识别大赛chime四连冠,2021年在国际低资源多语种语音识别竞赛openasr中获得所有15个语种受限赛道和7个语种非受限赛道的冠军;在多语种翻译技术上,2018 年 11 月首次达到catti考试英语二级《口译实务(交替传译类)》合格标准,并在2021-2023年,连续三届获得iwslt(国际口语机器翻译比赛)冠军,覆盖同传、离线、方言翻译等多类任务。
该项目还构建了自主可控的多语种产业生态:支持华为手机、奇瑞汽车、比亚迪汽车等上亿台套产品出海,汽车出海目前已覆盖23个语种,出口60余个国家;开创ai翻译机等智能硬件品类,覆盖全球200多个国家和地区,能够解决用户全球旅游、商务等跨语言沟通问题,在北京冬奥会、进博会、博鳌论坛、国家安全、海关等重大活动和场景中获广泛应用。
根据德勤数据发布的《2020-2021中国语音产业发展白皮书》及华经产业研究院的《2023-2028年中国智能语音行业市场发展现状及投资方向研究报告》,科大讯飞稳居语音产业国内市场第一,在全球多语种市场占比8.1%,并持续提升。同时,作为国家新一代人工智能开放创新平台,科大讯飞提供了69个语种语音能力,并带动了“中国声谷”实现产业规模集聚。
主办:安徽省企研会质量信用专委会 承办:安徽省徽企质量信用评价中心
地址:安徽省合肥市红星路1号省委办公厅服务楼2楼 电话:0551-62607456
安徽质量信用网