Interspeech 2026 第二届音频编码器能力挑战赛正式启动-虎嗅科技日报

国际语音顶级会议 Interspeech 2026 将于2026年9月在澳大利亚悉尼举行。由小米、萨里大学、清华大学、海天瑞声联合发起的第二届 Audio Encoder Capability Challenge（AECC）音频编码器能力挑战赛将同步亮相 Interspeech 2026，目前已正式开放报名。

微信图片_20251215111609_632_120.jpg

当前，音频大语言模型（LALMs）发展迅速，但大多数主流模型在音频前端编码器上选择非常单一，几乎均基于 OpenAI Whisper Encoder。这种对单一技术的依赖不利于模型架构的多样化探索，也限制了 LALMs 整体能力的进一步提升。为应对音频理解能力不断增长的需求，本次挑战赛将聚焦于音频编码器这一核心模块，重点评估其在复杂真实场景下的理解与特征表示能力。

评测方法

本次挑战赛采用统一的端到端训练和评估框架。参赛者只需提交预训练的编码器模型，下游任务的训练和评估由主办方完成。主办方提供了开源的评估系统 XARES-LLM。该系统基于用户提供的音频编码器自动训练一个典型的 LALM。该系统会自动下载训练数据，训练模型，然后测试各种下游任务，并为每个任务提供分数，如下图所示。

微信图片_20251215111611_633_120.png

参赛者并不需要自己运行 XARES-LLM，而只需把音频编码器按照一个简单的接口说明和示例封装，通过邮件发送给主办方即可，大模型的训练和评估由主办方完成。当然，由于 XARES-LLM 是开源的，且只需 GTX4090 即可完成训练和评估，参赛者也可以自行使用该系统训练大模型、评估待提交的编码器的性能，并和主办方提供的基线系统比较。

训练数据

和大多数比赛不同，本挑战赛不仅重视模型设计和训练，也同样重视数据的收集和利用。主办方不规定具体的训练数据集。参赛者使用的训练数据必须是公开可访问的，不得使用私有保密数据。参赛的模型既可以基于任何开源的预训练模型参数，也可以从头训练。

同时，海天瑞声公司为比赛提供了一个补充数据集，供参赛者免费使用。该数据集从八个商用数据集（King-ASR-457、King-ASR-958 等）提取构建而成。其内容涵盖了丰富的日常环境噪声，具体包括书店、健身房、地铁、餐厅等多种室内外场景的背景噪声，以及家庭环境下的不同距离背景噪声。此外，数据集还收录了水流、脚步声、户外窗边等特定非语音干扰声，以及地铁车厢在不同时段的运行噪声。啸叫类数据则包含了通话、游戏和直播场景下的纯净啸叫声。车辆相关环境噪声也是其重要组成部分，如机械噪声、空调运行声和开窗风噪，还有咖啡馆、医院、市场、步行街等生活场景的实录环境声。

报名参赛者可以免费访问该数据集，细节详见 :

https://dataoceanai.github.io/Interspeech2026-Audio-Encoder-Challenge/King_NonSpeech-Dataset_en_20h.html

微信图片_20251215113200_651_120.png

微信图片_20251215113419_655_120.png

报名和提交方法

报名阶段请于 2026 年 1 月 25 日11:59 PM AoE前完成赛事报名信息填写。了解详情可移步至海天瑞声公众号。

模型准备与自检参赛者需封装自己的音频编码器，并使用主办方提供的检测工具完成编码器合规性检查，确保模型接口与功能符合赛事要求。

模型提交请于 2026 年 2 月 12 日11:59 PM AoE 前，将编码器代码及模型文件统一打包为 ZIP 文件，并通过邮件方式提交至主办方指定邮箱。

技术报告提交请于 2026 年 2 月 25 日 11:59 PM AoE前，把技术报告 PDF 文件邮件发送给主办方。技术报告可以同时在 Interspeech 官方提交系统作为会议论文投稿。

联系方式

主办方邮箱：2026interspeech-aecc@dataoceanai.com

挑战赛官网：https://dataoceanai.github.io/Interspeech2026-Audio-Encoder-Challenge/

标题：Interspeech 2026 第二届音频编码器能力挑战赛正式启动

地址：http://www.heliu2.cn/cy/33642.html

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

虎嗅科技日报推荐浏览

一场温馨的“2026纵横家宴”一次“家人”的温暖相聚

2026开门红！吉利银河1月销量82990辆，多款车型月均过万

越野&改装一步到位，捷途旅行者骏马版&自由者骏马版正式上市限时焕新

累销破百万！每3台自主燃油大7座SUV就有1台捷途X70系列

中国重汽HOWO新能源轻卡，能量满格为拼搏持续赋能！

从“1.6万辆”破纪录，看中国重汽的全球化征程

合肥哈工兴航：打造智慧海洋生态引领水下机器人产业化革新

-30℃极寒淬炼！星途ES增程以硬核实力燃动央视风云汽车·冰雪嘉年华

曜夜，不止是颜色！星途凌云曜夜版隐藏的性能科技大揭秘

从技术创新到生活方式的引领者，好孩子重构未来母婴生态

虎嗅科技日报热门资讯

孩子写作业拖拉怎么办？宾果智慧光以护眼黑科技重构学习专注力

从纳斯达克到硅谷：Vaboo发布AI宠物健康系统，中国宠物科技走向全球舞台

百和仕以一站式商业空间全球交付能力亮相德国Euroshop

新进阶，新星途！星途品牌之夜即将启幕，全面开启3.0时代

一个国民品牌的“硬核突围”：凭什么臣博视站在未来？

曜夜，不止是颜色！星途凌云曜夜版隐藏的性能科技大揭秘

百万骑士 | 25个月百万公里！中国重汽汕德卡G7S的“运营传奇”

告别赝品与信息孤岛：智能平台为钱币藏家建立可信数字社区

星途汽车将成为首个中国厂家车队参加勒芒赛事

一箱油跑1400km，冬天也不怂，瑶光C-DM寰球版重新定义混动续航标准

虎嗅科技日报最新文章

合肥哈工兴航：打造智慧海洋生态引领水下机器人产业化革新

政策推动绿色商用车转型加速奇瑞商用车立志领跑新能源赛道

力量承载速度引领丨中国重汽亮相2026年F1中国大奖赛

追觅戒指 Glow 正式发布：全球首创指尖 AI 心电监测，重塑指尖智能穿戴新标杆

越野&改装一步到位，捷途旅行者骏马版&自由者骏马版正式上市限时焕新

对话一位KISSABC英老师区域经销商：做这份事业，我收获了三次成长

芯联生态智合共赢｜2026 AMD EPYC 行业生态峰会・上海站教育专场圆满举办

共生之美·小吉风｜小吉首次亮相AWE 2026，展现美学科技实力

从硅谷到AWE，追觅图灵进化6款算存电连芯片，赋能全场景AI智能化

仓库月台、AMR、机械臂都需要它：如何选对靠谱的ToF传感器供应商

虎嗅科技日报网简介