AdoDAS 多模态挑战赛

挑战赛网址:https://adodas.hai-lab.cn/

一、摘要

在青少年心理健康问题日益凸显的今天,早期筛查与及时干预至关重要。如何在保障隐私与伦理安全的前提下,开展可扩展、可复现、可比较的智能评估研究,是多模态智能与数字健康领域的重要议题。为此,我们隆重推出 AdoDAS 多模态挑战赛。这是一个包含 6000 名儿童及青少年参与者、共计 24000 个音视频片段的大规模、隐私保护型多模态数据集。

本挑战赛的数据收集基于严格控制的校园环境协议,结合了标准化文本阅读与开放式访谈提示。真实标签源自 DASS-21 量表,提供抑郁 (Depression)、焦虑 (Anxiety) 和压力 (Stress) 三个子量表的评分以及 21 个条目级别的反馈。不同于以往聚焦社交媒体或成人访谈的比赛,AdoDAS 专门面向未成年人,并采用了严格的隐私保护机制,不公开原始音视频,仅发布可复现的预计算特征及跨模态时序元数据。我们提供了两个基准赛道及基线模型,旨在推动安全、可靠的多模态心理健康研究。

二、引言与背景

青少年阶段是心理健康问题识别与早期干预的关键时期。抑郁、焦虑和压力问题不仅具有较高发生率,而且常常存在共现现象。现实场景中的心理筛查,仍然大量依赖问卷量表和有限的专业资源,这使得大规模、持续性、低负担的评估面临挑战。

近年来,多模态情感计算的发展表明,人在交流过程中的语音特征、面部行为、动作模式与时序变化,能够为心理状态评估提供有价值的补充信号。但现有公开资源大多集中在成人访谈、社交媒体文本或“野外场景”数据,真正面向未成年人、同时又兼顾隐私保护与标准化评测的多模态基准仍然十分稀缺。

其中,最核心的难点有两点:

第一,是隐私与伦理约束。对于儿童和青少年数据,哪怕经过常规匿名化处理,原始音视频仍可能带来身份重识别风险,因此直接开放数据存在较大限制。

第二,是评测标准不统一。不同数据集、任务定义、划分方式和指标设置差异明显,容易导致结果不可比,甚至产生被试泄漏等问题,影响模型评估的可靠性。

AdoDAS 正是在这样的背景下提出:在保证未成年人数据安全的前提下,构建一个可复现、可比较、可拓展的多模态挑战平台,为青少年心理健康评估提供新的研究基准。

三、核心亮点

  • 聚焦青少年心理健康评估

AdoDAS 不再局限于成人访谈或社交媒体文本,而是将研究重点放在儿童与青少年群体,围绕抑郁、焦虑和压力三个关键维度展开,更贴近实际心理健康筛查需求。

  • 大规模、多模态、标准化采集

数据集覆盖 6000 名参与者、共 24000 段音视频样本。每位参与者均包含 4 个采集片段:一个标准化朗读任务(A01),以及三个开放式问答任务(B01–B03),兼顾受控表达与自然表达两类场景。

图 1 数据分布

  • 隐私保护优先的发布机制

AdoDAS 不发布原始音频、原始视频和可识别人脸帧图像,而是以预计算特征 + 时序元数据的方式对外开放,既降低隐私风险,也为研究者提供可直接建模的输入表示。

  • 支持粗粒度筛查与细粒度建模

标签来源于 DASS-21,既提供抑郁、焦虑、压力三个子量表得分,也包含 21 个条目级响应。这使得研究者既可以进行二分类筛查,也可以探索更细粒度、可解释的症状建模问题。

四、挑战赛道设置

本次挑战赛包含两条赛道:

赛道一:多任务二分类筛查(Track A1)

本赛道面向 抑郁 / 焦虑 / 压力(D/A/S) 三个维度的筛查任务。对于每个样本,参赛者需要分别预测其在三个维度上是否属于“Normal”或“Mild-or-above”类别,即完成三个二分类任务。

在评测上,赛道一的主要指标为三个任务 F1 的平均值,辅助指标为平均 AUROC,用于衡量模型在筛查任务上的整体判别能力。

赛道二:DASS-21 条目响应预测与子量表重建(Track A2)

本赛道进一步提升任务粒度。参赛者需要对每个样本预测 DASS-21 的 21 个条目分值,每个条目取值范围为 0–3。在此基础上,官方将依据标准 DASS-21 规则重建抑郁、焦虑与压力三个子量表得分。

赛道二的主要指标为 21 个条目上的平均 QWK,辅助指标为平均 MAE,用于考察模型在条目级预测上的整体一致性与模型预测值与真实标注之间的偏差程度。

五、基线系统

我们为参赛者提供了一个完全基于特征、保护隐私的时序基线模型。该模型采用模块化设计,核心组件包括:

  1. 分组适配器 (Group-wise adapters): 缓解低维行为特征与高维 SSL 嵌入之间的尺度不匹配。
  2. 时序编码器 (Temporal encoders): 采用残差扩张时序卷积块,在 25Hz 的时间轴上捕捉局部动态与长程趋势。
  3. 掩码感知注意力池化 (Mask-aware pooling): 结合时序元数据和视觉质量信号,降低缺失或低质量帧的干扰。
  4. 多任务预测头 (Fusion and multi-task heads): 针对 A1 和 A2 赛道,分别设计了二分类输出头与 21 个题目的有序回归/分类头。
图 2 基线系统

六、重要时间节点

Data, website, baseline and code available21 Mar, 2026
Results submission start09 May, 2026
Results submission deadline20 May, 2026
Deadline for paper submission28 May, 2026
Paper acceptance notification16 Jul, 2026
Deadline for camera-ready papers06 Aug, 2026