代浩阳同学关于 TDOA 估计方面的研究《基于生成对抗网络的到达时间差估计器》被《信号处理》学报收录
======
近日,代浩阳同学相关论文《基于生成对抗网络的到达时间差估计器》被收录于 《信号处理》学报 2025 年第 9 期“智能语音信号感知与处理”专刊。《信号处理》学报是国内在信号处理与语音领域具有重要影响力的期刊,本次入选专刊反映了该工作在智能语音与声学信号处理方向的重要性与创新性。
到达时间差(Time Difference of Arrival,TDOA)是多通道声学信号处理中的关键空间特征,广泛应用于声源定位、阵列语音增强与空间滤波等任务。经典方法(例如 GCC-PHAT)在理想条件下效果良好,但在低信噪比与强混响环境中性能显著下降。近年来出现的基于深度学习的估计器虽提升了精度,但在极端噪声与混响场景中的鲁棒性仍有待加强。
为此,论文提出了一种 基于生成对抗网络(GAN)的鲁棒 TDOA 估计器,通过对抗训练机制增强模型在低 SNR 与强混响条件下的泛化能力。方法要点包括:
- 生成器(Generator) 使用门控循环单元(GRU)对原始多通道音频进行扩维处理,并基于 GCC-PHAT 提取互相关特征以强化时延信息;
- 判别器(Discriminator) 基于卷积神经网络(CNN)提取高维声学特征,结合真实或预测的 TDOA 输出置信度评分;
- 借鉴 Wasserstein GAN(WGAN) 思路,将判别器评分融入生成器损失,从而提升训练稳定性并缓解模式崩溃问题;
- 生成器同时优化交叉熵损失与对抗损失,使得预测兼顾精度与判别器定义的真实感。
在多个公开数据集上的对比实验表明:所提 GAN-TDOA 方法在低信噪比和强混响环境中显著优于经典 GCC-PHAT 及部分现有深度学习方法,在估计精度与鲁棒性上均有明显提升。

本论文由 内蒙古大学 独立完成,作者包括:代浩阳(硕士研究生)、呼德研究员(通讯作者)。该研究获得国家自然科学基金青年基金、地区科研资助及内蒙古自治区高层次人才引进“骏马计划”等项目支持。
论文收录信息:《信号处理》学报,2025 年,第 9 期,专刊:智能语音信号感知与处理。
论文链接:https://signal.ejournal.org.cn/article/doi/10.12466/xhcl.2025.09.011