呼德研究员在语音信号处理领域国际顶级期刊《IEEE/ACM Transactions on Audio, Speech, and Language Processing》发表最新研究成果2篇

======

近日,呼德研究员在语音信号处理领域国际顶级期刊《IEEE/ACM Transactions on Audio, Speech, and Language Processing》发表最新研究成果2篇。具体内容如下。

Distributed sensor selection for speech enhancement with acoustic sensor networks

作者:De Hu, Qintuya Si, Rui Liu, Feilong Bao

摘要:在分布式声学传感器网络中,只有少数节点对语音增强任务起到显著作用。利用这些信息最丰富的节点而不是整个网络,不仅避免了不必要的能量消耗,还延长了传感器的寿命。为此,提出了一种用于分布式语音增强的传感器选择方法。通过最大化信噪比(SNR)确定麦克风节点的最佳子集,同时保持激活节点之间的连接。上述准则涉及整数和非线性规划,通过多个基于3进制的子优化问题进行线性化,每个问题都由先进的最陡下降(SD)算法求解。此外,提出了一种贪婪搜索策略以快速选择传感器。最后,进一步推导了一种分布式SD算法,更适用于分布式传感器网络。该方法可以在嘈杂和回声环境中获得最佳子网络。与现有方法不同,它可以从具有任意通信图的麦克风网络中选择节点。此外,它仅需要节点之间的局部通信,无需外部中央处理器。实验证实了该方法的有效性。

图1

Distributed sampling rate offset estimation over acoustic sensor networks based on asynchronous network newton optimization

作者:De Hu, Huaiwen Zhang, Feilong Bao, Rui Wang

摘要:采样率同步是分布式声学传感器网络中不可避免的问题。本文首先提出了一种分析采样率偏移(SRO)估计方法,然后将其扩展为适用于具有任意通信图的声学传感器网络的分布式方法。具体而言,在短时傅立叶变换领域使用线性相位漂移模型来近似每对麦克风节点之间的SRO。接下来,在展开时间平均相位信息后,通过一种新的加权和准则对SRO进行解析恢复。基于此,每个节点建立了一个分布式代价函数,以分布式方式同时获取所有节点的SRO。最后,采用一种先进的分布式算法,名为异步网络牛顿优化,进行分布式SRO估计。所提方法可以在嘈杂和回声环境中有效估计声学传感器节点之间的SRO。与现有方法相比,它不需要外部中央处理器,仅需节点之间的局部通信。实验证实了该方法的有效性。

图2