语音信号处理的宽带说话人(声源)定位(DOA估计)算法

2022/7/17 1:17:46

本文主要是介绍语音信号处理的宽带说话人(声源)定位(DOA估计)算法,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

Abstract 本仓库是面向语音信号的声源定位传统算法

关键词:声源定位(sound source localization)、DOA估计(DOA estimation)、TDOA估计(TDOA estimation)、麦克风阵列信号处理(microphone array signal processing)

ssl_tools

包含SRP-PHAT(GCC-PHAT)、MUSIC、beamforming(波束形成)三类算法

  • SRP:SRP-PHAT、非线性SRP-PHAT
  • MUSIC
  • beamforming:基于延迟求和(DS)的SNR方位谱估计、基于MVDR的SNR方位谱估计及其对应的频率加权改进算法

与语音信号处理的宽带声源定位相关的参考资源

竞赛

  • acoustic source LOCalization And TrAcking [LOCATA]
  • Detection and Classification of Acoustic Scenes and Events [DCASE]

多通道数据集生成算法

  • rir-generator [Code]
  • ROOMSIM[Code]

开源代码

基于时延的定位

  • A simple DOA GUI [Code]

基于波束形成的定位

  • DNN_Localization_And_Separation [Code]

双耳定位

  • binauralLocalization [Code]
  • Binaural-Auditory-Localization-System [Code]
  • Binaural_Localization:ITD-based localization of sound sources in complex acoustic environments [Code]

高分辨率定位

  • WSCM-MUSIC [Code]

基于聚类定位

  • messl:Model-based EM Source Separation and Localization [Code] [Paper]
  • fast_sound_source_localization_using_TLSSC:Fast Sound Source Localization Using Two-Level Search Space Clustering [Code]

窄带定位

  • doa-tools [Code]
  • 麦克风声源定位 [Code]


这篇关于语音信号处理的宽带说话人(声源)定位(DOA估计)算法的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程