麦克风阵列算法笔记之一(Endfire,broadside)

麦克风阵列算法笔记之一(Endfire,broadside)麦克风阵列算法有两大类 一类是波束形成算法 另一类是盲源分离算法 两者互有优劣 先记录波束形成算法的笔记

大家好,欢迎来到IT知识分享网。

麦克风阵列算法有两大类,一类是波束形成算法,另一类是盲源分离算法,两者互有优劣,先记录波束形成算法的笔记。系列博客先介绍两种常见麦克风阵列结构,然后分别介绍固定波束形成(fixed beamforming, data-independent) 和自适应波束形成(adaptive beamforming, data-dependent)。

本篇博客只介绍Broadside和Endfire两种结构,其特点和应用场景。

Broadside 结构

Broadside结构是一种常见的麦克风阵列结构,麦克风之间间距为 d d d,目标语音方向和麦克风之间的连线呈垂直关系,如下图所示。
在这里插入图片描述

特点

  • Broadside结构的优点是处理简单,只需要将两路麦克风信号相加即可。
  • 缺点也很明显,只能衰减两边的信号,对称角度的空间响应是相同的。
  • Broadside适合用于有期望信号只来自正前方,干扰来自两侧的场景。
  • Broadside设计时只有一个变量,即麦克风间距 d d d。算法上可扩展为delay sum和filter sum,会增加延迟或者滤波器参数。

空间响应(频率变化)

  • 两个麦克风的场景,间距 d = 75 m m d=75mm d=75mm ,在90°和270°方向的衰减最厉害。
  • 衰减程度与频率相关,最大的衰减出现在1/2波长处。对于7.5cm麦克风间距,最大衰减频率为
    343 m / s e c ÷ ( 0.075 m × 2 ) ≈ 2.3 k H z 343 m/sec ÷ (0.075 m × 2) ≈ 2.3 kHz 343m/sec÷(0.075m×2)2.3kHz
  • 高于这个频率后,信号将发生空间混叠,在其他方向也会出现零点。下图中,3kHz的信号出现了四个零点。
  • 减小麦克风间距,可以提高发生空间混叠的信号频率,但是会减少低频信号的衰减,指向性不好。
    在这里插入图片描述

频率响应(角度变化)

  • 0°方向的频响是平坦的,两路麦克风拾取到这个方向信号是相同的,仅仅相加而已。
  • 90°方向可以找到2.3kHz位置的零点 F n u l l F_{null} Fnull
  • 0°和90°是两个极限:0°,低频没有衰减, F n u l l F_{null} Fnull 为无穷大;90°,低频衰减最大, F n u l l F_{null} Fnull 为最小。
    在这里插入图片描述

Endfire结构

Endfire是一种常见的麦克风阵列结构,麦克风之间间距为 d d d,目标语音方向和麦克风之间的连线呈平行关系,目标语音先到达一个麦克风再到达另一个,如下图所示。
在这里插入图片描述

特点

  • Endfire结构稍微复杂一些,先收到目标语音的麦克风信号与另一路麦克风延迟 z − n z^{-n} zn后的信号反向相加。
  • Endfire的优点是能有足够的衰减,具体的衰减与延迟 z − n z^{-n} zn相关。
  • Endfire的设计有两个变量,麦克风间距 d d d和信号延迟 τ \tau τ
  • Endfire适合用于有期望信号只来自端射方向,其他方向都是干扰的场景。

空间响应(频率变化)

下图为两个麦克分组成的差分阵列,信号采样率48k,信号延迟3个采样值,麦克风间距为21mm。(21mm对应48kHz信号的三个采样值的时间。)

  • 根据上述条件可以计算0°方向,到达零点的频率 F n u l l F_{null} Fnull
    F n u l l = 343 m / s e c ÷ ( 0.021 m × 2 ) ≈ 8.2 k H z F_{null} = 343 m/sec ÷ (0.021 m × 2) ≈ 8.2 kHz Fnull=343m/sec÷(0.021m×2)8.2kHz
  • 从下图可以看出,频率小于 F n u l l F_{null} Fnull时,都会在180°方向形成零点,得到一个心形响应。
  • 一旦频率超过 F n u l l F_{null} Fnull,发生频谱混叠,在多个方向出现零点。
    在这里插入图片描述

空间响应(延迟变化)

固定麦克风间距 d d d,相应的延迟 τ A = d / c \tau_A=d/c τA=d/c ,调整延迟 τ \tau τ。可以分别得到下面三种空间响应。

  • 延迟 τ = τ A \tau=\tau_A τ=τA,得到cardioid(心形响应),如上图所示。
  • 延迟 τ = τ A \tau=\tau_A τ=τA,得到hypercardioid(超心形响应)。
  • 延迟 τ = 0 \tau=0 τ=0,得到dipole。即没有延迟直接相减,这样垂直方向上的信号衰减得最厉害,与broadside刚好相反。
    在这里插入图片描述

频率响应(角度变化)

下图为两个麦克分组成的差分阵列,信号采样率48k,信号延迟3个采样值,麦克风间距为21mm。对应上图中的心形响应。

  • 计算0°方向,幅频响应平坦时的频率 F f l a t F_{flat} Fflat
    F f l a t 1 = 343 m / s e c ÷ ( 0.021 m × ( 4 / 1 ) ) ≈ 4.1 k H z F_{flat1} = 343 m/sec ÷ (0.021 m × (4/1)) ≈ 4.1 kHz Fflat1=343m/sec÷(0.021m×(4/1))4.1kHz
    F f l a t 2 = 343 m / s e c ÷ ( 0.021 m × ( 4 / 3 ) ) ≈ 12.3 k H z F_{flat2} = 343 m/sec ÷ (0.021 m × (4/3)) ≈ 12.3 kHz Fflat2=343m/sec÷(0.021m×(4/3))12.3kHz
  • F f l a t 1 F_{flat1} Fflat1时幅频响应平坦,然后迅速衰减,直到 F n u l l F_{null} Fnull,然后迅速上升,直到 F f l a t 2 F_{flat2} Fflat2时再次到到平坦的幅频响应。
  • 差分阵列无法获得平坦的频率响应,而是一个类似高通的效果。
  • 一阶差分阵列在 F n u l l F_{null} Fnull之前,幅频响应有一个6dB/octave的上升。
  • 0°和180°是两个极限:0°,低频衰减最少, F n u l l F_{null} Fnull 为最小;180°,低频衰减最大, F n u l l F_{null} Fnull 为无穷大。
  • 在这里插入图片描述

总结

结构 优点 缺点
Broadside summing 1. 实现简单
2. 结构简单
1. 非期望方向衰减较少
2. 为防止混叠间距较小
Endfire differential 1. 非期望方向衰减更多
2. 更小的尺寸
1.实现复杂,需要延迟
2.低频幅度衰减
3.需要更深的阵列结构

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/144729.html

(0)
上一篇 2025-04-24 19:10
下一篇 2025-04-24 19:15

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信