找回密码
 立即注册
首页 业界区 业界 C#实现语音预处理:降噪、静音检测、自动增益(附Demo源 ...

C#实现语音预处理:降噪、静音检测、自动增益(附Demo源码)

凤患更 2025-6-19 16:00:01
      无论是在音视频录制系统,还是音视频通话系统、或视频会议系统中,对从麦克风采集到的说话的声音数据进行预处理,都是是非常必要的。
      语音数据预处理主要包括:​​降噪(Noise Reduction)、静音检测(Silence Detection/VAD)、自动增益(Automatic Gain Control, AGC)​​ 。
一. 语音预处理的作用

   我们先解释一下,降噪、静音检测、自动增益,这些语音预处理分别起什么作用。
(1)降噪
      降噪,用于消除背景噪声,比如马路车流声、环境杂音等,以保留清晰的说话人声。
      更高级的,结合AI模型训练,还可以消除电脑的风扇声、键盘敲击声等等。
(2)静音检测
      静音检测,又称为语音活动检测,用于识别音频流中的静音片段(没有讲话人声),这样可以简化后续的编码等环节,并可以节省传递所需要的带宽。
(3)自动增益
      自动增益,用于动态调整说话声音的音量,使输出电平保持稳定,以避免讲话的声音忽大忽小。
二. 实现语音预处理

      接下来,我们使用C#实现一个Demo,这个Demo将从麦克风采集声音数据,然后进行语音预处理,并且将处理后的声音数据实时播放出来。Demo的运行效果如下图所示:
      
1.png

      Demo 功能很简单,那我们来具体看看代码是如何实现的。
1. 创建采集器、预处理器、播放器

     麦克风声音数据采样率我们选择16K、单声道。 
  1. WaveSampleRate sr = WaveSampleRate.S16k;
  2. int channelCount = 1;
  3. //创建语音预处理器,开启降噪、自动增益、静音检测
  4. this.voicePreprocessor = CapturerFactory.CreateVoicePreprocessor(sr, channelCount, true ,true);
  5. //创建麦克风采集器
  6. this.microphoneCapturer = CapturerFactory.CreateMicrophoneCapturer(int.Parse(this.textBox_mic.Text), sr);
  7. this.microphoneCapturer.AudioCaptured += new ESBasic.CbGeneric<byte[]>(microphoneCapturer_AudioCaptured);
  8. //创建声音播放器
  9. this.audioPlayer = PlayerFactory.CreateAudioPlayer(int.Parse(this.textBox_speaker.Text), (int)sr, channelCount, 16, 2);               
  10. this.microphoneCapturer.Start();
复制代码
  CreateVoicePreprocessor 方法的最后两个参数可以指定在降噪的同时,是否开启静音检测和自动增益功能。
2. 预处理语音数据

      语音预处理器每次处理10ms的声音数据,而现在的麦克风采集器每次采集的是20ms的PCM数据,所以,我们将其拆成两个10ms数据,再提交给预处理器处理。
  1. void microphoneCapturer_AudioCaptured(byte[] audioData)
  2. {
  3.     if (this.checkBox_enabled.Checked)
  4.     {
  5.         //麦克风每次采集20ms数据,降噪器每次处理10ms数据。
  6.         byte[] frame10ms1 = new byte[audioData.Length / 2];
  7.         byte[] frame10ms2 = new byte[audioData.Length / 2];
  8.         Buffer.BlockCopy(audioData, 0, frame10ms1, 0, frame10ms1.Length);
  9.         Buffer.BlockCopy(audioData, frame10ms1.Length, frame10ms2, 0, frame10ms2.Length);
  10.         this.HandleData(frame10ms1);
  11.         this.HandleData(frame10ms2);
  12.         return;
  13.     }
  14.     this.audioPlayer.Play(audioData);
  15. }
复制代码
(1)通过一个CheckBox勾选框来实时控制是否启用语音预处理,这样在测试时,就可以很方便的对比体验开启了语音预处理的效果。
(2)调用IVoicePreprocessor 的 Process 方法,就可以完成一帧语音数据(10ms)的预处理。如下所示:
  1. private void HandleData(byte[] frame10ms)
  2. {
  3.     byte[] res = this.voicePreprocessor.Process(frame10ms);            
  4.     if (res == null) //静音帧
  5.     {
  6.         ++this.silenceFrameCountTotal;
  7.         this.audioPlayer.Play(this.voicePreprocessor.SlienceFrame);
  8.     }
  9.     else
  10.     {
  11.         this.audioPlayer.Play(res);
  12.     }
  13. }
复制代码
  如果Process 方法返回的是null,表示检测到该帧是静音帧,于是,将内置的10ms静音帧 SlienceFrame 提交给播放器去播放。
3. 统计静音帧数量

  一个语音帧是10ms,那么1秒钟就有100个语音帧,程序中,我们统计了上一秒出现了多少个静音帧,并在UI左下方显示出来。
  1. private volatile int silenceFrameCountTotal = 0;
  2. private volatile int silenceFrameCountPre = 0;
  3. private void timer1_Tick(object sender, EventArgs e)
  4. {
  5.     int delt = this.silenceFrameCountTotal - this.silenceFrameCountPre;
  6.     this.silenceFrameCountPre = this.silenceFrameCountTotal;
  7.     //显示上一秒静音帧数量。
  8.     this.label_silenceFrameCount.Text = delt.ToString();
  9. }
复制代码
   实际测试时可以发现,当不说话时,UI实时显示1秒钟出现的静音帧是100个。
三. Demo源码下载

        源码下载:VoicePreprocessDemo.rar
   如果不想打开VS,可以直接到Debug目录下,双击 Oraycn.VoicePreprocessDemo.exe 即可运行Demo,开始体验语音降噪、静音检测、自动增益的处理效果。
        建议使用耳麦测试,对比效果会更明显。当开启预处理时,能立即感觉到背景噪音消失了,而且说话的声音变大了(AGC),不说话时,UI显示静音帧的数量变多。
   来下载试试语音预处理的效果吧。
 

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册