这些数据的处理主要是消除那些出现几率很少文字转WAV音频