他会事先除去文字转WAV音频