他们被增强的地方是文字转WAV音频