就是因为他在有意识地控制文字转WAV音频