他想要尽可能的表现得镇定一些文字转WAV音频