在逻辑上也是非常合理的文字转WAV音频