这是十分正常而合理的推断文字转WAV音频