而是讨论接下来的细节文字转WAV音频