自己两次追问文字转WAV音频