似乎是在等着自己表态文字转WAV音频