不需要第一个开口表态文字转WAV音频