所以他刚才说话文字转WAV音频