所以他站在原地文字转WAV音频