所以他也是直接将话喊了出来文字转WAV音频