但他还是要讲文字转WAV音频