所以他更愿意倾听文字转WAV音频