还不如说是讲给所有的观众听文字转WAV音频