去接受每一个观众的审视文字转WAV音频