它只服务于一个观众文字转WAV音频