显然是在监控这里文字转WAV音频