每一个出口都去一个人盯着文字转WAV音频