他们需要分成不同的小队文字转WAV音频