然后两个车队拼在一起文字转WAV音频