而我们则是被分开派遣了文字转WAV音频