于是人群自动分开一条通道文字转WAV音频