每一组两位歌手演唱完毕后文字转WAV音频