是2种语言合并一起的歌曲文字转WAV音频