在两个人的身后则跟着几个人文字转WAV音频