然后原本站在他们身边的其他人文字转WAV音频