就能猜到他们每个人都是从不同的大厅里传送过来的文字转WAV音频