好像就是从前面那栋建筑传出来的文字转WAV音频