现场人群似乎又增加了一大堆文字转WAV音频