因为现场每一张脸孔都因为过度的兴奋而扭曲了文字转WAV音频