仅仅从周围的众人的表现他也能够判断出文字转WAV音频