似乎在探查周围环境文字转WAV音频