基本上是时时刻刻都会关注周围的情况文字转WAV音频