主要是利用瞄准镜瞭望周围文字转WAV音频