而且是需要在近距离进行观察和测量文字转WAV音频