我则选了一个视角合理的地方居高临下去观察那个坐标点的动静文字转WAV音频