利用大高清格式帧拍摄了百分之五十左右的镜头文字转WAV音频