目前大致的镜头都已经拍完文字转WAV音频