从各个角度拍摄下了上万幅图像文字转WAV音频