其拍摄出的文字转WAV音频