根据拍摄到的情况文字转WAV音频