它再现拍摄者对原作的理解文字转WAV音频