但每次我们都要把他移出镜头文字转WAV音频