然后通过摄像机将这一切记录下来文字转WAV音频