将你观察到的所有声音和画面文字转WAV音频