是一排排的监控视频文字转WAV音频