两人都是一张图只能找出五个错误地方的两三处文字转WAV音频