然后由我们三位统计出谁的答案准确文字转WAV音频