这个考核一共有着三轮文字转WAV音频