多数情况都是点头或者摇头文字转WAV音频