还有就是对眼前人身份的判断文字转WAV音频