由他来确认此人是否是目标本人文字转WAV音频