看上去应该是在找是不是有认识的面孔文字转WAV音频