以他们四人的能力自然能分辨出那五人是谁文字转WAV音频