从其中几人的衣着可以看出文字转WAV音频