又恢复了标准人类的外貌文字转WAV音频