它们依据外界抽象的事物文字转WAV音频