前者是意念凝聚实体后的存在文字转WAV音频