但核心数据是很难完全虚构的文字转WAV音频