它们的核心内核文字转WAV音频