他们也是直接出文字转WAV音频