大部分是一炼层次文字转WAV音频