其他的都是辅助文字转WAV音频