可基本上都可以算做独立的个体文字转WAV音频