但其实第二重是分好几个境界文字转WAV音频