或许它可以模拟出人类的形态文字转WAV音频