理论上是技能使用者的等级文字转WAV音频