全部都是按照所施展的人的功力来判断文字转WAV音频