又根据重要性做了一个单独的排列文字转WAV音频