按照一次比一次台阶多的情况来分析文字转WAV音频