接下来的难度会呈现几何下降文字转WAV音频