每一步和前一步迈出去的距离都是不同的文字转WAV音频