每一个层次之间的差距再次被放大文字转WAV音频