是为了让他们借助这种方法来分出高下文字转WAV音频