也许……只是单纯的恰好没有抽取到我们文字转WAV音频