到时候可以优先抽取铺面文字转WAV音频