第二个疑问就是……是否有办法避开这种抽取文字转WAV音频