这一连用了两个多小时进行透视文字转WAV音频