还需要留守一大部分在关内文字转WAV音频