必须预先处理掉他们文字转WAV音频