所以这个说话自然没有太多的遮拦文字转WAV音频