为什么要推迟文字转WAV音频