主要是在一个引导上面文字转WAV音频