但大多只是点头应对一下文字转WAV音频