然后才会做出相应的决策文字转WAV音频