一旦接受到了指令文字转WAV音频