尤其是以前孙子轩还需要根据对方的动作进行反应文字转WAV音频