对刚才的景象判断文字转WAV音频