根据他先前听到房间里面的对话文字转WAV音频