扫描清楚环境和路人之后文字转WAV音频