粗打量了一下周边的环境文字转WAV音频