在确定了他们目前所处的位置后文字转WAV音频