将目光从下方的都市中收回文字转WAV音频