就是小心翼翼地控制着神识在目标的周围文字转WAV音频