所有格中的物体都因此有了一个明确的自定义坐标文字转WAV音频