他们出现的坐标是随机的文字转WAV音频