大致是在问我坐标文字转WAV音频