所以我们两个必须找到中心点文字转WAV音频