从而最终稳定的属性文字转WAV音频