总是尽可能的接近目标文字转WAV音频