但是他们也提出一个新的条件文字转WAV音频