但如果自己直接提两个条件文字转WAV音频