但问题是现在这种能力还无法使用文字转WAV音频