那两个能力是拥有先后次序的文字转WAV音频