这两项能力可是需要有庞大的灵力作为支持的文字转WAV音频