而是按照杜克的要求文字转WAV音频