不过他们可能还要多上一份文字转WAV音频