而是采取了一种接近于中式的主持方式文字转WAV音频