可见他们也并没有太多的重视文字转WAV音频