但却因其笨重加上必须需要人来驱动文字转WAV音频