因此这不但要耗费大量的时间来准备文字转WAV音频