不然不会下那么重的手文字转WAV音频