而不是单纯的靠手臂的力量带动文字转WAV音频