而后者刚开始还能控制文字转WAV音频