但已经基本被控制文字转WAV音频