但控制已经到了地级文字转WAV音频