然后主动送上嘴唇文字转WAV音频