并且随着他的行走文字转WAV音频