基本能确定他的身份后文字转WAV音频