所以认出了对方的身份之后文字转WAV音频