显然也是认识对方的文字转WAV音频