她们才会根据对方的身份文字转WAV音频