他只是负责最简单的身份验证文字转WAV音频