因为他不能判断二狗子的话文字转WAV音频