上个月聊到一个做了半年还没上线的准入项目,问题出在什么地方?不是功能不够,也不是性能不行,而是对接企业现有的IT环境时碰到的兼容性问题一个接一个,工期一拖再拖。这类问题在项目初期往往重视不够,等到实施阶段才发现,补救成本就很高了。
第一个最常见的兼容性问题出在网络设备层面。准入认证系统需要跟交换机、无线AC、防火墙这些设备做联动,通过802.1X、Portal或MAC地址来实现准入控制。这里的关键不是"支不支持"——主流准入系统通常都说支持华为、H3C、锐捷、思科等主流厂商的设备。真正的问题是协议版本的兼容性。比如Portal协议,华为有Portal 1.0、Portal 2.0,CMCC也有自己的协议规范,同一厂商不同固件版本对协议的支持程度也不完全一样。有的设备Portal 1.0跑得没问题,升级固件后Portal报文格式变了,准入就失效了。实施前建议收集网络环境里所有涉及准入的设备型号和固件版本,让系统厂商逐一确认兼容性,不光是"型号在支持列表里",而要具体到固件版本。
第二个高频兼容性问题出在身份源对接。大多数准入系统需要跟企业现有的身份管理系统(AD域、LDAP、OA系统、HR系统)做对接,从中获取员工信息和权限。这里面的麻烦通常来自三个方面。一个是LDAP的版本差异,OpenLDAP和Active Directory在某些字段的处理方式不一样,需要做字段映射。另一个是用户数据格式不一致,比如有的系统员工编号是纯数字,有的是带字母的混合编码,准入系统如果对格式有预设要求,就需要做适配。第三个是增量同步的机制设计,员工入职离职是每天都在发生的,准入系统需要能及时感知身份源的变化,而不是每天全量同步一次。全量同步在用户量大的时候耗时很长,增量同步的实现方式各系统差异较大,这也是选型时要重点确认的。
第三个兼容性问题很多人不会提前想到——证书体系的兼容性。如果企业用的是802.1X证书准入,证书的格式、有效期、吊销列表(CRL)的处理逻辑都需要和准入系统对齐。有些企业的证书是由自建CA签发的,证书链结构和标准公网证书不一样,准入系统能否正确校验这些证书是一个需要实际测试的点。还有一个容易被忽略的细节是终端设备证书的安装和更新机制——如果是Windows域内设备,可以通过组策略自动下发证书;如果是BYOD设备或Mac电脑,证书的安装过程就复杂很多,需要一套独立的终端引导流程。
第四个是网络拓扑层面的兼容性。准入系统在网络中的部署位置(旁路、串联、分布式)会直接影响控制效果和风险范围。旁路部署改动最小,对现网影响低,但对某些准入控制场景(如实时阻断)的支持弱于串联部署。现实中很多企业网络拓扑经过多年演变已经比较复杂,如何在最小化网络改造的前提下把准入系统"嵌入"现有拓扑,本身就是一道兼容性考题。选型时建议让厂商出具体的部署拓扑方案,明确指出哪些设备需要配置变更、对现有业务流量的影响有多大、回滚方案是什么。
第五个容易踩坑的地方是已有安全产品的共存。很多企业在建准入系统之前,已经部署了VPN、防火墙策略、NAC设备、终端管理软件等。准入系统上线后,可能会跟这些已有安全产品产生策略冲突。比如防火墙上有基于IP的访问控制规则,准入系统又在做基于用户身份的准入策略,两者如果不协调,就可能出现"准入系统判定准入通过,但防火墙规则拦截了用户"的情况,排查难度较大。准入系统不是替代已有安全基础设施,而是和它们形成策略协同——这个定位需要在项目初期就建立起来。
最后一个兼容性问题出在终端层面。员工的终端设备五花八门:Windows不同版本、Mac、Ubuntu、iOS、Android,每种操作系统对802.1X和Portal的支持程度不完全一样。有的老版本Windows在802.1X认证时需要关闭"验证服务器证书"选项才能通过,这在安全策略上是不允许的。有的手机在Portal认证时,弹出页面的时间窗口很窄,用户还没来得及输入账号密码页面就消失了。这些问题在实验室环境里不一定能复现,但在真实环境中会频繁发生。建议在项目POC阶段,用企业实际使用的终端类型(包括老设备)做准入流程的端到端测试,不要只拿一台标准配置的测试机走过场。
兼容性问题在准入项目里几乎是不可避免的,能做的是在项目早期把它们充分暴露出来,制定应对方案,而不是等到实施阶段才发现。一个好的实施计划,应该把对接兼容性验证作为第一个里程碑,而不是功能上线的最后一步。

English