在高校数字化进程加速的今天,校园网络运维已从 "保障连通" 迈向 "体验驱动"。南昌大学网络与信息中心以算力和大模型为底座,以智能体技术为核心,打造了一套网络运维智能体矩阵,实现了运维流程的语义化理解与自动化处置的闭环,破解宿舍光网、账号认证、设备监测三大场景痛点,用技术创新实现运维效率跨越式提升。
光猫注册智能体:移动化运维的 "效率引擎"
针对宿舍光网注册重复操作多、人工失误率高的难题,团队自主研发了全流程自动化的光猫注册智能体。
依托现有运维平台框架,通过 FastAPI 打造学校专属 OLT 标准化 API 接口,实现注册命令统一下发与集中管控,该接口将复杂的注册指令封装为统一的REST API,使运维系统能够以标准化方式下发开通命令。与此同时,搭配本地部署的 Qwen3-30B 大模型,基于 MCP(Machine Communication Protocol,多智能体协作协议)工具调用协议,实现自然语言指令到 API 调用的无缝转换。这一技术赋予智能体 AI 自主规划动作的能力,可根据不同设备型号和网络环境自动调整注册流程。例如,智能体能够针对不同区域OLT 自动选择相应的命令模板,并根据端口使用状态或链路连通情况自动调整生成的配置参数,确保开通流程一次成功完成。
1.支持移动终端操作,业务开通时间大幅缩短。
2.采用 "权限最小化" 设计,仅开放注册权限杜绝误删风险。
3.输入智能校验 + 操作全留痕,既规避人为故障,又实现问题可追溯,让运维安全与效率兼得。
新生入学高峰期,传统逐个通过 OLT 平台配置不仅耗时且易出错。借助该智能体,运维人员可通过手机随时随地处理光猫注册工单,无需返回机房操作,从以往单个注册5-10分钟缩短至秒级响应,大幅提升业务处理效率,让师生更快用上网络。
针对上网认证系统,构建自动化响应的智能体,打通账号管理与安全处置的 "全闭环"。
封装认证系统 API,在运维平台搭建自动化工作流,通过 MCP多智能体协作协议,调用 Qwen3-30B 模型,实现 "对话意图识别→指令智能执行→操作结果反馈" 一体化。该智能体能够根据不同业务场景自动适配处理流程,实现账号管理与安全处置的智能化闭环。
1.用户业务启停、信息变更秒级响应。
2.接入设备数量灵活管控,规范网络使用。
3.与网络安全科实时协同,可疑账号、异常设备快速封禁隔离,将安全风险扼杀在萌芽状态。
面对师生账号密码重置、设备管理等高频需求,运维人员通过智能对话即可完成批量操作,告别繁琐的后台查询与手工配置;安全事件发生时,可快速联动多个智能体协同处置,实现"发现问题→定位根因→自动封禁→通知相关方"全流程自动化响应。
监测智能体:核心设备的 "7×24小时哨兵"
面对重点保障期间设备高可靠性要求,打造全天候、智能化的设备状态监测智能体。
依托运维平台的监测能力,对核心设备、链路、接口开展7×24小时主动巡检。监测手段涵盖SNMP数据轮询采集、Syslog日志收集等,将各设备的运行指标和告警日志实时汇聚到统一平台后,采用多模型融合策略进行智能分析。结合本地Qwen3-30B 模型的快速响应能力和DeepSeek V3大模型的深度推理能力,对巡检数据进行语义分析、故障判定与原因推断。在这一融合策略下,Qwen3-30B 模型可以对海量监测信息进行秒级语义解析并给出初步判断,而DeepSeek V3 作为超大参数的专家模型,擅长对复杂异常进行深入的逻辑推理和关联分析。两种模型相辅相成,使智能体能够精准判定故障及推断根因。同时智能体可根据告警等级自动决策是否需要联动其他智能体进行应急处置。当告警级别较低时,智能体仅发送提醒并持续观察;而当遇到严重告警(例如核心链路中断),智能体将自主触发应急流程,如通知相关运维人员并联动认证智能体对可疑流量源进行隔离,防止故障扩大化。
1.正常运行时自动推送 "报平安" 通知,无需人工盯守。
2.故障发生时精准定位至具体设备与端口,实时推送告警并推断故障原因。
3.将故障定位时间从 "小时级" 压缩至 "分钟级",真正实现移动化、无人化监控。
重保期间,运维人员无需通宵值守盯屏,智能体自动完成设备巡检并推送健康报告。深夜突发网络故障,手机即时收到智能推送,精准告知故障设备、端口及可能原因,运维人员可快速远程诊断或到场处置,最大限度降低网络中断对师生的影响。
从光猫注册的"降本提效",到账号管理的"安全协同",再到设备监测的"智能预警",南昌大学网络与信息中心以智能体技术为支点,重构校园网络运维模式。这不仅是一次技术升级,更是一场服务理念的革新——让师生享受更快速、更智能、更贴心的网络服务,让运维团队从繁琐事务中解放,专注于更有价值的创新工作。未来,我们将持续深化 AI 与运维场景的融合,让技术成为校园网络稳定运行的"硬核保障"!
来源:南昌大学网络与信息中心