随着人工智能技术的迅猛发展,大模型技术作为数智化时代的核心驱动力,正逐步渗透到各行各业,成为推动行业变革与社会进步的重要力量。然而,随着大模型技术的广泛应用,其面临的安全风险也日益凸显。为了确保大模型能够在更加安全、可靠的环境中健康发展,中兴通讯通过构建完善的大模型安全防护体系,加强技术监管与合规审查,为数智化时代保驾护航。
大模型发展面临的安全风险
当前,大模型正处于蓬勃发展阶段,针对大模型的攻击层出不穷,大模型在数据处理、训推部署、业务运营等各个阶段面临着多种安全风险。
大模型训练依赖海量数据,数据的安全性直接关乎模型的准确性与可靠性。由于潜在数据安全风险导致数据供给方不愿开放用于训练的数据,降低了模型效果。在数据采集、数据预处理、数据标注等过程中存在敏感信息泄露、训练数据投毒、私有数据出域、训练数据集与模型参数泄露等风险。此外,数据在流通过程中的安全风险也不容忽视。
大模型的复杂性和高维性使得其算法可能存在漏洞,攻击者可能利用漏洞、逆向工程、对抗攻击等技术手段对大模型进行模型盗窃、模型篡改、后门攻击等,严重影响大模型训练和推理的输出结果。甚至智算基础设施也可能遭受直接攻击,导致模型无法正常运行或数据丢失。
大模型的输出内容存在安全合规风险,攻击者可能利用大模型生成虚假或有害信息误导或诱骗公众,利用大模型生成恶意代码或软件对政府、军事等机构发起自动化攻击,严重危害社会安全。
中兴通讯星云大模型端到端安全防护方案
为了保障星云大模型的安全性和可靠性,中兴通讯推出星云大模型端到端安全防护方案(见图1),通过自主研发和技术创新,从数据安全、模型安全、网络安全、业务安全、内容安全等多个维度构建大模型安全防护体系,为星云大模型提供端到端全流程安全保障,推动大模型技术快速发展。
星云大模型采用严格的数据保护措施,确保用户数据的安全性和隐私性。数据安全是大模型安全防护体系的核心,在采集海量原始语料数据时,通过数据分类分级技术自动发现并动态更新数据资产,支持根据数据的重要性与敏感程度实现自动分类分级管理。结合数据脱敏、数据防泄漏、数据隐私保护等技术研发自动化工具,针对不同级别的语料数据采取相应的安全防护措施,支持识别并清除有毒数据、无关信息、企业或个人标识数据,帮助用户解决训练数据投毒、私有数据出域,敏感信息、训练数据集与模型参数泄露等问题,为用户构建高质量训练与精调数据集。同时,通过建立有效的数据恢复机制,定期进行数据备份,防止用户数据丢失或损坏。此外,通过对用户敏感数据进行加密存储和传输,防止数据在流通过程中被窃取或篡改,充分保障星云大模型用户的数据安全。
模型文件是大模型训推过程中的核心资产,中兴通讯采用模型文件加密、模型签名和完整性检测技术,防止攻击者在训推过程中注入有害代码、窃取或篡改模型,确保模型的完整性和可信度。此外,中兴通讯通过实时监控模型的推理过程,及时发现异常行为或潜在攻击,利用检查激活的方式进行模型后门检测,支持通过微调、模型剪枝等方式消除模型后门。
在网络层面,通过部署防火墙、WAF、DDoS防护、漏洞扫描、主机入侵检测、主机防病毒等安全服务,实现网络隔离与访问控制,防止远程代码执行、侧信道攻击和恶意流量入侵等黑客攻击。另外,在边缘侧通过部署超融合安全网关,在基础设施中内置安全能力,为用户呈现大模型全生命周期网络安全态势,支持及时发现并处置告警事件,保障模型与智算基础设施安全。
星云大模型支持为用户提供完善的权限管理功能,确保只有授权的用户才能访问和使用模型提供的服务和应用。针对部分授权用户恶意利用大模型的行为,通过关键词过滤、用户行为检测等方式,识别恶意prompt,确保模型应用和业务流程的合法性和规范性。
相比于传统安全,大模型安全更加强调AIGC(人工智能生成内容)的安全合规。中兴通讯采用基于深度匹配的输入输出风险检测技术,通过预置关键词库实现非法内容的拦截,支持有效拦截违法违规、色情、反动等内容,同时,通过建立内容及主题过滤机制,能够有效识别并避免侵犯用户的著作权、商业秘密等知识产权。此外,中兴通讯采用RLHF(基于人类反馈的强化学习)技术,通过制定安全合规基线、人工标记比较、设置奖励函数等方式实现人机对齐,有效解决AIGC输出安全和价值观问题,对可能引起民族、信仰、性别、地域等多维度敏感属性歧视内容的正确识别率达99.5%,证明星云大模型在确保多元文化、平等尊重及非歧视原则方面具有卓越性能,支持为交通、水利、油气、电力、冶钢等各个行业大模型提供内容安全合规保障。
当前,大模型发展与算力资源紧缺成为行业用户面临的一大难题,中心训练+边缘推理成为行业模型训推的主要应用场景之一。中兴通讯支持为行业用户构建协同一致的云网安数基础设施(见图2),通过在边缘推理节点上部署超融合安全网关,融合安全、算力、数据与AI能力,支持轻量化部署推理模型与AI应用,通过内置20多种安全组件,提供全栈安全防护能力,保障精调数据与业务模型安全,支持为边缘推理节点提供轻量化可信沙箱、网络安全、数据安全、风险控制、内容合规安全检测,以及统一安全运维管理能力,支持安全能力按需编排调度,实时处理告警,减少运维响应时间,安全响应能力提升16.5%,降低企业边缘侧算力需求与投资成本,打造云网安数融合能力底座,保障行业模型安全训推。
中兴通讯通过建设星云大模型端到端安全防护方案,为星云大模型提供全流程安全防护,支持监控、评估和应对大模型面临的各种安全威胁,保障星云大模型完成了国家网信办生成式人工智能服务备案。中兴通讯通过构建大模型安全防护体系,助力大模型安全赋能千行百业。
未来展望
随着大模型技术的持续演进与创新,越来越多的行业希望借助大模型来实现业务升级、效率提升和创新驱动。在智能制造、智能交通、智能医疗等领域,云边协同架构能够实现资源与服务的高效整合与协同优化。在云边协同架构下,边缘用户更加关注如何保障敏感数据的安全。因此,中兴通讯正积极探索在星云大模型的精调与推理阶段融入差分隐私技术,通过在边缘用户的明文数据上添加噪声或进行模糊处理等方式,大幅降低敏感数据泄露的风险,确保在大模型精调与推理过程中边缘用户敏感数据的隐私与安全。
未来,随着大模型在安全领域的标准与规范逐渐建立和完善,大模型的安全防护能力无疑将同步得到提升。中兴通讯将利用大模型技术提升威胁预测与智能化防御水平,积极应对未知安全风险,构建支持自我完善的安全防护体系,保障大模型与AI应用的运行安全,推动人工智能技术健康有序地发展,为数智化转型提供安全保障。