新聞中心 行業(yè)動(dòng)態(tài)

打造AI賦能新型工業(yè)化背景下的大模型安全“工具箱”

2025-09-25 10:59    來(lái)源:中國(guó)鋼鐵新聞網(wǎng)
  一  概述
  自2017年Transformer架構(gòu)誕生,大模型便踏上了迅猛發(fā)展的征程。從數(shù)量來(lái)看,全球大模型創(chuàng)新節(jié)奏持續(xù)加快。2023年,全球基礎(chǔ)模型數(shù)量較2022年實(shí)現(xiàn)翻倍增長(zhǎng)。2024年,創(chuàng)新活力持續(xù)釋放,新增或迭代的基礎(chǔ)模型近百個(gè)。據(jù)2025年7月世界人工智能大會(huì)最新數(shù)據(jù)顯示,全球已發(fā)布大模型總數(shù)達(dá)3755個(gè),其中中國(guó)發(fā)布1509個(gè),位居首位;7月31日召開(kāi)的國(guó)務(wù)院常務(wù)會(huì)議審議通過(guò)《關(guān)于深入實(shí)施“人工智能+”行動(dòng)的意見(jiàn)》,提出要深入實(shí)施“人工智能+”行動(dòng),推動(dòng)人工智能在經(jīng)濟(jì)社會(huì)發(fā)展各領(lǐng)域加快普及、深度融合,形成以創(chuàng)新帶應(yīng)用、以應(yīng)用促創(chuàng)新的良性循環(huán)。
  從技術(shù)能力來(lái)看,大模型的技術(shù)能力邊界不斷拓展。從最初簡(jiǎn)單的文本處理,逐步向多模態(tài)領(lǐng)域延伸,如今已能實(shí)現(xiàn)文本、圖像、音頻等跨模態(tài)內(nèi)容的理解和涌現(xiàn)。目前,已經(jīng)出現(xiàn)了一批以大模型為基礎(chǔ)、多智能體協(xié)作的技術(shù)解決方案,正在向通用人工智能快速演進(jìn)。
  從產(chǎn)業(yè)應(yīng)用來(lái)看,大模型與傳統(tǒng)產(chǎn)業(yè)融合速度顯著加快。自2025年初DeepSeek在全球范圍引發(fā)熱潮以來(lái),大模型在政務(wù)、醫(yī)療、互聯(lián)網(wǎng)、教育等垂直領(lǐng)域落地生根,不僅重塑了傳統(tǒng)產(chǎn)業(yè)的生產(chǎn)模式與服務(wù)形態(tài),更成為數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的重要?jiǎng)恿Α?/div>
  然而,大模型的迅速發(fā)展也帶來(lái)了一系列嚴(yán)峻的安全問(wèn)題,貫穿模型的全生命周期。在國(guó)務(wù)院常務(wù)會(huì)議中,特別強(qiáng)調(diào)要提升安全能力水平,加快形成動(dòng)態(tài)敏捷、多元協(xié)同的人工智能治理格局。
  二  大模型安全風(fēng)險(xiǎn)分析
  隨著大模型技術(shù)與產(chǎn)業(yè)場(chǎng)景的深度融合,其安全風(fēng)險(xiǎn)已從技術(shù)層面延伸至業(yè)務(wù)全鏈條,既包含內(nèi)生隱患,也衍生出對(duì)物理世界的直接威脅。全面梳理這些風(fēng)險(xiǎn),并構(gòu)建系統(tǒng)性防護(hù)方案,成為大模型健康發(fā)展的關(guān)鍵。
  從技術(shù)層面看,大模型安全風(fēng)險(xiǎn)首先體現(xiàn)在技術(shù)本身的“先天不足”,即內(nèi)生安全問(wèn)題,包含模型魯棒性差、算法黑箱特性顯著,加之大模型特有的“幻覺(jué)”問(wèn)題。在應(yīng)用過(guò)程中,這些內(nèi)生安全問(wèn)題會(huì)得以顯現(xiàn),即衍生安全問(wèn)題,包括模型誤用、濫用導(dǎo)致的虛假信息泛濫、決策偏差等。這些問(wèn)題已開(kāi)始對(duì)金融、工業(yè)等核心領(lǐng)域的業(yè)務(wù)連續(xù)性構(gòu)成威脅——例如工業(yè)制造中,模型決策偏差可能沿生產(chǎn)鏈路放大,引發(fā)連鎖反應(yīng)甚至業(yè)務(wù)中斷。
  從全生命周期看,安全風(fēng)險(xiǎn)貫穿始終。在模型選型與測(cè)試評(píng)估階段,開(kāi)源模型易遭投毒、契合場(chǎng)景需求的系統(tǒng)性安全測(cè)試評(píng)估方法、測(cè)試數(shù)據(jù)、工具缺失的問(wèn)題嚴(yán)重,傳統(tǒng)的基于規(guī)則的判斷模式難精準(zhǔn)衡量大模型的安全問(wèn)題。在模型訓(xùn)練/微調(diào)階段,訓(xùn)練或微調(diào)語(yǔ)料若含違法不良信息等敏感數(shù)據(jù)會(huì)污染模型,缺乏模型安全對(duì)齊機(jī)制可能導(dǎo)致模型輸出易失控,這也成為了模型在應(yīng)用過(guò)程中風(fēng)險(xiǎn)的最直接根源。在上線服務(wù)階段,模型部署依賴的推理框架等軟件環(huán)境普遍存在漏洞缺陷,模型魯棒性差、智能體等上層應(yīng)用防護(hù)不完善,可能導(dǎo)致數(shù)據(jù)泄露等嚴(yán)重危害。在更新、下線銷毀階段,緩存數(shù)據(jù)、臨時(shí)文件可能干擾新模型運(yùn)行,模型文件、權(quán)重、緩存等信息則需妥善銷毀。盡管更新下線階段風(fēng)險(xiǎn)暫時(shí)沒(méi)完全顯現(xiàn),但隨著技術(shù)應(yīng)用的不斷深入,會(huì)在未來(lái)呈現(xiàn)出實(shí)際危害。
  與傳統(tǒng)信息系統(tǒng)安全相比,大模型安全的攻防焦點(diǎn)延續(xù)了傳統(tǒng)安全的核心要素——硬件、數(shù)據(jù)。防火墻、數(shù)據(jù)泄露防護(hù)(DLP)等工具經(jīng)改造后仍可發(fā)揮作用,傳統(tǒng)的“識(shí)別-評(píng)估-管理-持續(xù)改進(jìn)”的風(fēng)險(xiǎn)管理框架依然適用。但大模型也帶來(lái)了新的威脅:如攻擊手段已實(shí)現(xiàn)智能化迭代,攻擊者可通過(guò)大模型自動(dòng)演化攻擊模式,突破傳統(tǒng)邊界防護(hù);業(yè)務(wù)系統(tǒng)的復(fù)雜度提升,“云邊端”一體化架構(gòu)下,一次攻擊可能導(dǎo)致多個(gè)業(yè)務(wù)系統(tǒng)中斷;防護(hù)和應(yīng)對(duì)成本大幅攀升,據(jù)統(tǒng)計(jì),2023年全球AI網(wǎng)絡(luò)安全支出為240億美元,預(yù)計(jì)2030年增至1330億美元。
  此外,大模型安全風(fēng)險(xiǎn)還呈現(xiàn)出多維復(fù)雜交織的新態(tài)勢(shì)。風(fēng)險(xiǎn)載體從傳統(tǒng)硬件、數(shù)據(jù)擴(kuò)展至模型、智能體等新對(duì)象,數(shù)據(jù)層面的投毒、對(duì)抗樣本有可能造成模型后門植入,或致使推理決策的重大錯(cuò)誤。模型黑箱、幻覺(jué)特性導(dǎo)致內(nèi)容生成過(guò)程中的風(fēng)險(xiǎn)不可預(yù)見(jiàn)。智能體因形態(tài)多樣、協(xié)議不統(tǒng)一、權(quán)限控制能力不足,難以用標(biāo)準(zhǔn)化手段防護(hù)。同時(shí),在風(fēng)險(xiǎn)檢測(cè)評(píng)估方面,缺乏統(tǒng)一的標(biāo)準(zhǔn)、工具和動(dòng)態(tài)監(jiān)控方法。這些都需要新的管理思路和技術(shù)手段進(jìn)行應(yīng)對(duì)。
  三  大模型安全“工具箱”
  大模型安全“工具箱”作為一套集成全流程安全技術(shù)產(chǎn)品和工具的綜合解決方案,以“攻-檢-防”全流程為核心思路,覆蓋大模型生命周期的主要環(huán)節(jié),形成了涵蓋“智鑒”大模型安全檢測(cè)平臺(tái)、“智鉞”大模型安全自動(dòng)化仿真驗(yàn)證平臺(tái)和“智盾”大模型安全加固防護(hù)方案的產(chǎn)品服務(wù)矩陣,實(shí)現(xiàn)風(fēng)險(xiǎn)“發(fā)現(xiàn)-評(píng)估-加固-驗(yàn)證”閉環(huán)機(jī)制,確保大模型在全生命周期的安全性。
  “智鑒”大模型安全檢測(cè)平臺(tái)聚焦于大模型基礎(chǔ)環(huán)境和模型應(yīng)用過(guò)程中輸入輸出內(nèi)容的安全檢測(cè)。大模型基礎(chǔ)環(huán)境檢測(cè)針對(duì)大模型研發(fā)和部署環(huán)節(jié)安全問(wèn)題,通過(guò)代碼掃描、漏洞和軟件成分,發(fā)現(xiàn)模型環(huán)境的安全風(fēng)險(xiǎn)。模型輸入輸出內(nèi)容安全檢測(cè)重點(diǎn)針對(duì)模型接收和產(chǎn)生的內(nèi)容,包含有害、商業(yè)或技術(shù)敏感信息。
  “智鉞”大模型安全自動(dòng)化仿真驗(yàn)證平臺(tái)主要用于對(duì)大模型提供自動(dòng)化的安全評(píng)估支持。在測(cè)試能力方面,支持自動(dòng)化調(diào)用模型接口,無(wú)需人工干預(yù)即可完成攻擊測(cè)試,測(cè)試完成后,可自動(dòng)生成包含測(cè)試過(guò)程、結(jié)果、安全問(wèn)題及改進(jìn)建議的評(píng)估報(bào)告,為應(yīng)用方提供清晰直觀的結(jié)論。在測(cè)試數(shù)據(jù)方面,平臺(tái)集成了百萬(wàn)量級(jí)測(cè)試數(shù)據(jù)和近百種攻擊方法模板。同時(shí),還可結(jié)合用戶需求,定制化開(kāi)展數(shù)據(jù)制作和評(píng)估模型建設(shè)工作,滿足場(chǎng)景化安全測(cè)試需求。
  “智盾”大模型安全加固防護(hù)方案依托積累的海量大模型安全數(shù)據(jù),采用模型微調(diào)對(duì)齊和安全知識(shí)庫(kù)增強(qiáng)等手段進(jìn)行模型對(duì)齊防護(hù),提升大模型自身安全能力,同時(shí)兼顧大模型原本的通用能力,避免安全加固對(duì)模型功能造成負(fù)面影響。經(jīng)實(shí)踐驗(yàn)證,“智盾”方案能顯著提升大模型的安全性能,多個(gè)開(kāi)源大模型被攻擊成功概率下降超過(guò)30個(gè)百分點(diǎn),最高超過(guò)70個(gè)百分點(diǎn)。此外,還支持對(duì)大模型進(jìn)行語(yǔ)意層面的權(quán)限控制,防止不同權(quán)限人員使用同一套模型的過(guò)程中造成的數(shù)據(jù)未授權(quán)訪問(wèn)問(wèn)題。
  目前,工具箱中的產(chǎn)品已經(jīng)服務(wù)于能源行業(yè)多個(gè)用戶單位開(kāi)展大模型安全檢測(cè)、防護(hù)等工作,特別支撐了煤炭科學(xué)研究院太陽(yáng)石礦山大模型,完成了生成式人工智能服務(wù)上線備案工作。
  四  結(jié)語(yǔ)
  未來(lái),大模型、智能體必將與業(yè)務(wù)生產(chǎn)環(huán)節(jié)實(shí)現(xiàn)更加深度的融合。因此,為推動(dòng)新技術(shù)的深度融合,可通過(guò)對(duì)場(chǎng)景進(jìn)行風(fēng)險(xiǎn)分級(jí)分類評(píng)估的方式,全面梳理并最終形成技術(shù)落地的路線圖,再配合技術(shù)手段進(jìn)行檢測(cè)、監(jiān)測(cè)、防護(hù),實(shí)現(xiàn)大模型、智能體與傳統(tǒng)行業(yè)的深度融合。
-->
  • OA系統(tǒng)
  • 企業(yè)郵局
用戶名:
密 碼:
友情鏈接:
網(wǎng)站首頁(yè) | 公司簡(jiǎn)介 | 建言獻(xiàn)策 | 企業(yè)郵局 | 聯(lián)系我們
行政人事部:0913-5182286 黨委工作部:0913-5182082 供銷中心:0913-5182135
  
版權(quán)所有 陜西龍門鋼鐵有限責(zé)任公司 © 2025 陜ICP備05004228號(hào)

陜公網(wǎng)安備 61058102000140號(hào)