團(tuán)體標(biāo)準(zhǔn)編制范圍
《云網(wǎng)協(xié)同:云端AI模型部署與更新規(guī)范要求》
本標(biāo)準(zhǔn)規(guī)定了云端AI模型部署與更新的總體架構(gòu)、主要技術(shù)要求、預(yù)期目標(biāo)等要求。
本標(biāo)準(zhǔn)適用于云端AI模型部署的管理、維護(hù)、部署、歸檔等規(guī)范要求。其他組織的云端AI模型部署與更新可參照執(zhí)行。
團(tuán)體標(biāo)準(zhǔn)編制目的、意義或必要性
2021年5月24日,國家發(fā)展改革委員會、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局聯(lián)合印發(fā)的《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》要求加速建設(shè)全國一體化算力網(wǎng)絡(luò)。此外中國政府出臺了多項政策,鼓勵人工智能行業(yè)發(fā)展與創(chuàng)新,如《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場景的通知》、《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見》等。基于云端的AI模型部署與更新呈現(xiàn)爆發(fā)式增長。《中華人民共和國網(wǎng)絡(luò)安全法》和《中華人民共和國數(shù)據(jù)安全法》分別于2017年6月1日和2021年9月1日開始執(zhí)行,對網(wǎng)絡(luò)、信息安全提出明確要求,并明確運營者的安全義務(wù)。
隨著算力芯片技術(shù)的突破,為原有多種AI核心技術(shù)帶來新生,并帶動了人工智能技術(shù)的高速發(fā)展,各式各樣的AI能力以及影響了我們生活的方方面面。在大量AI技術(shù)的快速演進(jìn)的過程中,消耗的算力資源也非常的大,算力成本也越來越高,因此越來越多的企業(yè)和組織開始將AI應(yīng)用部署到云端,以便更好地服務(wù)于廣大用戶。但云端野蠻式生長會帶來一些問題:
(1)海量AI模型的部署,質(zhì)量層次不齊,沒有統(tǒng)一的標(biāo)準(zhǔn)來約束云端的模型,導(dǎo)致用戶之間、企業(yè)之間、平臺之間的難以建立建康、互信的供需關(guān)系;(2)云端AI模型涉及到大量的用戶數(shù)據(jù),如何保證數(shù)據(jù)安全和隱私成為至關(guān)重要的問題。制定規(guī)范可以確保AI模型在部署和更新過程中遵循嚴(yán)格的安全標(biāo)準(zhǔn),防止數(shù)據(jù)泄露和濫用。(3)AI模型的部署和更新可能會對現(xiàn)有系統(tǒng)產(chǎn)生影響,甚至導(dǎo)致系統(tǒng)崩潰。
為解決以上難點,需要通過對云端AI模型的數(shù)據(jù)管理、模型功能和性能的度量、模型兼容性的度量、模型的版本控制標(biāo)準(zhǔn)、模型的法律和倫理要求等方面進(jìn)行標(biāo)準(zhǔn)化管理,因此云端AI模型部署與更新就是為了處理這樣的問題,為AI算法工程師提供模型訓(xùn)練和產(chǎn)出要求,實現(xiàn)對模型的質(zhì)量、兼容性、效率的約束;為云平臺服務(wù)提供商提供AI模型部署與更新的管理依據(jù);為AI能力運維人員提供AI模型部署的準(zhǔn)入條件,實現(xiàn)高質(zhì)量的能力發(fā)布;通過建立AI模型基于云端的孵化到發(fā)布生產(chǎn)全流程的約束機(jī)制、激勵機(jī)制、和合作機(jī)制,形成基于云端的AI模型典型的部署和更新模式,帶動人工智能的安全高效發(fā)展的典型模式,帶動人工智能企業(yè)向“高質(zhì)量、高安全、高效率”轉(zhuǎn)型升級,實現(xiàn)公司科技經(jīng)濟(jì)效益、社會效益、安全合規(guī)的協(xié)調(diào)優(yōu)化。
基于以上目的和意義,有必要建立云網(wǎng)協(xié)同系列標(biāo)準(zhǔn)。此系列標(biāo)準(zhǔn)第 18 部分云端AI模型部署與更新規(guī)范,包括數(shù)據(jù)管理、模型管理、模型部署、模型更新等。
團(tuán)體標(biāo)準(zhǔn)主要技術(shù)內(nèi)容
1、總體架構(gòu)
云端AI模型部署與更新引擎通過從云端AI模型的質(zhì)量、效率、安全的角度出發(fā),嵌入孵化到生產(chǎn)的各個細(xì)節(jié),對各環(huán)節(jié)之間的銜接過程、過程產(chǎn)物和質(zhì)量參數(shù)進(jìn)行分析。在孵化、部署、維護(hù)、監(jiān)控等過程嵌入監(jiān)控點,從模型、數(shù)據(jù)集、引擎等方面進(jìn)行審核,在實現(xiàn)AI模型功能不受影響的前提下,提升整個鏈條的市場競爭力,實現(xiàn)高效率發(fā)展、高安全發(fā)展、高穩(wěn)定發(fā)展。

圖 1 云端AI模型部署與更新整體構(gòu)成
2、主要技術(shù)要求:
(1)模型管理
模型分類,模型至少分為以下幾類:1)訓(xùn)練模型:從未訓(xùn)練過的模型,需要通過訓(xùn)練集進(jìn)行訓(xùn)練。2)驗證模型:已經(jīng)訓(xùn)練過的模型,但在實際部署之前,需要在驗證集上進(jìn)行驗證,以評估模型的性能。3)部署模型:經(jīng)過驗證的模型,已經(jīng)被部署到生產(chǎn)環(huán)境,用于實際服務(wù)。
模型版本管理,每個模型都應(yīng)該有一個唯一的版本,用于標(biāo)識不同批次的模型。版本應(yīng)至少包含以下信息:1)版本號:用于唯一標(biāo)識當(dāng)前模型的版本。2)發(fā)布日期:模型版本發(fā)布的日期。3)模型介紹:模型文件大小、文件格式以及模型用途和使用方式說明。4)版本描述:對當(dāng)前模型的改進(jìn)和變更的描述。
模型部署,模型的部署方式應(yīng)根據(jù)實際業(yè)務(wù)需求和硬件環(huán)境來選擇。在模型部署前,應(yīng)在進(jìn)行充分的穩(wěn)定性測試和壓力測試,以確保模型在生產(chǎn)環(huán)境中的性能和可靠性。
模型評估,模型發(fā)布前應(yīng)收集模型的運行狀態(tài)和性能數(shù)據(jù),并能夠進(jìn)行監(jiān)控和評估。模型的監(jiān)控至少包含如下指標(biāo):1)準(zhǔn)確率:模型的正確預(yù)測率。2)召回率:模型正確預(yù)測為正樣本的樣本占實際為正樣本的樣本的比例。3)精確率:模型正確預(yù)測為正樣本的樣本占實際為正樣本的樣本的比例。4)F1 值:精確率和召回率的調(diào)和平均值,用于衡量模型在正負(fù)樣本上的平衡表現(xiàn)。5)算力需求:應(yīng)評估模型應(yīng)具備的基礎(chǔ)算力需求,以及典型應(yīng)用場景的算力需求。如GPU、CPU、內(nèi)存、存儲等算力使用量,以及芯片架構(gòu)、型號、品牌、依賴庫等底層環(huán)境需求。
根據(jù)實時收集的監(jiān)控指標(biāo)數(shù)據(jù),應(yīng)能夠?qū)δP瓦M(jìn)行評估和持續(xù)優(yōu)化。如果評估發(fā)現(xiàn)問題應(yīng)支持回滾到之前的版本。
(2)模型發(fā)布
發(fā)布的AI模型應(yīng)確保與各大主流深度學(xué)習(xí)框架及云端、本地部署環(huán)境的高度兼容性,如支持TensorFlow、PyTorch 等框架,并能在國內(nèi)主流云服務(wù)商的基礎(chǔ)設(shè)施上順利部署。模型應(yīng)提供便捷的部署包或鏡像,便于用戶在不同環(huán)境上迅速部署和啟用。
算力資源標(biāo)準(zhǔn)說明:發(fā)布時,AI模型需詳細(xì)闡述其運行過程對硬件資源的需求參數(shù),包括但不限于GPU、CPU、內(nèi)存、存儲等硬件需求,以及在單一設(shè)備或多設(shè)備分布式部署時的策略。同時,附帶典型業(yè)務(wù)場景下的資源消耗參考數(shù)據(jù),幫助使用者評估自有資源是否足以支撐模型的有效運行。
數(shù)據(jù)接口規(guī)范:模型對外提供的接口應(yīng)遵循統(tǒng)一標(biāo)準(zhǔn),如支持 RESTful API、gRPC 接口等主流通信協(xié)議,確保與外部系統(tǒng)間的數(shù)據(jù)交換便捷順暢。模型輸入數(shù)據(jù)格式應(yīng)遵循業(yè)界認(rèn)可的標(biāo)準(zhǔn)格式(如文本、圖像、音頻等),并明確聲明數(shù)據(jù)預(yù)處理步驟和格式要求。同時,模型輸出應(yīng)清晰定義輸出格式(如文本、圖像、音頻等),以適應(yīng)不同應(yīng)用場景的需求。

(3)模型維護(hù)
內(nèi)容安全:模型輸出內(nèi)容應(yīng)符合國家法律法規(guī)和社會道德規(guī)范,不得產(chǎn)生或傳播任何形式的危險、違法、暴力、仇恨、歧視等不當(dāng)信息。模型開發(fā)者應(yīng)建立完善的濫用風(fēng)險評估機(jī)制,識別潛在的濫用場景和風(fēng)險點,并采取有效的技術(shù)防護(hù)措施,防止模型被用于非法活動或虛假信息的制造。
隱私與數(shù)據(jù)保護(hù):在處理個人隱私數(shù)據(jù)時,應(yīng)嚴(yán)格遵守《中華人民共和國個人信息保護(hù)法》及相關(guān)配套政策,制定并執(zhí)行全面的數(shù)據(jù)安全管理制度。應(yīng)建立實時的風(fēng)險監(jiān)測和應(yīng)急響應(yīng)體系,確保在發(fā)現(xiàn)安全風(fēng)險或突發(fā)事件時,能夠立即啟動應(yīng)急預(yù)案,采取有效措施,控制和減少損失。
服務(wù)可用性:模型服務(wù)應(yīng)保證高可用性,正常運行時間應(yīng)達(dá)到99.9%,全年計劃內(nèi)中斷時間不得超過8小時。對于關(guān)鍵服務(wù)型模型,在人機(jī)交互場景下的平均響應(yīng)時間應(yīng)控制在2秒以內(nèi)。
版本兼容性:模型升級更新過程中,新版本應(yīng)確保與舊版本向后兼容,以保障現(xiàn)有應(yīng)用的連續(xù)性和穩(wěn)定性,避免因版本更新導(dǎo)致的大規(guī)模適配調(diào)整。版本管理流程應(yīng)統(tǒng)一規(guī)范,確保透明和可追溯。
無障礙訪問:應(yīng)為殘障人士等特殊群體提供無障礙訪問解決方案,確保他們能夠平等無障礙地獲取和使用模型服務(wù),滿足國家無障礙要求標(biāo)準(zhǔn)。
版本控制與演進(jìn)管理:應(yīng)建立完整的模型版本控制和演進(jìn)管理機(jī)制,詳細(xì)記錄每個版本的更新歷史和變更詳情。新版本上線前,必須進(jìn)行全面的測試驗證,確保新版本的穩(wěn)定性和性能。
性能監(jiān)控與故障響應(yīng):應(yīng)構(gòu)建模型性能監(jiān)控系統(tǒng),實時監(jiān)測模型的運行狀態(tài),對于發(fā)現(xiàn)的異常和故障,應(yīng)及時進(jìn)行定位和故障分析,并在規(guī)定時間內(nèi)制定并執(zhí)行恢復(fù)方案。
基礎(chǔ)設(shè)施冗余與容災(zāi):基礎(chǔ)設(shè)施應(yīng)實現(xiàn)數(shù)據(jù)和計算資源的冗余備份,制定并執(zhí)行完善的容災(zāi)和恢復(fù)預(yù)案,確保關(guān)鍵服務(wù)的持續(xù)運行。數(shù)據(jù)處理應(yīng)遵循FAIR(可查找、可訪問、可互操作和可復(fù)用)原則。
AI倫理與合規(guī):嚴(yán)格遵守國家AI倫理標(biāo)準(zhǔn)和規(guī)范,制定并全面執(zhí)行企業(yè)AI倫理政策,確保模型的開發(fā)和應(yīng)用符合倫理道德標(biāo)準(zhǔn)。應(yīng)建立有效的AI倫理審查機(jī)制,對模型的開發(fā)、應(yīng)用和更新進(jìn)行全面的倫理審查,確保模型符合倫理道德規(guī)范。
偏見與歧視消除:持續(xù)評估并消除模型在人口統(tǒng)計學(xué)特征(如年齡、性別、種族等)方面的潛在偏見和歧視,確保模型的公平性和包容性。應(yīng)建立有效的偏見檢測和消除機(jī)制,定期對模型進(jìn)行偏見評估,并采取措施消除模型中的偏見和歧視。
人機(jī)交互準(zhǔn)則:制定規(guī)范的人機(jī)交互準(zhǔn)則,確保人類用戶能夠?qū)δP桶l(fā)出合理的指令和進(jìn)行必要的修正,體現(xiàn)以人為本的設(shè)計理念。人機(jī)交互界面應(yīng)易于理解和使用,并提供必要的安全保障措施,防止用戶誤操作或被模型誤導(dǎo)。
(4)模型歸檔
模型歸檔是模型生命周期管理的重要組成部分,有助于模型版本的追溯、復(fù)現(xiàn)和持續(xù)優(yōu)化。以下為模型歸檔的規(guī)范化約束與指導(dǎo)建議:
數(shù)據(jù)集歸檔:應(yīng)全程保存模型訓(xùn)練、優(yōu)化、微調(diào)過程的各階段數(shù)據(jù)集,確保決策輸出路徑具備可解釋性和可追溯性,提高模型運行的透明度和可信度。若涉及隱私和敏感信息,須確保數(shù)據(jù)已脫敏或匿名化處理,并遵循相關(guān)法規(guī)要求。
模型文件歸檔:按照模型版本進(jìn)行歸檔,每個版本包含模型文件、權(quán)重文件、訓(xùn)練日志、參數(shù)配置文件等。每個模型版本應(yīng)附帶詳細(xì)的訓(xùn)練報告,評估報告等內(nèi)容。如模型涉及多個組件或模塊,每個組件的版本也應(yīng)一并歸檔。
訓(xùn)練引擎和依賴庫記錄:記錄每個模型版本所使用的訓(xùn)練引擎版本以及依賴的第三方庫版本。提供訓(xùn)練環(huán)境的配置信息,確保模型在相同環(huán)境下能夠復(fù)現(xiàn)。
算法描述與理論依據(jù):對模型所使用的算法進(jìn)行詳盡描述,包括原理、特點、優(yōu)缺點等。如有必要,提供算法設(shè)計和實現(xiàn)的相關(guān)論文、專利等參考資料。
版本管理與變更記錄:采用版本控制系統(tǒng)(如Git)對模型代碼、配置文件等進(jìn)行版本管理,記錄每次變更的提交信息和作者。設(shè)立專門的模型版本庫,按照日期、版本號等有序存放各個版本的模型及相關(guān)資料。
團(tuán)體標(biāo)準(zhǔn)與國內(nèi)外標(biāo)準(zhǔn)情況簡要說明
經(jīng)查詢,目前國內(nèi)與云網(wǎng)協(xié)同的標(biāo)準(zhǔn)有關(guān)的標(biāo)準(zhǔn)有:
ITU-T M.3173.1《云和SDN網(wǎng)絡(luò)協(xié)同管理接口需求》
ITU-T Y.2324《基于網(wǎng)絡(luò)演進(jìn)的云網(wǎng)協(xié)同編排器功能架構(gòu)》
YD/T 4199.1-2023 《基于云網(wǎng)協(xié)同的上云業(yè)務(wù)用戶體驗質(zhì)量評價體系》
參編人員要求
與云端AI模型部署與更新相關(guān)的研發(fā)、生產(chǎn)、經(jīng)營的各機(jī)關(guān)企事業(yè)單位、科研院所、高校、采購單位、供應(yīng)商單位有關(guān)于本標(biāo)準(zhǔn)規(guī)定范圍及適用領(lǐng)域的研發(fā)人員、應(yīng)用人員、項目工程師、項目經(jīng)理、技術(shù)采購等,與此標(biāo)準(zhǔn)規(guī)范適用相關(guān)的從業(yè)人員均可參與編制。
參編流程
1、蓋章并提交團(tuán)體標(biāo)準(zhǔn)參編申請表(見附件);
2、簽訂協(xié)議;
2、加入編制組;
4、參與編制工作。
聯(lián)系人信息
聯(lián)系電話:17603075005
中企檢測認(rèn)證網(wǎng)提供iso體系認(rèn)證機(jī)構(gòu)查詢,檢驗檢測、認(rèn)證認(rèn)可、資質(zhì)資格、計量校準(zhǔn)、知識產(chǎn)權(quán)貫標(biāo)一站式行業(yè)企業(yè)服務(wù)平臺。中企檢測認(rèn)證網(wǎng)為檢測行業(yè)相關(guān)檢驗、檢測、認(rèn)證、計量、校準(zhǔn)機(jī)構(gòu),儀器設(shè)備、耗材、配件、試劑、標(biāo)準(zhǔn)品供應(yīng)商,法規(guī)咨詢、標(biāo)準(zhǔn)服務(wù)、實驗室軟件提供商提供包括品牌宣傳、產(chǎn)品展示、技術(shù)交流、新品推薦等全方位推廣服務(wù)。這個問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測認(rèn)證網(wǎng)在線客服13550333441。為您提供全面檢測、認(rèn)證、商標(biāo)、專利、知識產(chǎn)權(quán)、版權(quán)法律法規(guī)知識資訊,包括商標(biāo)注冊、食品檢測、第三方檢測機(jī)構(gòu)、網(wǎng)絡(luò)信息技術(shù)檢測、環(huán)境檢測、管理體系認(rèn)證、服務(wù)體系認(rèn)證、產(chǎn)品認(rèn)證、版權(quán)登記、專利申請、知識產(chǎn)權(quán)、檢測法、認(rèn)證標(biāo)準(zhǔn)等信息,中企檢測認(rèn)證網(wǎng)為檢測認(rèn)證商標(biāo)專利從業(yè)者提供多種檢測、認(rèn)證、知識產(chǎn)權(quán)、版權(quán)、商標(biāo)、專利的轉(zhuǎn)讓代理查詢法律法規(guī),咨詢輔導(dǎo)等知識。
本文內(nèi)容整合網(wǎng)站:中國政府網(wǎng)、百度百科、搜狗百科、360百科、知乎、市場監(jiān)督總局 、國家認(rèn)證認(rèn)可監(jiān)督管理委員會
免責(zé)聲明:本文部分內(nèi)容根據(jù)網(wǎng)絡(luò)信息整理,文章版權(quán)歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內(nèi)容、版權(quán)和其它問題,請跟我們聯(lián)系刪除并致歉!






