信息技術服務 運行維護 第4部分:數據中心規范
Information technology service - Operation and maintenance - Part4:Specifications for data center
(報批稿)
引言
隨著各行業、各領域信息化工作的深入開展,有越來越多的信息系統進入運行維護階段。然而,提供運行維護服務的各類組織的能力水平參差不齊,需方缺乏評價或選擇供方的方法、手段及規范。本標準對不同服務對象、服務過程和服務需求的能力要素進行抽象,并通過關鍵指標對服務能力進行評價;針對不同服務對象的運行維護服務過程、服務交付內容及特定服務需求提出了要求。
本部分規定了數據中心運行維護服務的對象、服務策略、交付內容等要求,旨在規范數據中心運行維護服務供方(以下簡稱供方)行為、改進服務能力及提高數據中心運行維護服務的工作效率。數據中心運行維護服務的服務需方(以下簡稱需方)可以參照本部分提出明確的數據中心運行維護服務需求。本部分亦適用于需方選擇和評價供方。
本部分的第4章提出了數據中心運行維護服務的對象和服務的交付內容,以及它們之間的關系。
本部分的第5章闡述了數據中心運行維護服務的基本策略。
本部分的第6章對數據中心運行維護服務交付內容進行了詳細的描述。
1 范圍
本部分規定了數據中心運行維護服務的對象、服務策略、交付內容等要求。
本部分適用于規范供方針對數據中心服務對象提供的運行維護服務內容,也可供需方參考使用。
2 規范性引用文件
下列文件對于本文件的應用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T 22080信息技術 安全技術 信息安全管理體系 要求
GB/T 22081信息技術 安全技術 信息安全管理實用規則
GB/T 24405.1-2009信息技術 服務管理 第1部分:規范
SJ/T XXXXX.3信息技術服務 運行維護 第3部分:應急響應規范
3 術語、定義和縮略語
3.1 術語和定義
下列術語和定義適用于本文件。
3.1.1
數據中心datacenter
以信息技術為支撐,實現應用集中處理和數據集中存放,提供數據的構建、交換、集成、共享等信息服務的基礎環境。
3.1.2
配置管理數據庫configuration management database
包含每一個配置以及配置項之間重要關系的詳細情況的數據庫。
[GB/T 24405.1-2009信息技術服務管理-規范,定義2.5]
3.1.3
工作說明書statement of work
合同的重要附件之一,詳細規定了合同雙方在合同期內應完成的工作,如項目范圍、工作描述、進度表、風險、需方責任等。
3.1.4
服務級別協議service Level agreement
服務提供商與服務需方之間簽署的記錄了服務和約定服務級別的協議。
[GB/T 24405.1-2009信息技術服務管理-規范,定義2.13]
3.1.5
外部事件external events
為服務對象運行提供支撐的、協議獲得的、不可控、非自主運維的服務資源(例如互聯網、市電、租賃的機房等等)中斷引發的事件。
3.1.6
系統事件system events
在服務對象范圍內的、自主管理或運維的系統資源服務中斷引發的事件。
3.1.7
安全事件security events
由于安全邊界破壞、安全措施或安全設施失效,造成的安全等級下降或信息被非法盜用等需方(數據中心)利益被侵害的事件。
3.1.8
虛擬資源池 Virtual resource pool
指通過使用虛擬化技術對數據中心的計算、存儲、網絡等物理資源進行虛擬化,通過管理軟件來動態部署給用戶使用,這些被虛擬化集中管理的資源叫做虛擬資源池 Virtual Resource pool。
3.1.9
虛擬機virtual machine
指通過軟件模擬的具有完整硬件系統功能的、運行在一個完全隔離環境中的完整計算機系統。
3.1.10
宿主機 hypervISOr
指運行虛擬化軟件,并為虛擬機運行提供環境的物理機器。
3.1.11
電源使用效率 Power Usage Effectiveness
數據中心消耗的所有能源與IT負載使用的能源之比,簡稱PUE。
3.2 縮略語
ACL 訪問控制列表(Access Control List)
APU 輔助(或備用)電源設備(Auxiliary Power Units)
ATS 自動轉換開關(Automatic Transfer Switch)
CMDB 配置管理數據庫(Configuration Management Database)
CPU 中央處理器(Central Processing Unit)
HBA 主機總線適配器(Host Bus Adapter)
IO 輸入/輸出(Input/ Output)
IOPS 每秒進行讀寫(I/O)操作的次數(Input/ Output Operations Per Second)
IP 互聯網協議(Internet Protocol)
LED 發光二極管(Light Emitting Diode)
PUE 電源使用效率(Power Usage Effectiveness )
QOS 服務質量(Quality Of Services)
RAID 廉價冗余磁盤陣列(Redundant Arrays of Inexpensive Disks)
SAN 存儲區域網絡(Storage Area Network)
SLA 服務級別協議(Service Level Agreement)
SOW 工作說明書(Statement Of Work)
UPS 不間斷電源(Uninterrupted Power Supply)
VDC 虛擬設備上下文(Virtual Device Context)
VLAN 虛擬局域網(Virtual Local Area Network)
VPC 虛擬端口通道(Virtual Port Channel)
VPN 虛擬專用網(Virtual Private Network)
VRF 虛擬路由轉發(Virtual Routing and Forwarding)
VSS 虛擬交換系統(Virtual Switching System)
VSwitch 虛擬交換機(Virtual Switch)
4 服務對象與交付內容
4.1 服務對象與交付內容的對應關系
4.2 服務對象
根據數據中心的特點,數據中心的服務對象分為機房基礎設施、物理資源、虛擬資源、平臺資源、應用資源和數據六類。這六類對象的集合構成應用系統:
a)機房基礎設施:指確保機房環境滿足計算機相關設備正常運行要求的各類設施,包括機房電力 系統(供配電系統、UPS系統、發電機系統)、空調系統(精密空調系統、新風系統)、安防系統(防雷接地系統、消防系統、視頻監控系統、門禁系統)、綜合布線系統等;
b)物理資源(網絡及網絡設備、服務器設備、存儲設備)
1)網絡及網絡設備:指保持數據中心內部各系統之間、數據中心與外部系統連接的網絡及網絡設備,包括內部局域網、外部廣域網、互聯網、網絡線路(包括專線、撥號網絡、VPN)和網絡設備(包括路由器、交換機、防火墻、入侵檢測、負載均衡、語音以及通信傳輸設備等);
2)服務器設備:實現各種計算服務的硬件設備,包含PC服務器、小型機和主機等;
3)存儲設備:實現數據存放的各種存儲設備,包括磁盤陣列和磁帶庫等。
c)虛擬資源(虛擬網絡資源池、虛擬計算資源池、虛擬存儲資源池)
1)虛擬網絡資源池:通過各種網絡虛擬化技術(如:VLAN、VPN、VDC、VPC、VRF、VSwitch、VSS等), 將數據中心內網絡設備進行統一管理和調度,構成網絡資源池,對業務系統需要的網絡資源進行合理、靈活的分配;
2)虛擬計算資源池:指通過虛擬化技術,將數據中心內計算設備進行統一管理和調度,構成計算資源池,對需要不同計算能力的業務系統進行合理、靈活的分配;
3)虛擬存儲資源池:通過虛擬化技術,將數據中心存儲存儲設備進行統一管理和調度,構成存儲資源池,對業務系統需要的存儲空間容量進行合理、靈活的分配。
d)平臺資源(操作系統、數據庫、中間件等):指支持應用軟件運行的系統軟件,包括操作系統、 數據庫、中間件等;
e)應用資源:指實現用戶特定需求的應用軟件;
f)數據:指由應用軟件產生、處理、并存儲于數據中心的業務數據。
4.3 交付內容
數據中心的服務交付內容包括調研評估、例行操作、響應支持和優化改善四類,其中:
a)調研評估服務:根據需方、服務相關方或系統運行的需求,對服務對象的運行狀況、運行環境進行現狀調研、系統分析和評估并提出相應的建議和服務方案;
b)例行操作服務:按照約定條件觸發或預先規定的常態服務,分為監控、預防性檢查和常規作業;
1)監控:指采用各類工具和技術,對數據中心服務對象的動態指標、靜態指標、運行狀況和發展趨勢等進行記錄、分析和告警;
2)預防性檢查:指為保證服務對象的持續正常運行,供方根據服務對象的監控記錄、運行條件和運行狀況進行檢查和趨勢分析,發現其脆弱性,以便消除或改進;
3)常規作業:指供方對數據中心服務對象進行的日常維護,包括定期保養、配置備份、數據備份、恢復、定期重啟等活動,以保證服務對象的穩定運行。
c)響應支持服務:根據響應的前提不同,分為事件驅動響應、服務請求響應和應急響應;
1)事件驅動響應:由于不可預測原因導致服務對象整體或部分性能下降、功能喪失,觸發將服務對象恢復到正常狀態的服務活動。事件驅動響應的處理過程首先應爭取在最短的時間內恢復服務或啟用備份資源,維持服務的持續提供,并應對事件做出分析、明確誘發事件的原因和影響的范圍,采取有效的防控措施,減少類似事件的再次發生。事件驅動響應的觸發條件包括外部事件、系統事件和安全事件三種;
2)服務請求響應:由于需方提出各類服務請求,引發的需要針對服務對象、服務等級做出調整或修改的響應型服務。服務請求響應需要根據總體服務策略并參考已有的SLA/ SOW做出判斷,對服務的實施進行影響評估,制定詳細的實施方案和回退措施,并在條件允許的情況下執行實施方案和回退方案的測試。變更型響應服務實施完成后,應進行總結,確認已達到預期的目標。此類響應可能涉及服務等級變更、服務范圍變更、技術資源變更、服務提供方式變更等;
3)應急響應:指在數據中心出現跨越預定的應急響應閾值的重大事件、發生重大自然災害、由于政府部門發出行政指令或需方提出要求時,應當啟動應急處理程序。應急響應的服務實施及相關要求見SJ/T XXXXX.3。
d)優化改善服務:包括適應性改進、增強性改進和預防性改進三種類型;
1)適應性改進:為保持數據中心服務對象在已變化或正在變化的環境中可持續運行而實施的改造;
2)增強性改進:根據數據中心的運行需求或由于服務對象的缺陷,采取相應改進措施增強數據中心的安全性、可用性和可靠性;
3)預防性改進:檢測和糾正數據中心服務對象運行過程中潛在的問題或缺陷,以降低系統風險,滿足數據中心未來可靠運行的需求。
5 運行維護服務基本策略
5.1 總則
為保證數據中心的業務連續性和信息安全性,應制定有效的運行維護策略來保證服務交付的質量,兼顧運行維護過程(及時和規范)和運行維護結果(可用和安全),實現“事前防范,風險前移;事中控制,快速響應;事后改進,持續評估”的持續改進原則。
5.2 可用性
供方應采取適當措施,確保按服務協議提供長期、持續的滿足需求的優質服務,保持服務對象符合SLA的可用性要求。包括:
a)供方在服務實施時,應建立相關的作業流程和響應機制,必要時按需方要求制定系統冗余和備份規范,以滿足需方對可用性的要求;
b)進行合理的人員崗位設置和職責定義,應保證專人專崗并設置人員備份;
c)應配備具有相應能力的人員和必要的工具,并定期進行專業培訓,以提高服務可用性。人員能力具體要求見附錄A;
d)應選擇適用的運行維護技術,以保證服務的可用性;
e)根據運行維護服務級別要求,必要時應建立體系架構的關鍵健康檢查點,并配備相應的運行維護工具,以保證服務水平。運行維護工具等級見附錄B;
f)供方應根據服務要求配備足夠的資源,避免由于資源的缺失導致對服務的可用性帶來影響。
5.3 安全性
服務的供、需雙方應采取各種安全手段或措施,有效控制數據中心運行維護服務的各個環節,保護數據中心運行維護服務中的物理安全、網絡安全、系統安全、應用安全和數據安全。包括:
a)建立適當的信息安全管理機制,以規范數據中心運行維護服務人員的信息安全行為。信息安全管理可參照GB/T 22080、GB/T 22081等標準的有關規定執行;
b)應對數據中心運行維護服務人員采取有效的信息安全管理措施,如進行人員背景調查、簽訂安全保密協議等;
c)應對數據中心運行維護服務人員進行相關安全管理及安全要求培訓,并進行適當的檢查,以確保服務人員了解并遵守數據中心安全、保密相關規定;
d)應充分關注數據中心業務安全需求,結合信息安全技術與管理標準,進行適當的安全評估,提供相應的安全建議,并對服務對象進行適當的監控和保護;
e)應對數據中心安全進行監控、分析,把安全風險控制在可接受范圍內,防止安全事件發生;
f)應建立有效的安全通報機制,以及時通報安全事件相關情況和相應防范處理措施等。
5.4 及時性
供方應采取適當的手段確保提供滿足SLA時間指標要求的運行維護服務。包括:
a)對事件、問題、變更建立明確的分級策略,并與服務窗口時間、響應時間等指標相匹配;
b)建立可確保滿足需方要求的溝通聯絡機制,保持溝通渠道通暢,以實現對服務需求的及時響應;
c)建立有效的服務資源調度機制及與服務相關方的協同機制,配置必要的備品備件,以提供及時的服務保障;
d)特殊時間段(如法定節假日或重大事件等),應提升響應級別,提供必要的現場支持;
e)建立有效機制,周期性對事件級別定義進行更新,以確保定義準確有效。
5.5 規范性
供方應建立適當的服務管理流程、服務活動指導文件或實施規則,以保證服務過程的規范運作。包括:
a)建立有效的服務管理流程文件,以保證服務過程實施規范性;
b)建立或遵循需方的數據中心相關管理制度,如出入場管理制度、安保控制制度等;
c)對于例行操作服務,應制定詳細、可操作的技術手冊,以降低操作風險;
d)對于非例行操作服務(響應支持、優化改善、調研評估),應在實施前,制定詳細的實施方案,并進行風險評估及分析,采取相應的風險規避措施和回退手段;
e)在服務過程中進行的任何活動,應建立服務檔案,可形成服務報告(見附錄C),保留完整的服務記錄。
6 運行維護交付內容
6.1 機房基礎設施
6.1.1 服務對象
服務對象包括空調系統(精密空調系統、新風系統)、電力系統(供配電系統、UPS系統、發電機系統)、安防系統(防雷接地系統、消防系統、視頻監控系統和門禁系統)以及綜合布線系統。
6.1.2 調研評估
機房基礎設施調研評估服務內容包含但不限于:
a)空調系統(精密空調系統、新風系統):機房環境指標分析及改進建議、機房熱點分析及布置改進建議、機房送風、回風方式改進建議,新風風量、風壓指標分析及改進建議;輔助制冷單元配置建議等;
b)電力系統(供配電系統、UPS系統、發電機系統):機柜供電分析及改進建議、機房回路調整分析調整建議、機房擴容建議等;發電機負荷分析及調整建議等;UPS運行分析及擴容建議,超過設計使用壽命的電池更換建議、整流直流電容、逆變交流電容等;
c)安防系統(防雷接地系統、消防系統、視頻監控系統和門禁系統):防雷接地系統分析及改進建議、消防系統現狀分析和改進建議(按照當地消防管理部門管理要求)、視頻監控系統的分析和改進建議、門禁系統的分析和改進建議等;
d)綜合布線系統等:光纖、銅纜容量、使用效率分析;應用環境及性能分析;數量、路由改進或擴容建議;級別提升建議等。
e)機房電源使用效率:通過對機房PUE連續監測分析,提供機房能效改進建議,包括但不限于:空調系統優化(消除機房熱點、冷熱通道遏制、改善送回風、使用節能型設備等)、電力系統優化(回路優化、使用節能型設備等)、實施容量管理(對機柜的電力容量、制冷容量及空間容量進行統籌管理,以充分利用資源)等。
6.1.3 例行操作
機房基礎設施的例行操作服務包括:監控、預防性檢查、常規作業。
6.1.3.1 監控
對機房基礎設施的監控
6.1.3.2 預防性檢查
應在監控服務的基礎上對機房基礎設施進行預防性檢查。包括:性能檢查和脆弱性檢查。
6.1.3.3 常規作業
機房基礎設施的常規作業包括基礎類操作、測試類操作和數據類操作,其中:
a)基礎類操作:按服務管理手冊的有關規定,執行設備的日常運行、維護和保養;
b)測試類操作:按服務管理手冊的有關規定,對機房基礎設施各系統功能、性能進行測試;
c)數據類操作:按事先規定的程序,對機房基礎設施運行日志、記錄等數據進行操作。
6.1.4 響應支持
6.1.4.1 事件驅動響應
針對設備的軟、硬件故障引起的業務中斷或運行效率無法滿足正常運行要求,而進行的響應服務,包括但不限于:
a)空調系統:故障排查、關閉部分機組以維持機房最低溫濕度指標、關閉新風系統等;
b)電力系統:配電系統包括故障排查、投入備用電源回路、關閉非重要回路等;發電機系統包括故障排查、啟動發電機、油料補充等;UPS系統包括故障排查、旁路系統、關閉非重要輸出等;
c)安防系統:防雷接地系統包括浪涌保護器復原、更換,接地電阻降阻等;消防系統包括故障排查、系統啟動、報警聯動、疏散警示等;視頻監控系統包括故障排查、監控頭或硬盤更換、檢查告警、數據恢復等;門禁系統包括故障排查、手動開啟或關閉門禁系統、檢查告警或監控記錄等;
d)綜合布線系統:線纜更換等。
6.1.4.2 服務請求響應
根據應用系統運行需要或需方、服務相關方的請求,而進行的響應服務,包括但不限于:
a)空調系統:調整溫度、濕度參數等,調整新風量等;
b)電力系統:配電系統包括增減回路、增減供電類型(如直流、110V)等;分支回路相位調整等;發電機為指定負載供電等;UPS系統包括旁路操作、為指定負載供電等;
c)安防系統:防雷接地系統包括新設備接地等;消防系統包括增減終端設備、檢查及提供告警及監控記錄、備份或清除記錄等;視頻監控系統包括調整攝像機位置、增加攝像機,增加錄像機容量等;門禁系統包括增加、刪減、變更門禁權限等;
d)綜合布線系統:鏈路跳接、跳線更換,布線擴容等。
6.1.5 優化改善
6.1.5.1 適應性改進
根據應用系統特點和運行需求,對機房基礎設施進行調整,包括但不限于:
a)空調系統:調整溫濕度參數等、調整機組位置、增減新風風量等;
b)電力系統:配電系統包括更換開關、導線以適配負載容量等,發電機包括調整啟動方式等;
c)安防系統:調整防雷接地系統、消防系統、視頻監控系統和門禁系統,以適應應用系統的變化;
d)綜合布線系統:調整綜合布線系統,以適應應用系統的變化。
6.1.5.2 增強性改進
根據應用系統的特點和運行需求,通過對機房基礎設施的運行記錄、趨勢的分析,對機房基礎設施進行調整、擴容或升級,包括但不限于:
a)空調系統:增減精密空調機組、增減APU單元,增加新風機組、預處理裝置等;
b)電力系統:配電系統包括增加回路、增加ATS設備等;UPS系統包括增加主機數量、增加電池數量等;
c)安防系統:防雷接地系統包括增加冗余引下線、接地裝置,降低接地電阻阻值等;消防系統包括增加傳感器和噴頭數量,更換高性能控制主機;視頻監控和門禁系統包括增加報警聯動、增加終端數量、增加存儲容量等;
d)綜合布線系統:線路擴容、更換高性能布線等。
6.1.5.3 預防性改進
根據對機房基礎設施的運行記錄、趨勢的分析,結合應用系統的需求,發現機房基礎設施的脆弱點,有針對性地進行改進性作業,包括但不限于:
a)空調系統:調整機組位置,調整出回風方式等;
b)電力系統:配電系統包括更換開關、更換導線、調整回路等;發電機包括更換或添加高標號油料等;
c)安防系統:防雷接地系統包括焊接點加固、防腐處理等;消防系統包括消防系統預防性改進(按照當地消防管理部門管理要求);視頻監控和門禁系統包括門禁系統支持與消防系統和視頻監控系統的聯動;
d)綜合布線系統:弱電線纜與強電線纜的物理隔離,鼠患排查等。
6.2 物理資源
6.2.1 服務對象
服務對象包括1)網絡及網絡設備;2)PC服務器、小型機等服務器;3)磁盤陣列、磁帶庫等存儲設備。
6.2.2 調研評估
通過對物理資源的運行記錄、運行趨勢進行分析,根據應用系統的特點和運行需求,提出物理資源的改進建議和方案,調研評估服務包括但不限于:
a)網絡及網絡設備調研評估
1)(整體或局部)網絡實際負荷與承載能力分析;
2)(整體或局部)網絡預期負荷與承載能力分析與建議;
3)(整體或局部)網絡架構分析與建議;
4)(整體或局部)網絡路由策略分析與建議;
5)(整體或局部)網絡安全策略分析與建議;
6)(整體或局部)網絡配置調優分析與建議等。
b)服務器調研評估
1)服務器負載情況分析;
2)服務器安全策略分析;
3)服務器的高可用性分析;
4)服務器性能分析及調整建議。
c)存儲調研評估
1)存儲的負載情況分析;
2)存儲的空間使用分析;
3)存儲的性能及調整建議;
4)存儲的鏈路連接分析;
5)存儲的高可用性分析。
6.2.3 例行操作
6.2.3.1 監控
重點是對物理資源(網絡及網絡設備、服務器設備、存儲設備)的運行狀態、運行性能、資源分配使用情況進行監控,以便了解其是否滿足運行要求。監控應當采用合適的裝備與手段,分配專門人員定期或全時段進行監控。
6.2.3.2 預防性檢查
在監控服務的基礎上,對物理資源(網絡及網絡設備、服務器、存儲)進行預防性檢查。包括:性能檢查、脆弱性檢查。
6.2.3.3 常規作業
物理資源(網絡及網絡設備、服務器、存儲)的常規作業
6.2.4 響應支持
6.2.4.1 事件驅動響應
針對物理資源的故障引起的業務中斷或運行效率無法滿足正常運行要求,而進行的響應服務,包括但不限于:
a)網絡及網絡設備事件驅動響應
1)故障定位;
2)停止、啟動進程;
3)中斷、連通網絡連接;
4)關閉、啟動端口;
5)網絡備件更換;
6)更改、恢復配置。
b)服務器事件驅動響應
1)服務器重啟;
2)更換故障部件,包括主板、電源、CPU、內存、硬盤等;
3)服務器關鍵部件微碼升級;
4)服務器硬盤RAID配置修復。
c)存儲事件驅動響應
1)存儲重啟;
2)配置文件恢復;
3)更換故障部件,包括電源、硬盤等;
4)微碼升級;
5)存儲管理軟件補丁安裝;
6)數據修復。
6.2.4.2 服務請求響應
根據應用系統運行需要或需方、服務相關方的請求,而進行的響應服務,包括但不限于:
a)網絡及網絡設備服務請求響應
1)增加、降低網絡接入的數量或速度;
2)更改網絡設備配置;
3)啟動、關閉端口或服務;
4)更換、更新或升級設備硬件或軟件。
b)服務器服務請求響應
1)服務器設備搬遷;
2)服務器設備停機演練;
3)服務器設備清潔維護等。
c)存儲服務請求響應
1)存儲設備搬遷;
2)存儲設備停機演練;
3)存儲設備清潔維護;
4)存儲硬盤空間擴容;
5)存儲結構調整;
6)新增主機分配存儲空間;
7)主機端多路徑軟件的安裝配置。
6.2.5 優化改善
6.2.5.1 適應性改進
根據應用系統特點和運行需求,對物理資源進行調整,包括但不限于:
a)網絡及網絡設備適應性改進
1)路由策略調整;
2)設備或鏈路負載調整;
3)安全策略調整;
4)監控對象覆蓋范圍調整;
5)局部交換優化;
6)局部冗余優化。
b)服務器適應性改進
1)服務器硬盤RAID配置調整;
2)服務器網絡、光纖鏈路冗余調整;
3)服務器電源供電接入冗余調整。
c)存儲適應性改進
1)存儲設備讀寫Cache比例調整;
2)存儲設備RAID保護級別調整;
3)存儲設備新增硬盤,包括新增磁盤擴展柜;
4)存儲設備邏輯盤的容量調整;
5)存儲設備分配主機的調整;
6)光纖交換機ZONE規劃調整。
6.2.5.2 增強性改進
根據應用系統的特點和運行需求,通過對物理資源的運行記錄、趨勢的分析,對物理資源進行調整、擴容或升級,包括但不限于:
a)網絡及網絡設備增強性改進
1)硬件容量變化,如網絡設備硬件、軟件升級、帶寬升級等;
2)整體網絡架構變動;
3)網絡架構容量變化,如網絡子系統的增減等;
4)系統功能變化,如新增功能區、新增安全系統、新增審計系統等;
5)路由協議應用及部署調整;
6)整體安全策略收緊;
7)交換優化;
8)冗余優化。
b)服務器增強性改進
1)為本服務器從存儲系統上分配更大空間;
2)服務器CPU個數增加;
3)服務器內存容量增加;
4)服務器磁盤空間擴容;
5)服務器網卡和HBA接口卡增加等。
c)存儲增強性改進
1)存儲設備控制器、硬盤等部件的微碼升級;
2)存儲設備新增硬盤擴容,包括新增磁盤擴展柜;
3)存儲設備Cache容量增加;
4)存儲設備光纖模塊的升級;
5)光纖交換機的光纖模塊升級;
6)存儲設備管理軟件的版本升級。
6.2.5.3 預防性改進
根據對物理資源的運行記錄、趨勢的分析,結合應用系統的需求,發現物理資源的脆弱點及潛在的隱患,有針對性地進行改進性作業,包括但不限于:
a)網絡及網絡設備預防性改進
1)配置參數優化,例如關閉不必要的服務、打開缺省的增強功能、加快三層網絡路由收斂速度、加快二層網絡生成樹收斂速度等;
2)安全優化,例如密碼加密,TELNET控制等;
3)提高軟件配置命令可讀性。
b)服務器預防性改進
1)檢查服務器硬盤RAID配置,及時修復或更換故障硬盤;
2)增加服務器網卡、光纖卡以及鏈路冗余情況;
3)增加服務器電源供電模塊冗余。
c)存儲預防性改進
1)收集磁盤空間的使用情況,及時清理垃圾數據或增加存儲設備容量;
2)查看存儲控制器電池的使用情況,及時更換新的電池;
3)檢查存儲設備的電源是否老化,及時更換新的電源;
4)查看存儲設備的讀寫性能,適時調整存儲控制器的Cache容量。
6.3 虛擬資源
6.3.1 服務對象
服務對象包括虛擬網絡資源、虛擬計算資源、虛擬存儲資源。其中虛擬網絡資源含虛擬網卡、虛擬網絡設備、虛擬鏈路、虛擬機網絡和網絡設備等;虛擬計算資源包括虛擬機、虛擬機宿主機、虛擬計算資源池(Resource Pool)集群等;虛擬存儲資源包括虛擬存儲卷、存儲資源池、服務控制器等。
6.3.2 調研評估
通過對虛擬資源的運行記錄、運行趨勢進行分析,根據應用系統的特點和運行需求,提出物理設備、虛擬資源的改進建議和方案,調研評估服務包括但不限于:
a)(整體或局部)虛擬資源實際負荷與承載能力分析;
b)(整體或局部)虛擬資源預期負荷與承載能力分析與建議;
c)(整體或局部)虛擬資源架構分析與建議;
d)(整體或局部)虛擬資源安全策略分析與建議;
e)(整體或局部)虛擬資源配置調優分析與建議等。
6.3.3 例行操作
6.3.3.1 監控
對虛擬資源的監控內容
6.3.3.2 預防性檢查
應在監控服務的基礎上,對虛擬資源進行預防性檢查。包括:性能檢查、脆弱性檢查。
6.3.3.3 常規作業
虛擬資源的常規作業
6.3.4 響應支持
6.3.4.1 事件驅動響應
針對虛擬資源及所依賴的硬件故障引起的業務中斷或運行效率無法滿足正常運行要求,而進行的響應服務,包括但不限于:
a)故障定位;
b)虛擬資源重新調配、緊急遷移、緊急擴容;
c)解決虛擬資源所依賴的物理資源故障和缺陷,包括:服務器、網絡及網絡設備、存儲、仲裁控制點(磁盤、光纖鏈路、服務器等)等;
d)虛擬資源緊急操作,如更換、中斷、連通網絡連接、關閉、啟動端口、更改、恢復配置、停止及啟動進程、重啟等。
6.3.4.2 服務請求響應
根據應用系統運行需要或需方、服務相關方的請求,而進行的響應服務,包括但不限于:
a)虛擬機、配置信息、數據的備份與恢復;
b)虛擬機遷移、回收、變更;
c)虛擬資源池的容災、高可用配置、計劃實施與演練;
d)數據統一存儲;
e)數據訪問性能優化;
f)數據在線遷移與分級存儲;
g)新增主機分配存儲空間;
h)現有主機存儲空間調整;
i)主機端多路徑軟件的安裝配置;
j)虛擬資源池的擴容、調配、變更;
k)增加、降低虛擬網絡資源網絡接入數量或速率;
l)更改虛擬網絡資源配置;
m)啟動、關閉端口或服務;
n)更換、更新或升級虛擬網絡資源硬件或軟件。
6.3.5 優化改善
6.3.5.1 適應性改進
根據應用系統特點和運行需求,對虛擬資源進行調整,包括但不限于:
a)虛擬網絡設備或鏈路負載調整;
b)虛擬網絡安全策略調整;
c)虛擬網絡監控對象覆蓋范圍調整;
d)虛擬網絡路由策略調整;
e)虛擬網絡交換及冗余優化;
f)虛擬網絡資源調配;
g)虛擬機計算資源CPU、內存容量、硬盤容量、網絡的調整;
h)虛擬機計算資源遷移;
i)虛擬化計算資源調度的算法;
j)虛擬存儲服務控制器前后端網絡(SAN或IP)端口吞吐速率的調整;
k)根據數據生命周期,進行存儲資源分層調整;
l)數據存儲平衡算法調整;
m)虛擬存儲卷保留份數調整;
n)虛擬存儲卷鏡像復制級別調整。
6.3.5.2 增加性改進
根據應用系統的特點和運行需求以及數據量處理能力要求,通過對虛擬資源的運行記錄、趨勢的分析,對虛擬資源進行調整、擴容或升級,包括但不限于:
a)虛擬網絡資源調整,如CPU、內存、端口的調配、擴容回收;
b)虛擬網絡資源網絡架構變動;
c)虛擬網絡架構容量變化,如網絡子系統的增減等;
d)虛擬網絡系統功能變化,如新增安全系統、新增審計系統等;
e)虛擬網絡路由協議應用及部署調整;
f)虛擬網絡整體安全策略收緊;
g)虛擬網絡資源冗余優化;
h)虛擬計算資源宿主機服務器和虛擬機計算能力擴容;
i)虛擬計算資源宿主機服務器和虛擬機內存擴容;
j)虛擬計算資源宿主機服務器和虛擬機網絡吞吐能力擴容;
k)虛擬計算資源高可用性增強與演練;
l)虛擬計算資源容錯機制增強與演練;
m)虛擬計算資源備份恢復測試;
n)虛擬存儲服務控制器節點數量增加;
o)虛擬存儲服務控制器內存容量增加;
p)虛擬存儲服務控制器CPU性能增強;
q)虛擬存儲服務控制器前后端網絡(SAN或IP)端口增加;
r)虛擬存儲服務控制器后端分布式物理存儲的Cache、容量等增加;
s)虛擬存儲服務控制器微碼升級;
t)存儲虛擬化軟件升級。
6.3.5.3 預防性改進
根據對虛擬資源的運行記錄、趨勢的分析,結合應用系統的需求,發現虛擬資源的脆弱點及潛在的隱患,有針對性地進行改進性作業,包括但不限于:
a)虛擬網絡配置參數優化,例如虛擬網絡資源的VLAN、QoS、ACL、帶寬等;
b)虛擬網絡部署路由策略情況下端到端選路變化、端口流量變化、路由條目變化;
c)根據系統監控得到的信息替換可能存在問題的內存,CPU,硬盤,網絡設備等;
d)根據系統的壓力增長趨勢主動對物理服務器的數量進行必要的擴容;
e)根據系統的發展趨勢對網絡系統采取必要的擴容;
f)收集存儲資源池空間的使用情況,及時清理垃圾數據或增加存儲資源池的容量;
g)監控服務控制器的負載情況,必要時增加硬件數量,或提高硬件規格;
h)監控服務控制器的硬件出錯率,替換存在問題的硬件;
i)監控服務控制器后端分布式物理存儲的硬件出錯率,替換存在問題的硬件;
j)監控仲裁控制點(磁盤、光纖鏈路、服務器等)的運行情況;
k)服務控制器微碼升級;
l)存儲虛擬化軟件升級。
6.4 平臺資源
6.4.1 服務對象
服務對象包括操作系統、數據庫、中間件等系統軟件。
6.4.2 調研評估
通過對平臺資源軟件的運行記錄、運行趨勢進行分析,根據應用系統的特點和運行需求,提出處理或改進的建議和方案。
6.4.3 例行操作
6.4.3.1 監控
重點是對平臺資源(操作系統、數據庫、中間件等)的運行狀態、運行性能、資源使用分配情況進行監控,以便了解其是否滿足運行要求。監控應當采用合適的裝備與手段,分配專門人員定期或全時段進行監控。
6.4.3.2 預防性檢查
應在監控服務的基礎上,對平臺資源(數據庫、中間件等)進行預防性檢查。包括:性能檢查、脆弱性檢查。
6.4.3.3 常規作業
對平臺資源(數據庫、中間件)的常規作業
6.4.4 響應支持
6.4.4.1 事件驅動響應
針對設備的軟、硬件故障、誤操作等引起的業務中斷或運行效率無法滿足正常運行要求,而進行的響應服務。包括但不限于:
a)操作系統事件驅動響應:
1)操作系統損壞;
2)操作系統CPU、內存等資源耗盡;
3)操作系統服務進程無效;
4)操作系統文件系統空間不夠;
5)操作系統網口無法通訊;
6)操作系統無法識別外置存儲空間。
b)數據庫事件驅動響應:
1)數據文件壞塊修復;
2)數據庫重啟;
3)網絡偵聽重啟;
4)數據庫備份恢復;
5)數據庫解鎖。
c)中間件事件響應驅動:
1)程序恢復;
2)應用服務重啟;
3)配置文件恢復;
4)守護服務調整。
6.4.4.2 服務請求響應
根據應用系統運行需要或需方、服務相關方的請求,而進行的響應服務。包括但不限于:
a)操作系統服務請求響應:
1)操作系統版本升級;
2)操作系統死機修復;
3)操作系統文件系統損壞修復;
4)操作系統文件系統空間擴容;
5)操作系統IP地址修改;
6)操作系統參數調整;
7)操作系統日志清理。
b)數據庫服務請求響應:
1)數據庫版本升級;
2)數據庫災難恢復;
3)數據清理和維護。
c)中間件服務請求響應:
1)中間件服務器更換;
2)中間件參數調整;
3)中間件軟件版本升級。
6.4.5 優化改善
6.4.5.1 適應性改進
根據應用系統特點和運行需求,分析平臺資源軟件的運行情況,調整平臺資源軟件不合理的初始容量配置、參數配置等,以滿足應用系統的運行需求,包括但不限于:
a)操作系統適應性改進:
1)操作系統交換區容量調整;
2)操作系統內核參數調整;
3)操作系統文件系統使用空間調整劃分;
4)操作系統IP地址調整。
b)數據庫適應性改進:
1)數據庫資源使用調整;
2)數據庫執行SQL計劃調整;
3)數據表參數調整;
4)數據庫對象的調整;
5)主機操作系統內核參數調整;
6)數據庫參數調整;
7)臨時表空間、用戶表空間調整;
8)數據庫物理部署的調整(遷移至新服務器或者數據庫存儲陣列調整);
9)調整數據庫備份策略。
c)中間件適應性改進:
1)中間件參數配置優化;
2)數據庫連接參數調整;
3)連接池參數調整;
4)相關操作系統參數調整。
6.4.5.2 增強性改進
根據應用系統的特點和運行需求,通過對平臺資源軟件的運行記錄、趨勢的分析,對平臺資源軟件進行調整、擴容或升級,包括但不限于:
a)操作系統增強性改進:
1)操作系統版本升級;
2)操作系統內容擴容;
3)操作系統磁盤空間擴容;
4)操作系統增加網卡、光纖卡數量;
5)操作系統參數調優。
b)數據庫增強性改進:
1)數據庫版本升級、打補丁;
2)由于主機CPU個數、內存容量增加調整數據庫相應的參數;
3)由于主機存儲的增加調整數據庫表空間容量;
4)數據庫安全備份架構構建以提高可用性;
5)數據庫調優等。
c)中間件增強性改進:
1)中間件版本升級、打補丁;
2)由于主機CPU個數、內存容量增加調整中間件相應的參數。
6.4.5.3 預防性改進
根據對平臺資源軟件的運行記錄、趨勢的分析,結合應用系統的需求,發現資源平臺軟件存在的脆弱點,有針對性地進行改進性作業,包括但不限于:
a)操作系統預防性改進:
1)操作系統刪除垃圾數據,釋放數據空間;
2)操作系統文件系統擴容;
3)操作系統增加網卡、光纖卡冗余;
4)操作系統用戶權限合理分配;
5)操作系統服務端口調整。
b)數據庫預防性改進:
1)增加數據庫表空間數據文件空間使用范圍;
2)對數據庫存在的無效對象處理;
3)數據庫用戶的權限合理分配。
c)中間件預防性改進:
1)刪除臨時文件,釋放數據空間;
2)監控主要參數以及時調優;
3)應用備份策略調整;
4)定期備份。
6.5 應用資源
6.5.1 服務對象
服務對象是應用資源。
6.5.2 調研評估
通過對應用資源的運行記錄、運行趨勢進行分析,根據應用系統的特點和運行需求,提出處理或改進的建議和方案。
6.5.3 例行操作
6.5.3.1 監控
對應用資源的監控內容
6.5.3.2 預防性檢查
應在監控服務的基礎上,對應用資源進行預防性檢查。包括:性能檢查、脆弱性檢查。
6.5.3.3 常規作業
應用資源的常規作業內容
6.5.4 響應支持
6.5.4.1 事件驅動響應
針對應用資源故障而進行的響應服務。包括但不限于:
a)應用級啟停;
b)系統級啟停等。
6.5.4.2 服務請求響應
根據應用系統運行需要或需方、服務相關方的請求,進行及時響應和處理。例如:
a)按服務請求指示進行用戶增加;
b)口令修改;
c)參數調整等。
6.5.5 優化改善
應用資源的優化改善服務包括但不限于:
a)應用消息隊列、共享內存優化;
b)應用服務能力優化,例如應用進程數、應用線程數的優化;
c)應用日志級別及日志空間的調整;
d)應用版本升級、打補丁。
注:本部分中應用資源的優化改善服務通常指在軟件運行中對軟件有關性能、維護參數調整,對于應用資源自身功能增加、變動等引起的優化改善活動不在本部分范圍內,具體詳見《信息技術軟件維護》。
6.6 數據
6.6.1 服務對象和活動
服務對象是數據。
6.6.2 調研評估
見本部分6.4.2和6.5.2的要求。
6.6.3 例行操作
6.6.3.1 監控
監控應當采用合適的裝備與手段,分配專門人員定期或全時段進行監控。
6.6.3.2 預防性檢查
應在監控服務的基礎上,對數據進行預防性檢查。包括:性能檢查、脆弱性檢查。
6.6.3.3 常規作業
對數據的常規作業內容
6.6.4 響應支持
見6.4.4和6.5.4的要求。
6.6.5 優化改善
見6.4.5和6.5.5的要求。
中企檢測認證網提供iso體系認證機構查詢,檢驗檢測、認證認可、資質資格、計量校準、知識產權貫標一站式行業企業服務平臺。中企檢測認證網為檢測行業相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業性問題可以撥打中企檢測認證網在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產權、版權法律法規知識資訊,包括商標注冊、食品檢測、第三方檢測機構、網絡信息技術檢測、環境檢測、管理體系認證、服務體系認證、產品認證、版權登記、專利申請、知識產權、檢測法、認證標準等信息,中企檢測認證網為檢測認證商標專利從業者提供多種檢測、認證、知識產權、版權、商標、專利的轉讓代理查詢法律法規,咨詢輔導等知識。
本文內容整合網站:百度百科、搜狗百科、360百科、知乎、市場監督總局 、國家認證認可監督管理委員會、質量認證中心
免責聲明:本文部分內容根據網絡信息整理,文章版權歸原作者所有。向原作者致敬!發布旨在積善利他,如涉及作品內容、版權和其它問題,請跟我們聯系刪除并致歉!