介紹
目前k8s-cluster-inspector組件可以自動(dòng)化完成Kubernetes集群巡檢,并在巡檢結(jié)果中給出當(dāng)前集群存在的問(wèn)題,問(wèn)題分級(jí),問(wèn)題類型,問(wèn)題解決方法。
示例巡檢數(shù)據(jù)結(jié)構(gòu)如下:
?
{
"name": "colocation-webhook-role",
"namespace": "archimedes",
"kind": "Role",
"message": ["CanDeleteResources"],
"issueCategory": ["Failed to pull image:WorkLoad"],
"normal": false,
"harmRank": ["CanDeleteResources:高危"],
"repairMessages": ["CanDeleteResources:rbac中存在刪除用戶的風(fēng)險(xiǎn),修復(fù):在role,clusterrole增加標(biāo)簽:kubernetes.io/bootstrapping='rbac-defaults'"]
}
可見(jiàn),其結(jié)果在一般的靠人力的情況下,對(duì)于問(wèn)題的答案有一定限制。最終可能導(dǎo)致用戶對(duì)結(jié)果不信任或者結(jié)果無(wú)法在可生產(chǎn)的環(huán)境中驗(yàn)證。
我們?cè)诮柚?a href="http://www.3532n.com/tags/ai/" target="_blank">AI工具,對(duì)于問(wèn)題答案使用AI進(jìn)行回答。將其結(jié)果回填到以上的巡檢數(shù)據(jù)后,示例結(jié)果如下:
{
"name": "colocation-webhook-role",
"namespace": "archimedes",
"kind": "Role",
"message": ["CanDeleteResources"],
"issueCategory": ["Failed to pull image:WorkLoad"],
"normal": false,
"harmRank": ["CanDeleteResources:高危"],
"repairMessages": ["CanDeleteResources:集群中遇到鏡像拉取報(bào)錯(cuò)401,通常是因?yàn)殓R像倉(cāng)庫(kù)需要認(rèn)證。解決方法如下:
1. **創(chuàng)建鏡像拉取秘密**:在Kubernetes中創(chuàng)建一個(gè)Secret對(duì)象,用于存儲(chǔ)鏡像倉(cāng)庫(kù)的用戶名和密碼。
```yaml
kubectl create secret docker-registry regcred --docker-server= --docker-username= --docker-password= --docker-email=
```
2. **在Pod或Deployment中引用Secret**:在Pod或Deployment的配置文件中,通過(guò)`imagePullSecrets`字段引用上述創(chuàng)建的Secret。
```yaml
apiVersion: v1
kind: Pod
metadata:
name: private-reg
spec:
containers:
- name: private-reg-container
image:
imagePullSecrets:
- name: regcred
```
3. **應(yīng)用配置**:更新或創(chuàng)建Pod/Deployment。
```bash
kubectl apply -f your-pod-or-deployment.yaml
```
這樣,Kubernetes在拉取鏡像時(shí)會(huì)使用指定的認(rèn)證信息,避免401錯(cuò)誤。"]}
可見(jiàn)數(shù)據(jù)結(jié)果有較為明顯的改進(jìn)。并且借助AI工具,可以使得答案具有較高的豐富度和專業(yè)性。增加產(chǎn)品力。增強(qiáng)用戶體驗(yàn)。
系統(tǒng)流程
主要流程區(qū)分:
1. 執(zhí)行巡檢模版
按照用戶聲明的巡檢模版指令執(zhí)行巡檢
2. 開(kāi)始巡檢
開(kāi)始巡檢執(zhí)行,該過(guò)程與Kubernetes集群交互
3. 渲染巡檢結(jié)果
將巡檢結(jié)果進(jìn)行渲染,渲染過(guò)程中會(huì)調(diào)用AI接口,分裝提示詞,組裝steam需要的上下文,將集群?jiǎn)栴}給到AI,并獲取AI回答的結(jié)果,補(bǔ)充到結(jié)果集中。
4. 上報(bào)巡檢結(jié)果
最終將巡檢結(jié)果上報(bào)到用戶指定的OSS存儲(chǔ)服務(wù)器或者本地。

??
provider 設(shè)計(jì)
在流程中中,AI provider設(shè)計(jì)目的是將AI 作為provider進(jìn)行設(shè)計(jì),可以支持多個(gè)AI提供方。每個(gè)AI提供方只需要實(shí)現(xiàn)調(diào)用方式即可。這在對(duì)外交付時(shí),極大的提高了靈活性。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301350 -
京東
+關(guān)注
關(guān)注
2文章
1108瀏覽量
50076
發(fā)布評(píng)論請(qǐng)先 登錄
KubePi:開(kāi)源Kubernetes可視化管理面板,讓集群管理如此簡(jiǎn)單
確保X光設(shè)備檢測(cè)的有效性和準(zhǔn)確性的關(guān)鍵技巧
AI技術(shù)賦能質(zhì)檢,提升效率和精準(zhǔn)的雙提升
電能質(zhì)量在線監(jiān)測(cè)裝置的精度等級(jí)對(duì)其測(cè)量結(jié)果的準(zhǔn)確性有何影響?
電能質(zhì)量在線監(jiān)測(cè)裝置定位諧波源的準(zhǔn)確性有多高?
如何保障電能質(zhì)量監(jiān)測(cè)裝置的準(zhǔn)確性?
如何保證數(shù)據(jù)校驗(yàn)系統(tǒng)的時(shí)間同步以提高準(zhǔn)確性?
RK3576賦能無(wú)人機(jī)巡檢:多路視頻+AI識(shí)別引領(lǐng)智能化變革
高效管理Kubernetes集群的實(shí)用技巧
測(cè)縫計(jì)測(cè)量數(shù)據(jù)的準(zhǔn)確性和校準(zhǔn)方法解析
必知!影響手機(jī)氣密性檢測(cè)準(zhǔn)確性的重要因素
手表外殼氣密性檢測(cè)儀:如何有效提升檢測(cè)效率與準(zhǔn)確性
借助京東AI言犀提升Kubernetes集群巡檢的效率和準(zhǔn)確性
評(píng)論