“沒說就是零卡。”近日,網絡健身博主@禿頂吳彥祖的金句意外走紅,揭開了無數擼鐵干飯王的最強自我欺騙套路——只要食物包裝上沒有注明卡路里,吃了它我就不會發胖!除此之外,“冰可樂沒有熱量”、“卡路里正正得負”等高頻彈幕也常常令人忍俊不禁。實際上,它們并不僅僅是幾句戲言,通過Transformer Cross Transformer (TxT)人工智能推薦系統,漢堡王發現,當人們把高熱量食物而非低熱量食物加入購物車時,他們更愿意再點一份甜點。也就是說,高熱量食物和高熱量食物更配哦!另外,TxT還發現,即使天氣很冷,漢堡王的顧客都會點上一份奶昔——而此前人們一般認為,低溫天氣會使冷飲銷量降低。
其實,想要在客戶服務中使用人工智能,尤其是快餐推薦,線下快餐門店面臨著自己獨特的挑戰。相比電子商務、搜索引擎等能夠在較為充裕的時間內通過大量推理與訓練,掌握用戶偏好的行業,對于快餐品牌而言,目前仍然沒有什么簡單的方法可以在瞬間識別客戶并檢索到他們的檔案,因為所有食物推薦都是在線下完成的。此外,在把位置、上下文特征加載到模型之前,還必須對此類數據進行預處理,對于要求快速響應的線下快餐門店來說,這著實是一個不小的難題。
為了應對這些挑戰,漢堡王的Transformer Cross Transformer (TxT)人工智能推薦系統應運而生。該系統采用了所謂的“雙”Transformer架構,既能夠學習實時訂單序列數據,也能夠學習位置、天氣和訂單行為等特征。TxT可以利用餐館中所有可用的數據點,而無需在接單流程開始之前識別顧客。例如,如果顧客在其購物車內加入的第一款商品是奶昔,那么這將影響TxT的推薦,這些推薦基于顧客過去購買的商品、當下購買的商品以及商店售賣的商品。這是從模型方面的創新。
另一方面的創新則是統一的大數據處理和模型訓練的流水線。目前,大多數企業的做法是建立兩個模型,一個模型做大數據處理,一個模型做深度學習,但這一方式效率低下,拷貝文件就占了整個訓練20%以上的時間。而英特爾和漢堡王合作創建的端到端推薦流水線將整個端到端的數據處理和模型訓練遷移到基于BigDL的統一的平臺上,其中包括分布式Apache Spark數據處理和在英特爾至強集群上進行的Apache MXNet訓練,能夠讓企業直接在現有集群上運行程序,從而大大提高了人工智能的工作效率。
說到這里,你會發現,想要將AI部署于現實的應用,其中所面臨的一個重大挑戰就是針對生產數據集進行數據分析、機器學習和深度學習。生產數據集來源于龐大的分布式數據倉庫,而按照傳統方法,企業需要設立兩個單獨的集群,一個用于大數據,導出數據并轉移到另外一個深度學習集群進行建模,該集群運行TensorFlow、PyTorch等。在這種架構下,首先會產生大量與數據移動相關的開銷,其次,它會產生隔離的工作流,從而大大降低開發效率。
而針對上述難題,英特爾BigDL 2.0有著清晰的解決思路——提供一個統一的大數據架構,為分布式AI提供統一的端到端管道。如此一來,企業就可以在同一個集群、同一個應用內使用Spark等處理數據倉庫中的數據。在此基礎上,人們可以針對內存Spark Dataframes直接使用TensorFlow、PyTorch、OpenVINO等深度學習AI模型。Spark Dataframes是駐留在內存中的數據集,分布在整個集群上,客戶可以透明地在分布式數據集上使用這些AI模型、AI算法——都在一個集群內,更重要的是,一個程序,只需一個工作流。
通過這種方法,英特爾的一些客戶,如中國最大的軟硬件廠商之一的浪潮,已經成功將研發周期從幾個季度縮短到幾個月。毋庸置疑,這一顯著的進步極大推動了人工智能現實應用的進一步發展。
而在這一成就的背后,是英特爾BigDL 2.0所凝結的大量創新。分布式模式運行本地筆記本上的代碼。實際上,這一直是很多數據科學家的痛點,他們沒法簡單地獲取一個單節點PythonNotebook,并在集群上以分布式模式運行,因此,他們通常需要重寫代碼。

在Orca中,英特爾BigDL嘗試讓用戶可以把筆記本電腦上運行的Notebook部署到分布式集群,云中托管的Kubernetes集群、或者Hadoop集群。在Notebook的一開始,只需調用Orca下文中的一個方法,它會告訴程序用戶希望運行哪個環境,可以是在本地筆記本電腦上,也可以是本地集群或者Kubernetes集群等。只需改變一行代碼,這個Notebook就可以在本地筆記本電腦上運行,模擬分布式集群規模,在分布式環境中處理大型數據集。
而在更高層級的運用,即基于這些管道開發更垂直的行業解決方案中,用戶可以通過BigDL PPML,在云上創建一個支持大數據和AI的可信平臺環境。在把數據或者模型轉移到云上之前,用戶可以使用加密技術保護內容,然后通過BigDL PPML直接在加密數據上運行應用軟件、模型、Spark數據分析等,PPML會在可信環境中讀取加密數據,解密并運行相應的應用,同時確保數據的安全性和應用的完整性。在此基礎下,BigDL PPML還可以提供可信的聯邦學習(也被稱為聯合學習)——每一方只擁有一部分信息和功能,但他們可以聯合訓練一個模型,而不需要向另一方披露數據。通過SGX提供的硬件級的安全環境,聯邦學習場景中的性能和安全性能夠得到有效保證。
此外,BigDL之上構建的其他垂直行業解決方案還包括Chronos項目——一個利用AutoML技術構建大規模、分布式時間序列分析的應用框架,可用于時序數據的處理,滑動窗口取樣、縮放、重采樣、補全,以及自動的特征提取。同時,其中內置了大量時序預測和異常檢測模型,用戶可以直接使用TSDataset構建時序應用進行數據處理,使用對應的模型進行預測或者異常檢測。AutoML技術幫助用戶搜索最佳的模型參數以提高模型預測的準確性。 Chronos同時內置了Intel的分類加速工具可以幫助用戶取得更好的訓練與推理速度;以及Friesian項目——用于構建大規模端到端推薦解決方案的應用框架,提供了豐富的內置特征工程操作、推薦算法和參考樣例,幫助用戶快速構建一個完整的推薦系統來應對離線或者在線的推薦場景。
總而言之,作為一個開源項目,BigDL能夠提供端到端大數據人工智能管道,讓用戶、科學家和數據工程師更容易構建大規模分布式人工智能解決方案,并使其變得更加容易。它還提供各種垂直框架,如推薦、時間序列分析、隱私保護機制,以幫助用戶快速整合他們的AI解決方案。或許在并不遙遠的未來,伴隨著人工智能在人類生活中更加深度的滲透,BigDL與大數據的結合將為我們揭示更多意想不到的神奇真相。
-
英特爾
+關注
關注
61文章
10302瀏覽量
180515 -
人工智能
+關注
關注
1817文章
50102瀏覽量
265514 -
機器學習
+關注
關注
66文章
8554瀏覽量
136979 -
大數據
+關注
關注
64文章
9065瀏覽量
143774
發布評論請先 登錄
Dante數字化會議系統、分布式視頻系統、“AI”人工智能在會議運維中的應用
香港科技大學與英特爾共建聯合實驗室,聚焦高能效智能計算
Intewell×Intel 強強聯合 | 光亞鴻道亮相2025英特爾生態大會
40個項目脫穎而出!2025英特爾人工智能大賽圓滿收官,下一個AI應用浪潮開啟
聚焦液冷痛點:英特爾UQD互換性認證助力數據中心高效發展
硬件與應用同頻共振,英特爾Day 0適配騰訊開源混元大模型
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
英特爾發布邊緣AI控制器與邊緣智算一體機,創造“AI新視界”
英特爾銳炫Pro B系列,邊緣AI的“智能引擎”
英特爾2025年Q1營收127億美元,數據中心與AI業務可圈可點
英特爾? 具身智能大小腦融合方案發布:構建具身智能落地新范式
盟通科技攜手Acontis助力英特爾虛擬化驅動工業負載整合
英特爾BigDL深挖大數據價值 助力分布式人工智能廣泛落地
評論