智東西6月21日報道,昨日,在O’Reilly和英特爾人工智能大會上,英特爾公司架構圖形與軟件集團副總裁、數據分析技術總監馬子雅針對“統一大數據分析和人工智能從而更快地大規模洞察”這一主題發表了演講。
會后,智東西與少數媒體對英特爾公司架構圖形與軟件集團副總裁、數據分析技術總監馬子雅,英特爾高級首席工程師、大數據技術全球CTO戴金權進行了采訪。在采訪中,馬子雅對英特爾的分布式深度學習庫BigDL和Analytics Zoo技術的應用、優勢等方面進行了詳細的闡釋。
同時,英特爾還將在中國設立大數據分析和人工智能創新院,由戴金權負責。該研究院將與中國進行更廣泛的生態系統合作,加快統一的數據分析和人工智能技術在中國的創新和應用。
一、BigDL+Analytics Zoo:提供端到端的開發和部署效率
在主題演講活動中,馬子雅表示,當下人們正處于一個數據變革的時代,人類歷史上90%的數據都是在過去幾年產生的,50%的數據都是短短兩年所生成的。
因此,企業的生產發展需要高效地利用數據分析和人工智能來提高生產效率,以擴大競爭優勢。同時,馬子雅表示,人工智能的真正落地需要一個完整的數據分析流水線,而這也是英特爾選擇開源BigDL的重要原因。
在加快數據分析及人工智能大規模應用方面,馬子雅對英特爾開發并開源的BigDL和Analytics Zoo技術進行了介紹。
BigDL是建立在大數據平臺(Hadoop/Spark)之上原生的分布式深度學習庫,它為用戶提供了在Apache Spark(快速通用計算引擎)上豐富的深度學習功能,以幫助 Hadoop(分布式系統基礎架構)和Spark成為一個統一的數據分析平臺,為整個數據分析和機器學習過程提供比現有框架更加統一和集成化的支持。
據英特爾表示,它能夠實現主流深度學習框架TensorFlow、Caffe以及Torch等同樣的功能。同時作為Spark標準組件,它還能夠和Spark大數據生態系統的不同組件很好地整合在一起。
Analytics Zoo是英特爾基于至強計算平臺、傲騰數據存儲器,并結合英特爾云服務推出的大數據分析+AI的平臺。它能夠將Spark、TensorFlow、Keras和BigDL合并到一個集成管道中,方便地擴展到企業已有的大型Apache Hadoop/Spark集群,進行分布式訓練或推理。這讓用戶能更輕松地開發基于大數據、端到端的深度學習應用。
BigDL和Analytics Zoo這兩個平臺,不僅能進一步地提高資源利用率和端到端的開發及部署效率,同時還能降低普通大數據用戶和數據科學家在使用深度學習進行數據分析和構建人工智能應用時的門檻。
馬子雅還表示,英特爾在過去的幾個月中,將Analytics Zoo基于英特爾最新的Optane(傲騰)內存技術上和OpenVINO技術進行了優化,它的深度學習、模型訓練以及推理性能均得到了提升。
Analytics Zoo平臺與美的、韻達、歐洲核子研究中心(CERN)等企業和科研組織進行了合作。比如,通過與Analytics Zoo的合作,韻達在運輸線路、貯存等方面均得到了優化,這為韻達帶來了七千萬美元運營成本的節省。同時,英特爾與騰訊云、阿里云、百度云以及第四范式、科沃斯等企業均有項目合作,范圍涉及智慧醫療、智慧教育、智慧零售等多個領域。
二、為客戶提供全棧式的AI解決方案
馬子雅提到,在如今大數據分析和人工智能平臺逐漸融為一體的驅使下,英特爾將進一步為客戶提供全棧式的人工智能解決方案,構建硬軟件協同發展,其中包括硬件和軟件兩個層面。
硬件方面,英特爾將提供包括CPU、GPU、FPGA、加速器、網絡等涵蓋前端到數據中心,專用到通用的產品組合。
軟件方面,則是包括nGraph、BigDL、Intel Deep Learning Studio等框架、數學庫以及工具在內的優化軟件。
三、進一步降低BigDL和Analytics Zoo應用門檻
演講結束后,智東西與少數媒體記者對英特爾公司架構圖形與軟件集團副總裁、數據分析技術總監馬子雅,英特爾高級首席工程師、大數據技術全球CTO戴金權進行了專訪。
數據清洗問題是當前大數據+AI應用的一個難點。在智東西問及Analytics Zoo對于數據清洗方面的功能優化時,戴金權表示,數據清洗是一個非常繁瑣的過程,他們將在Analytics Zoo的下一個版本中加入類似AutoML的新工具,可以進行時間序列異常檢測和自動選擇生成特征。
以英特爾與歐洲核子研究中心(CERN)的合作為例,CERN每秒有四千萬粒子,生成1PB的數據。處理數據的第一步,就是要將這個過程中無用且重復的數據過濾掉,以搭建包括數據清洗在內的整個端到端的流水線。
在BigDL和Analytics Zoo的應用門檻方面,馬子雅表示,起初這些技術幾乎都在與終端客戶合作,如今為了覆蓋更多的用戶,英特爾必須降低門檻,把功能整合到服務或產品中,讓用戶可直接用云服務、原始設備制造商以及軟件中提取所需的功能。
▲基于英特爾OPENVINO、英特爾至強可擴展平臺的深度學習推理-腦部腫瘤圖像分割模型加速解決方案
四、硬軟件協同發展,提供更完整解決方案
今年,硬軟件協同發展的“大數據分析+AI”平臺也是英特爾重點發力的內容之一。目前,英特爾共有15000名軟件工程師。
在加強人工智能生態行業的合作上,馬子雅認為,英特爾更像是一個人工智能解決方案的提供者,主要幫助客戶將人工智能更好地利用到他們的生產和生活中。
在Analytics Zoo的兼容性方面,馬子雅提到,由于Analytics Zoo的性能提升和優化主要是英特爾平臺上進行的,它雖然可以兼容其他X86的CPU,但在非英特爾平臺上使用,它的性能可能會受到一定影響,無法達到最佳效果,而在英特爾平臺上使用時才能享受到它的更多特性。
硬件層面,英特爾將為客戶提供更完整的解決方案,除了至強處理器和GPGPU外,在硬件的存儲和網絡方面也進一步地研發與更新。
值得一提的是,在英特爾AI芯片的未來規劃上,馬子雅表示,英特爾不僅僅集中在計算方面,將繼續對傲騰技術、網絡架構技術等存儲和網絡方面進一步研發和更新。另外,包括CPU、GPU、FPGA等新規劃都在逐步推進中。
結語:英特爾進一步推動AI與大數據分析整合發展
無論是BigDL還是Analytics Zoo技術,它們的開源都在深度學習使用和人工智能應用構建上,給大數據用戶和數據科學家帶來了極大的便利,進一步加速了人工智能在人們生活中真正普及和落地的進程。
另一方面,英特爾在人工智能領域的不斷發力,為企業帶來了促進產品和業務發展的各種技術支持,同時讓大家看到了人工智能與商業應用相結合的更多可能性。
未來,大數據分析和人工智能將如何進一步實現整合,如何更快更好地落地,如何從云端到智慧空間能有效運用,這些都是值得我們思考的,期待人工智能給人們生活帶來更多的精彩。
電子發燒友App





評論