5月6日,螞蟻金服副 CTO 胡喜正式宣布開源機器學習工具 SQLFlow:“未來三年,AI 能力會成為每一位技術人員的基本能力。我們希望通過開源 SQLFlow,降低人工智能應用的技術門檻,讓技術人員調(diào)用 AI 像 SQL 一樣簡單。”

目前,SQLFlow已經(jīng)在GitHub上獲得1636個Star,236個Fork。(GitHub地址:https://github.com/sql-machine-learning/sqlflow)
SQLFlow 的目標是將 SQL 引擎和 AI 引擎連接起來,讓用戶僅需幾行 SQL 代碼就能描述整個應用或者產(chǎn)品背后的數(shù)據(jù)流和 AI 構造。其中所涉及的 SQL 引擎包括 MySQL、Oracle、Hive、SparkSQL、Flink 等支持用 SQL 或其某個變種語言描述數(shù)據(jù),以及描述對數(shù)據(jù)的操作的系統(tǒng)。而這里所指的 AI 引擎包括 TensorFlow、PyTorch 等深度學習系統(tǒng),也包括 XGBoost、LibLinear、LibSVM 等傳統(tǒng)機器學習系統(tǒng)。
從 SQL 到機器學習
SQLFlow 可以看作一個翻譯器,它把擴展語法的 SQL 程序翻譯成一個被稱為 submitter 的程序,然后執(zhí)行。 SQLFlow 提供一個抽象層,把各種 SQL 引擎抽象成一樣的。SQLFlow 還提供一個可擴展的機制,使得大家可以插入各種翻譯機制,得到基于不同 AI 引擎的 submitter 程序。
SQLFlow 對 SQL 語法的擴展意圖很簡單:在 SELECT 語句后面,加上一個擴展語法的 TRAIN 從句,即可實現(xiàn) AI 模型的訓練。或者加上一個 PREDICT 從句即可實現(xiàn)用現(xiàn)有模型做預測。這樣的設計大大簡化了數(shù)據(jù)分析師的學習路徑。
此外,SQLFlow 也提供一些基本功能,可以供各種 submitter 翻譯插件使用,用來根據(jù)數(shù)據(jù)的特點,推導如何自動地把數(shù)據(jù)轉換成 features。這樣用戶就不需要在 TRAIN 從句里描述這個轉換。

以上這些設計意圖在 SQLFlow 的開源代碼中都有體現(xiàn)。當然,SQLFlow 開發(fā)時間還比較短,仍然存在很多做的不夠細致的地方。螞蟻金服將其開源的另一個目的,就是希望能夠和各個 SQL 引擎團隊和各個 AI 團隊一起打造這座橫跨數(shù)據(jù)和 AI 的橋梁。
-
人工智能
+關注
關注
1819文章
50242瀏覽量
266638
原文標題:螞蟻金服開源機器學習工具SQLFlow,機器學習比SQL還簡單
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
商湯科技旗下大曉機器人完成天使輪融資
奧比中光與螞蟻靈波達成戰(zhàn)略合作意向
基于ETAS嵌入式AI工具鏈將機器學習模型部署到量產(chǎn)ECU
漢威科技打造國內(nèi)首款彈性傳感器動捕服
AI 驅(qū)動三維逆向:點云降噪算法工具與機器學習建模能力的前沿應用
開源鴻蒙驅(qū)動機器人與AI產(chǎn)業(yè)生態(tài)發(fā)展,M-Robots OS正式開源
全國首個開源鴻蒙機器人操作系統(tǒng) M-Robots OS 正式開源
開源電機驅(qū)動,免費學習
開源工具 Made with KiCad(131):BomberCat 安全測試工具
商湯科技“小浣熊家族”與螞蟻集團旗下智能體開發(fā)平臺“螞蟻百寶箱”正式達成生態(tài)合作
螞蟻金服開源機器學習工具SQLFlow
評論