來源:OpenLoong開源社區(qū)
行業(yè)攜手,共建開放可信的數(shù)據(jù)基礎(chǔ)設(shè)施
隨著人形機(jī)器人技術(shù)的突破不斷加速,高質(zhì)量、多模態(tài)、結(jié)構(gòu)化數(shù)據(jù)已成為推動(dòng)模型能力提升及產(chǎn)業(yè)走向規(guī)模化應(yīng)用的核心要素之一,為支撐這一發(fā)展方向,OpenLoong開源社區(qū)積極推進(jìn)高質(zhì)量數(shù)據(jù)資源的開放共享,吸引行業(yè)伙伴共同建設(shè)統(tǒng)一的數(shù)據(jù)體系。
近日,樂聚智能正式將其構(gòu)建的LET數(shù)據(jù)集捐贈(zèng)至OpenLoong開源社區(qū),為社區(qū)補(bǔ)充了一套覆蓋真實(shí)作業(yè)場景的重要數(shù)據(jù)資源。該數(shù)據(jù)集規(guī)模大、結(jié)構(gòu)規(guī)范、場景豐富,具備突出的工程化與研究價(jià)值,將為國內(nèi)人形機(jī)器人研發(fā)提供有力支撐,它的加入不僅體現(xiàn)了行業(yè)對(duì)統(tǒng)一數(shù)據(jù)規(guī)范與開源治理模式的認(rèn)可,也標(biāo)志著 OpenLoong數(shù)據(jù)生態(tài)建設(shè)進(jìn)入了新的階段。
LET數(shù)據(jù)集:內(nèi)容構(gòu)成與數(shù)據(jù)體系概覽
LET數(shù)據(jù)集由樂聚智能與合作團(tuán)隊(duì)聯(lián)合構(gòu)建,是國內(nèi)少有的面向真實(shí)作業(yè)場景的全尺寸人形機(jī)器人真機(jī)數(shù)據(jù)集,它基于樂聚夸父系列全尺寸人形機(jī)器人進(jìn)行統(tǒng)一采集,覆蓋真實(shí)作業(yè)鏈路,規(guī)模超過60,000 分鐘。
任務(wù)場景豐富
LET數(shù)據(jù)集在場景覆蓋上跨越工業(yè)、商業(yè)零售和日常生活三大領(lǐng)域,包含汽車工廠、快消場景、酒店服務(wù)、3C工廠、生活服務(wù)和物流共六類真實(shí)生產(chǎn)與服務(wù)環(huán)境,并在此基礎(chǔ)上構(gòu)建了31項(xiàng)任務(wù)和117種原子技能,形成了結(jié)構(gòu)清晰的任務(wù)體系。這些任務(wù)目標(biāo)清晰、流程有約束,適用于訓(xùn)練機(jī)器人在多場景、多步驟、多目標(biāo)條件下進(jìn)行學(xué)習(xí)與推理。
數(shù)采鏈技術(shù)創(chuàng)新
與此同時(shí),數(shù)據(jù)集同步記錄頭部與雙腕視覺流,并提供RGB、深度、關(guān)節(jié)狀態(tài)和末端執(zhí)行器狀態(tài)等多模態(tài)信息;通過組幀技術(shù)將傳感器時(shí)間誤差壓到10毫秒以內(nèi),再以視覺伺服閉環(huán)機(jī)制對(duì)齊到統(tǒng)一抽象空間,使數(shù)據(jù)一致性超過90%。
多模態(tài)數(shù)據(jù)融合
在標(biāo)注方面,復(fù)雜任務(wù)被拆解為語義明確的原子動(dòng)作步驟,配有時(shí)間軸、自然語言描述及對(duì)象、技能、場景等語義標(biāo)簽,便于模型理解任務(wù)結(jié)構(gòu)與動(dòng)作邏輯,為行為理解、策略學(xué)習(xí)和技能組合打下基礎(chǔ)。同時(shí),數(shù)據(jù)集還配套數(shù)據(jù)轉(zhuǎn)換、模型訓(xùn)練、仿真測試與真機(jī)部署工具鏈,為研究人員提供從數(shù)據(jù)到算法再到驗(yàn)證的完整流程,提升整體使用效率。
部分任務(wù)示例包括:
商超售賣↓
衣服收納↓
垃圾回收分類↓
LET數(shù)據(jù)集為OpenLoong帶來了行業(yè)中極具代表性的一套結(jié)構(gòu)化資源,為社區(qū)的開源生態(tài)補(bǔ)充了關(guān)鍵的真實(shí)世界數(shù)據(jù)資源,它的加入將推動(dòng)行業(yè)在任務(wù)建模、技能學(xué)習(xí)與策略驗(yàn)證等方向展開更深入的研究,同時(shí)也為開發(fā)者提供了可用于性能驗(yàn)證的高質(zhì)量樣本。
建設(shè)行業(yè)可信賴的數(shù)據(jù)規(guī)范體系
當(dāng)前,人形機(jī)器人正在加速從實(shí)驗(yàn)室走向真實(shí)應(yīng)用場景,產(chǎn)業(yè)鏈對(duì)高質(zhì)量數(shù)據(jù)集的需求不斷提升,但行業(yè)內(nèi)存在數(shù)據(jù)來源分散、數(shù)據(jù)格式各異、數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一等共性問題,既降低了數(shù)據(jù)集質(zhì)量,限制了模型能力的提升,又降低了跨機(jī)構(gòu)協(xié)作效率。因此,構(gòu)建體系化數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范數(shù)據(jù)全生命周期管理過程是促進(jìn)高質(zhì)量數(shù)據(jù)集流通、激活人形機(jī)器人數(shù)據(jù)價(jià)值的必由之路。
遵循國家地方共建人形機(jī)器人創(chuàng)新中心(以下簡稱“國地中心”)的數(shù)據(jù)采集、數(shù)據(jù)處理等標(biāo)準(zhǔn)可以從源頭確保數(shù)據(jù)質(zhì)量與可用性,為行業(yè)提供標(biāo)準(zhǔn)化、易復(fù)用的數(shù)據(jù)資產(chǎn)。為了確保數(shù)據(jù)在高度一致性、可復(fù)用性和長期可維護(hù)性等方面滿足要求,國地中心建立了一套覆蓋數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)質(zhì)量審核和版本管理的標(biāo)準(zhǔn)體系,覆蓋數(shù)據(jù)全生命周期,使得不同來源的數(shù)據(jù)在OpenLoong開源社區(qū)上以格式一致、標(biāo)注清晰的形式呈現(xiàn)。作為國家級(jí)創(chuàng)新中心,國地中心始終致力于推動(dòng)產(chǎn)業(yè)標(biāo)準(zhǔn)化進(jìn)程,攜手生態(tài)伙伴共建訓(xùn)練場和數(shù)據(jù)標(biāo)準(zhǔn)生態(tài),累計(jì)主導(dǎo)或參與國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)60余項(xiàng);同時(shí),建設(shè)并維護(hù)具身智能數(shù)據(jù)集開源平臺(tái),與行業(yè)共享標(biāo)準(zhǔn)化成果。2025年9月,國地中心申報(bào)的“上海虛實(shí)融合具身智能訓(xùn)練場標(biāo)準(zhǔn)化試點(diǎn)”獲批公示,數(shù)據(jù)是具身智能訓(xùn)練場的核心驅(qū)動(dòng)之一,具身智能數(shù)據(jù)標(biāo)準(zhǔn)的編制與應(yīng)用驗(yàn)證是未來開展國家標(biāo)準(zhǔn)化試點(diǎn)的重要任務(wù)之一。
作為開放原子開源基金會(huì)孵化及運(yùn)營的重點(diǎn)項(xiàng)目,OpenLoong依托國地中心的建設(shè)經(jīng)驗(yàn),持續(xù)推進(jìn)共享型數(shù)據(jù)框架的構(gòu)建,以開源方式推動(dòng)數(shù)據(jù)的規(guī)范化組織與復(fù)用,為行業(yè)提供穩(wěn)定的數(shù)據(jù)底座。LET 數(shù)據(jù)集的捐贈(zèng)進(jìn)一步擴(kuò)充了社區(qū)的真實(shí)場景數(shù)據(jù)儲(chǔ)備,為行業(yè)提供更具代表性的訓(xùn)練樣本,也為模型能力的持續(xù)提升奠定了基礎(chǔ)。未來,格式統(tǒng)一、標(biāo)注規(guī)范、高質(zhì)量的數(shù)據(jù)集將成為人形機(jī)器人產(chǎn)業(yè)的重要支撐,提升人形機(jī)器人行業(yè)的研發(fā)效率與協(xié)作水平。
OpenLoong數(shù)據(jù)生態(tài)持續(xù)擴(kuò)展,共建共享加速行業(yè)協(xié)同
LET數(shù)據(jù)集現(xiàn)已正式捐獻(xiàn)給OpenLoong開源社區(qū),并可在社區(qū)網(wǎng)站上下載使用,歡迎點(diǎn)擊文末閱讀原文或掃描下方二維碼,快速獲取數(shù)據(jù)集資源。
作為OpenLoong人形機(jī)器人全棧開源項(xiàng)目的重要組成部分,該數(shù)據(jù)集將在開放原子開源基金會(huì)的孵化下持續(xù)運(yùn)營與維護(hù),穩(wěn)定更新,為行業(yè)提供系統(tǒng)化的真實(shí)場景數(shù)據(jù)資源,同時(shí)也體現(xiàn)了企業(yè)與開源社區(qū)在推動(dòng)數(shù)據(jù)開放與行業(yè)協(xié)同方面達(dá)成的深層共識(shí)。
隨著越來越多的企業(yè)、高校和科研機(jī)構(gòu)加入數(shù)據(jù)貢獻(xiàn),OpenLoong的數(shù)據(jù)生態(tài)正逐步形成覆蓋基礎(chǔ)能力訓(xùn)練、任務(wù)執(zhí)行、多場景研究和真實(shí)環(huán)境驗(yàn)證的多層次體系,社區(qū)也將持續(xù)強(qiáng)化數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),為行業(yè)提供統(tǒng)一可靠的技術(shù)支撐。
OpenLoong開源社區(qū)始終堅(jiān)持開放共享的原則,歡迎更多行業(yè)伙伴加入數(shù)據(jù)共建。社區(qū)鼓勵(lì)具備真實(shí)作業(yè)場景、具有代表性任務(wù)鏈路或擁有多模態(tài)采集能力的企業(yè)、高校與研究團(tuán)隊(duì)貢獻(xiàn)高質(zhì)量數(shù)據(jù),共同完善人形機(jī)器人領(lǐng)域的開源數(shù)據(jù)體系,同時(shí)也將持續(xù)為貢獻(xiàn)者提供規(guī)范透明的托管環(huán)境,通過開源機(jī)制確保數(shù)據(jù)被充分利用。隨著數(shù)據(jù)規(guī)模不斷增長,OpenLoong將與行業(yè)共同推動(dòng)多場景、多任務(wù)、多模型的協(xié)同研究,促進(jìn)形成更加開放、健康的產(chǎn)業(yè)生態(tài)。
歡迎加入OpenLoong開源社區(qū),共建人形機(jī)器人生態(tài)。
-
開源
+關(guān)注
關(guān)注
3文章
4203瀏覽量
46125 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1236瀏覽量
26190 -
人形機(jī)器人
+關(guān)注
關(guān)注
7文章
975瀏覽量
18496
原文標(biāo)題:樂聚LET數(shù)據(jù)集正式捐贈(zèng)至OpenLoong開源社區(qū),遵循國地中心統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)
文章出處:【微信號(hào):開放原子,微信公眾號(hào):開放原子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
生態(tài)合作 | 開源協(xié)同造芯力!OpenLoong×進(jìn)迭時(shí)空:全球首個(gè)RISC-V人形機(jī)器人運(yùn)控適配方案重磅落地
你好,我是StackChan,超可愛的社區(qū)共創(chuàng)開源AI桌面機(jī)器人!
潤和軟件亮相2025智能機(jī)器人操作系統(tǒng)開源社區(qū)生態(tài)大會(huì)
開放原子開源基金會(huì)與11個(gè)項(xiàng)目完成捐贈(zèng)簽約
深開鴻捐贈(zèng)M-Robots項(xiàng)目,以開源鴻蒙統(tǒng)一底座推動(dòng)機(jī)器人產(chǎn)業(yè)協(xié)同
樂聚智能LET數(shù)據(jù)集正式捐贈(zèng)至OpenLoong開源社區(qū)
評(píng)論