国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

八大機器學習數據集

DPVg_AI_era ? 來源:lq ? 2019-01-18 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Medium上的一位用戶整理了一份機器學習大型數據集清單,包括八大數據集資源庫??傆幸豢钸m合你,快來收藏吧!

下面的ML大型數據集,總有一款適合你。

就目前來看,找到一個特定的數據集來解決各種機器學習問題,甚至進行實驗還是比較困難的。

本文作者Will Badr便列舉了八大機器學習數據集。

不僅包含用于實驗的大型數據集,還附帶對數據集的描述以及使用示例。有的還包含用于解決與該數據集相關機器學習問題的算法代碼。

話不多說,上數據集!

1、Kaggle數據集

數據集地址:

https://www.kaggle.com/datasets

這是作者最喜歡的數據集之一。

每個數據集都是一個小型社區,用戶可以在其中討論數據、查找公共代碼或在內核中創建自己的項目。包含各式各樣的真實數據集。

用戶還可以看到與每個數據集相關的“內核”,許多數據科學家還提供了相關手冊來分析數據集。

2、Amazon數據集

數據集地址:

https://registry.opendata.aws/

該數據源包含多個不同領域的數據集,如:公共交通、生態資源、衛星圖像等。

網頁中也有一個搜索框來幫助用戶尋找想要的數據集,還有所有數據集的描述和使用示例,這些數據集信息豐富且易于使用!

數據集存儲在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個高度可伸縮的對象存儲服務。

如果用戶正在使用AWS進行機器學習實驗和開發,這將非常方便,由于它是AWS網絡的本地數據,因此數據集的傳輸將非??臁?/p>

3、UCI機器學習資源庫

數據集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一個來自加州大學信息與計算機科學學院的大型資源庫,包含100多個數據集。

用戶可以找到單變量和多變量時間序列數據集,分類、回歸或推薦系統的數據集。

有些UCI的數據集已經是被清洗過的。

4、谷歌數據集搜索引

數據集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他們最擅長的事情,推出了另一項偉大的服務——它是一個可以按名稱搜索數據集的工具箱。

他們的目標是統一成千上萬個不同的數據集存儲庫,使這些數據能夠且易被發現。

5、微軟數據集

數據集地址:

https://msropendata.com/

2018年7月,微軟與外部研究社區共同宣布推出“Microsoft Research Open Data”。

它在云中包含一個數據存儲庫,用于促進全球研究社區之間的協作。它提供了一系列用于已發表研究的、經過處理的數據集。

6、Awesome Public Datasets Collection

數據集地址:

https://github.com/awesomedata/awesome-public-datasets

這是一個按“主題”組織的數據集,比如生物學、經濟學、教育學等。

這里列出的大多數數據集都是免費的,但是在使用任何數據集之前,用戶需要檢查一下許可要求。

7、政府數據集

政府相關數據集也很容易找到的。

許多國家為了提高透明度,向公眾分享了各種數據集。以下是一些例子:

歐盟開放數據門戶:歐洲政府數據集。

數據集地址:

https://data.europa.eu/euodp/data/dataset

美國政府數據:目前由于一些非政治性原因,暫時無法訪問。

數據集地址:

https://www.data.gov/

新西蘭政府數據集:

數據集地址:

https://catalogue.data.govt.nz/dataset

印度政府數據集:

數據集地址:

https://data.gov.in/

8、計算機視覺數據集

數據集地址:

https://www.visualdata.io/

Visual Data包含一些可以用來構建計算機視覺(CV)模型的大型數據集。

用戶可以通過特定的CV主題查找特定的數據集,如語義分割、圖像標題、圖像生成,甚至可以通過解決方案(自動駕駛汽車數據集)查找特定的數據集。

總結

從上述作者所觀察到數據集情況來看,似乎是涵蓋各個方向和領域。

這些新數據集的社區將繼續發展,使數據更容易被獲取,使眾包和計算機科學社區能夠繼續快速創新,為生活帶來更多創造性的解決方案。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98042
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136931
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26190

原文標題:【收藏】8款大型機器學習數據集頂級資源

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器學習特征工程:分類變量的數值化處理方法

    編碼是機器學習流程里最容易被低估的環節之一,模型沒辦法直接處理文本形式的分類數據,尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發表于 02-10 15:58 ?329次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>特征工程:分類變量的數值化處理方法

    CITE2026公布八大關鍵詞,解構2026電子信息行業發展新態勢

    聚焦產業前沿與核心趨勢,特別圍繞 “八大關鍵詞” 構建展示框架,為業界呈現一場前瞻洞察、技術展示、交流合作于一體的科技盛宴。 1、 消費電子 近年來,隨著5G、人工智能、物聯網等技術的快速發展,智能手機、智能家居、可穿戴設備等新興產品需求
    的頭像 發表于 02-03 10:35 ?330次閱讀
    CITE2026公布<b class='flag-5'>八大</b>關鍵詞,解構2026電子信息行業發展新態勢

    八大常見芯片封裝類型及應用!

    的話,給大家盤點八大主流芯片封裝形式,看完就能分清它們的用途~01DIP雙列直插式封裝個常見芯片封裝類型作為很經典的封裝形式,DIP的引腳從兩側對稱引出,材料有塑
    的頭像 發表于 02-02 15:01 ?562次閱讀
    <b class='flag-5'>八大</b>常見芯片封裝類型及應用!

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據
    的頭像 發表于 01-07 15:37 ?187次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    從原理到場景:工業光電傳感器八大檢測原理

    在工業自動化的世界里,光電傳感器如同機器的“眼睛”,時刻感知環境、檢測物體,讓自動化成為可能。作為深耕光電傳感多年的傳感器專家,本期小明將帶大家深入了解工業光電傳感器的經典八大檢測原理,揭秘它們
    的頭像 發表于 11-18 07:33 ?1318次閱讀
    從原理到場景:工業光電傳感器<b class='flag-5'>八大</b>檢測原理

    RK3576機器人核心:三屏異顯+路攝像頭,重塑機器人交互與感知

    瑞芯微RK3576 AIoT處理器處理器憑借其卓越的多屏異顯與8路攝像頭接入能力,為機器人領域帶來革新。米爾電子MYD-LR3576開發板實測數據顯示,在高負載下CPU占用僅34%,完美實現多路視覺
    發表于 10-29 16:41

    【Sipeed MaixCAM Pro開發板試用體驗】 + 04 + 機器學習YOLO體驗

    、 機器學習YOLO體驗 1.在線訓練 Sipeed矽速科技擁有自研搭建的MaixHub平臺,可以快速簡單的完成yolo訓練。 下面我將展示訓練拍攝標注和訓練的相關圖片 數據
    發表于 07-24 21:35

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2885次閱讀

    江智原創性老人八大關鍵時光點全覆蓋 康養生態軟件系統

    深圳市江智工業技術有限公司從2016年開始專注康養機器人10年來的努力,專注老人穿戴,飲食,居住,出行,作息,文旅,健康,內心八大關鍵時光節點全覆蓋的全球原創性的康養軟件系統于2025年6月正式發布
    的頭像 發表于 06-29 20:54 ?1062次閱讀
    江智原創性老人<b class='flag-5'>八大</b>關鍵時光點全覆蓋 康養生態軟件系統

    使用AICube導入數據點創建后提示數據不合法怎么處理?

    重現步驟 data目錄下 labels.txt只有英文 **錯誤日志** 但是使用示例的數據可以完成訓練并部署
    發表于 06-24 06:07

    數據下載失敗的原因?

    數據下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓練報錯網絡錯誤 大的數據多大?數據量有多少?
    發表于 06-18 07:04

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節,今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發表于 04-01 00:00

    Raspberry Pi Pico 2 上實現:實時機器學習(ML)音頻噪音抑制功能

    程序的開發方式。應用程序開發人員現在可以為所需系統整理包含大量輸入和輸出示例的數據,然后使用這些數據來訓練ML模型。在訓練過程中,ML模型從輸入和輸出中
    的頭像 發表于 03-25 09:46 ?1219次閱讀
    Raspberry Pi Pico 2 上實現:實時<b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)音頻噪音抑制功能

    NVIDIA推出開源物理AI數據

    標準化合成數據的初始版本預計將成為世界上最大的此類數據,目前已作為開源版本提供給機器人開發人員。
    的頭像 發表于 03-24 17:52 ?1031次閱讀

    請問NanoEdge AI數據該如何構建?

    我想用NanoEdge來識別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數據的問題,請問我該怎么構建數據?或者生成模型失敗還會有哪些原因?
    發表于 03-10 08:20