国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

系統機器學習算法總結知識分享

zhKF_jqr_AI ? 來源:未知 ? 作者:steve ? 2017-12-15 14:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Statsbot數據科學家Daniil Korbut簡明扼要地介紹了用于推薦系統的主流機器學習算法:協同過濾、矩陣分解、聚類、深度學習

現在有許多公司使用大數據來制定高度相關的建議以提高收入。數據科學家需要根據業務的限制和需求,在各種推薦算法中選擇最好的算法。

為了簡化這一任務,Statsbot團隊準備了一份現有主要推薦系統算法的概覽。

協同過濾

協同過濾(collaborative filtering, CF)及其改版是最常用的推薦算法之一。 即使是數據科學初學者也可以使用它來構建他們的個人電影推薦系統,比如用它寫一個簡歷項目。

當我們想向用戶推薦東西時,最符合邏輯的做法是找到有相似興趣的人,分析他們的行為,然后給我們的用戶推薦相同的東西。 或者我們可以查看與用戶之前所購類似的物品,并進行相應的推薦。

這正是CF的兩種基本方法:基于用戶的協作過濾和基于物品的協作過濾。

在這兩種情形下,推薦引擎分兩步:

  1. 找出數據庫中有多少用戶/物品與給定的用戶/物品類似。

  2. 評估其他用戶/物品,這一評估基于比待評估用戶/物品更相似的用戶/物品的總權重,以預測給用戶推薦相應產品的評分。

算法中的“最相似”是什么意思?

假設我們有一個表示每個用戶的偏好的向量(矩陣 R的行)和一個表示用戶給每件產品評分的向量(矩陣 R的列)。

首先,讓我們去除一些元素,只保留兩個向量中值均已知的元素。

例如,如果我們想比較比爾和簡,我們可以看到,比爾還沒有看過《泰坦尼克號》,而簡到現在為止還沒看過《蝙蝠俠》,所以我們只能通過《星球大戰》來衡量他們的相似性。怎么會有人不看《星球大戰》,是吧?:)

最流行的衡量相似性的技術是用戶/物品向量之間的余弦相似性或加權平均數。

矩陣分解

下一個有趣的算法是矩陣分解。這是一個非常優雅的推薦算法,因為使用矩陣分解時通常不用考慮要在結果矩陣的列和行中保留的物品。

u是第i個用戶的興趣向量,v是表示第j部電影的參數的向量。因此,我們可以使用u和v的點積來逼近x(第i個用戶對第j部電影的評分)。我們使用已知評分來構建這些向量,并使用它們來預測未知評分。

例如,我們有表示用戶特德的向量(1.4; .9)和表示電影A的向量(1.4; .8),矩陣分解之后我們可以直接通過計算(1.4; .9)和(1.4; .8)的點積來還原電影A——特德的評分,結果為2.68。

聚類

前面兩個推薦算法非常簡單,比較適合小型系統。到目前為止,我們將推薦問題看作一個監督學習任務。現在到了應用無監督方法來解決這個問題的時候了。

想象一下,我們正在建立一個大型推薦系統,協同過濾和矩陣分解會花很長時間。這時第一個想到的應該是聚類(clustering)。

根據屬于同一聚類的所有客戶的偏好,每個聚類會被分配一個典型偏好。每個聚類中的客戶將收到在聚類層次計算出的推薦。

業務初期缺乏用戶評分,因此聚類會是最佳選擇。

不過,單獨使用的話,聚類有點弱。因為通過聚類,我們識別出用戶群組,然后給同一群組中的每個用戶都推薦相同的物品。當我們有足夠多的數據的時候,更好的選擇是將聚類作為第一步,用來調整相關用戶/物品選取,以供協同過濾算法使用。聚類也能提升復雜推薦系統的性能。

深度學習

十年來,神經網絡有一個巨大的飛躍。今天,神經網絡被應用到許多領域,正逐漸取代傳統的機器學習方法。我想談一下YouTube使用的深度學習方法。

毫無疑問,為這樣的服務打造推薦系統是一項非常具有挑戰性的任務,因為這一服務的規模很大,語料庫是動態的,還有各種難以觀察的外部因素。

根據《YouTube推薦系統的深度神經網絡》,YouTube推薦系統算法包括兩個神經網絡:一個用于生成候選視頻,另一個用于排名。如果你沒有足夠的時間閱讀上面的論文,我這里有一個快速總結。

接受用戶的歷史事件作為輸入,候選生成網絡顯著減少了視頻的數量,從一個巨大的語料庫抽取出一組相關性最高的視頻。生成的候選視頻是最和用戶相關的,我們即將預測用戶給候選視頻的評分。這個網絡的目標只是通過協同過濾來提供一些范圍較廣的個性化候選視頻。

接下來我們需要更仔細地分析這些候選視頻,以挑選出其中最好的視頻。我們通過評分網絡完成這一任務,評分網絡可以通過一個期望目標函數給每個視頻賦值一個分數,該期望目標函數使用描述視頻的數據和有關用戶行為的信息。評分最高的那些視頻將被推薦給用戶。

使用這一兩步方法,我們可以基于一個非常巨大的視頻語料庫推薦視頻,同時保證推薦的少量視頻是個性化的。這一設計也允許我們混合從其他來源生成的候選視頻。

這一推薦任務構成了一個極端多類分類(extreme multiclass classification)問題,基于用戶(U)和情境(C)精確地分類在給定時刻t觀看(wt)的特定視頻,這一視頻取自一個語料庫(V),總共有數百萬的視頻類別(i)。

構建你自己的推薦系統

  • 基于大型數據庫的在線推薦,最好的辦法是將這個問題拆分成兩個子問題:1)選擇排名最高的N個候選 2)對它們進行評分。

  • 如何評估模型質量?除了標準的質量指標之外,還有一些特別針對推薦問題的指標:Recall at K和Precision at K,Average Recall at K和Average Precision at K。另外可以參考《A Survey of Accuracy Evaluation Metrics of Recommendation Task》(JMLR 10 (2009))

  • 如果使用分類算法解決推薦問題,則應考慮生成負樣本。如果用戶購買了推薦的物品,不應將其作為正樣本,也不應將未購買的推薦物品作為負樣本。

  • 基于在線分數和離線分數考量算法質量。 僅使用歷史數據的訓練模型可能導向簡陋的推薦系統,因為該算法不知道新的潮流和偏好。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 聚類
    +關注

    關注

    0

    文章

    146

    瀏覽量

    14718
  • 協同過濾
    +關注

    關注

    0

    文章

    45

    瀏覽量

    10144
  • 矩陣分解
    +關注

    關注

    1

    文章

    13

    瀏覽量

    3781

原文標題:推薦系統機器學習算法概覽

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學科的技能,涵蓋數學基礎、編程能力、算法理論、工程實踐以及業務理解等多個方面。 以下是具體技能及學習建議: 線性代數核心內容:矩陣運算、特征值分解、向量空間等。應用場
    發表于 02-27 10:53

    穿孔機頂頭檢測儀 機器視覺深度學習

    LX01Z-DG626穿孔機頂頭檢測儀采用深度學習技術,能夠實現頂頭狀態的在線實時檢測,頂頭丟失報警,頂頭異常狀態報警等功能,響應迅速,異常狀態視頻回溯,檢測頂頭溫度,配備吹掃清潔系統,維護周期長
    發表于 12-22 14:33

    AI 驅動三維逆向:點云降噪算法工具與機器學習建模能力的前沿應用

    在三維逆向工程領域,傳統方法在處理復雜數據和構建高精度模型時面臨諸多挑戰。隨著人工智能(AI)技術的發展,點云降噪算法工具與機器學習建模能力的應用,為三維逆向工程帶來了創新性解決方案,顯著提升
    的頭像 發表于 08-20 10:00 ?692次閱讀
    AI 驅動三維逆向:點云降噪<b class='flag-5'>算法</b>工具與<b class='flag-5'>機器</b><b class='flag-5'>學習</b>建模能力的前沿應用

    PID控制算法學習筆記資料

    用于新手學習PID控制算法
    發表于 08-12 16:22 ?7次下載

    FPGA在機器學習中的具體應用

    ,越來越多地被應用于機器學習任務中。本文將探討 FPGA 在機器學習中的應用,特別是在加速神經網絡推理、優化算法和提升處理效率方面的優勢。
    的頭像 發表于 07-16 15:34 ?2885次閱讀

    機器學習異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測系統

    本文轉自:DeepHubIMBA無監督異常檢測作為機器學習領域的重要分支,專門用于在缺乏標記數據的環境中識別異常事件。本文深入探討異常檢測技術的理論基礎與實踐應用,通過IsolationForest
    的頭像 發表于 06-24 11:40 ?1409次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測<b class='flag-5'>系統</b>

    使用MATLAB進行無監督學習

    無監督學習是一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識
    的頭像 發表于 05-16 14:48 ?1435次閱讀
    使用MATLAB進行無監督<b class='flag-5'>學習</b>

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    學習建議 對于初學者,建議先通過仿真(如Gazebo)驗證算法,再遷移到真實機器人,以降低硬件調試成本。 多參與開源社區(如ROS2的GitHub項目),學習前沿技術并貢獻代碼
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+內容初識

    、軟件開發、系統集成等環節,讓讀者能夠全面了解一個完整的機器人應用開發過程。 實踐項目:除了案例分析,書中還設計了一些實踐項目,供讀者進行動手實踐。這些實踐項目涵蓋了從簡單的傳感器數據處理到復雜的多機器
    發表于 04-27 11:24

    機器人主控芯片平臺有哪些 機器人主控芯片一文搞懂

    AI芯片在人形機器人中的應用越來越廣泛。這些AI芯片專門設計用于執行人工智能算法,如深度學習機器學習等。
    的頭像 發表于 04-25 16:26 ?7578次閱讀
    <b class='flag-5'>機器</b>人主控芯片平臺有哪些  <b class='flag-5'>機器</b>人主控芯片一文搞懂

    復合機器人為什么要使用單點糾偏算法

    復合機器人單點糾偏算法
    的頭像 發表于 04-20 14:59 ?687次閱讀
    復合<b class='flag-5'>機器</b>人為什么要使用單點糾偏<b class='flag-5'>算法</b>?

    進群免費領FPGA學習資料!數字信號處理、傅里葉變換與FPGA開發等

    的基礎知識,講述了確定性數字信號處理的知識,包括離散時間信號及系統的介紹、z變換、傅里葉變換、頻率分析以及濾波器設計等。介紹了隨機數字信號處理的知識,主要
    發表于 04-07 16:41

    十大鮮為人知卻功能強大的機器學習模型

    本文轉自:QuantML當我們談論機器學習時,線性回歸、決策樹和神經網絡這些常見的算法往往占據了主導地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強大的算法,它們能夠
    的頭像 發表于 04-02 14:10 ?1093次閱讀
    十大鮮為人知卻功能強大的<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    機器學習算法,解決傳感器數據采集難題! 1. nRF54系列支持OTA嗎? 答:支持!nRF54L系列基于Zephyr的MCUBOOT和SMP DFU庫,支持BLE和UART等多種OTA方式
    發表于 04-01 00:00

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發表于 03-13 07:34