国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何讓tSNE在大型、高維數據庫上實時進行可視化的詳細資料概述

zhKF_jqr_AI ? 來源:未知 ? 作者:易水寒 ? 2018-06-10 10:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

tSNE是目前最為流行的一種高維數據降維的算法。在大數據時代,數據不僅越來越多,而且變得越來越復雜,數據維度的轉化也在驚人地增加。對于計算機而言,處理高位數據是沒問題的,但是人類能感知到的只有三個維度,因此很有必要將高維數據進行可視化,tSNE就是講數據集從任意維度降到二維或三維的算法。谷歌的一名實習員工最近提出了一種方法,可以讓tSNE在大型、高維數據庫上實時進行可視化,而且還開源了。以下是論智為大家帶來的編譯。

最近幾年,t分布隨機鄰近嵌入(tSNE)算法已經成為最常用的高維數據分析工具,它經常能提供有深度的見解。在TensorFlow嵌入項目和TensorBoard中用tSNE解釋深度神經網絡的輸出時,其中一個強大的特征是,tSNE在使用時只需要稍微調整參數,就能在不同規模下展現高維數據點的聚類。盡管有這個優點,tSNE算法計算時候的復雜程度也限制了它在很多小數據集上的應用。雖然已經有一些針對這個問題的解決方法(主要關注點在數據點之間相似度計算的可擴展性上),但目前為止當可視化大數據及使用tSNE嵌入時,它們還不能提供真正的互動體驗。

Linear tSNE Optimization for the Web一文中,我們提出了一種解決tSNE高度依賴現代圖形硬件問題的方法。我們的方法比其他類似技術能更快地生成嵌入,甚至可以利用GPU在客戶端的網頁瀏覽器上執行。二者的結合讓大型、高維的數據庫實時可視化成為了可能。另外,我們還在TensorFlow.js中開源了這項成果,希望能帶來更多貢獻。

用我們的方法為全部MNIST數據集進行實時tSNE嵌入演化。該數據集包含60000張手寫數字的圖片

tSNE的目標是聚合相似數據點之間的小“鄰居”,同時降低整體數據的維度使之更加便于可視化。換句話說,tSNE目標函數計算的是在二維或三維空間中這些相似數據的“鄰居”是如何分布的,然后根據此將它們映射到聚類之中。

在之前的研究中,tSNE的目標最小化是作為N-body模擬問題進行的,其中點在嵌入空間中隨機分布,每個點都受到兩種不同類型的力的作用。吸引力會將點與其在高維空間中最相似的點之間的距離越拉越近,同時排斥力使得它們與嵌入中的其他鄰近點越來越遠。

吸引力只作用于一小部分點(也就是有相同近鄰的點),而排斥力在所有成對的點上都有作用。由于這個原因,tSNE需要強大的計算力和多次的目標函數迭代,這就限制了數據庫的尺寸。為了改善這一問題,Barnes-Hut算法就用來近似估算排斥力和目標函數的梯度。這就可以將計算擴展到成千上萬個數據點,但是仍然需要15分鐘以上計算MNIST嵌入。

在我們的論文中,我們提出了解決上述問題的方法,通過利用在WebGL上生成的紋理計算目標函數的梯度近似值。我們的技術利用一個三通道的圖案在每次最小化迭代時都繪制一個“排斥域(repulsive field)”,其中的三個組成元素作為RGB通道中的顏色和形狀。每個點都會得到一個排斥域,用來表示點上水平和豎直方向的排斥力,第三個元素用作歸一化。歸一化要保證轉換過程中的量值對應高維空間的相似度測量方法。除此之外,圖案的分辨率也會根據不同情況調整,以保證像素的數量是不變的。

如何讓tSNE在大型、高維數據庫上實時進行可視化的詳細資料概述

渲染三個用來計算單個點產生的排斥力。上圖顯示了藍色區域中的點被推到了左側和底部,而紅色區域中的點被推倒右側和頂部,而白色區域中的點不會移動

之后每個點的作用都被添加到GPU中,生成與排斥域相似的圖形(如下面的動圖所示)。這種方法比計算點和點之間的作用的方法對GPU更友好。這是因為多個點的排斥力可以在GPU中快速地同時計算。另外,我們在GPU中也計算了點之間的吸引力。

如何讓tSNE在大型、高維數據庫上實時進行可視化的詳細資料概述

tSNE嵌入的演變動畫(左上);用來計算梯度的標量場(右上);水平變換(左下);豎直變換(右下)

我們還將嵌入更新從點對點實現修改為在TensorFlow.js中計算的一系列標準張量操作,這是一個JavaScript庫,用于在Web瀏覽器中執行張量計算。我們已經開源的方法能完全在GPU上實現tSNE嵌入的變換,同時計算復雜性也得以改善。

有了這種只需15分鐘就能在MNIST數據集上完成計算的方法,我們現在可以實時在網頁中進行可視化。另外,這種可視化還能在更大的數據集上實現。但是我們這項成果的主要缺陷就是目前只能在二維嵌入上工作。然而二維可視化卻經常比三維可視化更受歡迎,應為三維可視化需要更多交互才能理解聚類的結果。

未來的工作

我們相信,更快、更易交互的tSNE將大大提高數據分析系統的發展。我們很期待將這項成果用于深度神經網絡。除此之外,我們的實驗表明,在使用GPU計算時的橫向思維(即用RGB圖像計算梯度)可以加速計算。在未來我們將開發更多這類的梯度計算,不僅將其應用于降維算法上,還可以用到其他瀏覽器的N-body模擬中。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135434
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98044
  • 數據庫
    +關注

    關注

    7

    文章

    4019

    瀏覽量

    68339
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26190

原文標題:谷歌實習生提出tSNE在大型高維數據集上實時可視化的方法(附代碼)

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    KubePi:開源Kubernetes可視化管理面板,集群管理如此簡單

    人員 :能夠一個統一的界面上監控和管理所有集群資源,大幅提升效率。 企業IT :實現對跨地域、跨云的Kubernetes集群進行統一管理,提升運效率。 二、核心功能特點:不止于
    發表于 02-11 12:53

    昊衡科技-三場重構軟件,結構的溫度與應變可視化

    溫度/應變場可視化,為多場景監測提供了全新解決方案。圓柱體加載與降溫試驗以圓柱體為測試對象,模擬了“上部加載+中部降溫”的典型工況:軟件演示中的圓柱體,能實時
    的頭像 發表于 01-22 17:32 ?1176次閱讀
    昊衡科技-三<b class='flag-5'>維</b>場重構軟件,<b class='flag-5'>讓</b>結構的溫度與應變<b class='flag-5'>可視化</b>

    工業物聯網可視化平臺是什么?有什么功能?

    工業物聯網可視化平臺是基于物聯網、大數據、人工智能等技術,將工業生產中的設備、系統、流程等數據以圖形方式呈現,實現實時監控、智能分析與交互
    的頭像 發表于 11-17 17:49 ?1272次閱讀

    光伏電站可視化的實現

    ,將光伏電站的物理環境、設備狀態、發電數據等信息以圖形、動態化形式呈現,構建電站虛擬鏡像,從而實現對光伏電站運行狀態的實時監控、故障預測及運優化。 如何實現光伏電站的
    的頭像 發表于 10-21 17:29 ?1155次閱讀
    光伏電站<b class='flag-5'>可視化</b>的實現

    如何使用協議分析儀進行數據分析與可視化

    使用協議分析儀進行數據分析與可視化,需結合數據捕獲、協議解碼、統計分析及可視化工具,將原始數據轉化為可解讀的圖表和報告。以下是
    發表于 07-16 14:16

    數據庫數據恢復—MongoDB數據庫文件丟失的數據恢復案例

    將MongoDB數據庫文件拷貝到其他分區,數據復制完成后將MongoDB數據庫原先所在的分區進行了格式操作。 結果發現拷貝過去的
    的頭像 發表于 07-01 11:13 ?638次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—MongoDB<b class='flag-5'>數據庫</b>文件丟失的<b class='flag-5'>數據</b>恢復案例

    VirtualLab:光學系統的三可視化

    摘要 為了對光學系統的性質有一個基本的了解,對其組件的可視化和光傳播的提示是非常有幫助的。為此,VirtualLab Fusion提供了一個工具來顯示光學系統的三視圖。這些工具可以進一步用于檢查
    發表于 05-30 08:45

    如何實現光伏數字孿生可視化

    光伏數字孿生可視化是通過數字手段構建光伏電站的虛擬鏡像,實現物理實體與數字模型的實時映射與交互,目的是促進光伏電站運管理的智能、高效
    的頭像 發表于 05-29 15:27 ?701次閱讀
    如何實現光伏數字孿生<b class='flag-5'>可視化</b>?

    工業設備可視化管理系統是什么

    工業設備可視化管理系統是一種基于物聯網(IoT)、大數據、云計算、數字孿生等技術,對工業設備的運行狀態、性能參數、維護信息等進行實時監測、數據
    的頭像 發表于 05-27 14:56 ?1123次閱讀
    工業設備<b class='flag-5'>可視化</b>管理系統是什么

    光伏電站可視化這種技術的難點有哪些?

    通過數字孿生、三建模、數據融合等技術,將光伏電站的物理環境、設備狀態、發電數據等信息以圖形、動態的形式呈現,這便是光伏電站
    的頭像 發表于 05-15 10:56 ?626次閱讀

    結構可視化:利用數據編輯器剖析數據內在架構?

    流動路徑,為數據驅動的決策提供堅實基礎。借助數據編輯器,企業還能更便捷地對可視化呈現的數據進行編輯、調整,以滿足不同分析場景的需求,進一步優
    的頭像 發表于 05-07 18:42 ?656次閱讀

    工業設備數據集中監控可視化管理平臺是什么

    工業設備數據集中監控可視化管理平臺是一種用于整合、監控和可視化工業設備數據的綜合性系統,旨在幫助企業實現設備數據的集中管理、
    的頭像 發表于 05-06 11:10 ?1062次閱讀

    SEGGER emFile支持大型數據庫

    SEGGER宣布emFile對大型數據庫的支持,集成了SQLite,方便與SEGGER的BigFAT和微軟的exFAT一起使用。
    的頭像 發表于 04-23 15:51 ?776次閱讀

    可視化組態物聯網平臺是什么

    可視化組態物聯網平臺是物聯網技術與組態技術相結合的產物,是通過提供豐富的圖形組件和可視化元素,用戶能夠以直觀、便捷的方式對物聯網數據
    的頭像 發表于 04-21 10:40 ?892次閱讀

    VirtualLab Fusion應用:光學系統的3D可視化

    摘要 為了從根本上了解光學系統的特性,對其組件進行可視化并顯示光的傳播情況大有幫助。為此,VirtualLab Fusion 提供了顯示光學系統三可視化的工具。這些工具還可用于檢查
    發表于 04-02 08:42