国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

成功構(gòu)建文本分析工作流的四個(gè)步驟

星星科技指導(dǎo)員 ? 來(lái)源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Seth DeLand ? 2022-11-23 15:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文本分析(從原始人類語(yǔ)言中發(fā)現(xiàn)隱藏模式以實(shí)現(xiàn)更好的決策和預(yù)測(cè)的過(guò)程)為工業(yè)和預(yù)測(cè)性維護(hù)系統(tǒng)提供了幾個(gè)好處。這些分析使工程師能夠利用原始文本數(shù)據(jù)輕松生成有關(guān)維護(hù)記錄的見(jiàn)解,并構(gòu)建故障預(yù)測(cè)算法以預(yù)防潛在問(wèn)題。

以非公路商業(yè)空間為例,在建筑工地上使用重型設(shè)備:如果一臺(tái)重型設(shè)備發(fā)生故障,在修復(fù)系統(tǒng)所需的時(shí)間和成本與施工停滯時(shí)現(xiàn)場(chǎng)的停機(jī)時(shí)間之間,可能會(huì)發(fā)生代價(jià)高昂的故障。傳統(tǒng)上,來(lái)自此設(shè)備的遙測(cè)數(shù)據(jù)已用于構(gòu)建可預(yù)測(cè)未來(lái)故障的預(yù)測(cè)性維護(hù)模型。但是,在機(jī)械師和操作員的文本注釋中也有關(guān)于過(guò)去故障及其原因的寶貴信息。工程師可以利用此文本數(shù)據(jù)來(lái)增強(qiáng)預(yù)測(cè)性維護(hù)模型,并確定應(yīng)解決的模式和故障模式。

文本分析的挑戰(zhàn)在于大量的非結(jié)構(gòu)化原始文本數(shù)據(jù)集,這可能會(huì)使分析工具不堪重負(fù)。這使得工程師更難快速直觀地提取用戶可能獲得的所有有價(jià)值的信息。但是,工程師可以通過(guò)正確的工具和遵守端到端工作流程來(lái)克服這些障礙。

當(dāng)涉及到端到端文本分析工作流程時(shí),工程師需要了解什么?工作流中有四個(gè)主要階段:

poYBAGN9yKuALPZSAACS46Gxj18876.png

圖1.端到端文本分析工作流。

第 1 階段:數(shù)據(jù)訪問(wèn)和探索

文本數(shù)據(jù)將來(lái)自各種來(lái)源,包括數(shù)據(jù)庫(kù)、內(nèi)部文件存儲(chǔ)庫(kù)和 Internet,并且格式多種多樣。正確準(zhǔn)備數(shù)據(jù)是成功工作流程的關(guān)鍵因素。適當(dāng)?shù)臄?shù)據(jù)準(zhǔn)備會(huì)將原始文本數(shù)據(jù)清理并預(yù)處理為“清理數(shù)據(jù)”以供分析。

以詞云為例。該模型將數(shù)據(jù)轉(zhuǎn)換為一種格式,使工程師能夠快速輕松地可視化正在使用的單詞以及數(shù)據(jù)池中最常見(jiàn)的短語(yǔ)。當(dāng)與應(yīng)用其領(lǐng)域?qū)I(yè)知識(shí)的工程師相結(jié)合時(shí),諸如詞云之類的可視化效果有利于更大的文本分析工作流程,因?yàn)楣こ處熆梢暂p松發(fā)現(xiàn)數(shù)據(jù)可能缺少標(biāo)記或需要清理的地方,因?yàn)樗麄兞私饨o定環(huán)境或用例中的典型問(wèn)題或問(wèn)題。

第 2 階段:數(shù)據(jù)預(yù)處理

這些可視化效果還有助于指導(dǎo)需要采取的后續(xù)操作。如圖 2 所示,停用詞(不增加價(jià)值的低信息詞)很常見(jiàn),它們的存在會(huì)扭曲可視化結(jié)果。在工程師開(kāi)始模型開(kāi)發(fā)過(guò)程之前,他們必須清理原始文本數(shù)據(jù),以過(guò)濾掉這些“停用詞”,并輸入真實(shí)、重要的數(shù)據(jù)以傳遞給建模過(guò)程。預(yù)處理階段允許用戶從原始文本中提取有意義的單詞。

數(shù)據(jù)清理通常是數(shù)據(jù)分析中最耗時(shí)的部分,根據(jù)數(shù)據(jù)量,清理步驟可能需要多次迭代。但是,投入所需的額外時(shí)間和資源所帶來(lái)的投資回報(bào)率允許在文本分析工作流的后期使用更準(zhǔn)確和成功的模型。在許多情況下,干凈的詞云會(huì)傳遞有關(guān)文本頁(yè)面上實(shí)際內(nèi)容的更多信息。

文本分析工具箱等工具通過(guò)提供用于預(yù)處理、分析和建模文本數(shù)據(jù)的算法和可視化,幫助用戶為模型構(gòu)建過(guò)程做好準(zhǔn)備,從而為工程師解決數(shù)據(jù)清理痛點(diǎn)。

這些工具從流行的文件格式中提取文本,從設(shè)備日志、新聞提要、調(diào)查、操作員報(bào)告和社交媒體等來(lái)源預(yù)處理原始文本,提取利用文本、數(shù)字和其他類型的數(shù)據(jù)的單個(gè)單詞或多詞短語(yǔ) (n-gram),將文本轉(zhuǎn)換為數(shù)字表示,然后構(gòu)建統(tǒng)計(jì)模型。

第 3 階段:預(yù)測(cè)模型構(gòu)建

清理和預(yù)處理數(shù)據(jù)后,就可以開(kāi)始使用機(jī)器學(xué)習(xí)深度學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型了。

這就是文本分析的優(yōu)勢(shì)所在:它發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式并以直觀的格式顯示它們,允許用戶消化數(shù)據(jù),然后采取糾正措施解決問(wèn)題,然后再進(jìn)一步進(jìn)入工作流程。

以將干凈的文本數(shù)據(jù)轉(zhuǎn)換為數(shù)字形式為例。工程師可以應(yīng)用“詞袋”等建模方法,該方法根據(jù)提供的文本數(shù)據(jù)創(chuàng)建一個(gè)數(shù)字矩陣,顯示每個(gè)單詞的使用頻率。從那里,工程師可以使用預(yù)測(cè)模型,如潛在狄利克雷分配(LDA)模型,該模型可以擬合到單詞/頻率矩陣中,以發(fā)現(xiàn)文本數(shù)據(jù)集中隱藏的主題和見(jiàn)解。

LDA 模型可以生成與數(shù)據(jù)中“隱藏主題”相關(guān)的詞云,顯示將文本數(shù)據(jù)擬合到此預(yù)測(cè)模型中后如何開(kāi)始出現(xiàn)模式,從而幫助為創(chuàng)建相應(yīng)問(wèn)題的解決方案提供信息。

使用新的敘述對(duì)模型(如上面示例中的模型)進(jìn)行測(cè)試以驗(yàn)證模型的預(yù)測(cè)是否正確后,可以建立自動(dòng)警報(bào),以便系統(tǒng)在需要注意的任何問(wèn)題上向響應(yīng)團(tuán)隊(duì)發(fā)送標(biāo)志。如果位置數(shù)據(jù)也可用,則結(jié)果會(huì)發(fā)現(xiàn)某些主題(例如,標(biāo)記的問(wèn)題)與其位置數(shù)據(jù)之間存在相關(guān)性,因此該模型還可以通過(guò)使用多個(gè)數(shù)據(jù)流來(lái)補(bǔ)充文本數(shù)據(jù)來(lái)提醒響應(yīng)團(tuán)隊(duì)潛在的更大基礎(chǔ)設(shè)施問(wèn)題。

第 4 階段:見(jiàn)解和預(yù)測(cè)模型部署

使用文本分析設(shè)置模型并驗(yàn)證其可接受的性能后,可通過(guò)多種方式與工程團(tuán)隊(duì)和/或管理層共享結(jié)果和模型,包括生成報(bào)告或交互式筆記本(例如 MATLAB Live 編輯器)、將數(shù)據(jù)傳送到桌面或 Web 應(yīng)用程序(例如 MATLAB 應(yīng)用程序設(shè)計(jì)器),或在生產(chǎn)服務(wù)器或 Web 應(yīng)用程序服務(wù)器上托管應(yīng)用程序。

對(duì)于工業(yè)自動(dòng)化、機(jī)械、汽車制造、航空航天設(shè)計(jì)或能源分配等行業(yè)的工程師來(lái)說(shuō),文本分析可以幫助他們執(zhí)行復(fù)雜的數(shù)值分析,以識(shí)別可以帶來(lái)更好結(jié)果并改進(jìn)預(yù)測(cè)性維護(hù)等功能的想法和概念組。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編輯器
    +關(guān)注

    關(guān)注

    1

    文章

    828

    瀏覽量

    32916
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136982
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124411
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    開(kāi)發(fā)工作流創(chuàng)建工作流

    擇要使用的節(jié)點(diǎn)。 2、將節(jié)點(diǎn)按任務(wù)流程相連接。 3、配置節(jié)點(diǎn)的輸入和輸出參數(shù) 測(cè)試并發(fā)布工作流 開(kāi)發(fā)者如需在智能體內(nèi)使用該工作流,必須先完成工作流的上架。 1、單擊【試運(yùn)行】,運(yùn)行成功
    發(fā)表于 03-10 10:05

    PCBA生產(chǎn)過(guò)程的四個(gè)主要環(huán)節(jié)?

    PCBA生產(chǎn)過(guò)程的四個(gè)主要環(huán)節(jié) PCBA(Printed Circuit Board Assembly)生產(chǎn)過(guò)程是將電子元器件組裝到印刷電路板(PCB)上,形成完整電子產(chǎn)品的過(guò)程。雖然直接參考資料
    的頭像 發(fā)表于 03-05 11:13 ?160次閱讀

    虛幻引擎5在建筑可視化中的應(yīng)用:趨勢(shì)、挑戰(zhàn)與基于Perforce P4的工作流

    UE5正在重塑建筑可視化:實(shí)時(shí)交互、AI輔助、BIM聯(lián)動(dòng)......技術(shù)紅利已來(lái),工作流卻拖了后腿?這篇干貨解析了趨勢(shì)和痛點(diǎn),更揭秘了如何用Perforce P4打造高效的UE5工作流
    的頭像 發(fā)表于 02-27 15:26 ?297次閱讀
    虛幻引擎5在建筑可視化中的應(yīng)用:趨勢(shì)、挑戰(zhàn)與基于Perforce P4的<b class='flag-5'>工作流</b>程

    安寶特方案丨AI 識(shí)別遇上 AR 工作流,PCB 質(zhì)控迎來(lái)新的「黃金時(shí)代」

    差異和流程不一致長(zhǎng)期制約良率,而基于AR標(biāo)準(zhǔn)化工作流+AI識(shí)別的應(yīng)用,正讓所有工位實(shí)現(xiàn)“無(wú)差別準(zhǔn)確執(zhí)行”。01破解人工質(zhì)檢困境:讓標(biāo)準(zhǔn)化操作如臨現(xiàn)場(chǎng)Arbigtec
    的頭像 發(fā)表于 02-10 11:35 ?358次閱讀
    安寶特方案丨AI 識(shí)別遇上 AR <b class='flag-5'>工作流</b>,PCB 質(zhì)控迎來(lái)新的「黃金時(shí)代」

    小藝開(kāi)放平臺(tái)平臺(tái)功能

    選擇插件、工作流,響應(yīng)用戶需求。LLM模式適用于簡(jiǎn)單對(duì)話、知識(shí)問(wèn)答、基礎(chǔ)內(nèi)容生成等場(chǎng)景。 工作流模式 工作流模式是一種基于規(guī)則化流程的智能體編排方式。開(kāi)發(fā)者將復(fù)雜任務(wù)拆解為有序的規(guī)則化步驟
    發(fā)表于 01-30 15:24

    合科泰MOSFET選型的四個(gè)核心步驟

    面對(duì)數(shù)據(jù)手冊(cè)中繁雜的參數(shù),如何快速鎖定適合應(yīng)用的 MOSFET?遵循以下四個(gè)核心步驟,您能系統(tǒng)化地完成選型,避免因關(guān)鍵參數(shù)遺漏導(dǎo)致的設(shè)計(jì)風(fēng)險(xiǎn)。
    的頭像 發(fā)表于 12-19 10:33 ?741次閱讀

    軸無(wú)人機(jī)是如何工作的?

    才能打造一架屬于自己的軸飛行器?一、軸飛行器如何飛行?本文將重點(diǎn)介紹軸飛行器,但本文解釋的很多內(nèi)容也適用于其他配備四個(gè)以上螺旋槳的飛行器。因此,如果你正在
    的頭像 發(fā)表于 11-14 10:28 ?829次閱讀
    <b class='flag-5'>四</b>軸無(wú)人機(jī)是如何<b class='flag-5'>工作</b>的?

    借助NVIDIA技術(shù)構(gòu)建實(shí)時(shí)視覺(jué)檢測(cè)工作流

    構(gòu)建一套可靠的視覺(jué)檢測(cè)流程來(lái)實(shí)現(xiàn)缺陷檢測(cè)和質(zhì)量控制面臨諸多挑戰(zhàn),例如針對(duì)特定領(lǐng)域定制通用視覺(jué) AI 模型、在算力受限的邊緣設(shè)備上優(yōu)化模型規(guī)模,以及高效實(shí)時(shí)部署以實(shí)現(xiàn)最大的推理吞吐量。
    的頭像 發(fā)表于 10-21 11:01 ?958次閱讀
    借助NVIDIA技術(shù)<b class='flag-5'>構(gòu)建</b>實(shí)時(shí)視覺(jué)檢測(cè)<b class='flag-5'>工作流</b>

    【產(chǎn)品介紹】Altair SimLab可連接CAD的多物理場(chǎng)工作流

    AltairSimLab可連接CAD的多物理場(chǎng)工作流SimLab是一種以流程為導(dǎo)向的多學(xué)科仿真環(huán)境,能夠準(zhǔn)確分析復(fù)雜裝配件的性能。包括結(jié)構(gòu)、熱和流體動(dòng)力學(xué)在內(nèi)的多物理場(chǎng)可以通過(guò)高度自動(dòng)化的建模任務(wù)
    的頭像 發(fā)表于 09-19 17:02 ?806次閱讀
    【產(chǎn)品介紹】Altair SimLab可連接CAD的多物理場(chǎng)<b class='flag-5'>工作流</b>

    設(shè)計(jì)優(yōu)先方法論實(shí)踐:SmartBear API Hub +ReadyAPI組合使用,構(gòu)建高效的API開(kāi)發(fā)

    設(shè)計(jì)優(yōu)先是一種在編寫代碼和執(zhí)行測(cè)試之前,優(yōu)先設(shè)計(jì)API接口的開(kāi)發(fā)方式,能夠幫助提升團(tuán)隊(duì)協(xié)作效率、加快開(kāi)發(fā)進(jìn)度、減少Bug和返工,并改善用戶體驗(yàn)。如何實(shí)現(xiàn)?——將該與SmartBear API Hub、ReadyAPI相結(jié)合,可共同構(gòu)建個(gè)完整、一體化的開(kāi)發(fā)
    的頭像 發(fā)表于 06-05 16:03 ?584次閱讀
    設(shè)計(jì)優(yōu)先方法論實(shí)踐:SmartBear API Hub +ReadyAPI組合使用,<b class='flag-5'>構(gòu)建</b>高效的API開(kāi)發(fā)<b class='flag-5'>流</b>

    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開(kāi)關(guān)端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開(kāi)關(guān)端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有
    發(fā)表于 05-28 18:33
    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個(gè)</b>線性 TRx 開(kāi)關(guān)端口 skyworksinc

    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開(kāi)關(guān)端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個(gè)線性 TRx 開(kāi)關(guān)端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊(cè),更有
    發(fā)表于 05-28 18:33
    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個(gè)</b>線性 TRx 開(kāi)關(guān)端口 skyworksinc

    四個(gè)方面深入剖析富捷電阻的優(yōu)勢(shì)

    理成本的電阻產(chǎn)品系列,為電子行業(yè)提供了一個(gè)可靠的選擇。本文將從產(chǎn)品結(jié)構(gòu)、同業(yè)對(duì)比、成本分析以及品質(zhì)保障四個(gè)方面深入剖析富捷電阻的優(yōu)勢(shì),展現(xiàn)其如何在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出。
    的頭像 發(fā)表于 05-09 10:47 ?1105次閱讀
    從<b class='flag-5'>四個(gè)</b>方面深入剖析富捷電阻的優(yōu)勢(shì)

    非技術(shù)人員如何用n8n + DeepSeek打造AI自動(dòng)化工作流

    ? 是一個(gè)開(kāi)源的低代碼自動(dòng)化工作流工具,允許用戶通過(guò)可視化界面連接不同的應(yīng)用程序和服務(wù),實(shí)現(xiàn)任務(wù)自動(dòng)化。 掌握n8n,公司中的非技術(shù)人員也能快速上手自動(dòng)化,通過(guò)畫布的方式,構(gòu)建自動(dòng)化工作流
    的頭像 發(fā)表于 04-09 14:28 ?8464次閱讀
    非技術(shù)人員如何用n8n + DeepSeek打造AI自動(dòng)化<b class='flag-5'>工作流</b>?

    【Android開(kāi)發(fā)者必看】使用JetBrains TeamCity為Android項(xiàng)目構(gòu)建CI/CD管道詳細(xì)指南

    【CI/CD】定義明確的構(gòu)建、測(cè)試和部署工作流對(duì)Android應(yīng)用的開(kāi)發(fā)至關(guān)重要。JetBrains TeamCity是一個(gè)用于構(gòu)建可靠管道的CI/CD平臺(tái),可與流行的Android開(kāi)
    的頭像 發(fā)表于 03-21 15:42 ?1221次閱讀
    【Android開(kāi)發(fā)者必看】使用JetBrains TeamCity為Android項(xiàng)目<b class='flag-5'>構(gòu)建</b>CI/CD管道詳細(xì)指南