資料介紹
相似重復(fù)記錄識(shí)別是數(shù)據(jù)清理中的一個(gè)關(guān)鍵問(wèn)題。文章針對(duì)常用的多趟鄰接排序法提出了兩點(diǎn)改進(jìn):一是在多趟排序識(shí)別過(guò)程中直接合并有重疊的相似記錄集,取消了最后計(jì)算傳遞閉包的環(huán)節(jié);二是利用關(guān)鍵字按字典序排序的特性,在求編輯距離之前先過(guò)濾前面的公共子串,減少了相似記錄比較的開(kāi)銷(xiāo)。文章最后給出了改進(jìn)算法與原算法的對(duì)比試驗(yàn)結(jié)果。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 基于MFCC與改進(jìn)ACF的汽車(chē)聲音識(shí)別算法研究_蔣翠清
- 一種改進(jìn)的局部和相似度保持特征選擇算法 12次下載
- 基于改進(jìn)CNN網(wǎng)絡(luò)與集成學(xué)習(xí)的人臉識(shí)別算法 6次下載
- 采用余弦相似度的習(xí)俗非負(fù)矩陣分解算法 7次下載
- 針對(duì)協(xié)同過(guò)濾推薦算法的相似度計(jì)算方法 6次下載
- 一種用于釋義識(shí)別的句子相似度算法 8次下載
- 一種改進(jìn)的聚類(lèi)聯(lián)合相似度推薦算法 10次下載
- 基于多比特識(shí)別的射頻識(shí)別標(biāo)簽防碰撞算法 3次下載
- 基于數(shù)據(jù)一致性的記錄比較方法 0次下載
- 改進(jìn)的HMAX算法應(yīng)用與車(chē)型識(shí)別 0次下載
- 改進(jìn)BP算法的圖像識(shí)別 7次下載
- 網(wǎng)上錄取數(shù)據(jù)處理中重復(fù)記錄去除程序的設(shè)計(jì)_董國(guó)鋼 0次下載
- 改進(jìn)的BP網(wǎng)絡(luò)算法在圖像識(shí)別中的應(yīng)用
- 一種基于重復(fù)串的STC改進(jìn)算法
- 基于屬性相似度的決策樹(shù)算法
- 基于改進(jìn)FCOS的鋼帶表面缺陷檢測(cè)算法 2.5k次閱讀
- 基于射頻識(shí)別系統(tǒng)中動(dòng)態(tài)ALOHA算法的改進(jìn)設(shè)計(jì) 4.1k次閱讀
- 用于實(shí)現(xiàn)并行處理加速硬件的H.264算法的改進(jìn)和優(yōu)化 3k次閱讀
- 重復(fù)接地種類(lèi)_重復(fù)接地電阻是多少 3.8w次閱讀
- 重復(fù)接地是什么意思_重復(fù)接地的作用有哪些 3.2w次閱讀
- 基于動(dòng)態(tài)矩陣方法改進(jìn)了傳統(tǒng)CACC模型預(yù)測(cè)控制算法 7.4k次閱讀
- 基于數(shù)字特征的識(shí)別算法設(shè)計(jì)實(shí)現(xiàn) 1.2w次閱讀
- 關(guān)聯(lián)規(guī)則挖掘——Apriori算法的基本原理以及改進(jìn) 9.8k次閱讀
- 基于matlab的文字識(shí)別算法 3w次閱讀
- 人臉識(shí)別算法分析 7.5k次閱讀
- 從應(yīng)用、算法、芯片角度了解語(yǔ)音識(shí)別技術(shù) 8.2k次閱讀
- 仿人足球機(jī)器人目標(biāo)定位技術(shù)與追蹤算法改進(jìn) 3.4k次閱讀
- 一種改進(jìn)的無(wú)線傳感器網(wǎng)絡(luò)非測(cè)距定位算法 1.6k次閱讀
- 人臉識(shí)別核心算法及技術(shù)解析 1.7k次閱讀
- 配電網(wǎng)絡(luò)重構(gòu)的改進(jìn)混合遺傳算法 1.4k次閱讀
下載排行
本周
- 1MDD品牌三極管MMBT3906數(shù)據(jù)手冊(cè)
- 2.33 MB | 次下載 | 免費(fèi)
- 2MDD品牌三極管S9012數(shù)據(jù)手冊(cè)
- 2.62 MB | 次下載 | 免費(fèi)
- 3聯(lián)想flex2-14D/15D說(shuō)明書(shū)
- 4.92 MB | 次下載 | 免費(fèi)
- 4收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊(cè)
- 2.50 MB | 次下載 | 免費(fèi)
- 524Pin Type-C連接器設(shè)計(jì)報(bào)告
- 1.06 MB | 次下載 | 免費(fèi)
- 6新一代網(wǎng)絡(luò)可視化(NPB 2.0)
- 3.40 MB | 次下載 | 免費(fèi)
- 7MS1000TA 超聲波測(cè)量模擬前端芯片技術(shù)手冊(cè)
- 0.60 MB | 次下載 | 免費(fèi)
- 8MS1022高精度時(shí)間測(cè)量(TDC)電路數(shù)據(jù)手冊(cè)
- 1.81 MB | 次下載 | 免費(fèi)
本月
- 1愛(ài)華AIWA HS-J202維修手冊(cè)
- 3.34 MB | 37次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
- 1.63 MB | 23次下載 | 免費(fèi)
- 3NB-IoT芯片廠商的資料說(shuō)明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測(cè)距通信定位模塊規(guī)格書(shū)
- 838.47 KB | 5次下載 | 免費(fèi)
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8100W準(zhǔn)諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問(wèn)
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論