深度解讀埋點質(zhì)量管理
如今互聯(lián)網(wǎng)人對于數(shù)據(jù)的使用可畏常態(tài)化,雖然有的是日常工作,有的只是幾次需求,但無論對與數(shù)據(jù)有多少依賴....
用這么久pandas才知道 category里的這些坑!
pandas有一個特別的數(shù)據(jù)類型叫category,如其名一樣,是一種分類的數(shù)據(jù)類型。categor....
一文詳解實時數(shù)據(jù)倉庫的發(fā)展、架構(gòu)和趨勢
數(shù)據(jù)處理現(xiàn)狀:當前基于Hive的離線數(shù)據(jù)倉庫已經(jīng)非常成熟,數(shù)據(jù)中臺體系也基本上是圍繞離線數(shù)倉進行建設(shè)....
如何理解整個數(shù)據(jù)倉庫建設(shè)體系?
數(shù)據(jù)倉庫的基本概念數(shù)據(jù)倉庫概念: 英文名稱為Data Warehouse,可簡寫為DW或DWH。數(shù)據(jù)....
全面分析Redis的最佳實踐優(yōu)化
這篇文章我想和你聊一聊 Redis 的最佳實踐。 你的項目或許已經(jīng)使用 Redis 很長時間了,但在....
數(shù)據(jù)庫字段要使用NOT NULL究竟是為何?
最近剛?cè)肼毿鹿荆l(fā)現(xiàn)數(shù)據(jù)庫設(shè)計有點小問題,數(shù)據(jù)庫字段很多沒有NOT NULL,對于強迫癥晚期患者來....
詳細剖析有數(shù)BI的權(quán)限體系!
權(quán)限體系是所有BI產(chǎn)品都會涉及的一個重要組成部分,目的是對不同的人訪問資源進行權(quán)限控制,避免因權(quán)限控....
Charts.css是用于數(shù)據(jù)可視化的新的開源框架
【導語】 :Charts.css 是用于數(shù)據(jù)可視化的開源 CSS 框架,幫助用戶理解數(shù)據(jù),幫助開發(fā)人....
分享pandas中超級好用的str矢量化字符串函數(shù)
本文介紹 你有沒有這樣一種感覺,為什么到自己手上的數(shù)據(jù),總是亂七八糟? ? 作為一個數(shù)據(jù)分析師來說,....
數(shù)據(jù)處理中pandas的groupby小技巧
pandas的groupby是數(shù)據(jù)處理中一個非常強大的功能。雖然很多同學已已經(jīng)非常熟悉了,但有些小技....
如何高效的使用Python和pandas清理非結(jié)構(gòu)化文本字段技巧
大家都知道數(shù)據(jù)清洗是數(shù)據(jù)分析過程中的一個重要部分。pandas有多種清洗文本字段的方法,可以用來為進....
提供全域數(shù)據(jù)與服務(wù)的畫像標簽體系
阿里 為打破數(shù)據(jù)孤島,創(chuàng)造更大的數(shù)據(jù)價值,阿里設(shè)計了OneEntity來提供全域數(shù)據(jù)與服務(wù)。OneE....
盤點Pandas的100個常用函數(shù)
經(jīng)過一段時間的整理,本期將分享我認為比較常規(guī)的100個實用函數(shù),這些函數(shù)大致可以分為六類,分別是統(tǒng)計....
一位數(shù)據(jù)人的7年產(chǎn)品職業(yè)成長之路
?我于14年畢業(yè)于河北師范大學信息資源管理專業(yè),截止投稿時算是在數(shù)據(jù)行業(yè)工作了第7個年頭(1年數(shù)據(jù)分....
Python工具pandas篩選數(shù)據(jù)的15個常用技巧
pandas是Python數(shù)據(jù)分析必備工具,它有強大的數(shù)據(jù)清洗能力,往往能用非常少的代碼實現(xiàn)較復雜的....
PB級分析型數(shù)據(jù)庫ClickHouse的應(yīng)用場景和特性等分享
在百花齊放的交互式分析領(lǐng)域,ClickHouse 絕對是后起之秀,它雖然年輕,卻有非常大的發(fā)展空間。....
梳理建立數(shù)據(jù)指標體系和分析方案的底層邏輯
先要確定數(shù)據(jù)指標體系的目標受眾,“他”看數(shù)據(jù)的視角和維度:職位側(cè)重點在哪里,業(yè)務(wù)階段是初期還是成熟期....
用戶畫像分析就是基于大量的數(shù)據(jù)
假如某個電商平臺需要做個活動給不同的層次的用戶發(fā)放不同的券, 那么我們就要利用用戶畫像對用戶進行劃分....
更高效的利用Jupyter+pandas進行數(shù)據(jù)分析
本文將對pandas支持的多種格式數(shù)據(jù)在處理數(shù)據(jù)的不同方面進行比較,包含I/O速度、內(nèi)存消耗、磁盤占....