国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

埋點實踐過程中遇到的一些問題

數據分析與開發 ? 來源:一個數據人的自留地 ? 作者:數據人創作者聯盟 ? 2021-10-22 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

埋點本身現在已經有太多的集成解決方案,神策、諸葛IO、GIO,但是在實踐的過程中仍然還是會碰都很多問題,這些問題都是躺過的坑。

01

梳理當前業務,未來業務發展問題,目的是給埋點預留空間

① 業務兼容的問題

前期規范執行之后,后續隨著業務的拓展,已有數據字段滿足不了業務的分析需求;

② 產品兼容的問題

埋點從應用端來區分,web/ios/android,小程序,公眾號,然后還要區分一下是否是原生,還是H5,新老版本之間肯定會帶來一些模塊化的差異;

③ 前后端埋點不一致的問題

前端請求服務端的數據大多是存在binlog里面的,數據日志同步解析的過程里面可能會存在丟包的可能性,數倉的穩定性也會影響數據質量;后端服務信息存儲的數據是存在mysql,表字段結構化,分多表存儲,需要靠主鍵進行關聯,有大量的ETL過程。兩者之間可能因為數據清洗、處理、實時技術等原因,造成數據差異化;

③ 自埋點和第三方應用統計口徑的問題

自埋點一般都會定義一個唯一id作為區分用戶的標志,但是第三方是缺少用戶屬性信息的判斷,一般會以設備號uuid/imse,或者IP地址段、mac地址段作為區分標志,從而造成統計數據上的差異化,對于留存分析、轉化分析、流失分析需要用到明細數據的場景,可兼容性不是很友好;

④ 埋點開發技術執行不到位的問題

絕大多數情況下我們說埋點,一般都是說前端埋點,前端開發工程師在做埋點的時候又多是人為埋點,在開發過程中,會造成部分信息冗余、重復、記錄不完整的情況存在;

⑤ 多產品之間的模塊差異化問題

埋點不能夠只有一套標準規范,多生態應用下,業務繁瑣,在產品、技術的架構上有明顯的差異,不同的產品、模塊、坑位、點擊事件的定義也可能有一定的區別,這時候可能需要根據場景劃分不同的埋點標準;

⑥ 自定義埋點信息的鍵對設計問題

往往會在埋點里面增加一個json的字段(bdata),在埋點的時候寫入自定義的業務信息進行場景識別,譬如活動id、業務信息、用戶快照的基本信息等,不同開發寫入的自定義字段格式可能會有差異;

02

埋點應用場景,對應初期埋點預留

基于業務分析框架,梳理常規分析案例中需要用到的埋點數據集,核心指標必須要有埋點;

基于算法模型框架,梳理算法所需要構建的數據特征需要用到的字段信息;

基于業務訴求,梳理非常規,當前沒需求未來有應用場景的字段信息;

舉個例子,譬如供需匹配、資源調度、智能選址,所對應的幾個信息主體分別是:用戶需求方、用戶供給方、商品信息、時間信息、空間信息、行為信息、業務信息;

03

標簽預留場景,反推埋點預留

基于用戶畫像的標簽建設,需要考慮畫像的多層屬性,社會屬性、基本屬性、市場屬性、交易屬性、行為屬性等,通過畫像篩選人群的時候,可能需要通過數據模型建立用戶分層的過程,所需要用到的輔助數據;

基于智能運營的標簽建設,運營策略、活動、方案的數據需求收集,哪些標簽需要用到埋點中的信息;

基于營銷系統的標簽建設,涉及到渠道分配、廣告投放、點擊預測等,可能需要對曝光、點擊、轉化進行全鏈路的埋點建設,或者基于某一個產品使用鏈路,埋點數據要完備;

標簽管理,沒有一套產品來支撐,多標簽你怎么對外提供;海量的標簽,又要怎么做標簽管理;

04

后面做推薦抓到核心指標,前期做埋點預設

推薦算法中需要用到的數據特征中包含哪些數據指標,其中埋點的部分所需要的數據格式是怎樣的;

推薦算法的設計方案,基于用戶、基于物品、協同過濾、基于規則、基于融合模型,不同的方案下,對數據底層的要求可能也會有一定的差異;

05

數倉庫表的開發成本

埋點數據落到數倉后,需要預先建立哪些表,如何做埋點數據的分層;

畢竟埋點的數據體量是非常大的,TB級數據的存儲本身就是一個比較大的成本,再加上調度系統、計算資源、運行性能等方面,就需要數倉團隊在一開始就要把數據模型提前建立好,做好ods層到dw層、ads層的劃分,維度和事實之間的建設;

06

數倉性能,時間問題(hive)

因為埋點數據的體量問題,落表的時候,一定會存在大量的冗余字段,如果集群資源比較緊張,對于常規數據的統計、計算都會帶來性能上的問題;

在數據團隊的架構中,有對外提供數據應用服務,對于數據的實時計算就有一定的要求,什么場景下應該是T+1,什么場景下應該是偽實時,避免數據調度任務影響前臺應用產出;

07

產品全埋點還是分塊埋點?分塊兒埋點的話有什么響應機制?應用措施?

全埋點和分模塊埋點,直接的影響是數據存儲成本的問題,作為一個數據分析,這也是不得不考慮的問題,如果數據結構優化不做好,每年浪費的存儲成本可能會是百萬級的消耗。隨著周期的增加,成本浪費會更嚴重。

所以說,企業數據的分析,不僅局限在數據本身,而應該是全面的剖析,多場景的結合。凡事都不簡單,如果簡單為什么那么多人都沒有做成功,只不過是層次還到而已。

- EOF -

推薦閱讀 點擊標題可跳轉

1、萬字長文說透分布式鎖

2、pandas 與 GUI 界面的超強結合,爆贊!

3、面試,MySQL 搞透這 20 道就穩了

看完本文有收獲?請轉發分享給更多人

推薦關注「數據分析與開發」,提升數據技能

點贊和在看就是最大的支持

原文標題:干貨分享:埋點實踐過程中碰到的坑點集合

文章出處:【微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

埋點本身現在已經有太多的集成解決方案,神策、諸葛IO、GIO,但是在實踐的過程中仍然還是會碰都很多問題,這些問題都是躺過的坑。

01

梳理當前業務,未來業務發展問題,目的是給埋點預留空間

① 業務兼容的問題

前期規范執行之后,后續隨著業務的拓展,已有數據字段滿足不了業務的分析需求;

② 產品兼容的問題

埋點從應用端來區分,web/ios/android,小程序,公眾號,然后還要區分一下是否是原生,還是H5,新老版本之間肯定會帶來一些模塊化的差異;

③ 前后端埋點不一致的問題

前端請求服務端的數據大多是存在binlog里面的,數據日志同步解析的過程里面可能會存在丟包的可能性,數倉的穩定性也會影響數據質量;后端服務信息存儲的數據是存在mysql,表字段結構化,分多表存儲,需要靠主鍵進行關聯,有大量的ETL過程。兩者之間可能因為數據清洗、處理、實時技術等原因,造成數據差異化;

③ 自埋點和第三方應用統計口徑的問題

自埋點一般都會定義一個唯一id作為區分用戶的標志,但是第三方是缺少用戶屬性信息的判斷,一般會以設備號uuid/imse,或者IP地址段、mac地址段作為區分標志,從而造成統計數據上的差異化,對于留存分析、轉化分析、流失分析需要用到明細數據的場景,可兼容性不是很友好;

④ 埋點開發技術執行不到位的問題

絕大多數情況下我們說埋點,一般都是說前端埋點,前端開發工程師在做埋點的時候又多是人為埋點,在開發過程中,會造成部分信息冗余、重復、記錄不完整的情況存在;

⑤ 多產品之間的模塊差異化問題

埋點不能夠只有一套標準規范,多生態應用下,業務繁瑣,在產品、技術的架構上有明顯的差異,不同的產品、模塊、坑位、點擊事件的定義也可能有一定的區別,這時候可能需要根據場景劃分不同的埋點標準;

⑥ 自定義埋點信息的鍵對設計問題

往往會在埋點里面增加一個json的字段(bdata),在埋點的時候寫入自定義的業務信息進行場景識別,譬如活動id、業務信息、用戶快照的基本信息等,不同開發寫入的自定義字段格式可能會有差異;

02

埋點應用場景,對應初期埋點預留

基于業務分析框架,梳理常規分析案例中需要用到的埋點數據集,核心指標必須要有埋點;

基于算法模型框架,梳理算法所需要構建的數據特征需要用到的字段信息;

基于業務訴求,梳理非常規,當前沒需求未來有應用場景的字段信息;

舉個例子,譬如供需匹配、資源調度、智能選址,所對應的幾個信息主體分別是:用戶需求方、用戶供給方、商品信息、時間信息、空間信息、行為信息、業務信息;

03

標簽預留場景,反推埋點預留

基于用戶畫像的標簽建設,需要考慮畫像的多層屬性,社會屬性、基本屬性、市場屬性、交易屬性、行為屬性等,通過畫像篩選人群的時候,可能需要通過數據模型建立用戶分層的過程,所需要用到的輔助數據;

基于智能運營的標簽建設,運營策略、活動、方案的數據需求收集,哪些標簽需要用到埋點中的信息;

基于營銷系統的標簽建設,涉及到渠道分配、廣告投放、點擊預測等,可能需要對曝光、點擊、轉化進行全鏈路的埋點建設,或者基于某一個產品使用鏈路,埋點數據要完備;

標簽管理,沒有一套產品來支撐,多標簽你怎么對外提供;海量的標簽,又要怎么做標簽管理;

04

后面做推薦抓到核心指標,前期做埋點預設

推薦算法中需要用到的數據特征中包含哪些數據指標,其中埋點的部分所需要的數據格式是怎樣的;

推薦算法的設計方案,基于用戶、基于物品、協同過濾、基于規則、基于融合模型,不同的方案下,對數據底層的要求可能也會有一定的差異;

05

數倉庫表的開發成本

埋點數據落到數倉后,需要預先建立哪些表,如何做埋點數據的分層;

畢竟埋點的數據體量是非常大的,TB級數據的存儲本身就是一個比較大的成本,再加上調度系統、計算資源、運行性能等方面,就需要數倉團隊在一開始就要把數據模型提前建立好,做好ods層到dw層、ads層的劃分,維度和事實之間的建設;

06

數倉性能,時間問題(hive)

因為埋點數據的體量問題,落表的時候,一定會存在大量的冗余字段,如果集群資源比較緊張,對于常規數據的統計、計算都會帶來性能上的問題;

在數據團隊的架構中,有對外提供數據應用服務,對于數據的實時計算就有一定的要求,什么場景下應該是T+1,什么場景下應該是偽實時,避免數據調度任務影響前臺應用產出;

07

產品全埋點還是分塊埋點?分塊兒埋點的話有什么響應機制?應用措施?

全埋點和分模塊埋點,直接的影響是數據存儲成本的問題,作為一個數據分析,這也是不得不考慮的問題,如果數據結構優化不做好,每年浪費的存儲成本可能會是百萬級的消耗。隨著周期的增加,成本浪費會更嚴重。

所以說,企業數據的分析,不僅局限在數據本身,而應該是全面的剖析,多場景的結合。凡事都不簡單,如果簡單為什么那么多人都沒有做成功,只不過是層次還到而已。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7335

    瀏覽量

    94769

原文標題:干貨分享:埋點實踐過程中碰到的坑點集合

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    在并聯使用MOS存在一些問題,要怎樣做才能避免這些問題?

    在并聯使用MOS存在一些問題,那我們要怎樣做才能避免這些問題? 首先,器件的致性定要好。 在功率MOSFET多管并聯時,器件內部參數的微小差異就會引起并聯各支路電流的不平衡而導致單管過流損壞。 其次是功率。如果功率高于25%
    發表于 12-10 08:19

    關于六類網線一些問題的解答

    今天我們就圍繞網友一些常見的關于六類網線的問題進行下匯總式解答: 問 六類網線可以當電源用嗎? 答 六類網線并不是設計用于傳輸電力的電纜,因此般不建議將其用于電源傳輸。 盡管六類網線的線芯可以
    的頭像 發表于 12-09 11:13 ?562次閱讀

    程序加載過程中遇到的問題及其解決方法

    。重新啟動Nuclei Studio,該問題解決。 (2)遇到的問題2:下載程序顯示未連接到開發板,報錯界面如下圖所示。 解決方法:在配套文檔,只要求安裝
    發表于 10-30 07:59

    對浮點指令擴展中一些問題的解決與分享

    出現無法寫的情況。 結論 以上就是我們組在擴展浮點指令中出現的一些問題,這些問題總體上歸結于對蜂鳥的代碼沒有整體性的把握,對內容的掌握程度還不夠。在后續的工作應注意理清功能的整體架構而對所有的相關部分進行修改。
    發表于 10-24 11:47

    極海MCU的ISP和IAP中程序跳轉運行問題分析

    最近在調試程序的程序升級方式,遇到了不少的問題,本篇筆記記錄遇到一些問題及在這個過程中一些問題
    的頭像 發表于 10-10 14:31 ?3519次閱讀
    極海MCU的ISP和IAP中程序跳轉運行問題分析

    靜力水準儀在測量過程中遇到誤差如何處理?

    靜力水準儀在測量過程中遇到誤差如何處理?靜力水準儀在工程沉降監測中出現數據偏差時,需采取系統性處理措施。根據實際工況,誤差主要源于環境干擾、設備狀態、安裝缺陷及操作不當四類因素,需針對性解決。靜力
    的頭像 發表于 08-14 13:01 ?862次閱讀
    靜力水準儀在測量<b class='flag-5'>過程中</b><b class='flag-5'>遇到</b>誤差如何處理?

    求助,關于TC387使能以及配置SOTA 中一些問題求解

    你好, 之前我拿到貴司給個demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1的bit位, 代碼如下
    發表于 08-08 07:31

    通過SEGGER JLINK調試CYUSB3014-BZXI遇到的問題求解

    最新版本)。 我按照《 EZ-USB? Suite 用戶指南》第 3 節“使用 Segger J-Link 進行調試”進行調試配置 然而我在調試過程中遇到一些問題 1. 運行程序時,它不會在應用程序線程
    發表于 07-16 08:27

    在低功耗藍牙產品開發的過程中,會涉及到一些參數的選擇和設定,這些參數是什么意思,該如何設定呢?(藍牙廣播)

    在低功耗藍牙產品開發的過程中,會涉及到一些參數的選擇和設定,這些參數是什么意思,該如何設定呢?在此介紹一些: 藍牙的廣播類型(Advertising Type) 可連接廣播(ADV_IND):允許
    發表于 06-25 18:25

    固定式測斜儀在測量過程中遇到誤差如何處理?

    在巖土工程與結構物安全監測,固定式測斜儀是捕捉位移變化的核心設備。然而,實際應用可能因環境、操作或設備因素導致測量誤差。很多人想要了解固定式測斜儀在測量過程中遇到誤差如何處理?下面
    的頭像 發表于 06-13 12:10 ?652次閱讀
    固定式測斜儀在測量<b class='flag-5'>過程中</b><b class='flag-5'>遇到</b>誤差如何處理?

    在FX2LP USB上配置GPIF中斷時遇到一些問題,求解決

    你好,我在 FX2LP USB 上配置 GPIF 中斷時遇到一些問題。 我啟用了 INT4 中斷并從 GPIF 中選擇了源 INT4,然后啟用了 GPIF 完成中斷,但我看不到中斷 4 工作。 我該如何做呢?
    發表于 05-06 08:00

    調試ADPD188芯片的過程中用I2C調試過程出現一些問題,求解決

    我在調試ADPD188芯片的過程中用I2C調試過程出現一些問題,參考官方提供的代碼調試中發現,初始化過不去,抓取波形發現芯片型號對不上了,從芯片外觀看ADPD188bi這個芯片,請問是是芯片回的問題還是軟件上需要調整還是什么原因
    發表于 04-16 06:57

    使用AD2428時,通過主節點發現從節點的過程中遇到的問題求解

    在使用AD2428時,通過主節點發現從節點的過程中遇到以下問題: 按照手冊中將0x9寄存器配置成0x1,讀回0x17寄存器的值為0x29,且主節點未發現從節點。 但是當在此基礎上,將0X9寄存器的值配置為0x9(即打開診斷模式),讀回0x17的值為0x18,主節點可發現
    發表于 04-15 07:14

    使用RTD5.0.0的s32k312,C40_Ip擦除pflash存在一些問題求解決

    我正在使用 RTD5.0.0 的 s32k312,C40_Ip擦除 pflash 存在一些問題: Erase block0(0x420000-0x500000) failed
    發表于 04-11 06:53

    開關電源設計過程中主要元件選擇指南(全333頁)

    該書講解了在開關電源的制作過程中一些關鍵的選型與參數計算方法 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內容有幫助可以關注、贊、評論支持下哦~)
    發表于 03-25 16:34