国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

【原理到實戰】實驗異質性分析

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2025-11-12 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

什么是實驗的異質性

1. 如何理解實驗結果中的指標變化

當我們看到如下試金石實驗指標結果時

wKgZPGkURUSAa3cFAAB7o08HvDo298.png

在進行分析前,可能我們的第一直覺是這樣的

wKgZO2kURUWAD0HqAAFhMba-t-s135.png

經過異質性分析后,可能會發現實際情況是這樣的

wKgZO2kURUaAXb9wAAGSFBNy8JE127.png

2. 概念解析與定義

實驗的異質性,一般被稱為HTE(即Heterogeneous Treatment Effects),意為實驗中同一個treatment對不同的實驗樣本,得到的策略效果可能是不一樣的。另外還有一些重要的概念需要大家理解

英文簡稱 英文全稱 中文譯名 含義 公式
ATE Average Treatment Effect 平均處理效應 所有實驗對象的平均實驗效果 ATE=E[Y(1)?Y(0)]ATE=E[Y(1)?Y(0)]
CATE Conditional Average Treatment Effect 條件平均處理效應 滿足一定條件的實驗對象的平均實驗效果 CATEX=E[Yx(1)?Yx(0)∣x∈X]CATEX?=E[Yx?(1)?Yx?(0)∣x∈X]
ITE Individual Treatment Effect 個體處理效應 某個實驗對象的實驗效果 ITEi=E[Yi(1)?Yi(0)],i=1,2,...NITEi?=E[Yi?(1)?Yi?(0)],i=1,2,...N

* 此處采用Donald Rubin提出的潛在因果框架(Potencial outcome)來對實驗效果進行統計公式上的描述 [1]

* 由于業內并沒有統一的定義,HTE、CATE、ITE概念在一定程度上會有混用的情況,讀者需要參考描述以及上下文綜合判斷名詞的含義

3. 異質性分析對于業務的意義

1.了解策略對于不同用戶的不同效果,協助挖掘背后的業務邏輯,輔助迭代、進行新一輪的實驗

2.嘗試尋找策略最優子人群,讓整體無效的策略,有機會進行部分先推全;反之依然,讓部分負向的策略,減少損失

3.對實驗結果建模后預測,對線上提供動態的最優人群支持

根據試金石測算,以某產品線下6月運行中的35個實驗為例,僅23%左右的實驗沒有在實驗人群視角發現異質性

異質性分析方法概述

1. 異質性分析的維度選擇

1. 對于分流單元的維度X,當X滿足以下條件時,可以作為異質性的維度進行后續分析

??

T⊥XT⊥X

?,即分析維度與實驗分流無關 (Unconfoundedness)

?分析工具化的常見簡化方式:對于一個分流ID,選取他在首次進入實驗前一天的標簽取值

?簡單推導:

wKgZPGkURUaAZAw7AADqjY18pR0663.png

T是隨機化的,

T⊥Y,T⊥XT⊥Y,T⊥X

,所以

E[Yi(1)∣x∈X]=E[Yi(1)|Ti=1,x∈X]E[Yi?(1)∣x∈X]=E[Yi?(1)|Ti?=1,x∈X]

,所以(3)成立

2. 異質性分析的維度分析bad case舉例

假設我們需要分析的實驗策略為:根據用戶的活躍度標簽,低、中、高頻用戶的優惠券策略分別做了新/老策略迭代

分析目標 & 常見錯誤方法舉例 不成立原因簡述 推薦的實驗分析方式
不同活躍度人群的策略效果 在實驗運行7天后,利用實驗用戶在第7天的活躍度標簽進行結果拆解 在實驗開始后,用戶的活躍度標簽受到了策略影響,即T⊥X不成立 使用用戶在進入實驗前1天的活躍度標簽值
分別分析低頻策略、中頻策略、高頻策略對于低、中、高頻用戶的策略效果 按天取每天用戶的活躍度標簽,對實驗結果進行拆解 用戶的活躍度標簽受到了策略影響,即T⊥X不成立 ·用戶所在分組應該是確定的,不隨時間改變 分別建立3個人群正交實驗
分析高單價類目商品(3C家電)和低單價類目商品(休閑食品)的轉化率差異 選取xx類目曝光用戶,計算實驗周期內對應類目的曝光訂單轉化率 分析目標是面向指標維度的(sku所在類目),而非分流單元的維度(C端實驗通常為賬號、設備),不適用本文提到的異質性分析方法 試金石現已支持指標維度下鉆 曝光訂單轉化率的分子、分母均受到策略影響,需在觀測全面后綜合判斷

2. 異質性分析的方法選擇

研究對象 研究方法 適用場景 pros & cons
CATE 維度下鉆 ·低維 ·分析目標明確 + 快速簡單,便于理解 + 產品化容易 - 維度選擇依賴分析師經驗 - 交互效應處理困難
方差分析(ANOVA,ANCOVA) ·低維 ·分析目標較明確 ·交互效應評估 + 解釋性強,統計學理論背書 + 可以處理低維度交互效應 + 可作為feature selection的候選方法 - 基于線性模型假設 - 高維度交互效應解讀困難
因果樹(Causal Tree) ·高維 ·分析目標不明確,希望探索 + 建模方法符合分析直覺 - 模型復雜度不足,無法準確描述復雜的現實世界效果 - 本方法為現代機器學習因果算法的基石之一,有更好的替代方案
ITE Meta - Learner ·高維 ·希望輸出ITE ·算法訓練 + 算法常用,可大規模并行,有工程化先例 + 在過往的simulation中X-learner對ITE估計的準確度表現優秀 + X-learner通常使用xgboost模型,對各種feature有較強的處理能力 - 計算量大,耗資源 - 需要調參 - 由于缺乏統計推斷結果,一般不會直接產出p-value,存在對于ITE數值準確性的質疑,算法利用結果的rank居多
DML ·高維 ·希望輸出ITE和置信區間 + 有嚴謹統計理論證明ITE估計的無偏有效性,可產出樣本級的ITE以及置信區間 + 在過往的simulation中Causal Forest DML對ITE估計的準確度表現優秀 + DML模型框架本身具備一定的robust特性,在結合Forest模型后,調參需求低,不容易過擬合,對各種feature有較強的處理能力 - 慢,耗資源,工程化先例少
ITE + CATE hybrid ITE Model + Decision Tree Interpreter ·高維 ·分析目標不明確,希望探索 + 決策樹的建模方法符合分析直覺 + ITE模型可以較好的對復雜的現實世界進行抽象總結 - ITE模型可能會慢

* CATE、ITE建模方法的細節可參考Appendix

CATE下鉆探索工具MVP版邏輯介紹

項目地址:http://xingyun.jd.com/codingRoot/abtest_ds/CATE_model?

模型邏輯:多維度的維度下鉆 + Decision Tree Interpreter

快速開始:

from CATE_model.utils.workflow import CateWorkFlow
yaml_path = 'config.yaml'                # 按分析要求配置YAML文件
cate_workflow = CateWorkFlow(yaml_path)  # 初始化CATE對象
cate_workflow.prepare_analysis()         # 初始化ABTestAnalyzer
cate_workflow.execute_cate_auto()        # 自動執行所有環節
cate_workflow.df_out.styler              # 輸出CATE差異最大子人群目標指標統計

項目基本流程

wKgZO2kURUeAYwa_AAB6v85axAU695.jpg

YAML配置方法:第一次可以先根據項目demo修改,并參考YAML配置說明.md?

項目MVP功能說明

1.通過填寫YAML配置,自動生成實驗分析SQL,并執行取數,目前包括

?自動獲取試金石實驗分流信息

?自動獲取試金石實驗指標信息

?解析實驗CATE研究使用的用戶標簽表

?自動生成所有數據源的關聯關系

2.為實驗CATE研究提供自動化工具,目前包括

?自動化生成實驗目標指標的CATE差異最大化子人群

?提供調參接口,高級用戶可自定義模型參數

?提供可視化的模型結果輸出,高級用戶可根據輸出調節模型表現

3.為實驗的下鉆分析提供探索、分析功能,目前包括

?CATE人群的實驗效果統計檢驗

?CATE人群的多指標拆解

?CATE人群的特征描述

?

實驗異質性分析show case

針對近期某頻道重點改版實驗,此項目整體實驗指標為負向不顯著,但通過運行分析工具后發現,有兩類子人群分別具有正向和負向的顯著效果

實驗HTE人群統計
wKgZPGkURUeAU21dAABPAgL9Ibc501.png

?

對于這些子人群,我們發現他們在業務漏斗上的變化并不一樣,那么下次對于頻道進行迭代時,產品經理可以整理有針對性的選擇對負向人群進行針對性的優化

人群編號 用戶畫像總結 頻道uv 點擊uv 加車uv 轉化訂單數
3 年輕人,低活躍 1.0% 2.2% 2.6% 5.8%
38 非年輕人,高線城市,plus用戶 -2.2% -2.2% -3.1% -5.7%

?

未來展望

1.自定義分流表

2.自定義畫像表 & 經海路畫像表

3.CATE模型迭代

4.通用維度配置模版 & 業務場景模版

5.圖形化交互界面,簡化輸入配置

Appendix & 參考資料

【1】因果分析框架 & Donald Rubin的Potencial Outcome

?Potencial Outcome

?設

TiTi?

?代表第i個樣本是否收到了處理(treatment,策略影響),是為1,否為0

??

YiYi?

?代表個體i的結果,另外記

{Yi(1),Yi(0)}{Yi?(1),Yi?(0)}

?為個體i接受處理、對照的潛在結果

?每個個體通常只會有1個狀態,個體因果作用無法直接觀測,我們只有

Yi=Ti?Yi(1)+(1?Ti)?Yi(0)Yi?=Ti??Yi?(1)+(1?Ti?)?Yi?(0)

?在隨機化實驗的場景下,我們可以得到

wKgZO2kURUiAVaQSAACt7QAKxts081.png

其中最重要的邏輯為:

T是隨機化的,

T⊥YT⊥Y

,所以

E[Yi(1)]=E[Yi(1)|Ti=1]E[Yi?(1)]=E[Yi?(1)|Ti?=1]

,所以(3)成立

?因果推斷(一):因果推斷兩大框架及因果效應:https://zhuanlan.zhihu.com/p/652174282?

?因果推斷簡介之二:Rubin Causal Model (RCM) 和隨機化試驗:https://cosx.org/2012/03/causality2-rcm/?

?

【2】ANOVA與CATE的交互效應分析

當需要進行異質性分析的維度為X時,我們可以通過構建下列回歸方程去描述X在實驗中是否存在顯著的異質性,當

β3β3?

對應的F-test顯著時,我們就可以認為實驗在維度X上存在顯著的異質性

Y=β0+β1?T+β2?X+β3?X?TY=β0?+β1??T+β2??X+β3??X?T

X∈{0,1}X∈{0,1}

時,我們可以用下圖來進行異質性的理解

wKgZPGkURUmAPA07AAA4AehLqEc572.jpg

【3】CATE & ITE估計

idea1:對于每個參與實驗的對象i,如果能得到

Yi(1)Yi?(1)

?和

Yi(0)Yi?(0)

?的合理估計,那么ITE就可求了 idea2:對于實驗人群X,如果能找到一種觀測方式,求得

E[Yx(1)?Yx(0)∣x∈X]E[Yx?(1)?Yx?(0)∣x∈X]

?,那么CATE就有了

?Meta Learner的極簡介紹

?S-Learner

?stage1: 利用模型估計

μ(x,t)=E[Y∣X=x,T=t]μ(x,t)=E[Y∣X=x,T=t]

?stage2: 定義CATE結果如下

τ^(x)=μ^(x,T=1)?μ^(x,T=0)τ^(x)=μ^?(x,T=1)?μ^?(x,T=0)

?T-Learner

?stage1: 利用兩個模型,分別估計

μ0(x)=E[Y(0)∣X=x]μ0?(x)=E[Y(0)∣X=x]

μ1(x)=E[Y(1)∣X=x]μ1?(x)=E[Y(1)∣X=x]

?stage2: 定義CATE結果如下

τ^(x)=μ1^(x)?μ0^(x)τ^(x)=μ1?^?(x)?μ0?^?(x)

?X-Learner

?stage1:利用兩個模型,分別估計

μ0(x)=E[Y(0)∣X=x]μ0?(x)=E[Y(0)∣X=x]

μ1(x)=E[Y(1)∣X=x]μ1?(x)=E[Y(1)∣X=x]

?stage2:實驗組、對照組數據交叉擬合構造

Di1=Yi1?μ0^(Xi1),τ1(x)=E[D1∣X=x]Di1?=Yi1??μ0?^?(Xi1?),τ1?(x)=E[D1∣X=x]

Di0=μ1^(Xi0)?Yi0,τ0(x)=E[D0∣X=x]Di0?=μ1?^?(Xi0?)?Yi0?,τ0?(x)=E[D0∣X=x]

?stage3:定義CATE為模型估計值的加權平均,權重來自于在condition x下實驗組、對照組的樣本比例

τ(x)=g(x)τ0(x)+(1?g(x))τ1(x)τ(x)=g(x)τ0?(x)+(1?g(x))τ1?(x)

?更多資料參考uber的causalML項目:https://causalml.readthedocs.io/en/latest/methodology.html?

?Causal Forest的極簡介紹

?如果將普通決策樹算法的葉子分裂準則從最小化整體

Y^Y^

?的MSE,替換為最大化葉子結點的CATE差異,那么根據貪心算法,我們可以得到一個拆解CATE的Causal Tree(還有很多保證樣本平衡、估計可靠的weighting和honest的方法細節沒有介紹)

?為了克服一棵樹帶來的high variance,仿照random forest,構建由Causal Tree組成的森林,并且我們可以通過觀察在不同樹中樣本是否被多次劃入一個葉子結點來調節本樣本對當前葉子估計的權重,最終得道一個可以產出ITE估計的森林模型

?DML的極簡介紹

?我們定義

θ(x)θ(x)

?為CATE,那么構建下列函數

Y=θ(x)?T+g(X)+?,E[?∣T,X]=0Y=θ(x)?T+g(X)+?,E[?∣T,X]=0

T=f(X)+η,E[η,X]=0T=f(X)+η,E[η,X]=0

?stage1: 擬合g、f函數,求得殘差

ω=Y?E[Y∣X]ω=Y?E[Y∣X]

υ=T?E[T∣X]υ=T?E[T∣X]

?stage2: 擬合殘差,求得CATE估計

ω=θ(x)?υ+?ω=θ(x)?υ+?

?如果我們將上述double ML的過程用GMM的方式寫成矩函數,

E[((Y?E[Y∣X])?(T?E[T∣X])θ(x))(T?E[T∣X])]=0E[((Y?E[Y∣X])?(T?E[T∣X])θ(x))(T?E[T∣X])]=0

那么根據Neyman orthogonality condition,我們可以證明此過程估計的

θ(x)θ(x)

在大樣本下具備無偏一致性,此特性與

ω,υω,υ

在一定程度上沒有關系

?關于doubly robust,R-learner,CausalForestDML等方法呢?是否有理論框架能總結這一類利用殘差進行推斷的方法呢?參考:Orthogonal Statistical Learning Arxiv:1901.09036V3

?更多關于DML、CausalForest資料請參考微軟的EconML項目:https://www.pywhy.org/EconML/spec/overview.html

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • YAML
    +關注

    關注

    0

    文章

    22

    瀏覽量

    2608
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RK平臺Linux IOMMU開發:從原理到實戰

    顯示(VOP)、編解碼(VPU/HEVC)等場景。今天就從原理、驅動、實戰、問題排查、Linux 內存管理支撐五個維度,帶大家快速上手 RK 平臺 IOMMU 開發。
    的頭像 發表于 02-04 16:24 ?1467次閱讀
    RK平臺Linux IOMMU開發:從原<b class='flag-5'>理到</b><b class='flag-5'>實戰</b>

    實驗性光纜有哪些應用場景

    實驗性光纜尤其是高芯數實驗性光纜,主要應用于探索光纜傳輸容量的極限、推動通信技術的進步,以及為未來大規模數據傳輸需求提供技術儲備,其典型應用場景包括: 超大規模數據傳輸測試: 實驗室環境下,高芯數
    的頭像 發表于 02-02 10:45 ?154次閱讀

    矢量網絡分析儀校準全解析:從原理到實戰的精準測量指南

    從事射頻測試的工程師們,常會面臨這樣的困惑:同樣的矢量網絡分析儀(VNA),同樣的被測件,為什么不同人測出的數據總有細微偏差? 有時,生產線上的快速測試與實驗室的精密測量結果對不上;有時,校準后得到的曲線看起來“完美”,但數據導入仿真軟件后卻發現問題。
    的頭像 發表于 01-15 17:44 ?741次閱讀
    矢量網絡<b class='flag-5'>分析</b>儀校準全解析:從原<b class='flag-5'>理到</b><b class='flag-5'>實戰</b>的精準測量指南

    雙向保護開關評估套件使用指南:從原理到實戰

    雙向保護開關評估套件使用指南:從原理到實戰 引言 在鋰離子電池應用中,電池管理系統(BMS)至關重要,它能實時監測電池狀態,保障電池安全運行。而BMS中的電子開關,就像是電池的“守護者”,在關鍵時刻
    的頭像 發表于 12-20 20:30 ?1099次閱讀

    醫療電子EMC整改:原理到實戰的系統化全攻略策略

    深圳南柯電子|醫療電子EMC整改:原理到實戰的系統化全攻略策略
    的頭像 發表于 11-27 09:45 ?697次閱讀

    迅為iTOP-3568開發板?Linux驅動開發實戰:menuconfig圖形化配置實驗

    迅為iTOP-3568開發板?Linux驅動開發實戰:menuconfig圖形化配置實驗
    的頭像 發表于 11-24 15:29 ?766次閱讀
    迅為iTOP-3568開發板?Linux驅動開發<b class='flag-5'>實戰</b>:menuconfig圖形化配置<b class='flag-5'>實驗</b>

    SAW 濾波器從原理到測量:一套可復用的實驗實戰流程

    實戰測量流程。從測試治具、矢網校準到 S 參數與群時延的判讀,給出一套可復用、可重復的 SAW 濾波器實驗室測量方法,幫助工程師把 datasheet 上的“漂
    的頭像 發表于 11-20 14:32 ?3747次閱讀
    SAW 濾波器從原<b class='flag-5'>理到</b>測量:一套可復用的<b class='flag-5'>實驗</b>室<b class='flag-5'>實戰</b>流程

    大功率電磁兼容整改:技術原理到實戰策略的系統化方案

    南柯電子|大功率電磁兼容整改:技術原理到實戰策略的系統化方案
    的頭像 發表于 11-10 09:59 ?635次閱讀

    從原理到實操:BLE藍牙配網(STA+SoftAP雙模式)一文通關!

    BLE藍牙配網如何兼顧便捷與穩定性?STA+SoftAP雙模式給出最優解。下面從技術原理到實戰案例,手把手教你搭建雙模式配網系統,無需復雜代碼,輕松實現設備快速聯網,小白也能秒變專家。
    的頭像 發表于 09-20 15:20 ?1708次閱讀
    從原<b class='flag-5'>理到</b>實操:BLE藍牙配網(STA+SoftAP雙模式)一文通關!

    數據庫慢查詢分析與SQL優化實戰技巧

    今天,我將分享我在處理數千次數據庫性能問題中積累的實戰經驗,幫助你系統掌握慢查詢分析與SQL優化的核心技巧。無論你是剛入門的運維新手,還是有一定經驗的工程師,這篇文章都將為你提供實用的解決方案。
    的頭像 發表于 09-08 09:34 ?974次閱讀

    泰克TBS1052C示波器從基礎波形捕獲到FFT頻譜分析實戰

    示波器作為電子工程師的“眼睛”,在信號調試、故障診斷和性能分析中扮演著關鍵角色。泰克TBS1052C示波器憑借其高精度、多功能和易用,成為眾多領域的必備工具。本文將深入講解從基礎波形捕獲到FFT
    的頭像 發表于 06-09 15:28 ?899次閱讀
    泰克TBS1052C示波器從基礎波形捕獲到FFT頻譜<b class='flag-5'>分析</b><b class='flag-5'>實戰</b>

    電機微機控制系統可靠性分析

    可靠是電機微機控制系統的重要指標,延長電機平均故障間隔時間(MTBF),縮短平均修復時間(MTTR)是可靠研究的目標。電機微機控制系統的故障分為硬件故障和軟件故障,分析故障的性質和產生原因,有
    發表于 04-29 16:14

    UC3854 功率因數校正設計全攻略:從理論到實戰

    ? 在電源設計領域,諧波污染、功率因數低、EMI 噪聲等問題始終是痛點。傳統 AC-DC 變換器功率因數僅 0.5~0.65,如何實現高效、高可靠的 PFC 設計? 這份資料以 UC3854 為核心,深度解析有源 PFC 設計全流程,從原理到落地,助你突破技術瓶頸! 資
    的頭像 發表于 04-09 15:35 ?1509次閱讀
    UC3854 功率因數校正設計全攻略:從理論到<b class='flag-5'>實戰</b>

    從IGBT模塊大規模失效爆雷看國產SiC模塊可靠實驗的重要

    深度分析:從IGBT模塊可靠性問題看國產SiC模塊可靠實驗的重要 某廠商IGBT模塊曾因可靠性問題導致國內光伏逆變器廠商損失數億元,這一案例凸顯了功率半導體模塊可靠
    的頭像 發表于 03-31 07:04 ?1745次閱讀

    零基礎學習一階RC低通濾波器(從原理到實踐)

    *附件:零基礎學習一階RC低通濾波器(從原理到實踐).docx
    發表于 03-26 14:35