卡方检验在实际工作中的应用
卡方检验是以2分布为基础的一种常用假设检验方法,统计样本的实际观测值与理论推断值之间的偏离程度,主要在分类数据资料统计推断中应用。
在电商平台中,广告图到处可见,引起用户兴趣,为商品或者店铺带去流量。表征广告图是否优秀的关键数据就是CTR(ClickThroughRate,点击通过率)。为了设计高CTR图片,电商运营、设计同学们都总结出了一些经验,但这些经验未形成更精细化的设计原则来回答特定品类下,什么样的广告图CTR最高。
借助于京东平台沉淀的大量广告图数据,我们希望通过分析历史广告图的数据表现,得到不同品类下高CTR广告图的设计特征,也为后期验证提供初步的数据假设。
我们对广告图包含的设计元素进行了分类打标,但在缺少广告图的CTR具体数据,仅有高低CTR分组数据时,应该如何分析呢?
答案是:卡方检验。
为什么用卡方检验?
定义是什么?
卡方检验是以2分布为基础的一种常用假设检验方法,统计样本的实际观测值与理论推断值之间的偏离程度,主要在分类数据资料统计推断中应用,如两个或多个率构成比之间的比较以及分类资料的相关分析等。
基于这个定义,我们了解到卡方检验的适用范围是分类数据,即说明事物类别名称的数据,比如性别是一个分类变量,其变量值是男或女,两者之间无法进行运算或比较。
此案例为什么合适?
此案例中,广告图中不同的设计元素,如装饰元素、设计手法、背景色调等均是分类变量。同时,图片被分为高低CTR两组,也属于分类变量。既然是对两个分类变量(设计因素、高低CTR)做相关分析,卡方检验很适用于此案例。
卡方检验怎么做?
思路是什么?
在基本的假设检验思路上,卡方检验与t检验、F检验等有着相似的过程:
建立无效假设H0:观察频数与期望频数没有差别(即某一因素设计水平下高低点击率广告图频数与平均频数没有区别);
在假设H0成立基础上,计算出2值来表征观察值与理论值之间的偏离程度;
根据p值(多设定为0。05)及自由度,根据2分布查出拒绝H0假设的临界值;
若计算得2amp;gt;临界值,即H0成立的概率5,表示在95置信水平下,观察值与理论值之间有显著差异;反之,则说明两者无差异。
根据这个基本思想及过程,可以看出,2、自由度(df)、不同自由度下2分布是我们进行卡方检验的必要元素。
具体怎么算?
(1)计算2值:
举个例子来说明公式的含义:
1)将高低CTR的广告图设计因素不同水平的数据呈现为列联表形式。
2)公式中A代表观察值,E代表理论值,(AE)代表观察值及理论值的差异,其中理论值是假设两个因素无关的情况下计算出来的。
e。g。设计因素1水平1高CTR组的理论值即(ab)(ac)N
3)求平方和以避免正负差值间抵消:由于有多个观察值,差值可能出现正负值而互相抵消,故利用平方的计算来避免。
4)除以理论值以避免理论值大小影响偏差。
(2)确定自由度(df)
自由度指计算某一统计量时,取值不受限制的变量个数。在列联表中,由于行或列总数一定,因此行或列中受限制条件数为1,列联表总df(行数1)(列数1)。
e。g。22列联表中df1,在32列联表中df2
(3)结合df及p值确定2分布中的临界值,与计算所得2值比较
e。g。df1,p值为0。05情况下,2临界值为3。84
如果我们计算所得的2值3。84,意味着H0假设落入了下图所示的右侧小尾巴似的拒绝域,H0假设就不成立,即设计因素1不同水平下高低点击率广告图频数与平均频数有区别,换句话说,设计因素1的不同水平与高低点击率有相关。
spss怎么操作?
除了手工计算及查表外,可通过spss来进行卡方检验,步骤如下:
(1)导入数据
将每张广告图的高低CTR分组作为A列,设计因素1分组作为B列,导入spss作为原始数据,如下图框1所示。(若原始数据是上方表格的频数数据,需进行频数加权处理)
(2)选择amp;lt;分析amp;gt;amp;lt;描述统计amp;gt;amp;lt;交叉表amp;gt;lt;!交叉表gt;lt;!描述统计gt;lt;!分析gt;
如下图框2所示:
(3)将变量添加到行列中
在amp;lt;统计amp;gt;对话框中勾选卡方,在amp;lt;单元格amp;gt;对话框中勾选lt;z检验gt;下方俩选项以便进行多变量间的两两比较。lt;z检验gt;lt;!单元格gt;lt;!统计gt;
两两比较方法之Bonferroni法(邦弗伦尼法,修正最小显著差法):在每次比较中,将显著性水平除以两两比较的次数N,使得显著性水平缩小到原来的N分之一,降低错误的概率,避免在原假设为真时拒绝原假设,没有显著差异却认为有显著差异。与常规的两两比较LSD检验(最小显著差法,LeastSignificantDifference)相比,其采用更严格的标准,更容易导致两两比较时无显著差异。
(4)解读结果
1)重点关注第三张卡方检验表格,指标的选择依照以下条件(定义n为总样本量,理论频数T):
n40,T5的单元格未超20,且T均1(图中展示符合此条件),采用皮尔逊卡方检验结果。e。g。210。38,p0。001amp;lt;0。05,即设计因素的不同水平会影响点击率情况,结合描述统计判定水平2的高点击率概率高于水平1。
若行、列变量较多,n40,或有T1,采用似然比卡方检验。
若是22的四格表,n40,1T5的单元格超20,采用连续性修正检验结果。
若是22的四格表,n40,或有T1,采用费希尔精确检验结果。
若行、列量变量是等级变量(可从小到大排列)时,采用线性关联检验结果。
2)在确定初步结果显著之后,若列联表达到3列及以上,需两两比较列变量水平间是否有差异。第二张交叉表表格中有a、b的下标提供了比较结果,不同下标的列变量水平之间有显著差异。
结论不符合预期时,卡方检验结论如何解读?
至此完成了卡方检验的基本操作,但检验结果仅代表数据的显著性,该显著性是否有意义仍需要结合实际情况来看。当数据显著性出现与假设、预期不相符时,多是以下几种情况。
1。描述统计差异较大但卡方检验不显著
e。g。某品类广告的amp;lt;商品图数量amp;gt;元素,描述结论发现两个商品图的图片高于平均水平(高点击率图片整体比例)11,但卡方检验却没有显著(26。79,p0。08)。lt;!商品图数量gt;
这里就涉及到自由度的概念,由于amp;lt;商品图数量amp;gt;原始数据分类有四个水平:无、一个、两个、三个及以上,导致自由度增加,卡方分布由陡峭变成缓坡,拒绝域随之右移,需要更大的卡方值才能拒绝零假设,虽然例子中6。593。84(自由度为1的极限卡方值),但仍7。82(自由度为3时的极限卡方值),因此判定该设计因素不同水平对高低点击率没有显著影响。lt;!商品图数量gt;
2。描述统计差异不大但卡方检验显著
同样是多水平条件的卡方检验,可能导致另一种现象,某一水平下点击率情况与总体平均水平差异不大,但卡方检验显示其与高点击率相关。
e。g。某品类amp;lt;装饰元素amp;gt;共三个水平纯色、少量、复杂,其中复杂水平下高点击率(32。5)与整体平均水平(29。7)差异并不大,但整体卡方检验显著,并将纯色、复杂两个水平认为与高点击率相关。lt;!装饰元素gt;
除复杂水平外其他两组分布与理论频数差异较大,导致整体的卡方分布显著,而事后进行两两比较的时候,复杂水平下频数表现与纯色组更为接近,因此复杂水平被认为与高点击率相关。
3。结论与常规认知不相符
在对广告图进行分析时,有一定的常规认知假设,如用户会更偏好有利益点、有品牌标识的图片,但当卡方检验显示两者对点击率无影响时,可尝试从以下维度去排查问题。
(2)是否分类方式出了问题?
e。g。amp;lt;利益点amp;gt;原分类方式:有具体数值或明确赠品为有利益点,其他为无利益点,卡方检验后此设计因素对点击率无影响。lt;!利益点gt;
考虑到用户在浏览广告图时,不一定有具体数值才是有利益点,全场秒杀、直降的文字也会吸引用户点击,后续将amp;lt;利益点amp;gt;分类方式调整为{无、直降促销(文字或数值)、满减、买免等促销(文字或数值)、买赠或其他}。卡方检验发现中间两类明确利益点的广告图均有较高点击率。lt;!利益点gt;
分类方式作为原始数据对检验结论影响巨大,在进行设计因素分类时应遵循用户认知广告图的方式,不局限于单纯的视觉展现形式,从内容、视觉形式等角度全面考虑。
(3)是否品类有其特殊性?
e。g。amp;lt;是否有大促标识amp;gt;这个因素,在其他品类中,卡方检验常得到有大促标识比无大促标识有更多高点击率图片的结论,但在手机品类下却未有显著差异。lt;!是否有大促标识gt;
仔细观察后发现,手机品类广告图的单品促销较为常见,与大促活动关联度不高,因此在手机品类广告图展现大促标识对点击率影响不大是可以解释的。
(3)是否采样方式出了问题?
e。g。amp;lt;文案行数amp;gt;因素在某品类下仅两行文案水平与高点击率相关,难以解释。lt;!文案行数gt;
用户对广告图的利益点感知最强烈,所以选择了amp;lt;利益点amp;gt;因素作为代表,与amp;lt;文案行数amp;gt;进行交叉,看两因素是否相互影响。而后发现,两行文案广告图中更多是低点击率利益点,即不同文案行数的广告图利益点分布不一致,样本分布有偏。这也提示后期在验证时,利益点、品牌效应等作为影响用户点击广告图的最重要因子,应尽量在其他变量间保持一致的分布。lt;!文案行数gt;lt;!利益点gt;
4。分类数据是否有更好的分析方法?
受数据类型的限制,不得已采用了卡方检验,仅能进行单个设计因素内不同水平的对比,无法进行多个设计因素间重要性对比,也无法考虑不同设计因素间的交叉影响,综合确定CTR更高的设计组合。
那么分类数据有没有更深入的分析方法呢?曾经同事采用了联合分析方法,对广告图元素设计进行了数据探索。简要来说,联合分析可以把用户在购买决策中一系列的产品特征价格考虑在内,综合评估后确定用户偏好的因素组合。
本文案例为什么不适用呢?
因为联合分析对数据样本的元素组合分布有一定要求,必须符合均匀分散、整齐可比的正交分布特征。本文案例中的卡方检验更多是初步探索,在后续投放广告图进行ABTest时可采用正交设计来确定不同设计因素组合,回收数据后采用联合分析明确最优广告图形式。
治老公抽烟看你还敢说假话糊弄我老公爱抽烟,老婆管着,让少抽。有一天,老婆想了个法子,偷偷的在老公的烟盒里面,用中性笔画了个对勾,然后数了数,还剩下8根,之后把烟放回原处。第二天,老公下班回了家,……
榜样就在你面前刘青青问汪主任:怎么就没有姑娘喜欢我?汪主任:小伙子,要知道,人家姑娘选中一个人,不只是看他长相如何,更会看他人品好不好。你看阿凡提,他在路上捡得一大笔美金,竟分文不留地……
只顾上冷了也没看好不好笑这画面太美我不敢看啊《只顾上冷了,也没看好不好笑》教授带两位侨生到家晚餐,一个性情开朗,一个较为拘谨。席间,那位开朗的同学笑指拘谨的同学给我们介绍说:他是缅甸来的,所以比较腼腆。随后他举起酒……
人们口中的榜眼是第几名第二名与考生名字排列位置有我们从小到大经历了许多场考试,有考试就会有排名古代的科举也不例外,考官会根据考生的答题试卷的优劣给他们排名次,对位居前列的人,会有不同的称谓,其中人们口中的榜眼是第几名你知道吗……
美国举行太空军事演习预设冲突时间为年美国X37B空天飞机据中国之声《新闻纵横》7时43分报道,人类对太空的梦想和追求似乎从来都没有停止:从第一架太空飞行器升空、到人类实现太空行走、再到登上月球迈出人类一大步……
一波冷冷的开心逗段1、你说对不起,不一定换来没关系。你说你大爷,一定换来你大爷!2、骑自行车肯定影响生育能力:首先路况不好时震得蛋疼,其次骑自行车的男人很难娶到老婆。3、不办健身卡你……
小叶桢楠和金丝楠区别小叶桢楠属于金丝楠中的一种小叶桢楠属于金丝楠中的一种,小叶桢楠是外观比较好而且质地比较优秀的金丝楠,小叶桢楠也是金丝楠各个分支中最为稀有而且收藏价值最高的一种。金丝楠以及小叶桢楠的产地主要在中国的西南,……
唐山阴兵过路事件是真的吗唐山大地震灵异事件探秘我们总是对一些未知的事件感到好奇,比如说在唐山大地震中就发生了很多的怪事。这到底是人们对于未知的恐惧,还是超自然科学事件已经不可考,但是我们应该相信这是大自然给予我们的警告。关……
禅茶一味珍惜每一片茶叶禅茶一味:珍惜每一片茶叶文林清玄抓一把茶叶丢进壶里,从壶口流出了金黄色的液体,喝茶的时候我突然想到:这杯茶的每一滴水,是刚刚那一把茶叶中的每一片所释放出来的。我们喝……
忘我美颜茶美白肌肤清肝明目延缓细胞衰老功效美容养颜茶忘我美颜茶配方:勿忘我20克,绿茶1小匙,蜂蜜少许。制作:1,将勿忘我与绿茶置于杯内,开水冲泡35分钟。2,待勿忘我茶出味后,加入蜂蜜调……
招让害羞再见再也不见心理学家萨姆帕特纳姆曾做过一个心理实验,充满童话色彩的肥皂泡泡、万圣节的化装面具和会发出响声的玩具就是全部的实验道具。一些孩子被带到实验室来游戏。有些孩子一见到泡泡便兴奋……
如何在春秋时期发动一场货币战争上回讲到战国时代时最少有14种货币,齐国更早在管仲铸造造邦刀之前,就以主要是非中央主导而铸造的小刀为流通货币。管仲等同要将自己铸造的货币,打造为流通货币,肯定是一种艰巨货币改革……
企业文化的量化评估与提升企业文化的建设是一个长期过程,需要经过一段较长时间的实践完善才能塑造出来。即使原来已经适用的企业文化,如果不注重维护,其文化理念也可能在各种因素(比如新进的CEO、新进员工)的……
许文强怎么死的被法国人所杀内含九大原因上海滩许文强原型说法一:许宝初上海滩许文强原型是谁,许文强不过是影视剧中一个虚构的人物,至于他的原型究竟是不是许宝初,我们似乎也无从考证。但是,这个实实在在存在过的……
爆笑之逗剧场第季1、据我多年观察,造成婚外恋的根本原因是结婚。2、刚在街上被捅了一刀,还好我跑的快,不然刀子就被要回去了。3、各种花的花语:玫瑰花代表爱情;康乃馨代表亲情;蔷薇花代……
人类已知的类外星人各种外星人种类大揭秘真的有在电影中出现的在外太空居住的外星人都像我们所看到的那样头很大,身体很瘦小吗,都能直立行走的吗,今天探秘志小编就向大家介绍人类已知的50类外星人,看看它们都长的什么样子,到底是否……
茶讲堂精致茶宠三分选七分养喜爱品茗的茶人,对茶宠肯定不会陌生,都说水为茶之母,器为茶之父。在品茗过程中,很多茶人都会在茶盘上摆放几只造型各异的摆件茶宠。这些茶宠,或有吉祥寓意,或有文化气息,或是搞笑逗乐……
混血妆怎么画操作方法01:hr首先遮瑕修容打阴影。首先我们需要遮住自己的瑕疵,然后修容,其他国家的人五官比较突出,所以我们需要打阴影,提高整体的立体感。02:hr眼妆。眼妆在这……
生姜红糖膏的做法aclasstaghrefwiki10060IH1ljFV14。html生姜a红糖膏有治疗咳嗽的效果,那么生姜红糖膏怎么做呢?请看下文。工具材料红枣、生姜、红糖……
年幼儿园期末工作总结2018年幼儿园期末工作总结伴随着新的一年的到来,本学期工作即将画上圆满的句号!我们脚踏实地的走过了充满挑战的一学期。回首一学期来的点点滴滴,我们看到的是姐妹并肩前行的身……
残联副理事长兼任光荣院院长述学报告我叫XX,男,汉族,中共党员,现年39岁,1989年服兵役,先后在XX、XX工作,历任XX、救灾储备中心主任、副主任科员、党组成员兼任殡仪馆馆长、党组成员、残联副理事长,现任残……
大气污染环保餐饮油烟集中整治活动阶段性总结自2016年7月份开展大气环境污染整治活动以来,XX领导高度重视,牢固树立大局意识、责任意识、担当意识、看齐意识,明确责任分工,细化整治举措,确保辖区内餐饮业油烟排放集中整治工……
文广新局工作总结2018年文广新局在市委、市政府的正确领导下,认真履职,积极作为,较好的完成了全年各项工作任务。一、优化公共文化服务供给,提升市民文化生活品质(一)文化设施日趋完善……
让菲律宾唤醒你美味之旅分享活动圆满结束2021年6月30日,菲律宾旅游部(PDOT)在菲律宾共和国驻华大使馆举办了一场名为让菲律宾唤醒你美味之旅的地道菲律宾美食分享活动。菲律宾驻华大使馆总领事欧帝诺先生,代表……