归因分析(Attribution Analysis)模型解析_服务器知识

在复杂的数据时代，我们每天都会面临产生产生的大量的数据以及用户复杂的消费行为路径，特别是在互联网广告行业，在广告投放的效果评估上，往往会产生一系列的问题：

· 哪些营销渠道促成了销售？

· 他们的贡献率分别是多少？

· 而这些贡献的背后，是源自于怎样的用户行为路径而产生的？

· 如何使用归因分析得到的结论，指导我们选择转化率更高的渠道组合？

你可能第一反应就是：当然是我点了哪个广告，然后进去商品详情页产生了购买以后，这个功劳就全部归功于这个广告呀！没有错，这也是当今最流行的分析方法，最简单粗暴的单渠道归因模型------这种方法通常将销售转化归功于消费者第一次 (首次互动模型，First Model) 或者最后一次接触 (末次互动模型，Last Model) 的渠道。但是显然，这是一个不够严谨和准确的分析方法。

我们发现，现实情况往往是很复杂的多渠道投放，在衡量其贡献价值以及做组合渠道投放力度的分配时，只依靠单渠道归因分析得到的结果和指导是不科学的，于是引入了多渠道归因分析的方法。当然，多渠道归因分析也不是万能的，使用怎样的分析模型最终还是取决于业务本身的特性以及考虑投入其中的成本。

也称，最后点击模型-----最后一次互动的渠道获得100%的功劳，这是最简单、直接，也是应用最为广泛的归因模型。

优点：首先它是最容易测量的归因模型，在分析计方面不容易发生错误。另外由于大部分追踪的cookie存活期只有30-90天（淘宝广告的计算周期最长只有15天)，对于顾客的行为路径、周期比较长的场景，在做归因分析的时候可能就会发生数据的丢失，而对于末次互动模型，这个数据跟踪周期就不是那么特别重要了。

弊端：这种模型的弊端也是比较明显，比如客户是从收藏夹进入商品详情页然后形成了成交的，按照末次归因模型就会把100%的功劳都归功于收藏夹（直接流量）。但是真实的用户行为路径更接近于产生兴趣、信任、购买意向、信息对比等各种环节，这些都是其他渠道的功劳，在这个模型中则无法统计进来，而末次渠道的功劳评估会被大幅高估。

适用于：转化路径少、周期短的业务，或者就是起临门一脚作用的广告，为了吸引客户购买，点击直接落地到商品详情页。

上面讲到的末次互动模型的弊端是数据分析的准确性受到了大量的"直接流量"所误导，所以对于末次非直接点击模型，在排除掉直接流量后会得到稍微准确一点的分析结果。

从上面的案例中，我们可以想象，用户是从淘宝收藏夹里点了一个商品然后进行了购买，但是实际上他可能是点了淘宝直通车后把这个商品加入到收藏夹的，那么在末次非直接点击互动模型里，我们就可以把这个功劳归功于淘宝直通车。

适用于：如果你的公司认为，你们业务的直接流量大部分都被来自于被其他渠道吸引的客户，需要排除掉直接流量，那么这种模型会很适合你们。

末次渠道互动模型会将100%的功劳归于客户在转化前，最后一次点击的广告渠道。需要注意这里的"末次互动"是指任何你要测量的转化目标之前的最后一次互动，转化目标可能是销售线索、销售机会建立或者其他你可以自定义的目标。

优点：这种模式的优点是通常跟各渠道的标准一致，如Facebook Insight使用末次Facebook互动模型，谷歌广告分析用的是末次谷歌广告互动模型等等。

弊端：很明显当你在多渠道同时投放的时候，会发生一个客户在第一天点了Facebook的广告，然后在第二天又点击了谷歌广告，最后并发生了转化，那么在末次渠道模型中，Facebook和谷歌都会把这次转化的100%功劳分别归到自己的渠道上。这就导致各个部门的数据都看起来挺好的，各个渠道都高估了自己影响力，而实际效果则可能是折半，如果单独使用这些归因模型并且把他们整合到一个报告中，你可能会得到"翻倍甚至三倍"的转化数据。

适用于：单一渠道，或者已知某个渠道的价值特别大

首次互动的渠道获得100%的功劳。

换句话说，首次互动模型更加强调的是驱动用户认知的、位于转化漏斗最顶端的渠道。

优点：是一种容易实施的单触点模型

弊端：受限于数据跟踪周期，对于用户路径长、周期长的用户行为可能无法采集真正的首次互动。

适用于：这种模型适用于没什么品牌知名度的公司，关注能给他们带来客户的最初的渠道，对于扩展市场很有帮助的渠道。

对于路径上所有的渠道，平等地分配他们的贡献权重。

线性归因是多触点归因模型中的一种，也是最简单的一种，他将功劳平均分配给用户路径中的每一个触点。

优点：他是一个多触点归因模型，可以将功劳划分给转化漏斗中每个不同阶段的营销渠道。另外，他的计算方法比较简单，计算过程中的价值系数调整也比较方便。

弊端：很明显，线性平均划分的方法不适用于某些渠道价值特别突出的业务。比如，一个客户在线下某处看到了你的广告，然后回家再用百度搜索，连续三天都通过百度进入了官网（真实用户场景也许就是用户懒得记录或者收藏官网地址），并在第四天成交。那么按照线性归因模型，百度会分配到75%的权重，而线下某处的广告得到了25%的权重，这很显然并没有给到线下广告足够的权重。

适用于：根据线性归因模型的特点，他更适用于企业期望在整个销售周期内保持与客户的联系，并维持品牌认知度的公司。在这种情况下，各个渠道在客户的考虑过程中，都起到相同的促进作用。

对于路径上的渠道，距离转化的时间越短的渠道，可以获得越多的功劳权重。

时间衰减归因模型基于一种假设，他认为触点越接近转化，对转化的影响力就越大。这种模型基于一个指数衰减的概念，一般默认周期是7天。也就是说，以转化当天相比，转化前7天的渠道，能分配50%权重，前14天的渠道分25%的权重，以此类推...

优点：相比线性归因模型的平均分权重的方式，时间衰减模型让不同渠道得到了不同的权重分配，当然前提是基于 "触点离转化越近，对转化影响力就越大" 的前提是准确的情况下，这种模型是相对较合理的。

弊端：这种假设的问题就是，在漏洞顶部的营销渠道永远不会得到一个公平的分数，因为它们总是距离转化最远的那个。

适用于：客户决策周期短、销售周期短的情况。比如，做短期的促销，就打了两天的广告，那么这两天的广告理应获得较高的权重。

基于位置的归因模型，也叫U型归因模型，它其实是混合使用了首次互动归因和末次互动归因的结果。

U型归因模型也是一种多触点归因模型，实质上是一种重视最初带来线索和最终促成成交渠道的模型，一般它会给首次和末次互动渠道各分配40%的权重，给中间的渠道分配20%的权重，也可以根据实际情况来调整这里的比例。

U型归因模型非常适合那些十分重视线索来源和促成销售渠道的公司。该模型的缺点则是它不会考虑线索转化之后的触点的营销效果，而这也使得它成为销售线索报告或者只有销售线索阶段目标的营销组织的理想归因模型。

以下，我们通过神策数据提供的归因模式，做一次计算原理的演绎：

下图是通过神策分析所得到某电商用户行为序列图示。在图示中，各字母代表的含义是 D-广告位、Q-商品详情页、D-推荐位、M-购买商品。目标转化事件是“购买商品”，为了更好地“配对”，运营人员将 M1（目标转化事件——购买商品1）与 Q1（前项关联事件——商品 1 详情）设置了属性关联，同样将 M2 与 Q2 进行关联。

该场景中，发生了两次购买行为，神策分析进行归因时会进行两轮计算，产生计算结果。

（一）第一轮计算：

第一步，从 M1 开始向前遍历寻找 Q1 以及离 Q1 最近发生的广告浏览。

如图所示，不难得到结果 M1=[Dc，Dc，Da]。

第二步，我们带入分析模型中，进行功劳的分配。运营人员选择 “位置归因” 的分析模型，根据“位置归因”的计算逻辑，第一个“待归因事件”和最后一个“待归因事件”各占 40%，中间平分 20%。

第一轮我们得到结果：Dc=0.4；Dc=0.2；Da=0.4

（二）第二轮计算

从 M2 开始向前遍历寻找 Q2 以及离 Q2 最近发生的广告浏览。

这里值得强调的是，即使第一轮中计算过该广告，在本轮计算时依然会参与到计算中，因为经常会出现一个广告位同时推荐多个商品的情况。

我们不难得到结论，M2=[Dc，Db]。基于这个结论，我们通过“位置归因” 得到结果：Dc=0.5；Db=0.5 （不足 3 个时会有特殊处理）。

经过两轮计算，我们得出结论：Dc=1.1；Da=0.4；Db=0.5，则广告位 c 的贡献最大、广告位 b 贡献次之，广告位 a 的贡献最小。

马尔科夫链思时间、状态都是离散的马尔科夫过程，是将来发生的事情，和过去的经理没有任何关系（只和当前有关系）。通俗的讲：今天的事情只取决于昨天，而明天的事情只取决于今天。

回到归因模型上，马尔科夫链模型实质就是：访客下一次访问某个渠道的概率，取决于这次访问的渠道。

归因模型的选择，很大程度上决定转化率计算结果，像前面讲的首次互动、末次互动等模型，实际上需要人工来分配规则的算法，显然它并不是一种“智能化”的模型选择。而且因为各个推广渠道的属性和目的不同，我们也无法脱离用户整个的转化路径来单独进行计算。因此，马尔科夫链归因模型实质上是一种以数据驱动的(Data-Driven)、更准确的归因算法。

马尔科夫链归因模型适用于渠道多、数量大、有建模分析能力的公司。

那么具体马尔科夫链怎么玩？（请自备图论知识）

如果将各推广渠道视为系统状态，推广渠道之间的转化视为系统状态之间的转化，可以用马尔科夫链表示用户转化路径。

马尔科夫链表示系统在t+1时间的状态只与系统在t时间的状态有关系，与系统在t-1,t-2,...,t0时间的状态无关，平稳马尔科夫链的转化矩阵可以用最大似然估计，也就是统计各状态之间的转化概率计算得到。用马尔科夫链图定义渠道推广归因模型：

1、状态集合，定义为 banner,text,keyword,link,video,mobile,unknown 7种推广类型加上start,null,conversion 3种系统状态

2、稳定状态下的转化矩阵，通过某公司web网站20天的原始click数据计算的得到如下状态转化矩阵

3、利用该转化矩阵来构造有向图（Directed Graph），通过计算从节点start到节点conversion的所有非重复路径（Simple Path）的累乘权重系数之和来计算移除效应系数

4、通过移除效应系数，计算各个状态的转化贡献值

什么是移除效应？

我们可以把上面的案例简化一下，尝试具体计算下移除效应和各渠道的转化贡献值：

在以上系统中，总体的转化率 = （0.667*0.5*1*0.5+0.333*1*0.5）= 33.3%

移除节点C1后，整体转化率 = 0.333*0.1*0.5 = 16.7%，所以C1节点的移除效应系数 = 1-0.167/0.333=0.5

同理可计算节点C2和C3的移除效应分别是1和1

通过移除效应系数计算得到转化贡献值：

C1 : 0.5 / (0.5+1+1) = 0.2

C2 : 1 / (0.5+1+1) = 0.4

C3 : 1 / (0.5+1+1) = 0.4

如果你对马尔科夫链有疑惑，可以点击这里了解下

从上面这么多种归因模型来看，我们大概可以把他们分成2类：

（1）基于规则的：预先为渠道设置了固定的权重值，他的好处是计算简单、数据容易合并、渠道之间互不影响，当然你也可以根据实际需要去调整他们的权重配比

（2）基于算法的：每个渠道的权重值不一样，会根据算法和时间，不同渠道的权重值会发生变化（数据驱动）

在选择用何种归因模型之前，我们应该先想清楚业务模式！

如果是新品牌、新产品推广，企业应该给予能给我们带来更多新用户的渠道足够的权重，那么我们应该选择首次互动模型；

如果是投放了单一的竞价渠道，那么我们应该选取末次互动归因模型或者渠道互动归因模型；

如果公司很在乎线索来源和促成销售渠道，那么我们应该选择U型归因模型；

如果公司的渠道多、数据量大，并且由永久用户标识，基于算法的归因模型能够为营销分析提供巨大的帮助；

....

总的来说，没有完美的归因模型。任何模型都存在他的局限性和不足，如何有效地结合客观数据与主观推测，是用好归因模型的重要能力前提。

这里抛出一个有趣的问题，大家可以通过思考他背后的分析逻辑，尝试一下如何应用到归因模型中

美国心理学家伯纳德·韦纳(BernardWeiner,1974)以成败行为的认知成分为中心，提出了一个归因模型。他认为，个人对成败的解释不外乎以下四种因素：(1)自身的能力；(2)所付出的努力程度；(3)任务的难度；(4)运气的好坏。其中，能力和努力两种是描述个人特征的“内在原因”；难度和运气则是表示环境因素的“外在原因”。韦纳又按“稳定性”维度对四种原因进行了划分：能力和任务难度属于稳定的因素；努力程度和运气好坏则是不稳定的，在各种情境中变化很大。他认为“内外控制点”（即内外因素）和“稳定性”这两个维度是相互独立的，对一个人成就动机的产生和质量分别起着不同的作用。“稳定性”维度对以后类似情境中是否成功的期望或预测产生重大影响。如果某人将在某项任务上的成功归因于稳定的原因，如他的能力很强或这项任务对他很容易，他自然会期望自己在以后类似情境中继续成功。如果成功被归因于随情境变化而变化的不稳定原因，如工作努力或运气不错，显然对下一次成功就不那么有把握了。相反，对某项任务上的失败，如果归因于个人难以改变的稳定原因，如能力太差或任务太难，对以后类似的任务显然也会作失败的打算；如果把失败归因于不稳定的原因，如运气不好或还没作出充分的努力，则会对以后的成功抱有更高的期望。控制点起什么作用呢？韦纳认为对成就行为的内控或外控判断影响到这一行为对个人的“价值”，并进而影响着其成就动机。人们更看重由内部原因所致的成功，并为此而奖励自己。考试中获得好成绩，若被归因于自己的能力或努力这些内部原因，而不是运气好或题目太容易这些外部原因，那么，个人会感到愉快并会继续争取成功。而归因于内部原因的失败则会对个人的自尊产生消极影响，并会削弱以后对成功的追求；如将失败归因于外在原因则不会如此。如果人们认为在某门功课上成绩不好是因为自己在这方面确实缺乏才能，即使加倍努力也往往无济于事，我们可能会突然觉得这门功课不那么重要，也不再对它用功了。但如果认为成绩不好是因为考试太难或试题太偏，则不会影响个人自我感觉，也不会降低这门课的价值或以后的努力。以下是韦纳的成就归因理论示意图：从以上介绍可看出，韦纳的归因效果论实际上也是一种关于成就的期望和价值的理论。即控制点影响着人对成败赋予的价值，归因的稳定性则影响着成就期望。价值和期望共同决定人在以后的成就行为中所付出的追求。他的这一理论比曾经对成就归因理论起过重要推动作用的克兰多又进了一大步。韦纳从稳定性和控制点两个维度来解释人的成就动机和行为，是全面客观的，是对成就归因理论的发展，而且许多实际研究资料也证明了这点。

单渠道的广告归因问题，其实就是用户识别问题，上一篇已经讲过，不再赘述。

广告归因问题，一般指多屏或多渠道的情况下，产生的广告转化的归属问题。

用场景举例：

广告公司在微信和今日头条都投了某产品的广告，然后用户在微信上看到了这个广告，没有下单；过几天在今日头条上也看到了这个广告，觉得东西挺好，还是没有买；过几天用户正好需要这个产品的时候，想起来这个商品了，去京东搜索了这个商品，然后下单购买了，那么这个购买是广告转化吗？如果是广告转化那是谁带来的广告转化呢？

其实归因这个问题没有固定的答案，因为广告归因其实不只是技术问题，更是一个运营问题，因为运营的策略来决定的这个广告归属。

一个好的归因模型，可以告诉运营，广告主的钱花在哪些地方去了，哪些渠道的效果更好，哪些渠道ROI不高，但是能覆盖大量的人群，哪些渠道的复参很好... 诸如此类的问题，都是由归因模型来决定的。

这里的渠道可以是多个流量平台，也可以是多个广告位。

多流量平台归因通常需要借助第三方DMP平台来完成。原因是多渠道间的数据孤岛需要通过第三方DMP平台来建立关联关系，第三方DMP平台可以通过用户识别的方式来将多渠道间的用户关联起来，统一按照归因模型来分析转化数据。

当然，这不是说广告平台自己做不行，只是说效果没有那么好，而且广告参与方越多，投放平台越多，自己来归因的效果会越差，这是显而易见的道理；但是多个广告位的归因就没这种烦恼了。

先假设一下广告投放的场景：

广告主在平台ABCD等很多渠道上都投放了广告，可能是效果广告，也可能是品牌广告然后其中一个用户的广告访问路径是：A渠道点击 ->B渠道点击 ->C渠道点击 ->D渠道点击，然后发生了转化行为；

最终我们需要通过模型来分析效果广告或者品牌广告在这些渠道上归因后的效果数据；那么每个渠道对这次转化的贡献我们用归因系数来描述。

最终互动模型的归因系数列表如下：

最终互动模型无疑是最简单，最直接可以衡量，直接将所有的广告转化效果归功与最后一次广告触达。

这种方式的好处就是：简单直接容易衡量，技术实现上最简单；只需要记录最后一次用户广告触达即可，不需要去记录并存储每一次用户广告访问，在广告业务场景下能节省巨量的存储资源和服务器资源。

但是弊端也很明显，过于关注最终成交的渠道，导致区域渠道的对用户兴趣的建立都忽略了，短期内会导致部分非成交渠道的广告投放数据过低，从长远来看，会导致渠道在投放广告时，过于倾向诱导、作弊、强制客户等行为，对广告主的品牌形象和广告投放效果都是负面影响。

一般来说，在采用最终互动模型时，会加上最终互动的有效期，举个栗子：用户在去年点过一个产品广告，直到今年才下单，那么从常理来分析，这次广告点击对广告的转化作用基本可以忽略不计。所以这种方式需要提供7日转化、15日转化、30日转化等不同维度的数据来综合分析。

这种归因模型很适合转化路径短、转化行为直接、广告投放周期短的效果广告使用，尤其是电商广告这类直接已成交来评价广告效果的广告形式。

这种归因方式是对上一种最终互动模型的弥补；

举个栗子：在同一个站内，可能ABCD渠道对应的不同的推荐位、购物车、收藏架等模块，那么在评估这些模块的转化效果时，如果用户之前在首页推荐中看到了商品广告，然后加入了收藏夹，最终用户在收藏夹中点击了该商品下单了，根据最终归因的模型，这次转化是要归因给收藏夹的，但是收藏夹在系统中并没有广告数据，而且电商场景下，很多商品成交都发生在收藏夹中，这样去归因并没有什么参考价值，那么剔除掉这种类似的直接渠道是比较合适的。

这种是比较佛系的归因模型，平等对待所有流量，平等去分配每次转化的功劳，这是多推广平台渠道归因的一种模型；

先说一下这种模型的天然的缺陷：在互联网广告的场景中，每个渠道的作用很难均衡，例如我们可能会在电视上看到某个产品的广告，但是我们通过互联网了解新信息的入口大部分是搜索引擎，那么很有可能是你通过搜索了解到详细信息才决定成交的，那线性模型对于搜索引擎就是不公平的。

这种广告也有优势，线性归因的模型让流量渠道可以不用过于关注转化效果，而进一步去加强广告的品牌效应，那么对于那些同流量渠道有长期稳定的合作关系的品牌方而言，可以帮助他们把流量平台的注意力转向加强广告的各个过程，而不会太过功利。

时间衰减归因模型是一种倾向把功劳划分给最接近转化的触点的多触点模型。该模型基于一个假设，该假设认为触点越接近转化，对转化的影响力就越大。

这种归因思路是脱胎于最终互动模型，又没有最终互动那么绝对，一样适用于最终互动模型的业务场景：投放周期短、转化路径直接的广告类型。

但是这种模型的弊端也是对于引流类型的渠道而言很不公平，举例我们在一些公众号上投放非效果广告时候，用户会在电商或实体店这类购买渠道产生转化，如果使用这种模型来归因的话，对于公众号渠道是很不友好的。

先解释下马尔科夫模型：是一种离散统计模型，主要应用于离散数学统计中，例如语音识别、文法分析等领域。马尔科夫模型认为，现在的状态只由过去的行为决定，而未来的状态只由现在的行为决定。

马尔科夫模型中发生的一系列时间和状态都是离散的过程成为马尔科夫过程，对于摩尔科夫过程中的每个当前状态的可能取值的条件概率，都可以通过之前的状态来统计得出。

说人话：在我们之前假设的广告场景中，假设ABCD四个渠道是四个互相关联的页面，A可以跳到B，B可以跳C，以此类推：

那么当我们大规模的统计ABCD四个页面的跳转行为之后，可以使用马尔科夫模型来建模，这样假设我们知道用户浏览了B页面时，那么就可以得出用户跳转到C页面的概率；

通过这种方式，我们就可以给所以广告投放链路上的渠道一个经过统计的系数，来标注该渠道对最终转化的贡献。

谷歌的Page Rank模型就是基于马尔科夫模型来计算的，需要长时间统计所有页面的跳转行为，经过计算分析，为每个页面生成一个PR值，来标识页面的质量。

而马尔科夫模型更适合的场景是语音识别，由Page Rank推而论之，我们说出来的句子中的每个词的顺序其实也是离散的，例如“我”后面跟着“们”这个字的概率，可以通过统计来得出。

广告归因的方式和算法多种多样，核心的思路都是依赖用户识别之后的点击数据来分配转化贡献。

在我们实际应用中，还是开头的话，在我们实际广告归因场景中，不必要去追求更精准，更完美的归因方式，而是根据运营需要去选择最符合业务特性的方式，来达成业务目标。再这个基础上再从技术层面上做到更精准，更完美。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/191704.html

归因分析(Attribution Analysis)模型解析

发表评论

评论列表（0条）