什么是Session?
如果把产品看成大卖场,那么互联网用户的行为就如同在大卖场扫货的顾客。对卖场来说,顾客从进入商场到离开商场,中间一系列行为购成了一次来访。
同样,对产品来说,用户进入产品到离开产品的一系列行为,就是一次访问。称之为 Session或Visit。
从技术上来说,Session是服务器为了保存用户状态而创建的一个特殊的对象。
用户用浏览器第一次访问产品运行的服务器时,服务器创建一个session对象(该
对象有一个唯一的id,一般称之为sessionId),服务器将sessionId以cookie的方式发送给浏览器。
用户再次用浏览器访问服务器时,同样会将sessionId发送过来,服务器依据sessionId就可以找到对应的session对象。
用户一系列行为中的每一个行为都最具备5大要素,用来描述用户的一个行为,即:在什么时间什么地点干了什么事,而5大要素构成了4W1H模型:
lWho:谁
lWhen:时间
lWhere:地点
lHow:如何
lWhat:具体事件
用4W1H模型对行为进行记录,产品就可以知道用户在产品里都做了什么,如:用户什么时间进入,什么时间买了东西等等。
用户session基础数据
使用session分析用户行为,需要先获取基于的底层的session基础数据。以下是两个基础信息表,记录了用户基础行为数据记录字段及其含义。
l用户行为数据:表示用户的行为信息
l用户信息
用户行为分析模块常见需求
Session的5大要素是用户行为分析的基础数据。在这些数据之上,在用户行为分析模块中,常见的用户行为分析需求包括:
一、能够按条件筛选出有指定行为特点的用户session
功能说明:
即在所有用户session中找出具备特定行为的用户session,能够按条件进行用户session记录的筛选,特定行为包括:
l搜索过某些关键词的用户
l访问时间在某个时间段内的用户
l年龄在某个范围内的用户
l职业在某个范围内的用户
l在某个城市的用户
功能特点:
这个功能比较灵活,操作者可以对感兴趣的用户群筛选后再进行其它业务逻辑的统计和分析,针对特殊人群形成结果数据,即对特定用户群进行分析;
如某个企业高层,想看本公司员工群体中,28~35岁、老师岗位的群体特征,再对这部分员工进行统计、分析形成结论,辅助高管进行公司战略决策制定。
技术实现:
技术实现时会遇到的问题包括:
1.按条件筛选session,筛选粒度不同
如搜索词、访问时间,这些有session粒度还有action粒度的;有时还要针对用户的基础信息进行筛选,如:年龄、性别、职业,筛选粒度不统一。
2.用户访问数据量每天至少5亿以上,10亿左右,进行session条件筛选时,不旦必须对不同颗粒度sessinon数据进行扫描,而且还要全量扫描。
user_visit_action是记录用户访问数据量的表,一行代表了一个用户行为。如:点击、搜索等
国内大的电商平台,如果每天活跃用户数量在千万级别。user_visit_action表每天的数据量至少在5亿以上,10亿左右。
对于存在的问题,技术实现时需要对原始数据进行聚合,即session粒度的聚合。
粒度的聚合是指用最基本的筛选条件,如:时间范围,提取数据,再按照session_id字段进行聚合,聚合后的记录是一个用户在指定时间内的访问的记录。如:
搜索过的所有的关键词
点击过的所有的品类id
Session中用userid关联用户基础信息,聚合后按照用户指定的筛选条件进行筛选,选出符合条件session粒度的数据就是需要的session了。
二、统计出符合条件的session中,指定访问时长的session占比;指定访问步长的session占比
session访问时长是一个session开始action到结束action间的时间范围;
访问步长是一个session执行期间依次点击过多少个页面。如:一次session持续1分钟,访问时长为1m。1分钟内点击了10个页面,则session访问步长为10。
常见指定访问时长包括:1s3s、4s6s、7s9s、10s30s、30s60s、1m3m、3m10m、10m30m、30m
常见指定访问步长包括:13、46、79、1030、30~60、60
统计出符合条件的session中,指定访问时长的session占比是指:
首先筛选出符合条件的session,如:数量有1000万条。
接下来计算出访问时长为:1s3s的session的数量,再除以符合条件的总session量(1000万),如:100万/1000万,由此算出1s3s内的session占比为10%。
功能的作用在于从全局角度了解符合某些指定条件的用户群体使用产品的习惯。如:
大多数人在产品停留多长时间
大多数人在一次使用产品时访问多少页面
三、在符合条件的session中按时间比例随机抽取指定数量session
为了保证样本的随机性,按时间比例随机抽取session是指:
如果12:00~13:00的session数量是100万,这一小时的session占比为1/10,需要抽取1/10 * 1000 = 100个session。
功能作用在于对符合条件的session,按照时间比例均匀随机采样指定数量session,观察其具体点击流/行为,如:
进入首页-点击食品品类-点击雨润火腿肠商品-搜索火腿肠罐头关键词-下单王中王火腿肠-支付订单
四、在符合条件的session中获取下单和支付数量排名前10的商品品类
每个session可能会对某些品类商品进行点击下单、支付等行为。需要获取这些重要的session点击(如下单、支付动作),并按不同商品的重要行为触发数量进行排名,如:排名前10的最热门品类。
这个功能功能的实现:
1.首先需要计算出所有session对各品类下单、支付等的触发次数,统计指标主要有3个,即每个品类的点击、下单和支付的数量。
2.然后分别按照3个指标 “点击、下单、支付” 数量依次排序:先比较点击数量,如相比较下单数,如还相同,比较支付数。
3.最后按照不同属性进行排序后获取前10名品类。
这个功能作用是了解符合条件的用户最感兴趣什么类型的商品。让产品团队清晰了解不同层次、不同类型用户的心理、喜好。
五、对排名前10的品类分别获取点击数排名前10的session
针对排名top10的品类,每个品类都获取其点击次数排名前10的session。
这个功能作用在于了解某个用户群体最感兴趣品类,各品类的典型用户的session行为。
功能实现需要对排名前10的品类数据集按照品类id进行分组,然后算出每组点击数量排名前10的session。
主要行为指标
Session 统计分析构成的主要用户行为指标包括:
l平均使用时长
平均访问时长指在一定统计时间内,浏览网站的一个页面或整个网站时用户所逗留的总时间与该页面或整个网站的访问次数的比。
指标解读:
平均访问时长越久, 说明产品越有吸引力。
如果用户停留平均时间非常低,可能存在内容不吸引人或界面优化较差的问题。
l平均交互深度
平均交互深度和平均访问深度定义有差别但意义相似,都是衡量产品质量的重要指标。
指标解读:
帮助企业了解产品页面内容的价值,功能是否满足用户需求,指标具体意义需要依照业务判断。
l跳出率
指在只访问了入口页面(例如产品首页)就离开的访问量与所产生总访问量的百分比。跳出率计算公式:
跳出率=访问一个页面后离开网站的次数/总访问次数
指标解读:
观察关键词跳出率可以知道产品内容对用户的吸引力,产品内容是否能够对用户有所帮助,留住用户也可以在跳出率中看出。
跳出率是衡量网站内容质量的重要标准。
lSession渠道转化分析
营销推广中典型需求是需要知道不同渠道带来的注册、购买等转化情况,这个需求本质上是界定 Session,然后按渠道属性查看注册、购买等事件的转化数量。
l用户路径
了解用户在业务流程中的行为路径,有助于找到用户流失环节,优化营销推广效果,产品经理通过验证用户行为与初步设想,完善功能,优化用户体验。
使用用户路径分析,设定起始事件与 Session 切割时间,可以观察一个 Session 内用户的行为流。
Session 分析是用户行为分析的重要方法,既可以了解流失用户,也可以了解活跃用户的使用习惯,增进产品用户体验设计。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)