SEM的前世今生，让你知道什么是SEM?_服务器知识

1997年9月，创业狂人Bill Gross创立了搜索引擎公司GoTo，后更名为Overture。9个月后，Overture开始在搜索结果页面上呈现商业广告，广告主只在搜索引擎用户点击其广告的时候才需要向Overture付费，因此这种广告形式被称为 Pay-Per-Click 。隔年，Overture在NASDAQ成功上市；2003年，被雅虎收购。

雅虎最终放弃了自己的搜索业务，但Overture所创立的商业模式，仍在被当今几乎所有主流搜索引擎使用。从Google Adwords到百度竞价，它们实现搜索流量变现的基本商业逻辑皆可溯源至Overture。顺便八卦一句，Bill Gross不但自己是个创业狂，还在1996年建立了一间专门孵化创业公司的公司idealab，孵出了一连串金光闪闪的名字。

Pay-Per-Click的出现，称得上是互联网广告乃至整个广告行业的一个里程碑式的变化。广告主不再因为在某个广告位“ 展示 ”了自己的广告而支付费用，而是因为潜在消费者对其广告产生兴趣而进行的“ 点击 ”广告的行为付费。

换句话说，广告主不再需要为对自己的产品或服务不感兴趣的人支付费用，John Wanamaker所提出的广告行业之“哥德巴赫猜想”——“我知道在广告上的投资有一半是无用的，但问题是我不知道是哪一半”——向着解决的方向迈出了关键性的一步。由于这种广告形式密切依存于搜索引擎，因此现在人们一般称它为搜索引擎营销(Search Engine Marketing，简称 SEM )。

在SEM广告出现之后，互联网广告的创新层出不穷，有些主打更加精美华丽的表现形式(如富媒体广告)，有些则致力于更加精准地定位到潜在消费者(如各种RTB广告系统)，但SEM广告仍然是一种非常重要的互联网广告形式，在国内市场上的收入占比接近40%。

SEM在将近20年的发展历程中，有过多次具体实现方式上的演变。这些变化所围绕的一个重要主题是，当有多个广告主同时购买一个广告的时候，哪个广告主的广告应当排在前面？在早期，搜索引擎曾采用过单纯由广告主的出价决定其广告位置的方式。这一排序方法的弊端非常明显：它很容易导致好的广告位甚至是全部广告位都被广告费用支付能力和支付意愿都足够高的广告主所垄断的情况。

这样一来，搜索引擎的广告收入虽然有可能在短期内得到快速增长，但从长期来看，会将支付能力不高或者广告投放策略相对保守的广告主屏蔽在市场之外，从而缩小整个潜在市场的规模；同时，消费者也可能因为无法找到高质量的产品和服务而流失，使得市场规模进一步缩水。因此，各搜索引擎陆续推出了影响排名的权重因素。

权重因素的计算方式和命名随搜索引擎和时间推移而不同。以百度为例，它在2009年首次推出了自己的权重因素，并将其命名为“ 质量度 ”。质量度从低到高有一星至三星三个水平，是百度综合各种因素做出的对于广告质量的评价。2013年，三星分级的质量度被调整为0~10分的质量得分。

当有多个广告主购买同一个广告的时候，搜索引擎对每个广告主按照公式(1)计算出排名指数，然后按照排名指数从高到低排序，排名指数最高的广告主获得第一个广告位，以此类推。

在这一机制下，权重得分高的广告主可以以更低的价格拿到更好的广告展现位置，从而搜索引擎实现了将广告主的竞争焦点从出价转移到提升权重得分上的目的。

权重的具体计算方式只有搜索引擎公司负责商业产品的核心团队了解，但是各公司都会公布可以提升权重的指导性原则，并且这些原则之间有很高的相似性，基本都以提升广告文案的吸引力、积累良好的投放数据等为主。

在决定了广告主的排列顺序之后，搜索引擎还需要决定的另一个重要问题是，一旦用户点击了某一广告，搜索引擎应向相关的广告主收取多少费用？一个直观的选择是，按照广告主的出价收费。但各大搜索引擎多按类似于如下公式(2)的方式确定点击价格。为了便于说明，这里借用了百度对于权重的命名。公式中的“当前排名”与“下一名”均指根据公式(1)计算出来的广告排名。

根据公式(2)，广告主实际支付的价格与自己的出价无关，反而在很大程度上受到排名指数紧随其后的竞争对手出价的制约；不过，结合公式(1)、(2)可以知道，它一定不会高于广告主自己的出价。这意味着，如果某广告主提供的广告质量度相对对手更高，那么他不但能够以较低的价格得到更好的排名，而且实际支付的点击价格还会比自己的出价(广告主愿意为这个广告支付的费用)更低；他在质量度上的相对优势越明显，就能节省越多的广告预算。搜索引擎通过这一机制，实现了进一步激励广告主提供高质量广告的目的。

以上就是搜索流量变现的基本商业逻辑，接下来我们简单了解一下，想要在搜索引擎上投放广告的广告主具体需要进行哪些工作。为了说明便利，这部分仍以百度为例，这些内容在各主要搜索引擎上会有诸多细微的差别，但主干部分非常相似。

实现搜索流量的变现需要广告主、搜索引擎和用户三方共同完成，缺一不可。广告主一方，首先要在想投放广告的搜索引擎上开立一个推广账户，并预存一部分费用。

然后他就要做出两个最关键的决策，购买哪些广告以及确定自己愿意为每一个广告支付的费用。

由于用户是通过提交搜索词的方式来使用搜索引擎的，因此广告主购买的广告也是以词为单位的，称为“ 关键词 ”，一个关键词就是一条广告；为了得到更多的展现和点击机会，关键词应当尽可能贴近用户的提交搜索词的习惯。

选定了关键词之后，广告主还要为这些广告决定出价、落地页和匹配方式等设置。

出价在之前已有描述，“ 落地页 ”是指用户点击广告后会进入的页面；这个页面来自于广告主的网站，应该与关键词足够匹配，否则用户即使点击了广告也会因为无法取得想要的信息而离开。比如，关键词“英语口语培训价格”对应的落地页，不应只介绍培训班的上课时间。

“ 匹配模式 ”则是在告诉搜索引擎，当用户的搜索词和一个广告主购买的关键词相似度达到什么程度的时候，才考虑展现该广告主的广告；比如在搜索“英语口语培训”时，由于匹配模式的不同，用户有可能会看到“英语口语培训”、“口语培训”、“英语外教”、“全外教教学”等关键词对应的广告。

用户的搜索习惯千差万别，这就决定了一个有效的SEM账户中会包含非常多的关键词。

这些关键词有些彼此含义非常相似，比如品牌的全称和简称、各种型号的同一产品的名称等。为了提高广告的投放效率，搜索引擎要求广告主将关键词按照相似性进行分组；百度要求的分组结构是两层的，相似关键词组成“ 单元 ”、相似单元再合并为“ 计划 ”。

组内的关键词很相似，因此可以为每一组关键词撰写通用的广告语，称为“ 创意 ”；而且组的数量相对于关键词的数量要小得多，创意与组关联使得广告主有精力对其进行精雕细琢，写出高质量的广告语。这是搜索引擎引导广告主提升广告质量的又一个手段。

对于一组关键词，广告主还可以设置它们的投放时间 (例如只在工作日下午3点到5点投放)和投放地域 (例如只在一线城市和省会城市投放)；在投放时间之外或投放地域之外进行搜索的用户，无法看到该广告主的广告。

至此，广告主的广告就有可能在搜索引擎上被用户看到和点击了。

图1 投放搜索引擎广告的实现

用户在搜索引擎进行搜索的时候，搜索引擎会先根据搜索词找到所有符合投放条件的关键词广告，按照公式(1)、(2)选择可以被用户看到的广告并计算出它们的点击价格，再将这些广告与非付费内容一起呈现给用户；用户看到广告后，可能会点击其中一部分引发其进一步阅览兴趣的广告，此时搜索引擎按照计算好的点击价格从用户预付的广告费用中扣除掉这次点击对应的费用。

SEM广告相关的基本行为到这里就结束了，搜索引擎会为广告主提供如下表1所示的数据报表以衡量投放效果。

表中的“ 展现 ”指一条关键词广告被呈现在搜索结果页上的次数；“ 点击 ”指用户点击该广告的次数；“ 消费 ”指广告主因这些点击向搜索引擎支付的合计费用；“ 平均排名 ”是关键词各次展现时排名的平均数，因为每个广告主预算以及他们在关键词推广时段等设定上的差异，同一关键词每次展现的排名可能是不同的，所以广告每次展现时的排名虽然是整数，但平均排名则可能是小数。

CPC和CTR是衍生指标：“ CPC ”是cost per click的缩写，通过消费除以点击得到，代表广告主平均为每次点击支付的费用；“ CTR ”是click through rate的缩写，通过点击除以展现得到，表示用户对展现出来的广告表现出兴趣的可能性大小。

搜索引擎一般以天为最细粒度提供数据，除了关键词级别之外，还按照账户级别、计划级别、单元级别、创意级别提供。广告主可以通过这些数据，了解自己的费用投放情况，并且根据它来优化自己的广告投放。比如，对于那些消费和CPC都很高(消耗资源多)、CTR很低(用户兴趣低)、平均排名非常靠前(出价相对于市场总体水平来说偏高)的关键词，可以考虑适当降低它们的出价(减少资源投放)或者尝试修改创意(尝试通过提升广告吸引力来提升质量度)。

表1 搜索引擎向广告主提供的数据报告示例片段

细心的读者可能会发现，在介绍SEM基本商业逻辑的时候，我们描述的是用户每一个步骤的行为，而表1所提供的则是按天对每一个关键词广告进行汇总或平均的结果。

在前面的讨论中，我们曾经提到过，关键词每一次展现的排名、用户是否点击广告、具体扣除的费用都可能随时间变化而不同，我们是否有可能拿到这样更细粒度的数据来对投放做更精细的优化呢？

比如，表1中的广告主，假定他希望平均排名2.5的广告“鲜花速递”一直都能出现在第2个广告位上就好，那么根据表1提供的数据，他还需要继续提高自己的出价，一般来说他为这个广告支付的费用也会随之增加。

但是，如果他进一步知道，这条广告在下午3点到5点之间可以保持在每次展现都在第1名，但在晚上8点至11点却一般排在第3名之后，那么他就可以在下午3~5点适度降低出价、在晚上8~11点适度提高出价，在控制消费量基本不变甚至略有下降的前提下实现提升平均排名的目标。

遗憾的是，搜索引擎一般并不提供这样的数据。

此外，同样是通过点击SEM广告进入广告主网站的搜索引擎用户，他们对于广告主的价值也不一样。

举一个极端的例子，彼此存在竞争关系的广告主也可以通过互相点击对方的广告来达到消耗对手广告预算的目的，这就是所谓的恶意点击。

搜索引擎会对其进行过滤，但不能完全防止它的发生。对于一些竞争特别激烈的行业，只要有少数的漏网之鱼就会造成大量的预算浪费(例如在前几年礼品经济还非常盛行的时候，节庆前期应季礼品相关的关键词，其点击价格有时会高达四位数)。

即使不考虑恶意点击之类极端的情况，通过SEM广告进入广告主网站的用户在到达网站后的行为也有差异，有些完成了广告主希望看到的行为(比如进入电商网站后，进行了注册和下单支付)，有些则没有；广告主花费在前者身上的推广费用得到了回报而后者则没有。

由上可知，仅靠搜索引擎提供的表1数据只能对SEM投放进行粗线条的优化。一个补救的方式是，在自己的网站上部署网站流量监测工具。

网站流量监测工具会在用户访问广告主网站的时候记录他们的访问轨迹，以及注册、购买等关键行为。

大型搜索引擎为了进一步扩大自己的数据收集能力，一般也会提供免费的网站监测工具供广告主使用，比如google的GA和百度的百度统计。

这些通用型的免费工具比较适用于那些仅仅将互联网作为引入潜在消费者的一种工具、最终的成交和交付行为主要发生在线下、并且由于规模等原因所限暂时无力负担数据技术团队的广告主；比如在医疗美容、教育培训等行业，潜在消费者在网站上的行为终止于留下联系方式，后续的销售、到店、支付、交易、售后等行为都在线下进行。

但是对于电商、第三方支付、互联网金融等几乎所有成交和交付行为都发生在线上的广告主来说，还是应当从一开始就建立自己的技术团队和网站流量监测工具。

表2 网站流量监测工具记录的基本信息

如果广告主进行推广的搜索引擎是百度，还可以在关键词广告的落地页链接上部署百度提供的 URL通配符参数，以获取更多的推广相关信息。

URL通配符是加在关键词落地页链接后的一串符合特定格式的字符串，能够在用户点击SEM广告进入广告主网站时，传递给广告主用户点击的是哪个关键词广告、当时排名的位置、该关键词的匹配模式等信息。

表2中“访问页面”里问号后面的字符串就是由URL通配符返回的结果，它告诉我们用户进入网站是通过点击了哪个关键词广告(keywordId=xxxxxxx)、这个广告当时展现在第几个广告位(adPosition=xxxx)。

对于不提供类似URL通配符一类服务的搜索引擎，广告主可以在每个落地页链接上自行添加参数标明关键词，但操作起来相对麻烦一些而且一般来说无法获取关键词之外的信息。

网站流量监测工具和URL统配符一起应用，广告主就可以知道广告每一次被点击的时间、大致发生在哪个地方、广告展现在第几个位置等信息；同时访问者编号可以让广告主识别点击了广告的用户是马上离开了网站，还是继续访问了其他页面，以及有没有进行广告主所希望的目标行为(根据广告主业务模式的不同，这个行为也会不同，常见的比如注册、下单、咨询等)。

换句话说，广告主可以知道一个用户通过点击了某个关键词广告进入了自己的网站，结合关键词的CPC，就大致知道了获取这个用户的成本；通过网站流量监测工具，可以知道这个用户后续有没有达成目标行为，这就是用户带来的产出。

投入和产出合并在一起，广告主就可以在用户、关键词广告等各种级别上进行推广的投入产出分析，并通过投入产出分析来对SEM广告投放进行更加精细的优化。

这就是图1中几个红色方框所表述的内容，它们发生在搜索引擎之外，但却是广告主精准评价自己的SEM广告投放效果所不可或缺的部分。

举例来说，有了补充数据之后，表1将被扩充为表3。从中可以看到，“鲜花礼品”虽然单价略高，但 ROI (Return>有些时候，广告主希望用户达成的目标行为结果无法以金额来表示，比如，当广告主希望取得更多注册用户时，其目标行为就是完成注册流程、成为注册用户。在这种情况下，表3中最右侧的两列可以被替换成“转化数量”和“CPA”。

“ 转化数量 ”就是用户达成的广告主目标行为的次数，在这个例子里就是新增了多少注册用户；“ CPA ”通过消费除以转化数量得到，表示广告主获得每一个目标行为的平均成本，它是比CPC更好的单位成本衡量指标。

表3 搜索引擎与广告主自行监测数据的合并

总结：

本节主要为大家介绍SEM广告的基本商业逻辑，其中的两个关键问题是：

a) 多个广告主购买同一个广告时，谁可以排在前面？

b) 用户点击广告时，搜索引擎会向广告主收取多少费用？

SEM在精准衡量广告效果方面，迈出了里程碑式的一步。广告主想要提升自己SEM广告的优化效果，除了使用搜索引擎提供的数据外，最好进一步通过如下方式获取补充数据：

a) 部署网站流量监控工具：有免费工具，也可自行开发；对有技术能力者，推荐后者

b) 在关键词广告落地页链接中添加URL通配符(百度)或自行添加关键词标识(其他搜索引擎)

讲解了一些基本术语的含义：

Pay-per-Click、SEM；账户、计划、单元、关键词、创意、落地页、出价、匹配模式、投放地域、投放时间；质量度、排名指数；展现、点击、消费、CPC、CTR、ROI、转化数量、CPA；网站流量监控工具、URL通配符。

练习：

附件中提供了一份模拟的关键词级别SEM推广报表，请根据表中已有的数据计算衍生指标CPC、CTR、ROI，并尝试寻找可能的优化方向。

PS：附件中的计划、单元组织结构参考了常见的关键词分组策略，可供初步接触SEM实务的读者参考。

参考：

1、本文在介绍sem广告时，为便于理解，对其业务逻辑进行了适度地简化。需要了解更详细内容的读者，请查阅各搜索引擎提供的指南

2、关于URL统配符的详细信息，可参考帮助文档。【http://dev2.baidu.com/docs.do?product=2#page=URL_Tag#page=URL_Tag】

3、关于网站流量监测工具及相关的数据分析，可参考网站分析在中国等网站及博客。【http://www.chinawebanalytics.cn/】

4、Bill Gross和John Wanamaker都是富有传奇色彩的人，有兴趣的读者可自行八卦。

注：

本文中使用的所有数据皆在真实数据基础上进行过模糊化处理，保留了实际投放中会遇到的典型数据特征，但不可作为实际投放的参考。

在用户研究工作中，如何让自己的数据和结论更有说服力，是很重要的问题。最近将自己积累的用研信度和效度的笔记整理一下，罗列在文中，希望对大家有所帮助。

一、调查的质量取决于调查的信度和效度。

信度主要指测量结果的一致性、稳定性。也就是说结论和数据是否反映了用户最真实稳定的想法。用户在回答问题的时候，往往会受到环境、时间、当时当地的情绪影响，而作出并不真实的想法，即会有随机误差。信度就是衡量这种随机误差对用户想法的影响大小。

效度是指多大程度上测量了你想要测量的东西。

对某个产品用研，我们现在用得最多是用户访谈、问卷调查和可用性测试。而在这几个过程中都会涉及信度和效度的问题。

二、用户访谈中的效度和信度

1. 访谈不能仅仅局限于用户

任何一个产品项目都会受到市场环境、公司战略、技术力量、平台规范和流行趋势等各个方面的影响。对某一产品的需求，可能来自用户、产品、技术、交互以及视觉。不同岗位人员看待产品的角度不一样，侧重点也不一样，找多个角色有助于把需求找全，不遗漏，所以必须提前了解他们的需求。这样才能使我们的研究更有针对性、全面性、有用性。有用程度、全面程度是效度的重要组成部分。

2. 巧妙的选择访谈用户

通常，前期深度访谈的用户数量不会太多，所以用户条件一定要把握适当。反馈的问题才能全面、合理、有用。

比如是做Android平台上的某一软件。

首先Android新手用户和熟练用户都是必须的，熟练用户更能反映android用户习惯性操作方式、平台特点、以及长期使用过程中积累的意见和建议；而新手用户可以更好的反映该平台哪些地方存在学习困难，从而通过我们的设计帮助用户去降低学习成本。

其次非Android平台用户也是必须的，可以从侧面了解他们不用Android的原因。从而帮助产品挖掘更多潜在用户提供方向。

人口学信息（学历、职业、性别、年龄）要覆盖全面。不同属性的用户看重地方会存在差异。需求也会不一样。

包含竞品用户。通过了解用户对竞品的评价，可以提炼出竞品的优劣势，从而为增强产品竞争力提供方向。

3. 一定要有专家

专家是重要的信息携带者。李乐山教授说专家有三类，用户专家、制造专家、市场销售专家，他指出判断某人是否是专家的标准是：（1）能够熟练使用一种产品；（2）能够比较同类产品；（3）有关的新知识容易整合到自己的知识结构中；（4）具有10年专业经验；（5）积累大量经验并且在使用经验方面具有绝招；（6）了解有关的历史（该产品设计史、技术发展史等）；（7）关注产品发展趋势（8）知识链或者思维链比较长，提起任何一个有关话题，他们都能够谈出大量的有关信息；（9）能够提出改进或创新的建议，他们的创新或改进方案，其高水平体现在采用简单方法解决复杂问题。

对于互联网，专家应该指的是用户专家、开发专家、设计专家以及产品专家；他们凭借丰富的经验，系统全面的掌握行业同类产品、开发及设计模式、历史及发展趋势、专业水平极高。他们可以为我们提供很多我们始料未及的建议。这是保证用研过程，特别是对于后期问卷结构效度有很大的作用。

三、问卷调查与分析中的信度与效度

为了提高工作效率，问卷调查往往采用网络调查的方法，信度效度问题出现的可能性就更大。

最近看到一些满意度调查是采用量表加结构方程模型（SEM）的方式。我们看看哪些地方可能会出现信度和效度的问题。

1. 理论模型支持

由于SEM进行的是验证性因子分析，是检验而不是探索新的模型，因此，整个因果关系的假设必须有强有力的理论支持和严密的逻辑框架。包括模型中变量关系的假定、指标的选取、甚至测度项的表达方式等。如果最终输出的模型和理论模型结构不符，那么该模型是没有任何说服力的。比如用ACSI模型作为满意度的理论模型时，是否真的按照感知质量、感知价值、顾客期望这几个层面去设计问卷？

2. 保证份量

普通抽样调查中原则上是越多越好，但遇到目标用户较少的情况，只要保证一定的条件就ok的，样本量受到置信区间、抽样误差范围的影响，可根据实际的况测算出最小样本量。常用的公式是：

14N=Z2蟽2d2′<</span>（N为样本量、Z为置信区间、d为抽样误差范围、 14蟽’<为标准差，常取0.5）

但对于结构方程模型大样本是必须的，SEM中涉及的变量众多，变量间的关系很复杂交错，小样本量会导致模型不稳定，收敛失败进而影响模型中参数。朱远程等[1]在文献中指出，当样本低于100时，几乎所有的结构方程模型分析都是不稳定的，大于200以上的样本，才称得上一个中型样本。若要得到稳定的结构方程模型结构，低于200的样本数量是不鼓励的。有些学者将最低样本量与模型变量结合在一起，建议样本数至少应为变量的十倍，这一规则经常被引用。模型中变量越多，对大样本的要求就越高。

3. 变量需遵循原则

a. SEM模型中各变量的函数关系要是线性的，否则是不能用回归计算路径系数的。

b. 在使用最大似然估计法时，变量一定要是多元正态分布的，这就要求指标要呈正态分布，否则就要对指标进行正态处理才行。

c. 变量间的多重共线性程度要低，否则路径系数会有很大误差。

d. SEM建立的过程中会不断的修正才能得到比较完美的模型，比如因子分析时，若发现某一测度项对应的因子载荷过小，就会人为的将该测度项删除，但是若模型建立之后，一些变量对应了4~5个测度项，一些变量只剩下1~2个测度项，那么我们就需要思考只有两个测度项的变量是否被完全解释，这仅有的两个测度项就全面真实的反映该变量么？如果是这样，就算KMO、Bartlett、因子载荷都通过了，效度也是难以保证的。所以问卷前期需要反复的预调研，不断的对问题进行修正，而不是随意的人为删除。我学生时代对淘宝满意度进行调查时，就犯了类似的错误，模型中的“互动性”片段，互动性由四个变量衡量，其中“双向沟通性”一开始设计的时候由5个测度项支持，但是因子分析检验通不过，就直接将因子载荷比较小的客服、论坛、淘江湖三者去掉了，最后虽然在数据上通过了信度效度检验，但是只有阿里旺旺、留言板这两个测度项支持是绝对不能解释“双向沟通性”的。

4. 数据质量是根源

要使模型结构稳定有效，首先要保证数据质量，反复检验问卷的信度。

a. 不同时间的一致性。

在设计问卷时，可以将同样的问题对同一个人重复测试，如果这两道题得到的答案是不一致的，相关系数（Pearson r）小于0.7，那么这份问卷的稳定信度就值得考量。

假如问卷样本足够大，可以一分为二（每一个样本也要保证足够样本量），分别建立两个模型；通过对比两个模型中参数的差异，便可以检验该模型的稳定性和适用性。如果两者差异太大，就说明模型本身是有问题的。

b. 不同形式的一致性

用内容等效但表达方式不同的两份问卷调查，检测两者的等效信度，比如Gamma系数。

c. 内在一致性

问卷中相关的问题为同样的目标服务，他们在逻辑一致，也就是同质的。首先要测量每个测度项与总体的相关性（item-total correlation），然后再测量同一变量下相关问题间的同质性，而对于不同的提问方式选择对应的方法：比如,对于李克特量表方法，就用Chronbach系数检验；在基础研究中，信度至少应达到 0.80 才可接受，在探索性研究中，0.70 可接受，0.70－0.98 为高信度,小于0.35 为低信度。对于是非题则采用kuder-Richardson系数检验。在进行内在一致性检验时，要看题目选项是否反序，如果两道题都是问“对该产品是否满意”，一道7代表满意，1代表不满意；另一道1代表满意，7代表不满意，这样就会影响信度。遇到这种情况要提前人为调整过来。

5. 看得更远一点

问卷结论不仅要解决当前的问题和需求，还有具有一定的预测作用，市场是变化的，当前的目标用户不一定就是未来的（或者下一个版本的）目标用户，比如目标用户的收入可能有增加的趋势，某一平台的使用率在快速提高，当前的满意度模型可能在一个月之后就不适用了（比如新功能点的出现）。

假设我们要对QQ影音进行满意度调查，现在建立了一个满意度模型，但若下个月QQ影音中多了一个重要的功能，对整个满意度的提升产生了很大作用，那么，模型中各项的路径系数会不会产生变化？该模型在下个月可能就不适用了，造成的后果就是当前的满意度值与下个月的满意度值没有可比性了，很多工作也就白费了。所以，诸如满意度模型这样的研究，是需要反复调查，长期对该满意度模型进行监控和修正，以求得到最稳定的模型，就可以让模型会具有很预测和比对作用啦。

6.关注细节

a. 问卷设计中题项表述不能出现歧义、避免太专业词汇以及诱导词汇

b. 选项间要有明确的区分（互斥）

c. 避免遗漏，“其他”选项是必须的，而且最好配有输入框，记忆中，每次问卷调查中都能从“其他”选项中获取大量信息。

d. 一般题项不能太多，设置问题选项的时候，尽可能的让选项随机显示，特别是在选项较多的情况下。

e. 数据处理过程中删除重复项矛盾项之外，最好能统计到用户填写问卷的时间差。如果整个填写的时间极短，完全可以判定用户没有认真填写。

f. 极端的、离群的选项可以考虑将其删除。

四、可用性测试中的信度与效度

首先保证，主持人的态度亲切、测试前随意聊聊彼此熟悉、测试提纲清晰全面。另外，以下几点也对保证测试的信度和效度很重要。

1. 不要忽略异想天开

脑暴中要求彼此不能批评，在进行访谈或测试中，也不能对用户某些操作做出评论，否则用户很有可能隐藏内心真实的感受。关注并记录用户出错，但是用户出错时态度要中立。

通常，用户在体验的真实的原型后，会产生很多看似异想天开的诉求，有些虽然在当前不能实现，但是会为未来发展提供很多思路和方向。所以，我们要积极鼓励用户进行思维发散。

2. 前后验证、竞品比对

在测试完成后，可以加上一个总体调查问卷，一者让用户对自己体验的各个功能点有一个回顾和比较，同样也可以验证用户体验过程的态度和最终的态度是否具有一致性。如果存在不一致，应该进一步追问理由，确定用户的真实想法。

测试时，让用户体验竞品，并作出比较，也是发现有效信息的途径。

3. 敏锐观察

测试中，除了按照已定的提纲进行问答之外，过程中还要敏锐的观察用户一些细微的表情、停留、思考。不但要了解用户对个功能点如何评价的，还要知道用户做某一任务过程中，是怎么思考、计划、实施的，用户的第一反应、习惯性的操作、思维路线的作用远远大于单纯的评价。用户任务完成之后，要追问用户如此操作的原因。

4. 记录原话并习惯性确认

测试结论要有用户的原话支持，不能轻易的改变用户的表述。和用户交流过程中，要习惯性的问：“请问你的意思是……?”“我这样理解你的意思，你看对么……?”以保证测试结论的效度。

5. 必要时进行入户调查

首先，入户调查会大大减少外界环境的影响，用户在自己的空间中，会更真实的反映常见的问题。其次，入户调查一般是在用户画像提取出来之后，按照用户画像描述的属性，有意识有针对性去挑选具有某些典型属性的对象进行深入、全面、系统调查（典型调查），比如某一产品的目标用户，他们反映的问题，代表性强，往往有以一当十的功效，避免了非目标用户信息造成的干扰。

6. 用户条件与数量

参与测试用户根据目标用户特征选择。

一般衡量测试是否需要继续进行的方法是：看是否发现新的问题，如果有新的问题，就应该继续，反之，可以结束。

Neilson研究结果表明，5名用户的测试可以发现85%的可用性问题。而在我们在以往的可用性测试经验中，用户数一般定为6个，基本上能发现全部问题。当然任何数字都只是一个参考，用户数量最好根据具体的测试情况（衡量时间、资源、投入产出比）而定。总之，关键在于是否有新的问题出现。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/115740.html

SEM的前世今生，让你知道什么是SEM?

发表评论

评论列表（0条）