应用语言学作为一门独立的新兴学科和语言学的重要构成部分。下文是我为大家整理的关于应用语言学论文的范文,欢迎大家阅读参考!
应用语言学论文篇1EQS在应用语言学中的应用
[摘要]EQS是结构方程模型(SEM)的应用软件之一,它能同时分析多变量之间错综复杂的关系,处理非正态分布和缺失值,具有多重拟合指标。近年来,EQS在应用语言学领域应用较少。文章简要归纳了国内外应用语言学中运用EQS的情况,并介绍了EQS的基本操作原理及建模步骤,此外,运用EQS对中学生学习策略、学习观念及自我效能相关性这一实例进行了建模研究,以期为应用语言学和外语教学的研究提供一些借鉴作用。
[关键词]结构方程模型EQS应用语言学学习策略
引言
结构方程模型(SEM,Structural Equation Modeling)是综合因子分析(Factor Analysis)和路径分析(PathAnalysis)来探索研究变数和因子之间因果关系的一种模型,其最大的特点是应用变量的协方差矩阵(Covariance Matrix)来同时分析多种变量间交错复杂的关系,即利用各潜在的观测因子来探讨因果关系的隐含结构,而传统的线性回归分析只能提供变量间的直接效应而不能显示可能存在的间接效应,以及回避了因共线性而导致出现单项指标与总体出现负相关等无法解释的数据分析结果。结构方程模型最初起源于心理学,后被广泛应用到其他研究领域,例如社会学、经济学、市场分析、应用语言学等。目前应用较为广泛的SEM软件有AMOS、LISREL、EzPATH、EQS等。
一、EQS综述
EQS(Structural Equation Modeling Software)是1986年由Peter M。Bentler开发的一种统计软件。其基本思路为:基于专业理论知识,构建一个关于一组变量间相互关系的假设理论模型。自变量数值通过测量所得,并形成一个自变量协方差矩阵,即样本矩阵。EQS对样本矩阵与假设理论矩阵进行拟合度的检测,若能较好地满足拟合度标准,则说明此假设模型成立否则,就需要对该假设理论模型反复调整修正以提高拟合度,直至获得较理想的模型为止若拟合度仍然未达到理想状态,则该否定此假设理论模型。
国外将EQS应用于语言学的研究主要侧重于学习者个体因素研究以及语言测试研究等,前者如Sasaki和Noels分别探讨了二语水平、外语学能及智力间的关系和学习者目标与教师交际能力问的相关性:后者主要有Purpura测试了西班牙语测试因素结构,Stevens探寻了认知及元认知策略与二语测试的关系。此外,在外语教学中的应用有Lee研究了英语写作的有利及不利因素Gorsuch还将EQS应用在外语教育政策的研究中。
国内这方面的研究仍处于起步阶段,且主要侧重于语言测试。刘宝权、郭晓群较为系统地介绍了EQS在语言评估中的应用。邹申、孙海洋等利用EQS分别对TEM8人文知识部分和职前中学英语教师口语考试进行构念效度验证。彭康洲、李清华应用项目反应理论借助EQS分析2007年TEM4听力理解项目的质量。侯艳萍借助EQS探讨了可能对TEM4阅读理解任务难度产生影响的阅读任务特征变量,其中包括变量的种类、数量、它们的内部因子构念和测量属性以及各个因子贡献率大小。
纵观国内应用语言学研究,研究者多使用LISREL和AMOS,EQS还未全面吸引国内应用语言学研究者的视线。但笔者在实践中发现相对于前两种传统软件而言,EQS灵活性更高,允许自变量有测量误差,变量间可存在协方差对原始数据可进行直接加工此外还可分析非多元正态分布,它能更准确地处理更大容量模型,这将为研究者带来更大的便捷。
二、EQS基本概念
EQS6.1包含有两类变量,两种模型和两种路径。两类变量指潜在变量(Latent Variable)和观测变量(Observed Variable)前者为不可直接测量的非观测变量(Unobserved Variable),又称因子,它通常通过多个外显或可观测指标间接推算后者是通过测量、观测可直接获得的原始数据,又称指标。在EQS路径图中圆形表示潜在变量或因子,长方形表示观测变量或指标。
两种模型即测量模型和结构模型。测量模型(Measurement Model)指观测变量和潜在变量间的关系模型,即指标和因子间的关系模型。结构模型(Structural Model)指潜在变量之间的关系模型。并不是所有的实际应用中都同时存在两种模型,例如在验证性因子分析中,可能只出现包含观测变量和潜在变量的测量模型。
两种路径为自变量(Independent Variable)和因变量(Dependent Variable)之间的路径,以及因变量和因变量之间的路径。在EQS描绘的路径图中,单向箭头表示一个变量直接影响另一个变量,如潜在变量指向指标的单向箭头表示因子负荷,直接指向指标的单向箭头表示潜在变量的误差双向弧形箭头表示两个变量可能相关潜在自变量不应有箭头指向,所有指向潜在因变量的箭头来自潜在自变量或其他潜在因变量。
三、EQS的建模步骤
根据Bollen和Long的研究,结构方程建模具有五个步骤:(1)模型构建(Model Specification)、(2)模型识别(ModelIdentification)、(3)模型估算(Model Estimation)、(4)模型拟合(Testing Model Fit)、(5)模型重构(Model Re-Specification)。
1.模型构建
在该步骤,研究者要在已有的理论和专业基础上确定具体的模型,通过EQS模型图和方程来表达该模型各变量间的相互关系,根据各变量对模型的路径参数进行模型估算,查看并评估各因子、潜在变量间的各种关系,并通过数据检验模型整体的拟合度。 2.模型识别
Kunnan认为在模型识别阶段会时会出现三种情况:(1)模型不可识别(Under-identified),即不能从协方差矩阵中估算出一个或多个参数的情况(2)模型正好识别(Just-identified),可估算出所有参数的情况(3)模型超识别(Over-identified),可有不止一种方法估算出所有参数的情况。因参数估算计值不稳定,模型识别不足的情况不能信赖。只有增加制约参数,才可达到正好识别或超识别这两种可以接受的模型。
3.模型估计
根据自变量的方差协方差模型估算所有参数的估计值,使模型再生矩阵与样本协方差矩阵间的差异渐进最吻合状态。目前最常用的估算方法是最大似然法,要求数据等距且多变量正态分布。EQS系统有个强韧选项(Robust Option)生成Satorra-Benfle卡方值,可获得一个比其他统计量更接近的分布。即使分布假设不能满足,出现非多元正态分布,强韧标准误在大样本中也可接受。EQS为所有变量、因子及变量因子间的误差设定了标准,从而固定了参数,获得新的估算值。
4.模型拟合
模型拟合是检测假设模型矩阵与样本矩阵在多大程度上的拟合,即检测模型的拟合度。因其中一个重要统计指标卡方值较敏感,容易受到样本大小的影响,所以在实际操作中还得考虑样本数据大小对模型拟合度所产生的影响。根据以往的研究经验,理想模型拟合度的参照标准如表1。
5.模型重构
若模型拟合度与各标准量范围差异较大或个别指标不理想,则该模型构建有误,需重构。重构时需检验两组估计值:第一组为具有显著意义的参数估计值,将没有显著意义的参数估计值设为0,但需在足够的专业理论基础上才可进行。第二组为残余值矩阵,若个别变量残余值较大,如大于或等于2.58,则该变量未设定好若较多变量残余值都较大,则该模型整体构建有误。在此过程中EQS系统的LM-检验和W-检验功能可对模型重构提供进一步的帮助信息。但每个参数及变量之间的相互关系非常密切,任何一处的改动都可能对总体模型产生较大的影响。因而每个参数的调整都需重新估算,得出新的模型拟合指数,直至获得最终的理想模型为止。
四、EQS在应用语言学中的应用实例
笔者曾运用EQS研究了中学生英语学习策略、学习观念和自我效能的相关性,下文将予以展示。本研究首先通过问卷调查的方式对某中学109名高二被试者进行测试。问卷由三部分组成:第一部分是Oxford设计的《英语学习策略量表》,它由记忆策略、认知策略、补偿策略、元认知策略、情感策略、社会策略等6个要素50个项目组成第二部分是Horwitz设计的《语言学习观念调查表》,包含外语学能、语言学习难度、语言学习性质、学习与交际策略、动机观念等5个要素34个项目第三部分是德国心理学家Schwarzer和Jerusalem设计的《自我效能量表》,包含1个要素10个项目。
收集了调查数据后,我们运用EQS对数据进行分析。首先打开EQS界面,新建一个原始数据库文件,设定应变量名称及数目,输入原始数据。三个量表所测量的12个要素为自变量,学习策略、学习观念和学习效能不可直接测量,需通过各量表12个要素间接测量,则为潜在变量。其次,对EQS作包括描述性分析、回归分析、相关分析、因子分析、误差分析在内的描述性统计,以观察样本整体情况。然后对EQS作验证性统计,即因子模型统计分析。根据已有的专业知识,构建初始模型如图1。
EQS运行后所得各拟合指数结果见表2。
按理想模型拟合度的参照标准,该模型并未达到可接受的理想模型程度。根据二语习得中学习策略、学习观念及自我效能的有关理论和最大标准化残差(Largest Standardized Residuals)所提供的修正指数(参见表3),通过设定自由参数和在模型的多组误差间增添多条双向箭头的路径以建立相应误差变量间的协方差矩阵,反复修正之后得到较理想的模型(如图2)。修正模型拟合效果指标如表4,该模型拟合度较高,可接受。
学习策略、学习观念和自我效能之间具有高度的相关性,但各自的路径强度却有所区别。相对于自我效能而言,学习观念对学习策略的影响更大(0.86>0.68)。学习策略、观念及效能的各个因素相互之间也具有不同程度的相关性,所以在平时的英语教学和学习中,既要在整体上注意对学习策略的选择、加强对学习观念的引导,注重对自我效能的提高,又要对具体的学习策略如补偿策略、记忆策略、认知策略以及语言难度和学习动机等方面有充分的认知,才能更有效地引导学习者的英语学习。
五、结语
本文介绍了EQS统计软件的基本操作原理及步骤,并通过对中学生英语学习策略、观念及自我效能间相关性的模型构建、拟合、重构、修正等过程,最终创建出满足各项指标的修正模型。结果发现学习策略、学习观念和自我效能之间高度相关,但相关强度有差异。学习者较多使用补偿、认知、记忆策略,较少使用社会策略。观念的学能和动机对学习策略的影响较大。在结构方程模型软件中,EQS更易操作,灵活性更高,能更准确地处理大容量多维度变量模型,尤其在处理非正态分布和有缺失值数据中效果良好,且允许变量测量误差和协方差的存在。EQS评估模型拟合指标的多重性可以为应用语言学中多因素间多维量化提供更准确、科学、直观的信息,具有广阔的应用前景。
应用语言学论文篇2应用语言学质化研究发展综述
【摘要】1960年开始,应用语言学作为一门独立的新兴学科和语言学的重要构成部分,应用语言学除了涉及语言教学外,还涉及结合语言和心理学、自然和社会等学科。而应用语言学质化研究逐渐成为人们关注的焦点。由于我国应用语言学质化研究的方式较为生疏,与量化研究相比要落后。因此,本文通过简要介绍应用语言学,对应用语言学质化研究遇到的问题进行分析,并针对应用语言学质化研究方式及重点方向进行了阐述。
【关键词】应用语言学质化研究发展
在应用语言学中,量化与质化问的差别在于它们主、客观的不同,以及文字和数字的不同等。这种差异间的研究主要是针对知识本质和本质问理解与信念的不同研究范式。这两种范式占据着后实证主义、解释主义地位。随着应用语言学的深入研究,质化研究方式主要有:语篇分析和个人叙述、人种志和专题陈述,以及互动分析等。例如:日记和传记研究、访谈和课堂互动分析等。新世纪的到来使应用语言学研究偏向量与质方式的融合和巩固。
一、应用语言学
19世纪初,语言理论方面的研究和应用方面的研究开始分化。19世纪叶末,J.N.博杜恩·德·库尔德内提出了应用语言学这个概念,但没有得到广泛的注意。20世纪以后,语言科学得到了进一步的发展,应用范围空前扩大,语言应用方面的研究和理论方面的研究明确地区分开来,应用语言学这个名词开始广泛运用,并促成了应用语言学和理论语言学的分化。
从广义的角度来分析,应用语言学主要是将语言学的知识在其它学科领域问题解决中得以应用。换句话来说,就是跨学科实现问题的解决。
从狭义的角度来分析,应用语言学主要是专门的语言教学,尤其是外语和第二语言的教学。其应用的知识有:语言理论与描述、相关语言学科,以及相关语言教学学科。主要涉及语言的模式,描绘语音和语法、语义和语用,及词汇等,在语言学边缘的学科,以及一些不是语言学,但与语言学教育学紧密联系的学科。
二、应用语言学质化研究遇到的问题
时代的发展必然对应用语言学的研究有着不断扩大与变换的影响。由于应用语言学具有跨科学性和实验性,以及开放性,因此,应用语言学质化研究所遇到的问题更具挑战性。
其一,在应用语言学质化研究中,由于相关学科知识的缺乏,使语言学质化研究受到严重的阻碍。例如:很多从事英汉语言教学的工作者和教师,常常因为自己对英、汉知识的缺乏,而放弃该领域的发展,因而影响到语言学科的发展。标准语的建立和规范化,文字的创制和改革。建立通用于各方言区的标准语是很重要的。应用语言学要解决的问题是如何选好这种标准语的基础方言和标准音。为无文字的语言创制文字时,基础方言和标准音更是重要的依据。文字改革包括文字系统(字母表、正词法和标点符号)的部分改进和彻底更换。标准语的建立只是语言规范化的开始。为了确定语音、语法、词汇规范,需要编出相应的正音词典、规范语法和各种类型的词典。
其二,应用语言学作为新的学科,它在理论基础上还不够完善,使质化研究的任务更为艰巨。尽管我国许多学者对应用语言学质化的研究有了一定的理论成果,但是应用语言学是否加大理论范式的建构,任然需要以多学科做后盾的理论研究。词汇是语言中变化最快的部分,新词新义不断涌现。及时、准确地把这些新词新义固定在词典中,指导人们如何运用,这是辞书对语言规范化最有效的影响。
三、应用语言学质化研究方式及重点方向
1、应用语言学质化研究方式
在应用语言学质化研究方式中,主要有:语篇分析和个人叙述、人种志和专题陈述,以及互动分析等。其中,语篇分析和个种志是目前语言教学研究中使用最多的。
其一,语篇分析。语篇分析主要是通过对真实口语语篇进行考察的一种研究,始于社会学,例如:在第二语言习得和口语测试,及技巧等教学方面研究中都有展现。语篇分析者是种处于兴趣的社交行为,而语言学者是以研究语言本身为重点的行为。语篇分析者认为语言是与语用结合的系统,它将语法和词汇等都作为可操纵的资源。总的来说,其语篇分析的对象主要是在交际中有秩序、有组织的交谈,确保社交行为的顺利进行。也可以视为站在交际者的角度,将社交行为进行发现和描述。突出内在机制。一般来说,语篇分析主要是利用语篇样本中的示例,描述和追踪交际的优势、分析和理解,已达成共识。其质化思想:交际中的秩序与以往的主导观点和研究的方向与目的完全相反交际的过程真实语料誉写和分析不可缺少分析的方式必须有实证资料的理论。
在以往应用语言质化语篇分析发展的最初阶段,只能通过录音的方式记录下口语语言资料,随着时代的发展,口语语言资料开始有图片和视频,以及非语言式的交际资料。根据语篇分析研究表明,语言学界开始对非语言线索的详细记录产生了争执。尤其是技术的发展与语篇分析的结合,技术的不断影响着语篇分析研究。
其二,人种志。人种志主要是对某文化群体的行为和语言,以及互动等进行的深度研究,属于人类学,并与自然学紧密联系,例如:深入发现人们的实际所做与应该做之间存在的矛盾等。在研究前详细描绘了研究对象的文化背景。在研究的同时,研究者必须与群体保持一定的认知距离,为了更准确的获取客观性。同时研究者必须反思自身所存在不同假想,以保持客观研究的态度。在自然背景下对群体的形体和表述进行研究,并深入群体,利用各种不同的方式对研究的资料进行采集、实验。其研究资料来源于非结构式的访谈。涉及的研究规模较小,数据分析通常涉及研究人员研究对象本身各自的行为意义的理解和解释。
2、应用语言学质化研究的重点方向
应用语言学质化研究的重点方向在于对教学方式与教师认知的研究。前者教师对交际教学观念和方法层见叠出,但结果是不一样的。除此之外,在听、说、读、写等教学方面研究中质化的应用也很普遍。在写作上,进行访谈和记录、日志和观察等采集的方式。听力上,以听力策略和技巧为主,融合了量与质。例如:Markee通过小组方式巧妙进行了非任务交谈,并且顺利进行任务与非任务交谈之间的变换。后者,由于教师是思考和积极的决策者,教学主要建立在实际导向和背景等不同思想和知识上的研究。
其认知研究内容一般为:教师认知和教育、认知和课堂教学,以及认知和语言学习等。虽然研究方式,出现了问卷为主的量化研究,但是绝大多教师认知都是利用质化研究。在教师认知研究中,量化和质化间主要出现争议的问题,量化研究多依靠问卷的方式来认知,并没通过实际考察因此受到批评。而质化研究利用回忆解说和启发式回顾、书面形式,以及课堂观察和访谈等进行资料的收集。同时,为抓住到隐形的认知过程,还需更进一步的研究。
总而言之,在应用语言学质化研究中,我国在提倡科学超越经验研究的同时,还要重视实证主义存在的缺陷,将质化研究进行规范,避免出现对学术范式的影响。虽然应用语言学质化研究在我国地位并不牢固,但是,在国外的研究中,已经占有牢固的地位。因此,就针对我国外语的语言质化研究来说,在掌握实践和质化方式的前提下,对混合方式的思考和时间应用,将对我国应用语言质化研究具有非常重要的意义。
结构关系方程模型(SEM)属于验证式的协方差结构模型分析,完整的协方差结构模型包含两个次模型:①测量模型(如图),潜变量(即不可自我描述的因变量)被显性指标(即观察变量)所测量或概念化,测量模型也可以复杂一些,比如二阶测量模型,;②结构模型(如图),潜变量之间的假设关系,以及无法解释的变异量部分,以确认假设的潜变量之间的关系以及潜变量与显性指标的一致性程度。当然,复杂度更高的结构模型比比皆是,这就太考验理论能力、概念化能力、量表设计能力和SEM模型控制能力了。1997年9月,创业狂人Bill Gross创立了搜索引擎公司GoTo,后更名为Overture。9个月后,Overture开始 在搜索结果页面上呈现商业广告 ,广告主只在搜索引擎用户点击其广告的时候才需要向Overture付费,因此这种广告形式被称为 Pay-Per-Click 。隔年,Overture在NASDAQ成功上市;2003年,被雅虎收购。
雅虎最终放弃了自己的搜索业务, 但Overture所创立的商业模式,仍在被当今几乎所有主流搜索引擎使用。 从Google Adwords到百度竞价,它们实现搜索流量变现的基本商业逻辑皆可溯源至Overture。顺便八卦一句,Bill Gross不但自己是个创业狂,还在1996年建立了一间专门孵化创业公司的公司idealab,孵出了一连串金光闪闪的名字。
Pay-Per-Click的出现,称得上是互联网广告乃至整个广告行业的一个里程碑式的变化。广告主不再因为在某个广告位“ 展示 ”了自己的广告而支付费用,而是因为潜在消费者对其广告产生兴趣而进行的“ 点击 ”广告的行为付费。
换句话说, 广告主不再需要为对自己的产品或服务不感兴趣的人支付费用 ,John Wanamaker所提出的广告行业之“哥德巴赫猜想”——“我知道在广告上的投资有一半是无用的,但问题是我不知道是哪一半”——向着解决的方向迈出了关键性的一步。由于这种广告形式密切依存于搜索引擎,因此现在人们一般称它为搜索引擎营销(Search Engine Marketing,简称 SEM )。
在SEM广告出现之后,互联网广告的创新层出不穷,有些主打更加精美华丽的表现形式(如富媒体广告),有些则致力于更加精准地定位到潜在消费者(如各种RTB广告系统),但SEM广告仍然是一种非常重要的互联网广告形式,在国内市场上的收入占比接近40%。
SEM在将近20年的发展历程中,有过多次具体实现方式上的演变。这些变化所围绕的一个重要主题是, 当有多个广告主同时购买一个广告的时候,哪个广告主的广告应当排在前面 ?在早期,搜索引擎曾采用过单纯由广告主的出价决定其广告位置的方式。这一排序方法的弊端非常明显:它很容易导致好的广告位甚至是全部广告位都被广告费用支付能力和支付意愿都足够高的广告主所垄断的情况。
这样一来,搜索引擎的广告收入虽然有可能在短期内得到快速增长,但从长期来看,会将支付能力不高或者广告投放策略相对保守的广告主屏蔽在市场之外,从而缩小整个潜在市场的规模;同时,消费者也可能因为无法找到高质量的产品和服务而流失,使得市场规模进一步缩水。因此,各搜索引擎陆续推出了影响排名的权重因素。
权重因素的计算方式和命名随搜索引擎和时间推移而不同。以百度为例,它在2009年首次推出了自己的权重因素,并将其命名为“ 质量度 ”。质量度从低到高有一星至三星三个水平,是百度综合各种因素做出的对于广告质量的评价。2013年,三星分级的质量度被调整为0~10分的质量得分。
当有多个广告主购买同一个广告的时候,搜索引擎对每个广告主按照公式(1)计算出排名指数,然后按照排名指数从高到低排序,排名指数最高的广告主获得第一个广告位,以此类推。
在这一机制下, 权重得分高的广告主可以以更低的价格拿到更好的广告展现位置 ,从而搜索引擎实现了将广告主的竞争焦点从出价转移到提升权重得分上的目的。
权重的具体计算方式只有搜索引擎公司负责商业产品的核心团队了解,但是各公司都会公布可以提升权重的指导性原则,并且这些原则之间有很高的相似性,基本都以提升广告文案的吸引力、积累良好的投放数据等为主。
在决定了广告主的排列顺序之后,搜索引擎还需要决定的另一个重要问题是, 一旦用户点击了某一广告,搜索引擎应向相关的广告主收取多少费用 ?一个直观的选择是,按照广告主的出价收费。但各大搜索引擎多按类似于如下公式(2)的方式确定点击价格。为了便于说明,这里借用了百度对于权重的命名。公式中的“当前排名”与“下一名”均指根据公式(1)计算出来的广告排名。
根据公式(2),广告主实际支付的价格与自己的出价无关,反而在很大程度上受到排名指数紧随其后的竞争对手出价的制约;不过,结合公式(1)、(2)可以知道,它一定不会高于广告主自己的出价。这意味着,如果某广告主提供的广告质量度相对对手更高,那么他不但能够以较低的价格得到更好的排名,而且实际支付的点击价格还会比自己的出价(广告主愿意为这个广告支付的费用)更低;他在质量度上的相对优势越明显,就能节省越多的广告预算。搜索引擎通过这一机制,实现了 进一步激励广告主提供高质量广告的目的 。
以上就是搜索流量变现的基本商业逻辑,接下来我们简单了解一下,想要在搜索引擎上投放广告的广告主具体需要进行哪些工作。为了说明便利,这部分仍以百度为例,这些内容在各主要搜索引擎上会有诸多细微的差别,但主干部分非常相似。
实现搜索流量的变现需要广告主、搜索引擎和用户三方共同完成,缺一不可。广告主一方,首先要在想投放广告的搜索引擎上开立一个 推广账户 ,并预存一部分费用。
然后他就要做出两个最关键的决策,购买哪些广告以及确定自己愿意为每一个广告支付的费用。
由于用户是通过提交搜索词的方式来使用搜索引擎的,因此广告主购买的广告也是以词为单位的,称为“ 关键词 ”,一个关键词就是一条广告;为了得到更多的展现和点击机会, 关键词应当尽可能贴近用户的提交搜索词的习惯 。
选定了关键词之后,广告主还要为这些广告决定出价、落地页和匹配方式等设置。
出价在之前已有描述,“ 落地页 ”是指用户点击广告后会进入的页面;这个页面来自于广告主的网站,应该与关键词足够匹配,否则用户即使点击了广告也会因为无法取得想要的信息而离开。比如,关键词“英语口语培训价格”对应的落地页,不应只介绍培训班的上课时间。
“ 匹配模式 ”则是在告诉搜索引擎,当用户的搜索词和一个广告主购买的关键词相似度达到什么程度的时候,才考虑展现该广告主的广告;比如在搜索“英语口语培训”时,由于匹配模式的不同,用户有可能会看到“英语口语培训”、“口语培训”、“英语外教”、“全外教教学”等关键词对应的广告。
用户的搜索习惯千差万别,这就决定了一个有效的SEM账户中会包含非常多的关键词。
这些关键词有些彼此含义非常相似,比如品牌的全称和简称、各种型号的同一产品的名称等。为了提高广告的投放效率,搜索引擎要求广告主将关键词按照相似性进行分组;百度要求的分组结构是两层的,相似关键词组成“ 单元 ”、相似单元再合并为“ 计划 ”。
组内的关键词很相似,因此可以为每一组关键词撰写通用的广告语,称为“ 创意 ”;而且组的数量相对于关键词的数量要小得多,创意与组关联使得广告主有精力对其进行精雕细琢,写出高质量的广告语。这是搜索引擎引导广告主提升广告质量的又一个手段。
对于一组关键词,广告主还可以设置它们的 投放时间 (例如只在工作日下午3点到5点投放)和 投放地域 (例如只在一线城市和省会城市投放);在投放时间之外或投放地域之外进行搜索的用户,无法看到该广告主的广告。
至此,广告主的广告就有可能在搜索引擎上被用户看到和点击了。
图1 投放搜索引擎广告的实现
用户在搜索引擎进行搜索的时候,搜索引擎会先根据搜索词找到所有符合投放条件的关键词广告,按照公式(1)、(2)选择可以被用户看到的广告并计算出它们的点击价格,再将这些广告与非付费内容一起呈现给用户;用户看到广告后,可能会点击其中一部分引发其进一步阅览兴趣的广告,此时搜索引擎按照计算好的点击价格从用户预付的广告费用中扣除掉这次点击对应的费用。
SEM广告相关的基本行为到这里就结束了,搜索引擎会为广告主提供如下表1所示的数据报表以衡量投放效果。
表中的“ 展现 ”指一条关键词广告被呈现在搜索结果页上的次数;“ 点击 ”指用户点击该广告的次数;“ 消费 ”指广告主因这些点击向搜索引擎支付的合计费用;“ 平均排名 ”是关键词各次展现时排名的平均数,因为每个广告主预算以及他们在关键词推广时段等设定上的差异,同一关键词每次展现的排名可能是不同的,所以广告每次展现时的排名虽然是整数,但平均排名则可能是小数。
CPC和CTR是衍生指标:“ CPC ”是cost per click的缩写,通过消费除以点击得到,代表广告主平均为每次点击支付的费用;“ CTR ”是click through rate的缩写,通过点击除以展现得到,表示用户对展现出来的广告表现出兴趣的可能性大小。
搜索引擎一般以天为最细粒度提供数据,除了关键词级别之外,还按照账户级别、计划级别、单元级别、创意级别提供。广告主可以通过这些数据,了解自己的费用投放情况,并且根据它来优化自己的广告投放。比如,对于那些消费和CPC都很高(消耗资源多)、CTR很低(用户兴趣低)、平均排名非常靠前(出价相对于市场总体水平来说偏高)的关键词,可以考虑适当降低它们的出价(减少资源投放)或者尝试修改创意(尝试通过提升广告吸引力来提升质量度)。
表1 搜索引擎向广告主提供的数据报告示例片段
细心的读者可能会发现,在介绍SEM基本商业逻辑的时候,我们描述的是用户每一个步骤的行为,而表1所提供的则是按天对每一个关键词广告进行汇总或平均的结果。
在前面的讨论中,我们曾经提到过,关键词每一次展现的排名、用户是否点击广告、具体扣除的费用都可能随时间变化而不同,我们是否有可能拿到这样更细粒度的数据来对投放做更精细的优化呢?
比如,表1中的广告主,假定他希望平均排名2.5的广告“鲜花速递”一直都能出现在第2个广告位上就好,那么根据表1提供的数据,他还需要继续提高自己的出价,一般来说他为这个广告支付的费用也会随之增加。
但是,如果他进一步知道,这条广告在下午3点到5点之间可以保持在每次展现都在第1名,但在晚上8点至11点却一般排在第3名之后,那么他就可以在下午3~5点适度降低出价、在晚上8~11点适度提高出价,在控制消费量基本不变甚至略有下降的前提下实现提升平均排名的目标。
遗憾的是,搜索引擎一般并不提供这样的数据。
此外,同样是通过点击SEM广告进入广告主网站的搜索引擎用户,他们对于广告主的价值也不一样。
举一个极端的例子,彼此存在竞争关系的广告主也可以通过互相点击对方的广告来达到消耗对手广告预算的目的,这就是所谓的 恶意点击 。
搜索引擎会对其进行过滤,但不能完全防止它的发生。对于一些竞争特别激烈的行业,只要有少数的漏网之鱼就会造成大量的预算浪费(例如在前几年礼品经济还非常盛行的时候,节庆前期应季礼品相关的关键词,其点击价格有时会高达四位数)。
即使不考虑恶意点击之类极端的情况,通过SEM广告进入广告主网站的用户在到达网站后的行为也有差异,有些完成了广告主希望看到的行为(比如进入电商网站后,进行了注册和下单支付),有些则没有;广告主花费在前者身上的推广费用得到了回报而后者则没有。
由上可知,仅靠搜索引擎提供的表1数据只能对SEM投放进行粗线条的优化。一个补救的方式是,在自己的网站上部署 网站流量监测工具 。
网站流量监测工具会在用户访问广告主网站的时候记录他们的访问轨迹,以及注册、购买等关键行为。
大型搜索引擎为了进一步扩大自己的数据收集能力,一般也会提供免费的网站监测工具供广告主使用,比如google的GA和百度的百度统计。
这些通用型的免费工具比较适用于那些仅仅将互联网作为引入潜在消费者的一种工具、最终的成交和交付行为主要发生在线下、并且由于规模等原因所限暂时无力负担数据技术团队的广告主;比如在医疗美容、教育培训等行业,潜在消费者在网站上的行为终止于留下联系方式,后续的销售、到店、支付、交易、售后等行为都在线下进行。
但是对于电商、第三方支付、互联网金融等几乎所有成交和交付行为都发生在线上的广告主来说,还是应当从一开始就建立自己的技术团队和网站流量监测工具。
表2 网站流量监测工具记录的基本信息
如果广告主进行推广的搜索引擎是百度,还可以在关键词广告的落地页链接上部署百度提供的 URL通配符 参数,以获取更多的推广相关信息。
URL通配符是加在关键词落地页链接后的一串符合特定格式的字符串,能够在用户点击SEM广告进入广告主网站时,传递给广告主用户点击的是哪个关键词广告、当时排名的位置、该关键词的匹配模式等信息。
表2中“访问页面”里问号后面的字符串就是由URL通配符返回的结果,它告诉我们用户进入网站是通过点击了哪个关键词广告(keywordId=xxxxxxx)、这个广告当时展现在第几个广告位(adPosition=xxxx)。
对于不提供类似URL通配符一类服务的搜索引擎,广告主可以在每个落地页链接上自行添加参数标明关键词,但操作起来相对麻烦一些而且一般来说无法获取关键词之外的信息。
网站流量监测工具和URL统配符一起应用,广告主就可以知道广告每一次被点击的时间、大致发生在哪个地方、广告展现在第几个位置等信息;同时访问者编号可以让广告主识别点击了广告的用户是马上离开了网站,还是继续访问了其他页面,以及有没有进行广告主所希望的目标行为(根据广告主业务模式的不同,这个行为也会不同,常见的比如注册、下单、咨询等)。
换句话说,广告主可以知道一个用户通过点击了某个关键词广告进入了自己的网站,结合关键词的CPC,就大致知道了获取这个用户的成本;通过网站流量监测工具,可以知道这个用户后续有没有达成目标行为,这就是用户带来的产出。
投入和产出合并在一起,广告主就可以在用户、关键词广告等各种级别上进行推广的投入产出分析,并通过投入产出分析来对SEM广告投放进行更加精细的优化。
这就是图1中几个红色方框所表述的内容, 它们发生在搜索引擎之外,但却是广告主精准评价自己的SEM广告投放效果所不可或缺的部分 。
举例来说,有了补充数据之后,表1将被扩充为表3。从中可以看到,“鲜花礼品”虽然单价略高,但 ROI (Return>有些时候,广告主希望用户达成的目标行为结果无法以金额来表示,比如,当广告主希望取得更多注册用户时,其目标行为就是完成注册流程、成为注册用户。在这种情况下,表3中最右侧的两列可以被替换成“转化数量”和“CPA”。
“ 转化数量 ”就是用户达成的广告主目标行为的次数,在这个例子里就是新增了多少注册用户;“ CPA ”通过消费除以转化数量得到,表示广告主获得每一个目标行为的平均成本,它是比CPC更好的单位成本衡量指标。
表3 搜索引擎与广告主自行监测数据的合并
总结:
1
本节主要为大家介绍SEM广告的基本商业逻辑,其中的两个关键问题是:
a) 多个广告主购买同一个广告时,谁可以排在前面?
b) 用户点击广告时,搜索引擎会向广告主收取多少费用?
2
SEM在精准衡量广告效果方面,迈出了里程碑式的一步。广告主想要提升自己SEM广告的优化效果,除了使用搜索引擎提供的数据外,最好进一步通过如下方式获取补充数据:
a) 部署网站流量监控工具:有免费工具,也可自行开发;对有技术能力者,推荐后者
b) 在关键词广告落地页链接中添加URL通配符(百度)或自行添加关键词标识(其他搜索引擎)
3
讲解了一些基本术语的含义:
Pay-per-Click、SEM;账户、计划、单元、关键词、创意、落地页、出价、匹配模式、投放地域、投放时间;质量度、排名指数;展现、点击、消费、CPC、CTR、ROI、转化数量、CPA;网站流量监控工具、URL通配符。
练习:
附件中提供了一份模拟的关键词级别SEM推广报表,请根据表中已有的数据计算衍生指标CPC、CTR、ROI,并尝试寻找可能的优化方向。
PS:附件中的计划、单元组织结构参考了常见的关键词分组策略,可供初步接触SEM实务的读者参考。
参考:
1、本文在介绍sem广告时,为便于理解,对其业务逻辑进行了适度地简化。需要了解更详细内容的读者,请查阅各搜索引擎提供的指南
2、关于URL统配符的详细信息,可参考帮助文档。【http://dev2.baidu.com/docs.do?product=2#page=URL_Tag#page=URL_Tag】
3、关于网站流量监测工具及相关的数据分析,可参考网站分析在中国等网站及博客。【http://www.chinawebanalytics.cn/】
4、Bill Gross和John Wanamaker都是富有传奇色彩的人,有兴趣的读者可自行八卦。
注:
本文中使用的所有数据皆在真实数据基础上进行过模糊化处理,保留了实际投放中会遇到的典型数据特征,但不可作为实际投放的参考。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)