菜单
导航菜单
/ 全部 / 多谷学院

从CCTV到Google:聊一聊竞价广告的机制设计

2018年09月28日

关于竞价广告,很多人有两个极端的看法:


  • 第一观点会认为竞价广告非常简单,不就是央视每年黄金广告位招标么,谁出价高广告位给谁;


  • 第二个极端会认为竞价广告过于复杂,涉及到到博弈论、机制设计、拍卖理论、CTR预估等普通人根本弄不明白高深理论,因此很多人对此望而却步………


告诉你,真相就像《小马过河》的结局一样:河水既不像黄牛说的那么浅,也不像松鼠说的那么深——竞价广告的基本逻辑当然会涉及到很多复杂理论,但看完这篇文章大部分人可以轻松理解其核心原理的来龙去脉。


一、从央视标王到Google的竞价广告系统


关于竞价广告,很多人认为百度是国内推出第一个竞价广告的公司;事实上,从更广泛的意义上,央视的黄金广告竞标更早地向大家普及了“竞价广告”这个概念。


早在1994年,央视就开始了以竞价的方式拍卖广告位,诞生了秦池、爱多VCD等知名标王。


一个典型的拍卖场景是这样的——拍卖师先标明广告位,同时表明底价,然后开始等待竞价者向上竞价,“100万!”、“120万!”、“200万!”,“200万一次,200万两次,成交!”

这样的场景我们在众多影视作品中再熟悉不过。


然而,并非所有的拍卖都是以这种方式进行,这仅仅是众多拍卖机制中的一种,这种不断提升价格的拍卖方式被称之为“英国式拍卖”。


和英国式拍卖类似,还有荷兰式拍卖。


荷兰式拍卖的形式正好相反,拍卖师先出一个非常高的价格,然后不断往下试探,直到有竞拍者愿意接受这个成交价格。


那么问题来了——传统的广告可以通过这种方式竞价,那么在线的广告是不是也可以用同样的方法进行竞价呢?


答案是否定的。


原因在于:在线广告的拍卖与传统广告拍卖有几点重要的区别,而这些区别会对竞价机制的设计产生重要影响——


第一,不管是英国式拍卖还是荷兰式拍卖,每个人的出价都是公开的,而在线广告主可能很多并不愿意公开自己的出价,因此公开竞价就变得不适合。


第二,央视的拍卖是单次行为,而在线广告是多次重复博弈,即这个广告位被抢了,广告主还可以抢下个广告位,广告主可以不断调整自己的出价。


第三,在线广告存在多个标的物(每一次广告请求可能都是多个竞价标的物)、海量实时计算的特征。


那么,在线广告应该采取什么样的竞价机制呢?


其实有很多选择,我们一个个来看:


第一个可能的选项是“密封第一价格”竞价。这其实也是我们熟悉的一种竞价方式,很多工程招标都采取这种方式。


它的机制是:每个竞价者不公布自己的出价,把它密封在信封里交给卖主,拍卖主让最高出价者赢得竞拍,并且支付最高出价者的出价。


有人说,这种方式看起来很完美啊,符合广告主不公开报价的需求,而且也被很多实践证明过。


然而这种竞价方式广告主的出价策略取决于别人怎么出,反而和自己的真实估值关系不大,而这应用到在线广告拍卖就会存在问题。


在线广告一个特征就是重复博弈,神马意思呢?比如线下的工程招标是一次性的,竞拍者会更加倾向于谨慎对待自己的出价——因为他只有一次机会,然而在线广告是多次的,即广告主有多次机会不断试探别人的出价,从而实现自己的最优策略。


我举一个例子——谷歌的关键词“跑步”下面的广告位,耐克认为一次点击值10块钱,阿迪认为值6块钱,这时候如果他们采取“密封第一价格”拍卖,而谷歌广告系统给出的底价是2块,那么阿迪和耐克都会试探着出价。


阿迪从2块开始出,耐克出2.1,阿迪出2.2,耐克出2.3,双方有一个不断加价的过程,一直加到6块的时候,阿迪停止出价了,因为它认为这个广告为最多值6块,阿迪退出了。


这时候只剩耐克了,耐克也不傻,既然没人和我竞争,那么我为啥要出6块呢,于是赶紧调到2块;这时候阿迪又会进场,周而复始的循环开始了。


细心的你会看到:这种方式有一个明显的缺陷——不稳定,背后的根源在于这种拍卖方式从博弈论的角度不存在纳什均衡(这一点已被经济学家从数学的角度证明),即它永远存在一个你追我赶的状态,原因是这种拍卖方式出价取决于对手的出价。


同时从更深层次上,这种机制在重复博弈的机制下至少有两个缺陷:


第一,不符合帕累托最优,即一个好的拍卖机制应该是把标的物卖给对它估值最高的竞价者,在这个案例中,评价最高的是耐克,然而有一半的几率被阿迪所抢走了。


第二,它也不符合卖方利益的最大化,耐克阿迪评价都远超2块,但出价却从2块开始出。


由此可以看出:这种竞价方式用在在线广告拍卖上不合理,那么有木有一种更好的竞价方式呢。


答案是有!


接下我们就一起来看一看:


二、获得诺贝尔奖的一次改动


经济学家威廉·维克里试图解决这个问题,他在1961年发表的《反投机、拍卖与竞争性密封投标》,这篇经典论文中系统性地论述了“第二密封价格”的拍卖方式。

它对“第一密封价格”做了一个小的改动,具体为——竞价者依然密封出价,依然是出价最高者赢得拍卖,但是胜出者只需要支付第二名出价的钱,即如果耐克出价10块,阿迪出价6块,依然是耐克胜出,但耐克只需要支付第二名阿迪的出价——6块。


这是一个违反直觉的小小改动——第一名居然只需要支付第二名的出价,然而不要小看这个小小的改动,正是因为系统地论述了这个改动,让威廉·维克里获得了1996年的诺贝尔经济学奖,“密封第二价格”拍卖在经济学里也因此被称之为“维克里拍卖”。


那么,这个神奇的小改动到底隐藏着神马秘密呢?


答案是:它正好系统地解决了“第一密封价格”存在的重大缺陷。


有人立马会问:为什么这样改一下就能克服这个缺陷呢?


简单地说,在“密封第二价格”的竞价机制中,每个人都存在一个固定的最优策略——出价等于自己的估值,还是以上的价格策略,耐克估值为10块,阿迪的出价多少不知道,这时候耐克的最优策略是神马?


答案是10块。


为什么?


我们考虑两个种情况:


第一,阿迪出价如果超过10块,那么耐克无论如何也赢不了,因为耐克不可能出价高于自己的估值,高过自己就亏了。


第二,阿迪低于10块,那么耐克应该出到自己能出到的最大价格以增加自己的获胜概率,而这个最大价值就是10块,即耐克没有下调出价的动力,因为它没有最终支付价格的控制力。


神马意思?


假如耐克出8块,这时候如果阿迪出6块,耐克赢得竞拍而且只需要支付6块,和它出10块没有区别,但如果阿迪出9块它就会失去竞价,因此耐克没有动力把出价调到8块这种有可能导致竞价失败的出价,唯一的最优策略就是出价10块。


用博弈论的话说,“密封第二价格”存在一个唯一的纳什均衡,即每个人都出自己对于商品的真实估值是最优策略,因此该机制是一个鼓励竞拍者讲真话的机制,同时具有相当的稳定性,即广告主没有频繁调整自己出价的动力。


在这种机制下,永远是对广告位评价最高的广告主胜出,同时保证了平台的收入,没有广告主出价比自己评价更低的出价。


事实上,谷歌、百度、新浪微博等广告平台都是采取这种竞价方式。


好,有人会说,这种竞价方式就是完美的竞价方式吗?其实不一定,“密封第二竞价”机制至少存在一个缺陷,那就是它的反作弊特性不强,假如存在互相勾结的同谋,在这种竞价机制下,同谋更加容易实现。


神马意思?


依然拿耐克阿迪来打比喻:耐克的心理出价是10块,阿迪是6块,这时候他们勾结,阿迪出1块,耐克出10块,最终耐克只需要花1块钱就能买走这个广告位,受伤的是广告平台。


聪明的人立马会说——难道“第一密封价格”不会出现这种情况吗?比如耐克和阿迪商量好,耐克出1块,阿迪出0.5元,还是耐克以1块钱的价格买走这个广告位啊!


哈哈,这么说也没错,但“第一密封价格”更容易出现背叛同谋的情况:尽管商量好耐克出1块,阿迪出0.5毛,但阿迪是有动力去违反同谋的,只要阿迪出2块,它就能赢得拍卖,这时候耐克就傻眼了。

但在“第二密封价格”的情况下,耐克出10块,阿迪出1块,这个同盟的就非常有力,因为阿迪无论如何背叛,它也不可能赢得拍卖(它的出价不可能超过6块),因此它没有背叛的动力,因此同谋就更容易达成,作弊的概率就会变大。


好,既然有这个缺陷,那么现在在线广告谷歌、百度为什么还要使用它呢?


一个重要的原因是:不同于线下的单一拍卖,在线广告是大规模重复博弈,大规模意味着参与竞价的广告主数量众多,客观上增加了勾结作弊的难度,从某种意义上掩盖了这种机制的缺陷。


三、VCG,一种多广告位的拍卖机制


以上我们讨论了竞价机制的基本原理,所有的例子都是一个广告位的情况,而在现实的广告系统中,一次请求的广告为往往是多个,比如搜索引擎就有多个广告位,我们应该如何设置竞价机制呢?


谷歌、百度就把“密封第二价格”拍卖进行了一个扩展;即如果有多个广告位,第一名按第二名加一个最小竞价单位扣费(如0.01元)、第二名按第三名扣费,第三按第四名扣费,以此类推,这种竞价方式被称作为“广义第二价格拍卖”(Generalized Second Price auction),简称GSP。

这种方式最大限度地保留了“密封第二价格”的优势,即它能形成稳定的均衡。


但它也有一个缺点:它并非全体竞价者福利最大化的竞价方式。


于是,三位经济学家Vickrey、Clarke、Groves分别在三篇论文中提出了一个多物品的拍卖机制,简称“VCG拍卖”。


这种复杂的竞价机制从整个竞价者的整体利益出发,它依然是价高者得,但扣费却是计算价高者参与给其他竞拍者带来的总损失,即先算出没有价高者参与时的总福利,然后算价高者参与之后的其他人的总福利,这个福利之差就是其他参与者的损失。


简而言之:你参与竞价,你因此给其他竞价者造成了损失,你需要为这个系统的整体福利的减小而付出成本,以保证整体福利的最大化。


这个竞价方式计算起来相对复杂,我用一个简单的例子来阐述——假如现在有两个广告位,即搜索“跑步”这个关键词的第一位和第二位,第一位能带来20个点击,第二位能带来10个点击。


有三个广告主来竞价,分别是耐克每点击付6块、阿迪的4块和锐步的2块。按照价高者得的原则,耐克赢得第一个广告位,阿迪赢得第二个广告位,锐步竞价失败。


这时候问题来了:应该扣耐克多少钱?


按照VCG竞价法则:

先算出没有耐克参与竞价时候阿迪和锐步的收益,即阿迪赢得第一个广告位,锐步赢得第二个广告位,收益为:4*20+10*2=100


然后算出有耐克参与竞价阿迪和锐步的收益,即阿迪赢得第二个广告位,锐步出局,收益为:4*10+2*0=40。


二者福利之差为:100-40=60


那么耐克应该为每个点击付的钱为:60/20=3块。

一方面是因为尽管VCG可以最大化竞价者福利,但它非常难向广告主解释,会面临极大的教育成本;


谷歌首席经济学家Hal Varian曾经就明确表示:谷歌在2002年不愿意从GSP转到VCG其中一个原因就是用户教育成本太高。


另一方面也因为从GSP直接转向VCG会面临收入下滑的风险,经济学家们已经证明VCG的收入不会比GSP高。


这篇文章主要介绍了竞价广告机制设计中的来龙去脉,事实上,竞价机制选择只是竞价广告中的一个小的方面。