渣排版预警,纯草稿。。。

唐平中。研究方向是经济学和ai方向,机制设计和拍卖设计。
内容:广告优化的方法论,自动优化。

【内容】
Basics on mechanism design and resrve pricing
Reinforcement mechanism design:
1.Reserve pricing in ad auctions (在广告拍卖中占到保留位,怎么算到最优)
2.Seller ranking in e-commerce.


【前言】
Auctions design and revenue optimization 拍卖设计
拍卖:
拍卖的设计涉及钱
谁能够拿到物品,每个人应该付多少钱。
目标是什么:


例子:1个用户,1个广告主。
q=1 if sold, q=0 if reserve;
buyer(advertiser):valuation x from Uniform [0,1]
假设所有信息大家都知道
buyer utility = x(q-t)
Auction = set a price p(in this case)
buyer decsion: buy if x>p
max(p(1-p)),solution: p = 0.5
可以推广到任何分布,改为f(p)*(f(1-p))即可


1个用户,n个广告主

1.first-price auction
known:Bayes equilibrium to bid (n-1) xi/n
Expected revenue:(n-1)/(n+1)

2.second price auction
known:Dominant strategy to bid truthfully
Expected revenue:(n-1)/(n+1)
结论:如果你不设保留价的话,那么你的期望收入和二价一样。无需证明(x


二价定律失效的例子:
毕加索的画卖给了王健林,2800万,但是王健林心理预期很高,但是他遇到了一些week buyer.所以付钱价格很低。
解决方案:设最小保留价格,比如我设4000万的门槛。
但这只是单次拍卖。


最优情况:
如果有1个物品,n个拍卖者
大家的xi都是uniform[0,1]
解决方案:second price auction with reserve 0.5
think of 0.5 as seller's bid, competitive for strong buyers
当大家的分布不一样的时候,查看07年诺贝尔论文。Myerson,1981,Nobel prize 2007
Myerson的问题:
没有按照bid排序,会影响公平性。
有不同的门槛。
Myerson may charge too much.可能会使得卖家流失。
(solution:objective: a revenue + b welfare + c clicks)(MSR论文) 平台+广告主+用户
雅虎:通过手动调整保留价,使得收入增加10%


High frequency mechanism design
区别:
1.高频的环境
2.Dynamic set of players
3.Rational,reflected in the data
4.Complicated,dynamic decision variables


工业界的现状:
gsp在工业界没有什么用,vcg也没什么用。
经常去调整广告的拍卖参数。
Ad hoc,Costly
能不能有一个算法来自动调整参数,使得能够得到很好的结果。


【主题】
Reinforcement mechanism design
这个不是机器学习,原因是:
我的方法是想得到更好的参数,使得广告收益更高。之前参数的data和我现在的data无关,所以这不是机器学习。
从一组参数很难预测出另外一套全新的参数的结果,有一些阶跃的东西,总之,这就不是一个machine learning


Dynamic GSP auctions
一堆关键字,平台会收到广告主的报价,然后我们能会回复kpis。
然后我们都会根据反应来修正自己的行为。
这实际上是一个Markov,每次的报价都depend on 昨天的bid distribution和 昨天的kpis


f(t+1) depend on f(t)

平台的参数制定,把整个广告主和自己的平台当作一个整体,action是每天调整参数,revenue就是每天赚得钱。
对于状态一,然后一堆bidder根据昨天的kpis和参数出了一次价格,然后可以推出新的状态。


每个关键字我们只看出价最高的bidder,不会让出价变动很大。
我们的bidder model使用rnn
输入:
kpis containing stats of several consecutive days
time-sepecific features.
输出:
bid distribution for the next time step(bid不容易预测的准,所以我们直接预估分布,而且头部buyers也是会变动)


结果的话,用rnn预估的结果和线上的结果确实比较符合。
效果比百度本身的预估好一倍。


解决刷单:
刷单方案:
1.建一个微信群,然后每个人给钱,寄空包裹,然后提高我的好评
2.把自己的价格压的非常低,使得自己的成交量上去。

导致使得一些不是优质的卖家,占据了优质流量,使得平台的转化量比较低。
淘宝本身的objective比较复杂。

解决方案,实际上是将差的卖家扔到下面去。
本质上是流量的分配。


总结:
。。。好像我们的广告系统的bid和推荐系统是分开的,所以这玩意儿好像我们根本没法用。
不过动态调整参数可以借鉴一下,可以试试greedy的方案。

唐平中讲座笔记 Reinforcement mechanism design 20171107的更多相关文章

  1. J粒子发现40周年-丁肇中中科院讲座笔记

    J粒子发现40周年-丁肇中中科院讲座笔记 华清远见2014-10-18   北京海淀区  张俊浩 watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveXVuZm ...

  2. WPF学习笔记-用Expression Design制作矢量图然后导出为XAML

    WPF学习笔记-用Expression Design制作矢量图然后导出为XAML 第一次用Windows live writer写东西,感觉不错,哈哈~~ 1.在白纸上完全凭感觉,想象来画图难度很大, ...

  3. Effective STL 学习笔记 Item 38 : Design functor classes for pass-by-value

    Effective STL 学习笔记 Item 38 : Design functor classes for pass-by-value */--> div.org-src-container ...

  4. i3D的一篇Unity教程中的笔记

    原地址:http://blog.sina.com.cn/s/blog_72b936d80100wwej.html 以下是i3D的一篇Unity教程中的笔记. i3D的这篇教程是[i3D.Next-Ge ...

  5. 新唐NDA102EC1中更改UUART1作为调试串口打印输出调试信息

    新唐NDA102EC1中更改UUART1作为调试串口打印输出调试信息 参考网上STM32修改fputc(int ch, FILE *f),把串口打印函数printf()重定向到UUART1模块的端口输 ...

  6. Android中View的layout mechanism(布局机制)

    layout mechanism Android中View的layout mechanism主要分为两个阶段:measure阶段和layout阶段.layout mechanism按照一定的顺序进行, ...

  7. 从Evernote大批顶尖高管离职,看处于漩涡中的笔记应用未来前景

    无论是巨头,还是独角兽,甚至是小而美的某些企业,在发生高管离职.裁员等情况时,总会引起业界的广泛关注.究其原因,就在于高管离职.裁员等往往意味着企业内部发生了动荡,甚至还会直接反映出所在行业的发展趋势 ...

  8. 学习笔记之Coding / Design / Tool

    CODING 学习笔记之代码大全2 - 浩然119 - 博客园 https://www.cnblogs.com/pegasus923/p/5301123.html 学习笔记之编程珠玑 Programm ...

  9. ThinkPHP中疑难笔记

    不但要记住核心的东西, 还要记住 相关的 东西: 如php cli的版本是 5.6.14 bulit: sep 30, 2015 tp中, 通常说的系统就是框架; 项目就是 "应用程序&qu ...

随机推荐

  1. 小甲鱼python基础教程飞机大战源码及素材

    百度了半天小甲鱼python飞机大战的源码和素材,搜出一堆不知道是什么玩意儿的玩意儿. 最终还是自己对着视频一行行代码敲出来. 需要的同学点下面的链接自取. 下载

  2. 记录一次因代理Controller产生的404问题

    spring 3.2.4 为了给每一个controller配置一个拦截器链 import com.google.common.collect.Lists; import org.aopalliance ...

  3. Lambda表达式树构建(上)

    概述 Lambda是C#常用的语句,采用委托等方式,来封装真实的代码块.Lambda其实就是语法糖,是一个匿名函数,是一种高效的类似于函数式编程的表达式,Lambda简化了开发中需要编写的代码量.它可 ...

  4. move_uploaded_file中文乱码

    move_uploaded_file($_FILES['file']['tmp_name'],iconv("UTF-8","gb2312",$filname)

  5. AtCoder Regular Contest 101

    C题是个傻逼题, 一定是先向右,然后停了或者向左走到某一个点(左边同理)模拟就可以了 D题想了一会才想出来 和tjoi那道排序挺像的 二分答案变0/1来做 刚开始写的时候还把自己作为另外一类搞出来 这 ...

  6. 【CF809D】Hitchhiking in the Baltic States

    题意: 给你n个区间[li,ri],让你选出从中一个子序列,然后在子序列的每个区间里都选择一个tj,满足t1<t2<...<tlent1<t2<...<tlen.最 ...

  7. python基础——高级特性

    1.切片  切片: >>> L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack'] >>> L[:3] ['Michael ...

  8. JMeter性能测试,验证请求数据的准确性(wc命令)

    wc: 该命令统计给定文件中的字节数.字数.行数.如果没有给出文件名,则从标准输入读取. wc同时也给出所有指定文件的总统计数.字是由空格字符区分开的最大字符串. - c 统计字节数. - l 统计行 ...

  9. Python题目练习(一)

    1.使用while循环输入 1 2 3 4 5 6  8 9 10 i = 1 while i <=10 : if i != 7: print(i) else: print(' ') i += ...

  10. spring cloud (一、服务注册demo_eureka)

    首先我的博客记理论知识很少,大家对spring boot.spring cloud  .分布式 .微服务什么的一点概念都没有的还请先去百度看看理论,知道了是做什么用的,然后再写下demo ,这样学起来 ...