注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

小木舟的博客

笔墨生活随想,记录似水年华。

 
 
 

日志

 
 

一次presentation  

2012-12-11 11:40:58|  分类: 大学校园 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

         实验室每周都会举行一次讨论会,讨论会上,导师除了和大家讨论项目、学习上的一些事情外,还会安排学生做presentationPresentation既可以讲自己做的项目,研究方向上的学习心得,也可以挑一篇论文看完之后和大家分享。

         上一周的讨论会轮到我做presentation,我和实验室的同学们分享了一篇我看过的论文,论文的题目是《Enlister: Baidu's Recommender System for the Biggest Chinese Q&A Website》,该论文由百度公司发表在2012年九月中旬在爱尔兰都柏林举行的推荐系统领域的顶级国际会议——ACM RecSys上。ACM RecSys 2012结束不久,百度在国际顶级推荐系统会议发表论文的消息很快就传回了国内,并在微博上疯狂。好吧,我也是在微博上看到这个消息的。之后,我看了相关具体的报道(点击[这里]),对阅读该篇论文产生了不小的兴趣,毕竟这是国内公司第一次在如此高级别的会议上发表论文,而且想到还要在实验室讨论上做presentation,刚好可以拿来当材料。于是,我就看了这篇短论文。

         看完之后,发现也就那么回事。这篇论文讲的是最大中文问答网站上的百度推荐系统,“最大中文问答网站”指的是百度知道,其实就是讲在百度知道上如何向回答问题的用户推荐问题列表。作为一篇短论文,讲的还是系统的实现,区区几页的确很难把问题说详细,所以论文里面只是说他们为了解决向回答问题的用户推荐问题列表时使用了哪些技术,然后对每种使用到的技术做了大概的说明,具体细节完全没有讲,隐藏了太多的信息量,导致我上去做presentation都有点心虚。事实也说明心虚不是没有理由,讨论会上导师就针对其中的几点提问了,结果我都不知道怎么讲,因为论文里面没有说,我也只能靠自己去猜和推测。好吧,导师最后点评了一句说,国内的公司还是做不到像谷歌那些国外公司那样的“技术分享精神”,当然也不排除百度所使用的具体的技术其实还是国外的那些,所以故意隐藏掉了。

         论文讲到百度为了解决向百度知道回答问题的用户推荐问题列表的问题,使用了Content-based(基于内容)、CTR prediction(点击率预估)以及Stream computing(流式计算)等技术,Content-based是对用户和问题进行建模,CTR prediction是通过使用搜索引擎常用的点击率来对向用户推荐的问题列表进行排序,其中对用户点击问题的概率的预估使用到了最大熵分类器,而Stream computing讲的则是如何使用流式计算技术来提高系统的实时处理的效率以及提高系统的可拓展性等问题,其实就是一个分布式处理技术。论文讲这些技术的时候,具体细节都没讲,例如说使用最大熵模型的时候,直接就给出一个算法公式,然后具体怎样就没下文了。好吧,具体可以去看论文原稿,在百度文档那里可以找到,点击[这里]

         为了做这次的presentation,又做了一份PPT。好吧,最近我怎么老是在做PPT啊!!!

 一次presentation - 小木舟 - 小木舟的博客

PPT首页

一次presentation - 小木舟 - 小木舟的博客

示例页 1

一次presentation - 小木舟 - 小木舟的博客

示例页 2

          具体PPT可以点击[这里]查看。

 
  评论这张
 
阅读(486)| 评论(0)
推荐

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017