六安沧州西安三亚宝鸡菏泽
投稿投诉
菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

需求满足综述

  一、什么是需求满足
  1。1什么是需求满足
  用户来搜索章鱼保罗,就文本相关性而言,搜索引擎只要返回和章鱼保罗内容相关的结果就可以了,这样用户是否满意呢?
  用户甲:听说章鱼帝挂了,来看看最新结果,怎么全是8月份的,往后翻页中
  用户乙:今天同事们在讨论章鱼哥挂了,章鱼哥是啥?我又out了,来搜索一下章鱼帝生平事迹是啥,怎么全是最新的结果,没有章鱼哥的介绍啊,变换个query看看
  用户丙:我是铁杆球迷,看完章鱼哥,再看看足球相关的吧,鲁尼,杰拉德是否又进球了,怎么连个相关推荐都没有,还得我亲自输入。
  用户丁:找个章鱼哥的头像用一下吧,一定很拉风,怎么全是结果没有方图呢,这么扁的图怎么用啊
  用户戊:换个章鱼哥的壁纸,也许下次买彩票能发大财,咦,怎么全是小尺寸的图
  (以上信息通过分析20101027用户session得出。)
  笼统的说,用户向搜索引擎表达他的需求,搜索引擎理解用户需求,提供各不同的需求下的资源,这整个过程可统称为需求满足。简单说,就是除了基础文字相关性之外的rank工作,都属于需求满足的范畴,也就是说,提供给用户的检索结果,不仅仅要求在字面上是和用户输入的文字相关的,还要满足用户的各种不同需求。
  需求满足在rank体系中所处的位置:
  1。2为什么需要需求满足
  用户通过query表达了自己的需求,而对于大部分query来说,尤其是具有隐含需求的query,仅仅字面匹配的查询结果未必能够满足其需求。目前我们的排序系统是主要是基于文本相关性这个维度的,权值体现了query中的term与obj的相关程度,在这个体系下,相关的结果未必能够满足用户需求。
  例如前面提到的章鱼保罗的例子,显然,这些需求在文本相关性这个维度下很难解决,尤其涉及到突发时效性需求,泛需求等。
  1。3需求满足包含哪些工作
  从上面的例子中,可以看出,需求满足需要解决时效性需求问题,多需求问题,相关推荐,size需求,素材类需求,浏览引导等问题。除了基础文本相关性以外的rank策略以及为了这些所做的query分析工作可认为属于需求满足的工作,另外还包括前端结果展现与用户引导浏览的工作。
  Image需求满足,按照不同的维度,可以划分为如下几个方面:
  需求识别
  资源建设
  需求调权
  结果组织与推荐
  用户引导交互
  二、需求满足如何做
  需求满足要解决的核心问题:
  需求识别
  资源建设
  需求调权
  2。1需求的识别
  2。1。1需求的类型
  识别query有哪些需求,以及需求的强弱,是最基础的工作。首先要有需求的体系,能完备的描述各种需求,其次是如何识别这些需求,把每个query的需求对应到这个体系中去。
  通过query分类识别需求:
  现在线上query分类体系,是按照话题属性为依据来建立的。包括风景类,地名类,人物类,汽车类等等,对于每个类别,在一些维度上的需求是不一样的,比如风景类需要尺寸比较大,比较清晰,不包含人的图片,而聊天类则需要尺寸较小,最好是动态的gif图。
  这个策略下的项目有:size调权,格式调权,人脸需求,人与非人等。
  基于统计的需求识别
  通过对大量的数据统计分析,可以识别出query有哪些方面的共性。可供分析的数据很多,比如用户行为数据,点击反馈,检索结果等。
  比如:对query的检索结果,按照某一feature进行聚类,如果某个类别所包含的图片数很多,超过设定阈值时,则认为这个类别内的图片,在这个feature上,代表了这个query的需求。线上人脸需求识别就是这样来做的。
  统计用户反馈来获取需求是最能反映用户需求的方式,用户的反馈包括用户点击,query变换等,在这方面我们做的工作不多,经验也不多,是我们后续工作的重点。
  专名amp;amp;需求词
  判断query中包含专名或者需求词等关键词,是最直接的方式。比如红色宝马,显示的表达了颜色方面的需求。
  时效性需求
  时效性需求包括三部分,突发时效性、周期时效性和泛时效性需求,目前线上做的是突发时效性需求。需求的识别,主要是通过检索量的突发,资源数突发和实效性事件来判断的。
  检索量的突发,是指累积每个小时的用户检索频率,用连续15天的用户检索频率,计算突发的斜率,根据斜率的大小,来判断时效性需求的强弱。
  上述方法只适合热门query,对于长尾query,检索频率很低,无法通过这种方式识别出来,一般这种query是多term的query,可以通过是否命中关键词来判断:
  通过事件判断:这种方式,主要是想看关键term命中时效性事件的比例。当然这些事件是通过主动挖掘的时效性query,通过聚类后,对每个类别训练出来的关键词。
  2。1。2需求的强弱
  要做好需求满足,不仅要识别query有哪一类型的需求,而且要识别该类型需求的强弱,他直接指导了后续需求调权的力度。
  每个维度的需求,必须要有需求的强度,在各维度调权合并时,需求的强度决定了该维度的权值。比如时效性需求,需求的强度很高,要求满足时效性的资源,一定要排在前面。又比如清晰度饱和度调权,对大部分query而言,需求不是很强烈,调权时的力度就不能太大。
  需求强弱的计算,和后面rankmodel的要求相关,理想的状态是每个query,可以动态的计算在每个维度上的需求强弱,我们在这方面经验不多,如果暂时不能做到准确的计算的话,暂时可以考虑人工指定的方式,比如针对不同的query分类,人工设定需求维度的强度。目前可以想到的一些方式:
  显式的需求为强需求
  用户通过在query中包含需求词的方式,表达自己的需求,这样的为强需求。
  比如,最新刘德华图片,红色宝马
  基于统计的方式挖掘需求时,判定值超出阈值的比例大小,决定需求的强弱
  在用统计挖掘用户需求的方法时,一般会选取某个维度的属性,量化后计算它的统计特性,可以根据统计后该数值的分布情况,判断需求的强弱。比如,时效性需求,某段时间内,该query检索量突发特别大,是昨天检索量的100倍,如果我们设定的阈值是2倍的话,那么这个query就可认为时效性需求特别强。
  又比如通过用户点击数据挖掘size需求,对于头像类的query,大部分用户点击的是100100的方图,但是所占总点击中的比例不是很高,比如只到60,那么对这个query而言,size需求是一般强度的需求。
  2。2需求的满足
  识别出query有哪些需求,下一步的工作就是提供相应的资源。
  2。2。1资源的挖掘
  如何获得满足需求的资源,是需求满足的另一个核心问题。在资源上,通过某一个或者几个特征组合,能够把满足要求的资源和不满足要求的资源区分开,找到用户需求需要的资源,去掉不满足要求的资源,是主要的工作。
  内容属性特征
  对内容属性维度来说,可以分为底层的物理特征,中层的物体识别和高层的语义特征;对于底层的物理特征,相对比较简单,我们现在可以利用的,包括尺寸,颜色,格式,清晰度饱和度等,中层特征,我们目前用到的不多,有人与非人的,色情图片的,整车的识别,手机图片的识别等;对于高层的语义特征,包括场景的识别,图片风格的识别,是我们未来发展的方向。
  话题属性维度
  类似的query分类的体系,也可以对资源进行相似的话题属性分类,我们目前只做了站点级别的分类,效果不是很理想,主要原因一是站点粒度太粗了,二是站点分类的召回存在很大的问题。
  我们希望能做到obj级别粒度的分类,至少是页面级别的分类。如果有了话题属性的分类,和query需求的分类相配合,可以达到事半功倍的效果。
  时效性资源的收录
  我们目前时效性资源主要是挖掘的ps的时效性库,和news的资源,和非时效性资源的区分是比较容易的。
  2。2。2需求调权
  明确了query的需求,挖掘了满足需求的资源,那么如何把满足需求的资源rank到前端呢?
  对于各种不同的需求维度,都有自己的调权的策略。比如格式调权,假设query有gif图需求,对于gif的动态图,权值乘了1。2,对于静态图要降权,权值乘了0。1。又比如时效性需求,直接在前三页插入的时效性库的结果,这是因为时效性需求是一个强需求维度,简单的加权,不能保证结果调整到前三页。从这些例子中可以看出,目前需求调权的策略就是2种类型:在总权值上调权,在最后排序结果上调序。
  目前这种策略直接叠加的调权方式,优点是简单,直接,缺点也比较多,最大的是不可控,一个维度上的调权,会对最后结果造成多大的影响,在多个调权维度上,他说的话,分量有多大,不知道。
  未来的需求调权,首先应该把资源满足需求的情况,做出细化的分档,做到有直观的物理含义,其次,根据该维度需求的强弱,把这个维度的打分反映到最终结果中去,究竟是跨档调权还是档内微调,比如:
  强需求:符合要求的结果直接调到最高档,比如时效性需求
  一般需求:符合要求的结果,可以根据一定规则,提高自身档位
  弱需求:不能提升档位,在同一档内,做权值调整
  2。3需求满足的效果
  前面已经完成了query需求识别,资源识别已经需求调权的工作,那么用户是否满足了呢?搜索引擎最终是给用户服务的,用户觉得爽,才是最重要的目标。那么如何知道用户是否满意呢?
  用户接收到搜索引擎的提供的信息后,会对这些信息做出反馈。这些反馈包括了用户对搜索结果的点击、对query的主动变换,以及这些行为之后的相关行为。通过对这些数据的分析,可以知道用户的满意度。
  比如对需求识别的修正,通过用户点击反馈,可以知道query需求识别的是否正确,该需求是否该退场。比如时效性需求,被误判的query或者应该退场的query,都可以通过用户的反馈,来判定是否应该退场。
  当然,这种方式是否合理还有待调研,毕竟用户不点击一张图的原因有很多可能,有可能是需求识别的问题,有可能是该维度强弱识别的问题,也有可能是rank的问题。目前用户反馈应用只有点击调权,是否用户的反馈可以在单独的维度上有效,还需要详细的调研分析。
  另外,随着时间的推移,query的需求是在不断变化的,通过用户的反馈,可以做出及时的调整。
  三、需求满足的展望
  3。1需求满足体系框架的建立
  之前做了很多需求满足的工作,颜色,格式,尺寸,人脸,表情,头像等等,分别是casebycase来做的,其实他们之间存在着很多相似的地方。从调研过程来看,可以分为需求识别、资源满足和需求调权三大部分。
  这样分散的各个点去做,有很多弊端,一是调研重复,效率低;二是前端调权系统像打补丁一样,越来越乱,没有形成清晰的体系框架。三是容易造成调权重复。
  目前比较好的思路是建立需求满足的体系框架,包括前端的需求分析和后端需求调权。前端分析清楚query包含哪些需求,以及每个需求的强弱,把这些信息传递给后端;后端首先要有各个需求所对应的资源,然后结合上面提到的需求调权,给每个obj一个合适的档位和权值。
  以后再做需求满足类项目时,只需要调整前端的需求识别即可,如果没有新增的需求维度,后端的资源和需求调权,都可以不用改动。
  3。2更智能的需求识别
  1。分析用户行为数据挖掘需求
  用户在搜索过程中,能够被我们记录下来的一切行为,比如点击,翻页,query变换,停留时间,去向,来源等等,利用好这些数据,就能更好地理解用户的意图。目前在这方面的应用还只有点击调权,需要挖掘方面的应用还很少,是我们未来工作的重点方向。
  2。个性化需求挖掘
  通过分析session,可以获取个性化的用户个体需求。目前我们结果的展示的好坏,主要是通过分析session,来判断用户的需求,而对于高频query,展示的结果是大规模用户的行为统计,得出的一个普适的模型,这个模型由于是统计出的,因此具有客观性,可能会伤害一部分个性用户。
  3。需求强度的识别
  每个维度的需求,必须要有需求的强烈度,在各维度调权合并时,需求的强度决定了该维度的权值,比如时效性需求,需求的强度很高,要求满足时效性的资源,一定要排在前面。又比如清晰度饱和度调权,对大部分query而言,需求不是很强烈,调权时的力度就不能太大。
  3。3资源建设
  目前我们在query分类,query需求识别,query分析方面做了大量的工作,相比较而言,资源方面的建设,我们做的工作比较少,接下来希望推动obj级别的资源分类,内容属性上的几个资源分类:图标资源识别,地图资源识别,卡通动漫图的识别,以及一些截图的识别。
  3。4需求引导
  Image是浏览型为主的产品,如何引导用户更加方便的浏览,是未来工作的重点之一。
  我们已经尝试了明星结果页的query分类展示,未来我们希望能对更多类别的query,做主动引导。引用pm对主题式query的定义:主题式Query是指:Query指代的人、事、物中包含有多方面内容,具体表现为Query对应目前的检索结果中存在明显的多方面内容的混杂情况。其实就是指泛需求、多需求的query。
  对于这种泛需求query的结果的展示样式,这种分tab多结果页的形式也未必是最优的,如何更好的发挥作用,需要更加深入的调研和创新的思路。

故事里的人生盘古开天地与女娲造人补天盘古开天地的故事说,在天地还没有开辟以前,有一个不知道为何物的象鸡蛋大小的东西,后人名之曰混沌,也有称之为帝江的。在混沌的里面,睡着一个叫盘古的人,他一直酣睡了约一万八千年后醒……演讲偏见不是一件坏事壹我们曾以为偏见是源于无知。但本期TED演讲者,心理学家PaulBloom将告诉我们,偏见与偏爱可不是坏事。如果没有它们,你可能没有办法正常生活。关键是知道它们的工作机制,然后……大狼托克打电话大狼托克家装了一部电话。他想给好朋友打电话,翻开电话号码本,多有趣啊!他想和松树说说话,就拨了电话号码23232。松树的声音好像是从地底下钻出来似的:天气好冷啊!你能来陪……黄水依依1hr轻风牵衣袖,一步一回头。朝霞刚刚升起,我们一行几人,已经自驾驶离黄水。虽然昨晚,我已连连向黄水道别,包括向那一直盛开在黄水湖广场边的几朵鲜艳的苕菊花。但……适合圣诞节朋友圈的说说1,圣诞节心事吐,美好祝福送一路,送你一株圣诞树,挂上幸福一簇簇,系牢开心和财富,愿你快快乐乐不发怒,好运把你来关注,平安把你来呵护!圣诞节快乐!2,如果说圣诞老人要我只……女士潮流卷发发型增加优雅气质碎发卷发造型碎发的齐刘海制造出随意的飘逸感,加上波浪的不规则卷发造型呈现出蓬松自然的减龄风格。中分卷发浅色的蜜糖棕色染发将肤色变得白皙,加上蓬松的波浪卷度更显……女生减龄全头烫发型这样烫发显脸小不老气全头烫发型,就是将全部头发都烫卷,只要选对了发型,不仅不会变成爆炸头,还超级显脸小,而且不用担心全头烫会显老气,时尚的女生们不妨试试全头烫发哦。女生全头烫发型女生的……表白的话有趣的表白语我们结婚吧,好不好?那样我们就可以不再对着电话诉说想念,就可以每天清晨起来看见你的睡脸,然后一起吃一顿不太丰盛却很温暖的早餐。我们结婚吧,好不好?那样我们就可以拿着民政局发的红……经典语句想念是茧层层叠叠爱是利剑突破一1、不要祈祷生活的舒适,要祈祷自己变得更加坚强。2、只有自己能给自己正能量,不被周围的言语所迷惑、困扰,做好自己,相信自己,不管别人怎么说,每个人都拥有值得骄傲的东西,但……婴儿防晒霜需要卸妆吗婴儿护肤一切以安全为主婴儿防晒霜需要卸妆吗婴儿防晒霜不需要卸妆,只要用婴儿专用的沐浴露或洗面奶清洗干净,因为婴儿防晒霜都采用易清洗配方,而且卸妆产品对于婴儿的肌肤来说刺激过大,另外,也不要给婴……齐肩发怎样才不外翘齐肩发外翘的原因齐肩发怎样才不外翘1、针对发质比较软的,可以先把头发打湿,然后用那种塑料卷发一下头发,,出门之前把头发放下来,喷一点固定胶,头发就不会往外翘了。2、用卷发棒。如果头……雪参的功效与作用雪参可以提升心脏作用,避免心脏心律不齐、心肌缺血、心脏功能衰退,还可以维护胃粘膜,减轻胃溃疡和慢性胃炎,缓解食欲不振、消化不良,提高胃的消化吸收功能。雪参的功效与作用……
我是修行千年的狐今天陪一个女同事去KTV唱歌,足足唱到了三个多小时,唱的我们几个都是有点晕了,我就送身边的女同事麦霸姐回家,可我们的麦霸姐真的唱出感觉了,晃悠悠的走到门口那里还嚎呢。到了……世界上最大的犬科动物非北美灰狼莫属我们平时总是在大街小巷上看见那一只一只的宠物,它们几乎都有着一个特点,那就是不是特别的大,也是,如果太大了走在大街上除了挡路之外,更是对人们的一种威胁,如果牵着一只老虎在路上,……世界末日预言是假的科学家逐条批驳谎言世界末日的传言每过一段时期就会出现,但最终都如肥皂泡一般破灭。目前,2012年人类将迎来世界末日的传言又不时出现,好莱坞灾难片《2012》编排的一些所谓科学根据甚至让部分人对传……段誉内心想不想认段延庆这个父亲其实段誉也无可奈何段延庆为了复位,将自己失去的一切重新夺回,他曾多次威胁段誉,目的就是引出段正淳还有段正明。只是段延庆和段誉做梦都不可能想到,他们竟然是父子关系。就在段延庆准备杀死段誉的那一刻,……小笑话长寿秘诀吵架煎鸡蛋和泻药等1、在一个小山村里,有位老人在庆祝自己的百岁生日。电视台的记者问他长寿的秘诀是什么,老人:我恐怕得过三天才能告诉你。现在我正和两家广告公司谈判:一家建议我说是矿泉水,另一家则让……喝醉酒喝浓茶解酒吗怎样才可以快速解酒多喝水喝浓茶是没有解酒功效的,浓茶其中的某些成分会让人变得比较兴奋。假如喝醉酒之后再去喝浓茶的话,会让人们感觉更加醉酒,同时还会心跳加速,整个人都兴奋起来,人们也会感觉很不舒服。……十月节十月节是哈尼族最大的节日。哈尼族人则称它为扎勒特。扎勒特因在农历十月间举行,故又称十月年。美首扎勒特即大年的第一天,所有的哈尼族村寨都打扫得干干净净,男女老少身着崭新的民……没关系是马拉松啊2014年11月2日,参加杭州马拉松赛,完成了42。195公里的全程马拉松。人们常用马拉松来比喻人生和职业生涯,在这次实际参加马拉松赛的过程中,一些感受是没有实际经历所无法体会……如何给自己挑选一个好老板人在职场漂,哪能不挨刀!据统计数据显示,67的离职原因是为了离开老板。近八成人在求职时会选择老板,而且把职场人选错老板比喻成了嫁错郎;还有消息称,导致员工离职的最大原因不是所谓……父母都反对的情侣结婚率有多高操作方法01:hr首先现代人对爱情,对婚姻都比较有自己的主见,父母给的意见反而不会有太大的影响02:hr不像古时,婚姻就是父母之命,媒妁之言。父母定下来的,无论喜欢……割眼皮的坏处人们都说好看的眼睛会说话,其实一点都不假,于是那些单眼皮的女孩子都会通过双眼皮手术来让自己变美的。变美方案01:hr割眼皮的坏处有些人不注重术后的护理,导致眼睛会出……年教育系统学校领导干部考核述职述廉述学报告2018年教育系统学校领导干部考核述职述廉述学报告又到一年述职季,是自己回顾、总结、反思的契机。本人将自2018年8月以来个人在行政工作、教育教学、学习成长等方面的情况汇……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网