当前位置:首页浅谈淘宝类目属性体系:商品搜索背后的逻辑架构 举报文章

浅谈淘宝类目属性体系:商品搜索背后的逻辑架构

作者:admin    来源:用户投稿    时间:2015.6.10   

  

  [核心提示] 淘宝拥有百家商户和超过10亿的商品数,它如何让用户精准地找到想要的商品呢?其背后有着强大的技术支撑。

  淘宝目前在线商品数超过 10 亿,如何精准的帮助用户找到他想要的商品呢?经过多年的探索,淘宝通过建立一套完整的类目属性体系,终于较好的解决了这一问题,今天就跟大家一起来谈谈淘宝的类目属性体系。

  一点点历史和架构

  2003 年淘宝刚上线时,商品量很少,没有分类。 后来,商品量上百,开始有了对商品进行单级分类,有点类似于现在的一级行业类目。

  等到商品上的时候,商品的单级分类已经不能满足需求,开始有了多级分类,就是一颗类目树了。从 06 年开始引入了属性,商家按照属性模板填写属性,用户可以按照属性筛选商品。

  到了 08 年,开始将前后台类目分开,用户根据前台类目筛选商品,商家将商品挂到后台类目上,前后台类目树之间建立好映射。

  今天的淘宝类目属性体系主要由后台类目树、前台类目树、挂载在后来叶子类目上的商品属性模板以及管理前后台类目之间映射关系的类目管理平台组成,整体架构如下:

  

  从图中可以看出,淘宝类目属性体系是一个非常基础的数据服务,在商品发布页上商家选择后台类目上传商品信息,详情页上以面包屑的方式给用户显示商品所属的前台类目,在搜索结果页上让用户根据前台类目筛选商品。运营同学可以通过一个管理后台来管理前后台类目之间的映射关系以及后台类目的属性模板。

  后台类目

  后台类目面向商家,主要用于商品的分类和属性管理。商家上传商品时见到的就是后台类目,如下图:

  

  后台类目有如下特点:

  后台类目树中最重要的是叶子类目,也就是类目树上不能再往下分的类目,任何商品都必须挂载到后台叶子类目上。

  叶子类目挂载属性模版,商家发布商品时选择好类目之后会根据属性模版,补充必填的商品属性信息,方可成功上传商品。

  后台类目相对稳定,不能随便删除,叶子类目不能重复。

  前台类目

  前台分类面向用户,方便用户筛选查找商品,大部分时候用户见到的类目都是前台类目。下图就是淘宝搜索结果页上的淘宝前台类目树:

  

  前台类目有如下特点:

  用户购买时看到的类目是前台类目。

  前台类目通过跟后台映射间接和商品关联。

  前台类目由后台叶子类目+属性组成,一个前台类目可以包含多个后台类目,一个后台类目也可以映射给多个前台类目。

  前台类目不直接挂载属性模版,前台类目对应的属性来自后台叶子类目的公共属性。

  前台类目很灵活,可重叠,可删除。

  为什么要将前后台类目分开呢?

  介绍完淘宝的类目属性体系,或许你会问为啥要将前台类目和后台类目分开呢?直接用一套类目体系不就行了吗?这里我就给大家解释一下原因,到了 08 年,淘宝商品日益增多,类目层级也越来越深,买家越来越难找到想要的商品。淘宝的小二们就开始不断调整类目属性,把类目树变浅,让商品更容易被买家找到。只有一套类目体系的情况下,小二每次调整,卖家也必须跟着调整。如果只是改一次,卖家也能勉强接受,但这是周期性的。比如,在夏天服装这个类目下可能是连衣裙、衬衫等夏装,到了冬天就会变成打底裤、羽绒服等冬装了,而且卖家也都知道这些调整时合理的,但是一年到头这么调整,意味着他一年到头都在编辑类目,可能还得专门养个把人在那里,一天到晚改类目,无形中卖家的运营成本也就提高了。

  08 年的时候,有个淘宝的产品经理从线下零售巨头沃尔玛得到启发,他发现沃尔玛仓库里面的类目分区和货架区的类目分区是分离的,仓库里面的类目分区比较稳定,很少变化,而货架区的类目分区会根据活动和季节经常调整。类似的,淘宝也可以把原来的一套类目体系分为后台分类和前台分类,后台分类面向商家,用来挂载商品和属性模板,比较稳定很少变化;前台分类面向用户,主要方便用户查找商品,很灵活,可以经常调整。后台类目和前台类目之间通过映射联系起来,一个后台类目可以映射到多个前台类目,一个前台类目也可以包含多个后台类目。

  从技术的角度来看的话,前台类目就是在后台类目的基础上建立了一个虚拟类目。

  类目属性体系在搜索上的应用

  先来看看类目属性体系是怎么帮助提升搜索的精准度的,下图是说明了用户 query 到商品搜索结果的全过程:

  

  用户入 query:iPhone,淘宝类目属性体系预测到跟这个 query 最相关的前台类目是手机,然后前台类目通过映射找到后台类目手机,最终在这个类目下找到了“iPhone 5s 土豪金”这个商品。

  有了类目属性体系,用户搜索 iPhone,淘宝就不会给出手机套这样的配件了,因为它只会到手机类目下去找商品。

  有了类目属性体系,用户可以直接在搜索结果页按照类目和属性筛选商品,更加高效的找到想要的商品。而淘宝搜索可以通过记录用户搜索 query 之后的类目属性筛选行为,精准预测每一个 query 的类目和属性意图,当用户再次搜索的时候,可以根据 query 的类目属性意图,在 query 文本相关性的基础上计算出商品的类目和属性相关性,把包含 query,且跟用户的类目和属性意图最相关的商品优先展示给用户。这也是百度这样的通用搜索引擎所做不到的,因为它没有类目属性体系。

  有了类目属性体系,还可以做好搜索算法的垂直化优化。也就是在每一个细分类目下,可以采用不同的商家权重和品牌权重,甚至可以有不同的排序公式。比如用户选择手机时,更多考虑各项参数和评测文章,这个时候相应的排序权重因子可以加强,而选择服装的时候,一张漂亮的主图就无比重要了,排序因子里面主图质量的权重就需要提升了。 有了类目属性体系,还可以做基于类目和属性的个性化搜索。搜索引擎通过用户的类目属性筛选日志,可以挖掘出用户的一些特征,比如性别,意向价格区间,偏好品牌,偏好品类等,从而可以对这个用户做个性化的展示。

  类目属性体系无处不在

  除了电商,其实在各个需要帮助快速查找信息领域都可以见到类目属性体系的身影。比如:教育行业里面的课程分类,医疗行业的疾病和医院分类。当我们把用户查找的信息看做一个个实体的时候,对实体分类以帮助快速定位查找就是一个非常通用的方法。从这个角度来讲,Google 的 Knowledge Graph 可以看做是将电商网站里面的商品类目属性体系推广到了整个世界中的事物,它试图使用一套统一的类目属性网来囊括所有的实体,或许这就是通用搜索引擎的类目属性体系吧。

  题图来自 Hybris Software

  作者:@葛灿辉-搜索数据挖掘/搜索产品经理

  任职百度,希望做一个有思想的搜索产品经理。

  来源:极客公园,转载请注明作者及原文链接。

  原文地址:http://www.geekpark.net/read/view/205894

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:浅谈  属性  体系  商品  搜索  背后  逻辑  架构  
  • 相关搜索
图片推荐
    余额宝:29日前转入 国庆收益提现免费

    余额宝:29日前转入 国庆收益提现免费

    马上就要迎来十一长假了,国庆庆节紧挨着双休日,股票市场也将迎来长达9天的休市期。余额宝日前公布了国庆假期安排:假日期间还能帮你赚足收益。此外,余额宝的资金未来也不受支付宝提现新规影响,转出免费。  据
    谷粉搜搜网站权重是如何1个月从2到6的?

    谷粉搜搜网站权重是如何1个月从2到6的?

    最近发现一个网站在短短1个月时间,就神奇让网站权重从2提升到了6。不错,就是权重从2到6,日PV增长了上百倍,这不是标题党,也没有夸大,更不是向大家介绍什么黑帽作弊技术,真真切切的一个网站,不过是一个
    PC端碰到移动端,谁才是你的最爱

    PC端碰到移动端,谁才是你的最爱

    2014年是互联网化时代的一年,移动端首次超越PC端,也就是说用手机搜索的次数超越了用电脑搜索的次数。各大平台、企业站点对手机端的优化也是越来越重视,都想争夺移动端的流量。那我们做为SEO人员,不能只
    豆瓣兴趣营销之路:耐心行 前景明

    豆瓣兴趣营销之路:耐心行 前景明

    兴趣营销。在整个社会化媒体发展到现在已经呈现出了百花齐放的局面,针对于不同的用户,不同的使用场景,甚至说不同的设备终端都有各种各样的适应于那种环境的社会化媒体在生长,基于现在这样的一个social m
    实例介绍网站快照不更新让关键词排名波动加剧

    实例介绍网站快照不更新让关键词排名波动加剧

    百度lee在官方平台上明确指出网站快照的更新频率与权重并不存在任何直接的关系,但大部分站长估计都或多或少持怀疑的态度。之前龙形也认为既然百度lee都已经明确指出了,作为百度官方的权威发言,我们广大站长
    “华为”用事实和数字证明了他们强大的实力

    “华为”用事实和数字证明了他们强大的实力

    华为技术有限公司是一家生产销售通信设备的民营通信科技公司,于1987年正式注册成立,总部位于中国深圳市。华为总部论收入华为轮值董事长徐直军正式对外宣布:华为2018年营收将超过1000亿美元大关,相当
    王通:用文案在客户大脑模拟成交的秘诀

    王通:用文案在客户大脑模拟成交的秘诀

    今天给大家分享一招撰写文案的秘密:在客户大脑中模拟成交!  文案就是在和客户沟通,相同的意思,不同的表达,在客户大脑里面呈现的画面是完全不同的。  例如:现在许多家电商都是承诺:7天包退!  用户看到
    哺乳期妈妈网售多余母乳 包装袋标出产日期

    哺乳期妈妈网售多余母乳 包装袋标出产日期

    有的卖家将母乳用模具制成母乳皂出售,价格几十元不等。  卖家在网站展示的袋装母乳,上面还标有出产日期和时间。  近日,北京晨报记者发现一些处于哺乳期的妈妈在网上出售自家宝宝喝不完的母乳,有的放在储奶袋
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面