笔者在上一个章节中,给大家初步的讲解了一下,站内搜索的前端和后端人工干预的一些逻辑与页面呈现。那么,接下来就顺着这条叙事主干,带领大家更加深入地了解一下:站内搜索接下来需要明白的杂七杂八和主干。
站内搜索逻辑的基本组成:怎么被搜到以及怎么排序靠前?怎么描述呢?
对商家而言,,商品怎么才能被搜索到解决的是有无问题,而怎么排序靠前被消费者看到解决的是温饱问题。透过这两个问题我们来好好聊一聊搜索的两大要素:索引和排序。
索引搜索其实是依靠爬虫来提取信息的。
什么是爬虫?说的简单点就像是帮你搬运信息到仓库的小哥,爬虫只负责帮你收集信息,且会给你存放在仓库里,分门别类安排的整整齐齐。然后,你这个老板只需要查看这些信息就好了。
那么,相比互联网的广域搜索比如百度 和谷歌。电商网站的搜索就显得简单和闭塞多了,所有的商品都存在一个库里,你的爬虫甚至都不需要每天无时不刻的劳作,只需要每天跑一次就够了。所以,一个商品能否被搜索抓取到是能否展现给用户的必要条件。
索引指的就是:被爬虫抓取到并整理好的商品库。
索引分为全量索引和增量索引两部分。
全量索引为全站商品的一次更新,所有的商品变化包括上下架,名称属性标签库存信息等的变化通过全量索引进行更新;增量索引为实时更新(也不一定是实时更新,可能是按照整点规则进行更新)更新的内容主要是商品的部分属性。
下图是我一同事为了宣讲做的ppt 不是本人原创,直接截图复用了。
那么商品的哪些信息会被纳入索引呢?
——商品名称、销售地区、库存量、商品属性(尺码颜色款式等)、商品挂靠的类目名称、商品编号、商品的标签信息和价格等。
除了以上的一些固有信息外,商品的数据信息,比如:销量、评价、曝光点击等数据也会被纳入索引,用来介入接下来的排序步骤,计算排序得分。我们举个简单的例子,比如:我早上上架了一款苹果耳机。但是,我的商品标题和属性里都没有对这个款耳机的英文 AirPods的描述。
那么,用户在搜索AirPods时,是否会搜索到这款产品呢。显然是无法搜索到的,因为搜索是针对文本信息的精确匹配,此时解决办法有两个。
是给AirPods和苹果耳机配置同义词。
在商品标题属性或者标签上给商品加上AirPods关键词。这样改产品才会被搜索到。
以上即当商品的标题,属性,类目,标签,描述等属于索引范围的文本信息都不包含用户输入的关键词以及系统中的同义词时,这款产品是无法被搜索引擎搜索到的,当然也无法呈现给用户。
那么,各位对索引的概念是否有了直观的认识?没有也不要紧,我肯定不会讲第二遍。
排序能不能被搜索到的问题解决了,接下来就是商家们最关心的问题,就是:怎样让自己的商品在搜索中让更多的用户看到?
这个就涉及到搜索的排序算法了。每家电商的搜索排序都是按照自己的算法逻辑进行的。排序的算法逻辑也是各有千秋和特色。排序算法应该是站内搜索里面各大电商的核心机密。
但是,排序的因子就不那么机密了,基本上你想得到的就这么些。只是各家在各个因子上的权重不一样,计算方式也不一样。
我们先来列举一下这些因子有哪些:销量(淘宝用成交笔数)、点击、收藏、加购、好评率、商品质量分(商品信息的完善和准确程度)、用户行为偏好(用以做千人千面个性化)、店铺评分等信息。
我这里倒是有一些 排序算法的公式,但是还是算了,我看了也头疼,大家只要知道影响排序算法因子就行,知道哪些因子起了决定性作用就ok。
下图为我为自家公司在初期版本上的排序因子,看看能得出什么结论?现在很多淘宝商家削尖了脑袋想一探这个排序算法的究竟,其实大可不必,电商千千万,搜索一条路。对于产品和运营而言,只要知道哪些是直接能够提升销售和转化就够了。
上一篇:电商运营之站内搜索全面指南(二) 下一篇:内容类电商流量变现,这三个环节缺一不可
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。