淘宝的推荐机制是怎么做的?

如题所述

淘宝在我们买过某个东西之后,会在首页给我们推荐对应的商品,这是因为大数据建立的用户画像。
淘宝在我们还没有买某个东西之前,就在首页给我们推荐对应的商品,这是因为视网膜效应或者幸存者偏差。
先从常见的大数据用户画像说起
在淘宝购物的时候,我们经常会碰到这么一种情况,刚买完一箱牛奶或者只是搜索过牛奶,等你再回到淘宝首页的时候,你就会发现你的推荐栏中就有各类牛奶的推荐。
这些推荐是怎么来的呢?这就是淘宝的大数据推荐。
在有推荐之前,得先有数据,最开始淘宝的数据都来自于自身,也就是淘宝自身,但现在的来源却十分广泛.
这也是这几年阿里巴巴不断的收购各大独角兽或者行业内比较有名的公司的原因。比如uc,比如饿了吗,因为这几家公司都有大量的用户数据。
不管出发点如何,公司的第一目标一定是盈利,而电商收入的很大一部分是广告,怎样的广告更加能吸引广告主呢,那自然是转化率越高的广告位置啦。于是电商平台不断的优化各种推荐机制,将对应的广告推送到有需求的用户面前。
那么如何构建一个用户的兴趣标签?
就拿上文中牛奶这个兴趣标签来简单说明一下。
兴趣标签(牛奶)权重=行为权重️访问时长️衰减因子
行为权重:什么都不干 1 分,搜索 + 3, 评论 + 0.5,点赞 + 0.5,转发 + 2,收藏 + 2
访问时长:10S 以内权重为 0.5,10S-60S 为 1,60S 以上为 2
衰减因子:0 - 3 天内权重为 1,3 - 7 天权重为 0.85,7 - 15 天权重为 0.7,15 - 30 天权重为 0.5,30 天以上权重为 0.1
上述的权重数字并不准确,就拿行为权重来说,搜索 , 评论、点赞、转发、收藏等操作都对应不同的分数,具体的分值跟业务相关。
同理访问时长也会影响你这个兴趣标签的权重,另外随着时间的推移,兴趣标准的权重会越来越低。
讲到这里,我想大家就可以理解为什么你搜索完一个商品之后,首页的推荐栏会出现你所搜索的物品。如果你把商品加入到购物车或者干脆买下来,首页推荐栏的对应商品的广告权重会更高。
但是….,这就存在一个很大的问题
比如我刚买完一箱牛奶,你首页又给我推荐了各类牛奶!我这是要成奶牛啊,买了一箱还要我买,我可能会买吗?
我相信有很多的朋友都碰到跟我一样的问题,也经常就此问题吐槽电商的推荐算法蠢。
针对性的推荐实际上解决了很多人的选择困难症。但我们更喜欢的是,我买了一箱牛奶,你能给我推荐一些面包,饼干,干粮之类的东西。在我买了一件衣服,你能给我推荐搭配的裤子或者鞋子。这样的推荐才是我们所期望的。
当然我相信这种关联性的推荐,电商平台肯定也在做,只是这可能需要更多的数据和标签。
兴趣标签之外的作用
我们的兴趣标签除了给我们推荐对应的一些商品之外.还会有其他的作用,一些推荐的算法可以通过这些数据计算出我们的消费能力.
经常购买饼干牛奶之类生活用品的人和经常购买钻石项链,名牌包包的人肯定不会处在一个消费能力上。
此外还有消费兴趣,社交习惯等。而如果还想计算更多关于你的信息,比如性格偏好,外卖偏好,运动便好等数据,则需要更多的数据,
其中外卖偏好各大外卖平台已经有了充足的数据;
运动偏好也可以从各大运动软件上获取;
至于性格偏好则可以从各大内容平台根据你的发言,回答,评论等数据揣摩一二。
看来这里,我想大家也应该知道为什么说现在是数据时代了吧!
只有拥有足够的数据(还要有钱)就能推算出一个人的大部分信息。
这也是阿里巴巴,腾讯等互联网巨头不断收购各类能产生数据的独角兽公司的原因,
麦克风和录音权限是否真的能泄露你的隐私呢
一说到大数据和推荐算法,就有很多人会说起自己遇到的一些“奇事”。
比如有的人会说,我那天刚和朋友说起孩子奶粉的事情,隔天打开淘宝就发现推荐栏中有奶粉的推荐,更可怕的是我之前都没有搜索过奶粉这个关键字。
类似的情况并不是孤例,这时就有人怀疑是不是手机上安装的那些app在我们无意识的时候偷偷开启麦克风录下了我们的话语。从而达到数据收集的目的。
关于麦克风搜集数据的问题,有业内资深人士出来反驳,“不存在”
为什么这么说呢?实际上还是一个成本的问题,
就技术上而言,偷偷开启麦克风录下用户的话语,并发到服务器去解析,是可以实现的。
但是以目前的技术来说还无法有效的获取需要的数据。你自己想想一个人每天说那么多话,如果都录下来,这个得多少的数据传数量,需要多少的服务器资源来解析对应的数据。更不要说互联网巨头手机捏着几个亿的用户量。
如果每个用户的数据都这么搜集的话,只会得不偿失。
那么为什么会出现我刚说完某个商品,隔天淘宝就给我推荐某个产品的情况呢。
这里提到一个视网膜效应或者可以用幸存者偏差来解释。
视网膜效应
当人们产生某种特别的需要或心向时,就会对需要的对象产生浓厚的兴趣,自然或不自然的去留意相关信息,而把那些与需要不相关的其它信息则无意识的过滤掉,从而产生选择性注意
幸存者偏差
取得资讯的渠道,仅来自于幸存者或者关注者时,此资讯可能会存在与实际情况不同的偏差。
还是那之前那个例子来说,你跟朋友谈论奶粉,隔天淘宝给你推荐奶粉。
可能只是系统根据你孩子的出生记录推算出你的孩子到了需要吃奶粉的年龄。这时如果你仔细观察,说不定会发现推荐栏中还有婴儿车,纸尿布等婴儿用品。
而你因为心理作用的原因只留意到奶粉,又因为留意到奶粉所以觉得手机被窃听了。
或许以后技术更进一步会出现手机窃听来搜集数据,
温馨提示:答案为网友推荐,仅供参考
相似回答