为了准确地表达用户对某些商品的兴趣度,常规的行为我们需要上报:点击、分享、点赞、收藏、加购、立即下单等,而且每个行为都有自己的权重来表示不同行为的不同重要性程度。我们经常会有这么一个体验,在电商平台上下单了一个电脑桌,当买完之后下次登录时发现,依然还有电脑桌会推荐给我们,我们都已经买过了,为什么还总是把买过的商品推荐给我们。在我看来出现这个问题的主要原因是:“立即下单”这个行为没有进行降权。
在真实的电商场景中,用户购买过的商品必然对用户的吸引力已经降低,用户的需求已经被满足。所以此时,“立即下单”这个行为应当进行降权处理,在计算的推荐列表中,不仅“立即下单”的商品不会再出现在列表中,跟此商品语义相近的商品也会降权至有较低概率才会再次出现在用户近期的推荐列表中。“立即下单”成了一个表达用户兴趣度的负向行为。如图4–8所示。
图4–8 计算的推荐列表
在数据上报中,除了用户的行为数据上传,系统还需要物料类的数据。而电商场景中的物料数据相比资讯类仅有的标题、正文、作者等显然要丰富得多,商品的属性、参数、详情页、厂家地址、价格、规格等都需上报,其中价格要用来生成消费力模型,规格用来过滤推荐列表里有相同商品但是规格不同的情况。
除此之外,经常有电商行业的客户提及是否可以将搜索词作为用户行为之一,我一般比较反对。理由是:如果一个用户在搜索栏上输入了某个搜索词,但用户浏览了部分搜索结果,一个结果都没点,那么说明用户本身对搜索结果是不满意的。有可能是搜索词描述的不合适,也有可能是没有匹配的商品,无论怎么说,此搜索词都不是一个能比较准确表达用户真实兴趣的词汇。而如果用户点击了搜索出来的结果,那么此点击行为也已被上报到系统,点击的商品所包含的信息能更全面地反映用户真实的兴趣,因此这种情况下,搜索词就更没有必要作为行为进行上报了。业外人士认知的“搜索什么推什么”其实不太准确,更准确的是“搜索之后点击什么推什么”。