更新时间:2019-12-02 来源:黑马程序员 浏览量:
标签库
个性化推荐的基础是用户画像,而用户画像就是将用户标签化,用一个个标签去描述用户处用户的特征、喜好、行为习惯等信息。为了数据标准化和规范化,我们需要在后台建立一个标签库,通过对标签库的维护,来满足用户画像的需求,并作为数据分析的依据。
所谓标签库,也就是标签的集合,讲标签组织化和结构化。在产品设计上,标签库就是一个标签的列表,并支持增删查改等基础的维护。
如果产品内容类型很丰富,那么标签的数量也会特别庞大。为了便于维护,也便于数据分析,最好能对标签进行分类管理,比如建立一个二级类目管理机制。
一级分类
二级分类
内容标签化
通过对用户贴标签来了解用户的喜好是个性化推荐的基础,但是给用户贴标签的依据是什么呢?那就是用户跟内容的互动。用户阅读了一篇文章、看了一部视频、回答了一个问题,都是用来给用户贴表情呢依据。那么我们就得首先知道,这些文章视频内容属于什么标签,也就是将内容标签化。
如何将内容标签化呢?对于不同形态的内容,方法是不一样的。
对于文本内容,一般是通过关键字匹配。这里,标签库就要发挥作用了。通过技术手段识别文本中的关键字,如果与标签库中的标签匹配上,即可作为该内容的标签。
如果是音频内容,标签的识别可能就得依靠人工手段了,毕竟靠技术识别的难度太大。通过在后台给内容手动打标签,将音视频等内容标签化。
用户标签化
当用户与内容产生互动,比如阅读、点赞、收藏等行为,那么首先,我们就得统计用户的行为。如何统计呢?
首先,梳理用户与内容能产生的所有行为;然后,梳理这些行为能产生的所有字段信息;最后,在后台讲这些行为数据表格化。
当用户与内容产生互动,即可认为这条内容的标签页属于用户的标签。为了画像更为精准,我们给用户的标签赋予一个权重的概念。用户的行为不同,该标签的权重值不同,比如仅仅是阅读的情况下,标签的权重+1,如果是点赞,则标签的权重值+2。通过一次次行为的积累,最终讲得到用户的标签权重表,而这张表,就是用户的画像。
不过,给用户标签赋值要考虑到多种因素,比如时间效应。用户兴趣会随着时间而衰减,因此减少对应的分值。还要考虑到热门内容的干扰,比如某个明星离婚的消息。用户看此类消息可能仅仅是一时的好奇,并不代表对此类标签(八卦、明星)的内容感兴趣,因此这类行为的权重值要降低。
个性化推荐规则
将用户和内容标签化之后,要实现个性化推荐,还需要最后一步:制定个性化推荐规则。所谓个性化推荐,就是根据用户画像,给用户做精准推荐。这里,我们举一个例子:
规则1. 选择匹配该用户标签权重值排前5的相关内容
规则2. 筛选满足规则1的且是最近48小时内发布的内容
1. 分页推送,每页8条,按照点赞数从多到少排列,上滑翻页
2. 下拉刷新,推送本次刷新与上次刷新之间产生的满足规则1和规则2的内容,根据分值从高到低排列,每次刷新最多推送8条,不足8条则推送实际数量
3. 已推荐过的内容则不再推荐
以上是一个比较简单的推荐规则,重点是要通过这个规则体现个性化推荐的应用思路,读者可以根据自身产品的实际需要制定更详细的规则。
小结
除了内容产品,很多业务场景都适合个性化推荐,比如电商的猜你喜欢,感兴趣的读者可以自己设计一套电商业务的个性化推荐体系。
猜你喜欢: