当前位置:   金科网 > 嘿科技 > 正文

从0到1,基于内容的推荐算法的产物设计(原创)

从0到1,基于内容的推荐算法的产物设计(原创)

一、前言&界说

可能许多和笔者一样非数据或算法科班身世的产物同学在涉及到需要举行内容推荐的产物时无从下手,只管在网络上可搜索到种种算法的基本原理和公式,但或过于专业或直接出现最终逻辑,但详细怎么做还是一头雾水,笔者抛开理论和庞大的公式,直接从产物出发设计一套最小可行性从0到1的推荐算法能力

什么是基于内容的推荐算法

基于内容的推荐:焦点思想是凭据推荐物品或内容的元数据,发现物品或者内容的相关性,然后基于用户以往的喜好记载,推荐给用户相似的物品。

从0到1,基于内容的推荐算法的产物设计(原创)

简朴地明白就是:凭据用户已往喜欢的内容,为用户推荐和他已往喜欢的内容相似的内容。

二、算法整体架构说明 1. 明确算法目的

我们在最开始做推荐算法时,要清楚初始阶段目的:即在保证内容质量的前提下凭据用户行为推荐尽可能切合用户期望的富厚内容。

这句话虽然很短,但包罗了三个很重要的关键词:内容的质量、内容富厚(多元)度和切合预期。

2. 推荐算法整体逻辑

基于推算的场景,我们很容易发现推荐逻辑:用户在线举行操作行为时,系统向后台提倡用户数据召回请求,然后凭据排序模型形成最终用户瞥见的内容,最后通过用户的请求和记载完善用户行为,以举行后续的内容匹配。常见的推算下图:

从0到1,基于内容的推荐算法的产物设计(原创)

图片虽然看起有点庞大,抽丝剥茧就三个焦点:一套内容治理后台+多个权重算法+展示逻辑。

3. 推荐算法产物框架

基于算法逻辑和最小可行性目的,我们可以整理出简朴的产物框架,如下图:

从0到1,基于内容的推荐算法的产物设计(原创)

很显着算法推荐公式可以不用立马就建设一套庞大的算法模型,只要有基础的用户治理、内容治理能力,联合内容质量权重和用户喜好权重,思量到去中心化和时效应影响,就可完成在保证内容质量的前提下凭据用户行为推荐尽可能切合用户期望的富厚内容。

三、详细算法权重设计 1. 质量治理评分公式

质量评分总得分Score由三大模块得分加权盘算得出,其公式如下所示:

(系数可凭据业务情况自行调整,起始分为100)

其中A、B、C为三大模块各自得分值。Score得分为三大模块得分乘以各自对应系数。

各模块得分由其多项评分指标及对应系数加权盘算获得,此处以A模块为例:

其中为A模块下对应的各项指标得分, 

从0到1,基于内容的推荐算法的产物设计(原创)

为各项指标得分所对应的权重系数。

A-内容流量模块评分

内容流量为是内容对流量的吸引能力体现,初始化的产物建议的焦点热度加权:停留时间(退出率)>评论量>点赞量>收藏量>PV/UV>转发量。下表为案例:

从0到1,基于内容的推荐算法的产物设计(原创)

B-内容质量模块评分

主要凭据后台内容的状态举行评断,在机审能力未完全搭建以前,本模块受到人工影响较大。

从0到1,基于内容的推荐算法的产物设计(原创)

附:评分公式

现在对于内容推荐型的评分算法,推荐贝叶斯平均评分法作。其公式如下:

其中,n为当前内容的评分次数,M为总内容平均得分,S为单个内容总得分,C为动态系数。

单个内容评分得分 = (总内容的平均得分 * C系数) + 单个产物的评分总和) / (当前内容的评分次数+ C系数)

C系数为每个内容的被评分的平均次数,即C=所有内容被评论的总次数/所有内容数量。例如:总共有1000个文章 一共被评论了50000次,那C就即是50000/1000=50。

小例:

从0到1,基于内容的推荐算法的产物设计(原创)

(贝叶斯平均法评估示例)