【理解推荐系统】从推荐产品角度的一点理解与思考

如题所述

第1个回答  2022-07-28
在笔者的实习过程中,常常每周面对十几个来自业务方的推荐接入需求,等待对接、评估和落地。由于推荐的专业性较强,业务方常常因为对推荐的理解不够深入,而无法准确地评估需求场景是否需要推荐、值得推荐以及如何进行推荐。在这个时候,推荐产品就承担起从推荐业务的角度,对需求进行理解评估、拆解落地的任务。

笔者在刚刚接触到需求对接和管理的工作时,常常感到力不从心,不知从何思考、落脚何处。除了对团队的推荐业务了解不深外,核心原因还在于没有形成对推荐系统、深入的理解。在近一年的推荐产品实习过程中,笔者通过交流、阅读和思考,理解增进了一二,在此略作梳理。

本文将分为以下三个部分:什么是推荐,阐述推荐的概念;为什么做推荐,阐述推荐的价值和适用场景;怎么做推荐,阐述推荐的逻辑以及推荐产品的工作职责。

推荐,现代汉语词典解释为“ 介绍好的人或事物希望被任用或接受 ”。在互联网产业中,推荐则指通过分析用户偏好,将符合兴趣的内容主动提供到用户面前,以提高内容消费转化的效率。根据词义可以从两个方面理解推荐, 一是推荐为用户主动提供“好的”,也就是符合其兴趣偏好的内容,二是推荐的目标是促成内容的消费转化 。

这两个理解看似废话,实则构成了理解推荐的底层逻辑。第一条指出推荐与其他内容分发模式的区别,运营给用户提供编辑认可的内容,搜索和分类则是被动由用户寻找到符合兴趣的内容。第二条明确推荐作为一种内容分发模式的终极目标——促进内容的消费转化。

接下来的问题是:用户在什么时候更加需要被主动提供感兴趣的内容?推荐如何主动提供用户感兴趣的内容?

信息过载指用户被淹没在大量的无用信息中,用户无法发现有价值的信息、有价值的信息也无法呈现在用户眼前的情况。随着信息产业的快速发展,信息激增,信息过载的问题日益显著。当用户面临海量的信息,如果有明确的目的,可以利用搜索引擎和分类目录来缩小范围、筛选信息;而如果没有明确的目的,则需要推荐系统提供解决方案。

归纳常见的用户面对海量信息却没有明确目的的情况,如影视、音乐、资讯、广告以及电商等场景,多为内容消费场景。为满足本身就多样化的用户需求,平台为用户提供了丰富的内容,但海量内容与用户兴趣的匹配工作不利,也导致用户的信息过载,无法充分消费平台内容。此时,推荐的价值就凸显了。

对推荐价值的评估可以从必要性和重要性两方面考虑。

1. 推荐内容数量多、多样化程度高。

用户需要筛选信息但却不明确此时此地所需,往往出现信息过载,推荐促进消费转化的核心价值得以体现。应用于实践中的判断,内容数量可以用绝对数量来衡量,内容的多样化程度则与当前场景下用户需求的多样性一致。

2. 用户对个性化的需求强烈。

此时,用户有强烈的期待获取符合其偏好的内容,即对推荐的需求强烈。对于非工具性场景,特别是购物、娱乐等有较大自主选择空间的消费场景,审美和口味对用户来说十分重要,这是因为个人形象和品味是通过消费彰显的。而对于工具性场景,如电子邮件等,应用推荐的需求主要在于提高工作效率,进行个性化推荐的必要性就较低。在实际工作中,用户对个性化需求的判断需要结合推荐场景具体分析。

提高内容消费转化效率是推荐之重要性的根本,在此之上,受到产品的成长阶段、影响范围、预期收益等方面的影响。

1. 产品阶段:

推荐在产品发展前期的主要作用是整合利用零碎流量,使长尾内容的流量得到充分利用;中期提高变现效率,如优先分发创收内容促进消费转化等;后期分配流量资源,实现有限的平台流量的统筹。根据不同的阶段目标,提升内容消费转化效率的重要性不同,推荐的地位和重要性也有所不同,推荐的目的和手段都有不同。

2. 影响范围:

影响范围不仅仅指推荐场景所覆盖的流量绝对数量,也指流量的潜藏价值。推荐场景的影响范围越大,实现内容转化的收益越多,推荐对核心指标提升的贡献越大,也意味着用户偏好越明显、异质性越强,对个性化推荐的需求越大。影响范围最大的常常是首页首屏的推荐场景,场景越深、流量越小。一般情况下,流量过小的场景接入推荐的优先级较低,但如果是针对会员用户、高消费高价值用户的付费场景,则又另当别论。

3. 预期收益:

指公司、产品、业务方能够从推荐获得的实际收益预估,主要是指核心指标和商业指标的预期提升,需结合先前场景的推荐效果。预期收益一方面指与影响范围综合评估得出的量化的收益规模,另一方面也指针对品牌形象、核心功能、认知度等的质性收益感知。

通过回答为什么做推荐、何时需要推荐的问题,推荐产品能够对推荐需求的必要性和重要性加以评估,从而对是否以及如何落地需求做出预判。

在对推荐需求的进行评估之后,接下来面临的问题就是怎么做推荐。下文将对接入推荐的一般步骤进行梳理,并以常见的推荐场景为例总结推荐策略的设计思路。

一个新推荐的实现可以被拆解为以下四个部分:场景分析、策略制定、开发测试、效果评估。本文重点讨论场景分析和策略制定两个部分。

1. 场景分析:

对需求场景进行准确、深入的分析至关重要,需要推荐产品和业务产品的共同交流达成一致。通过场景分析,推荐产品能够正确地预估接入推荐的必要性和重要性,从而对需求进行合理排序;还使结合场景对推荐策略进行调整,优化推荐效果和用户体验。

从推荐的角度来看,场景分析主要思考以下问题:

a. 该场景处于怎样的位置?怎样的展示样式?核心功能是什么?

b. 该场景下推荐内容库的数量、质量、类型是怎样的?内容的进退场规则是怎样的?

c. 该场景下的用户群体是谁?可以被如何分类?各个类别的用户的需求有哪些特点?

d. 该场景下用户的使用上下文和操作习惯是怎样的?

2. 策略制定:

策略的制定主要由业务产品、推荐产品和开发共同完成,其中业务产品从自身角度表达效果需求,推荐产品则结合场景需求和推荐能力规划推荐策略,将推荐需求拆解并与开发沟通实现。

推荐策略的制定主要包括特征、召回、排序、调优,笔者将从推荐产品的角度一一阐释:

a. 特征:

一般情况下,已有成型推荐系统中已经包含了大量的用户、物品特征和关联关系。作为推荐产品,主要是预判该场景下哪些特征有效、哪些未被利用的数据可以被作为特征使用、是否需要增加新的特征和关联关系,等等。

例如,用户的负反馈行为特征是推荐策略中内容降权的重要依据,作为推荐产品需要分析用户的行为,找到更准确反应用户负反馈行为,特别是隐形负反馈的行为数据和计算方式。对单个物品的负反馈可能体现为:无操作、跳过跳出、停留时长过短、无消费或过少、停留长但无消费,等等。推荐产品需要将用户内容消费前后和消费中的行为进行分类、组合,从而更准确地定义负反馈。

b. 召回:

召回指从海量内容池中,通过用户、内容的关联关系,根据少量、关键的用户、内容特征挑选出关联性最高的内容组成较小的推荐候选集,目的是快速挑选出用户最感兴趣的内容。召回算法由开发实现,推荐产品主要负责选择召回路径以及权衡各个召回路径的比重。常见的召回路径可以分为三种类型:

-算法召回:基于内容分析、协同过滤、自动聚类等算法模型进行召回

-内容规则召回:基于热度、时效性、内容关联关系等进行召回

-用户召回:基于用户的场景,如节假日、地理位置、wifi,以及行为,如搜索、消费历史、实时反馈、tag偏好等进行召回

召回策略的选择和组合方式,需要根据场景的核心功能、内容的特点、用户的期待等进行设计,并通过ab测试等评测相关指标水平。

c. 排序:

排序过程对各路召回形成的较小候选集中的内容进行点击率等指标预估和排列,从而给用户提供最个性化的内容推荐。相对于召回,排序过程所需要的特征更多、模型更复杂、速度更慢,追求的是精准。为了提高排序的速度,还会将排序进一步分为粗排、截断、再精排两个阶段来缩小复杂模型应用的对象数量,提升预测的精准度。相对于召回阶段,排序更偏技术而非策略,推荐产品主要在排序结果的调优阶段,也就是重排阶段进行策略设计。

d. 重排

重排阶段主要由推荐产品主导策略的设计,针对排序得到的推荐内容列表进行调整,从而实现一定的业务、产品目标,如商业盈利、内容建设等,或者改善用户体验。重排一方面依靠模型,另一方面依靠人工策略。常见的重排策略有四类:过滤、打散、强插、调权。

过滤 包括推荐内容列表内重复或相似内容的过滤、推荐场景上下文重复内容的过滤、对低质或广告内容的过滤等。主要目的是改善用户体验、提高推荐效率。 打散 指隔开同一类型的内容等,以提高推荐结果展示的多样性,增加推荐内容覆盖率,改善用户体验。 强插 指在固定位置人工插入特定内容,主要是为了与特定内容相关的运营、商业目的。强插策略主要受到业务产品目标的影响。 调权 指提高对业务、产品目标实现重要类型内容、待消费内容的权重,降低热点内容、已曝光内容、无操作内容、已消费内容的权重等。

人工的重排策略会对机器排序结果的效果产生影响,正负影响需要推荐产品结合业务目标进行权衡,通过ab测试选择效果更好的重排策略。

在推荐场景上线之后,是更加关键和长期的指标监测、效果评估过程。受篇幅所限,笔者会另起文稿,在此不再赘述。

综上所述是笔者作为一名推荐产品实习生对推荐业务的基础理解。通过系统地认识推荐,使笔者在作为一名实习生完成非核心工作时,对工作定位和团队目标的认识更加清晰,也使笔者更加明晰了作为一个推荐产品能够带来的价值和改变。

从小的工作层面来看,业务产品对技术的理解较浅,开发同学多为技术思维缺乏产品嗅觉,双方沟通成本高。而推荐产品则能够作为连通二者的桥梁,提高从技术到价值的实际转化和收益。从大的行业趋势来看,推荐系统的出现和应用是信息产业面向用户的一次革新,推荐产品通过商业、技术与人性的权衡,使信息分发效率有了质的提升,使信息环境更加健康、平衡,更使互联网产业更加人性化、产生更高的社会价值。
相似回答