深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)

上传人:wt****50 文档编号:44587349 上传时间:2018-06-14 格式:PDF 页数:16 大小:608.57KB
返回 下载 相关 举报
深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)_第1页
第1页 / 共16页
深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)_第2页
第2页 / 共16页
深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)_第3页
第3页 / 共16页
深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)_第4页
第4页 / 共16页
深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)》由会员分享,可在线阅读,更多相关《深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)(16页珍藏版)》请在金锄头文库上搜索。

1、深度丨从零搭建推荐体系:用户体系、项目体系和推荐体系(中)本文阐述整个推荐体系从0搭建的全流程,也是最近以来一直深入研究的成果展现,因原文太长,故此切分成3部分发送,每天发送1篇,全文结构为:上篇:第零章概述,第一章标签体系搭建;中篇:第三章用户体系,第四章项目体系,下篇:第五章推荐体系,第六章评估体系,第七章全文总结,第八章参考资料。内容相对全而深入,希望有推荐体系搭建意愿的平台或者产品经理,能够给予一定的帮助就好。另,求工作。上篇回顾深度丨从零搭建推荐体系(上)2. 用户体系2.1 搭建流程首先应该先确定用户动机,因为从用户的根本动机,我们才好做相应的推荐处理。那么我们应该如何获取用户动机

2、?只有一种方法,就是通过用户行为。所以我们应该优先建立用户行为体系,依据用户行为,分析用户动机;不管是主动动机还是被动动机,之后提取这些动机特征,结合用户物理属性,再进行后处理。再有要将特征值加以过滤,分配权重,结合衰减因子进行最终输出。最终输出的结果应该分为基本属性、用户兴趣、用户关系及用户行为,结合所有综合分析用户动机,在适时的时候推荐合适的内容从而形成推荐最佳化的最终目的,让用户最小成本的获取信息。所以在分析的时候,依据用户动机分析,推断我们应该注意的哪些环节点的哪些事情。2.2 动机经典理论在建立行为体系之前,一定要介绍动机和行为的关系。而又不得不介绍行为科学界一直以来的一个经典理论:

3、“使用与满足”理论,该理论是1974年E卡茨在其著作个人对大众传播的使用中被首先提出。使用与满足理论是站在受众的立场上,通过分析受众对媒介的使用动机和获得需求满足来考察大众传播给人类带来的心理和行为上的效用。但同传统的讯息如何作用受众的思路不同:它强调受众的作用,突出受众的地位。该理论认为受众通过对媒介的积极使用,从而制约着媒介传播的过程,并指出使用媒介完全基于个人的需求和愿望。E卡茨将媒介接触行为概括为一个“社会因素+心理因素媒介期待媒介接触需求满足”的因果连锁过程,提出了“使用与满足”过程的基本模式。经后人的补充和发展,综合提出“使用与满足”的过程:1. 人们接触使用传媒的目的都是为了满足

4、自己的需要这种需求和社会因素、个人的心理因素有关。2. 人们接触和使用传媒的两个条件:接触媒介的可能性;媒介印象即受众对媒介满足需求的评价,这种媒介印象或成为评价是在过去媒介接触使用经验基础上形成的。3. 受众选择特定的媒介和内容并开始使用。4. 接触使用后的结果有两种:一种是满足需求,一种是未满足。5. 无论满足与否,都将影响到以后的媒介选择使用行为,人们根据满足结果来修正既有的媒介印象,不同程度上改变着对媒介的期待。总结了使用与满足理论的要素,包括:1. 受众是主动的,对于大众媒介的使用是有目标的。2. 受众需要的满足和对媒介的选择间的联系中,受众拥有主动权。3. 媒介相互竞争以满足受众需

5、要。所以最终映射到网络,不难分析出用户使用网络一般是是为了:(1)人际交往;(2)打发时间;(3)搜寻信息;(4)方便快速;(5)信息分享;(6)自我表达;(7)娱乐放松。社会心理学的理性行为理论和建立在该理论基础上的技术接受模型(Technology AcceptanceModel,简称TAM)最早探究了哪些因素对人们有意识的行为产生影响。1989年,Davis在理性行为理论的基础上,针对技术接受和使用行为提出了技术接受模型:TAM认为系统使用行为是由行为意向决定的,而行为意向由想用的态度和感知的有用性共同决定,想用的态度由感知的有用性和感知易用性共同决定,感知的有用性是由感知的易用性和外部

6、变量共同决定,感知的易用性由外部变量决定的。外部变量包括系统设计特征、用户特征(包括感知形式和其他个性特征)等,为技术接受模型中存在的内部信念、态度、意向和不同的个人之间的差异、环境约束、可控制的干扰因素之间建立起一种联系。2.3 今日头条动机分析理论介绍完毕,也应该从理论切入分析当前最厉害的内容推荐平台,也就是不得不提的今日头条了。那么从有限的研究论述当中,可以从已经成功的产品中获取到用户使用头条产品的相关动机大致是什么,以指导我们日后的产品方向。头条相关的研究论文里的方法,也注明与附录3中,以供查看,下面将直接节选结论部分,以供参考。今日头条流行的主要原因是抓住了受众对个性化需求的心理。对

7、用户需求的研究结果表明,“个性化推荐”(60.79%)、“更新速度快”(60%)、“推送内容多(45.26%)是用户最为强烈的三种动机。个性化主要体现在三个方面:1. 频道定制:用户可以订阅自己感兴趣的频道(“今日头条”提供了社会、娱乐、政治、热点等48个频道),同时提供位置信息享受本地化新闻服务(还包含同城活动信息),而且“今日头条”也和微信一样开辟了自媒体平台,用户可关注自己感兴趣自媒体账号。2. 个性化推荐:“今日头条”若在新闻标题最左方标注一个蓝色的“荐”字,则表示为是根据用户兴趣专门推荐的内容。“今日头条”的信息分发完全基于智能推荐,用户浏览、收藏、转发、评论每一条新闻的行为都会被记

8、录,用户的阅读习惯、阅读时间、阅读位置也会被分析,两者结合形成“用户模型”。通过绑定社交媒体账号和大数据挖掘,后续还会根据用户使用产品的信息反馈(用户在“今日头条”上的“顶”、“踩”、“转发”、“收藏”等行为),不断进行算法的演进,用户分析越精准,推荐内容越来越精确。3. 个性化体验:服务性功能如“离线阅读”“同步收藏”“我的话题”“摘要模式”“阅读模式”“字体设置”都可以根据自己需求定制,体现了良好的用户体验。更新方法主要分为以下三种:1. 自动更新:手动更新以及推送更新。自动更新一般几分钟到几十分钟不等;2. 手动更新的设置是为了满足用户实时对信息的需求,每一次刷新都会有8-12 条不等的

9、信息;3. 推送更新是将信息发送到用户手机通知上,一天大约 6-10条不等,主要为社会要闻。并且头条为了满足碎片化阅读的需求,在新闻类型方面,新闻主要以消息和图片为主,鲜少特写、通讯和深度报道等传统意义上报纸的新闻体材,字数控制在1000字左右。根据今日头条年度数据报告,衡量读者阅读习惯的有两个指标:第一个是平均停留时长,第二个是跳出率。1000字的文章跳出率是22.1%,平均停留时长是48.3秒。4000字的文章则刚好相反,跳出率高达65.8%,超过一半以上的人打开一篇文章发现太长后会选择跳出。可见1000字以内的文章的传播率会更高。同时,头条还加入视频新闻;但并未像搜狐或是新浪客户端那样做

10、成一个单独的功能,而是将其嵌入频道中。视频内容长度在1分钟以内,以减少流量的消耗,主要以轻松、搞笑的内容为主。所以结合研究结论不难看出,头条用户的最大使用动机仍是精准的个性化推荐,也就是仍需要以精准的推荐为吸引用户打开的核心来源。2.4 分析模型由上图可知,我们应该依据已经成熟的用户行为,推断用户的动机因子,再推断至心里因素。实际来说是用户其实已经是带动机才打开APP,先依据有限的数据进行分析推荐,等有相关的行为之后,反推回去用户的动机,根据用户动机调整推荐内容,达到核心目的。这么做的好处是什么呢?头条类产品全都是依托于用户行为,进行调整,但是用户行为实际是不准确的。心情好与不好看的内容,操作

11、的流程细节,很可能都不一样;如果一味的只记录行为,只会不准确偏离。所以当我们记录了用户在任何情况之下的行为之后,反推回用户动机,进一步推回用户心里因素,依据心里结合喜好和行为,完成完美推荐。前文理论中同样表明,是社会因素与心里因素决定动机,所以当行为习惯模型建立,社会因素已经量化的时候,只有心理因素是变量,那么我们也能分析出不同的心理因素,依据不同心理因素改变本次的推荐内容,我想应该会大大提升转化率,并且可能是目前头条产品所不具备的一个点。结合常规的用户画像的相关属性,我们可以看到如下图(增加了购买):所以两者,也就可以合并成为两条大的脉络,一条是实际,一条是内心,而我们是要依据实际行为猜测内

12、心。两张图结合,将会无比清晰的阐述用户脉络和之间的关系:用户的浏览行为反映了用户的兴趣,两者之间的关系具有如下特点:1. 不同年龄、性别、职业的用户偏好反映在用户对商品的浏览行为上;2. 用户偏好具有动态转移性,将其反映在用户兴趣度上,即若用户偏好发生转移,则原来的兴趣度值减少;3. 用户对感兴趣的商品会高频度地点击和浏览,假设用户对某种/某类商品的浏览时间越长、频率越高,顾客对该种/类商品越感兴趣,反映用户偏好的兴趣度值也会随之增加。所以最终,我们会确定需要收集的量化数字,以代表行为的部分,反推分析,达到最终目标。2.5 行为收集一般情况下,动机拆分为媒介、社交和体验需求,分别代表的可能原因

13、有:1. 媒介需求一般有:更新速度快、推送内容多;2. 社交需求一般有:社交性强、互动性强;3. 体验需求一般有:个性化推荐精准、智能搜索快速全面、操作方便、离线下载。依据两种形式,主动行为和被动行为进行分类,主动行为就是用户主动自然操作,被动行为也就是APP人为增加拦截、问题、问卷等收集,所以整理一下我们通过不同动作需要收集的相关动作应该是,主动行为:1. 媒介:PUSH消息、打开时间;2. 社交:PUSH通知、分享、攒、回复、收藏、举报、等级;3. 体验:打开内容类型、内容载体、内容长度、历史搜索行为、历史打开偏好、间隔点击时间、滑动内容位置、阅读设置、下载缓存;4. 人口属性:年龄、性别

14、、地区、收入、签名等;5. 周边场景:地理位置、网络环境、端、信号强度、耳机扬声器、高度等;6. 被动行为:增加拦截、询问兴趣区域、反馈、小问题、问卷、卸载等。通过已经非常成熟的广告领域,可以参考到某些重要的信息,仍是我们的获取重要参考。例如用户来源追踪,以及跨域追踪,所谓跨域追踪是利用指的是比如你在百度上跳转到新浪,同样可以追踪到。利用的手段一般是cookie和缓存,前者一般是自带key,与用户关系不大。2.6 后处理后处理一般有三个环节,过滤、权重、衰减因素。过滤一般指过滤提取的无效特征或干扰数据,权重一般根据不同的行为偏好等因素综合考量后进行调整,衰减一般要考虑到用户某个兴趣会随时间延长

15、而降低,相关变量是用户点击频率和浏览时长,依据相关变量进行调整遗忘因子系数。还有一点是利用自然范数梯度下降算法,来进行准确度的修正。从技术方面来说都已经相对成熟,也有成熟算法,不多做阐述。2.7 模型输出所谓输出,实际是可依据上方分析后建模完成的相关体现。其作用是辅助我们发现问题,定位并解决。我们要考虑到时效性、便捷性、准确性等问题。从效果来看是数据,从特征来看是标签。所以 数据的展现要求的是可视化,以及灵活性,并且要准确,最小时间间隔维度不能过大。所以选定如:折线图、漏斗图、饼图、柱形图等常见格式,结合不同的区域位置和目的,实现最优展示方式选择。最小时间间隔可以有实时报表或半点报表,每日会汇

16、总报表进行输出,设置相应阀值,波动过阀值后进行相应报警等机制处理。那么用户标签,其实就是行为标签,依据行为进行计算贴合。是根据标签体系中的标签建设,在标签体系中所有标签二维化平铺,但是在用户体系中贴合的具体标签将有层级划分。其实两者不难发现是包含与被包含的关系,既整个标签体系给用户标签体系提供“素材”,而用户体系是直接拿来用,所以既然是使用者,就要有详细的层级以及权重计算,这个是非常重要,这与我们的终极目标有关。我们希望知道用户被打上这个标签的背后动机是什么,不同内容之间一定存在某种弱关联,弱关联的发现是通过内容标签背后的二维化体系支撑;但是关联侧重和确定选择,是通过用户层级标签来做到的,最终借此我们就可以相应的给一部分猜测,并给予惊喜推荐,完成超越用户所想的目的。通过弱关联,我们还可以完成用户之间的相互推荐,或者用户聚类等工作,建立用户之间的关系网络,为搭建社交氛围做好铺垫。上面是通过用户行为获取的标签,还有一部分是用户物理属性,也就是如性别、地区、客户端、网络环境等属性,尽量收集全,并且每日收集,记录维度以登陆时间为维度。最终行为标签与物理标签相结合,综合

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号