《[全]互联网公司大厂数据分析师真实面试过程问答经验总结》由会员分享,可在线阅读,更多相关《[全]互联网公司大厂数据分析师真实面试过程问答经验总结(9页珍藏版)》请在金锄头文库上搜索。
1、互联网公司大厂数据分析师真实面试过程问答经验总结自我介绍这里面试官只让我提出来一个项目讲,可能我讲的项目面试官接触不多,问的不是很细,但是自己也是准备了逻辑完全可以自洽的项目去说,所以各位准备自己的项目的前前后后也是要想清楚,避免逻辑错误,面试必考题每个人的公司项目不同面试正题这里的问题我的回答不太过关,如果我找到合适答案,再更新进来。同时把自己内心独白和思考过程引出来,有问题欢迎来反驳,相互进步!问题1:你最常用的app是?答:微博问题2:让你给微博搭一套指标体系给各个业务线vp看你会怎么搭?答: 平台指标:DAU、模块点击量、博主数、发帖量、点赞、评论 渠道指标:各个渠道的广告投放 用户指
2、标:留存率、频次、停留时长觉得合理的答案:有问过周围的同学,提到一个模型RARRA,觉得挺全面的RARRA模型是托马斯佩蒂特Thomas Petit和贾博帕普Gabor Papp对于海盗指标-AARRR模型的优化,RARRA模型突出了用户留存的重要性。 用户留存Retention:为用户提供价值,让用户回访。 用户激活Activation:确保新用户在首次启动时看到你的产品价值。 用户推荐Referral:让用户分享、讨论你的产品。 商业变现Revenue:一个好的商业模式是可以赚钱的。 用户拉新Acquisition:鼓励老用户带来新用户。问题3:微博平台发起明星挑战活动,让你评估效果你怎么
3、评估?答:明星的发帖量、用户的发帖量、用户的评论点赞,如果是关联到收入,可以看下这个活动带来的B端收益,以及细节指标像是各个模块的点击参与情况问题4:如果做发帖量的预测,你怎么做?我有看过很多人提到说用留存率去算,但是觉得这个丢失了一个自循环和周循环的因素,所以没选择这个解法,这里也抛出别人用留存率预测的链接答:时间序列中的ARIMA模型,用自循环率(AR-Auto Regression)和7天的周期(MA-Moving Average)在被问到留存率的时候,我意识到面试官想要用留存率去算,我又解释这个可以用幂函数拟合一个留存率,然后预测明天的留存率用今天的发帖乘以第1天留存率+昨天发帖*第2
4、天留存率,以此累加。现在想来这个模型好像能解决周循环和自增的问题,不确定,总觉得笨笨的,但是也没有什么特别好的方法,现实里面是真的这么运用的么?问题5:如何加入运营动作以及其他影响到这个模型里面?答:(自己也不确定怎么加)直接累加到上面的预测模型。问题6:你觉得预测DAU和发帖量是一个模型吗?答:(我想了想很相似)是的。问题7:让你去找发帖量与DAU之间的关系你怎么找?答:(当时被细致连问问懵了,其实自己想表达的是coefficient,都不知道自己在说啥)相关性测试、看斜率的相关性,0是不相关、1是正相关。问题8:如果现在有一些人直接复制别人的内容发出来,或者发出来的内容质量不高,让你定一个
5、策略出找出这些帖子,你怎么找?后面被问让总结补充这个策略模型,可能我说的太乱,也不太全的缘故答:ip地址是否异常,发帖是否太迅速,与其他贴的重复率是否很高。问题9:这个模型或者策略让你用一个指标去衡量表现,你用什么?现在让你做ABtest,你怎么做?答:(我把abtest解释了一通,发现他关心的是评价的指标)预测准确率问题10:现在你怎么对这个abtest分组?怎么取样?答:均匀分配,全量抽样问题11:全量抽样,现在抽样上来只有1%不到的样本是劣质的,你还全量抽样?答:扩大抽样样本,从疑似的里面抽问题12:这个策略上线,发现DAU下降了,你觉得是否有关?答:并不一定,如果说这个策略上线误判率很
6、高,也就是当中是优质的帖子被大量删除,抑制了用户发帖,帖子减少,DAU可能随之下降,如果说有效遏制了劣质的帖子的发送,让用户看到更多优质内容,体验提升,对DAU是有利的问题13:如果这个模型误判率也很低,还有其他可能会影响的因素吗?答:如果准确率也很高,误判率也降低,那0-1分类模型里面的四种情况都有效预测出来,那可以推断DAU下降与模型无关现在想是不是需要提供模型外部的影响因素?问题14:如果DAU异常监控追因的看板你怎么搭?答: 外部:政治、运营产品动作 内部:前面一开始搭的看板,从分渠道、分城市、分产品线来监控。面试反思最后面试官就问了问一些万金油问题,比如你还有什么问题?我简单问了几个组织架构,所需负责的内容的问题,这些问题都是万金油的存在。中间还有很小部分细节问题在答的同时伴随出来的我也记的不是很清晰了,大的问题框架是这样的。整个面下来反思自己思考问题有点挤牙膏,问一点答一点,短时间内拟大框架的能力还是欠缺,经验不足,还是有很多提升的地方