网易数据分析笔试题

1、
网易数据分析笔试题_第1张图片答案:A
只要A可以让2队一直剩4的倍数个,那么A就可以获胜。A先取13个宝石中的一个,之后B取1个,A取同堆中的3个,B取2个,A取同堆中的2个,B取3个,A取同堆中的1个。则A可以获胜。

2、排列组合
网易数据分析笔试题_第2张图片答案:A
插空法:将4个数字插到16个数字组成的17个空格中。C17 4=2380

3、支持度和置信度
网易数据分析笔试题_第3张图片
网易数据分析笔试题_第4张图片4、
网易数据分析笔试题_第5张图片呜呜呜,希望多一点这样简单的编程题,我太菜了。

def num(s):
    l=len(set(s))
    if l==2:
        print(2)
    elif l==1:
        print(1)
    else:
        print(0)
s=input("请输入字符串:")
num(s)

5、网易数据分析笔试题_第6张图片

[x, f, d, p]=list(map(int,input("请输入x、f、d、p的值,空格隔开:").split()))
if d<f*x:
    day=d//x
    print("最多独立生活%d天"%(day))
elif d==f*x:
    day=f
    print("最多独立生活%d天"%(day))
else:
    day=((d-f*x)//(x+p))+f
    print("最多独立生活%d天"%(day))

6、
**不稳定的排序算法:**快速排序、希尔排序、堆排序、直接选择排序
**稳定的排序算法:**基数排序、冒泡排序、直接插入排序、折半插入排序、归并排序

选择排序:每次从数组中选出一个最小数(最大数)放到数组最前面,存放在序列的起始位置,直到全部待排序的数据元素排完。
希尔排序:设置增量分割数组,逐步进行直接插入排序,增量逐趟减少,并最后使得整个数组基本有序,再对整体进行直接插入排序。
插入排序:构建有序序列,未排序数据依次从已排序数据按从后往前比较,插入到合适的位置。
归并排序:把序列分成两个长度为n/2的子序列,对这两个子序列分别归并排序(循环将两个数组的第一个值比较,并弹出第一个值, 直到数组长度都不存在),将两个排序好的子序列合并成一个最终的排序序列
网易数据分析笔试题_第7张图片

7、
网易数据分析笔试题_第8张图片
阿西,统计专业的把这道题做错了,我可能是无药可救了。每天一打击,也是很难过。
网易数据分析笔试题_第9张图片联合分布这块内容,我也不知道为啥,一直很抗拒学。

8、最大公约数
在这里插入图片描述

def hcf(a, b):
    a, b = min(a, b), max(a, b)
    if b % a == 0:
        return a
    else:
        return hcf(a, b % a)
 
a = int(input())
b = int(input())
print(hcf(a, b))

9、
在这里插入图片描述1.
(1)首先定位发展方向,是发展现有产品还是进行新产品的拓宽。可以通过用户调研,调查目前用户选择网易严选平台的原因,是因为专注于一个方向,还是因为性价比高,如果核心用户选择专注于一个方向,则更应该选择发展现有产品,否则可以考虑拓宽产品类型。
(2)确定方向后,确定具体产品,需要考虑用户的消费能力,选择品牌等。通过调研用户选择其他平台而不选择网易严选的原因,调查产品类别是否存在不足。确定产品类别后,还需考虑用户的消费能力,可根据消费者过往消费记录或调研将用户大致分为高水平消费者、中等水平消费者、低水平消费者三类,从而选择相应价位的产品
(3) 确定大致价格后,还需要调研产品的具体功能还是什么点对于消费者性价比高。例如,如果100元MUJI的香薰机还是80元其他品牌、功能相似的香薰机。
2.
(1)初期,可进行定性调查,考虑小范围用户体验的调研,KPI可以考虑用户一个月内使用次数等。chan从用户日常的使用过程中,衡量商品开发效果。例如,对于新买的家具,用户是否需要晾晒一段时间或者栽种盆栽来去除气味;针对同一款产品的不同颜色,用户是否具有偏好等。
(2)推广期,可进行定量调查,并和同类产品进行比较。
KPI: 该产品和同类产品一个月的浏览次数、点击次数、购买次数、各类评价的数量,以及衍生指标。购买率 = 购买次数/总浏览次数,点击率=点击次数/浏览次数,好评率=好评数量/评价数量,差评率=差评数量/总评价数量等。
该产品浏览次数较低,可能是因为推广度不够;浏览次数高,点击次数、点击率较低则说明该产品开发没有解决用户最急迫的需求,不能吸引用户;好评率低,则说明该产品存在问题等。

10、
网易数据分析笔试题_第10张图片

 select a.userid,amount
from order a
join (
select userid,min(paytime) paytime_first
from order
group by userid
) b
on  a,userid=b.userid and a.paytime=b.paytime_first;

2.①支付用户数 = 浏览用户数×支付率
② 面对本月支付用户数环比上月下跌30%的情况,首先要判断这是不是我们的问题。是不是上个月是双十一,所以销售额异常的高?或者是不是本月突然爆发了世界范围的经济危机?如果是这种情况,那么电商平台会不可避免地受到影响。
③如果支付用户数下跌是个问题,那么是浏览用户少了还是支付率下降了?如果是浏览用户少了,那么核心是找出哪些人群的浏览用户数下跌了。是新用户还是老用户?如果是新用户的问题,是不是渠道引流做的不够好?那么是哪个渠道出了问题呢?可以通过查看渠道的新增用户数查找问题;如果在渠道没发现问题,那是不是产品策略最近调整了? 可以查找产品迭代前后的浏览用户数进行对比分析。如果是支付率下降了,那么是哪个用户群体的支付率下降了?是有强烈下单需求但未下单的人群,还是购买频次≥10但超过一个月未访的忠实客户流失了?这个可以根据用户分层中的不同用户层逐一分析。通过不同维度、不同人群的拆分,把大的问题慢慢细化,落实到具体的指标上,找出问题所在。
3.指标选择略
对于连续数据且数据量较大的数据,用Kmeans聚类法。基本原理:先随机选取K个对象作为初始的聚类中心,然后计算每个对象与各种子聚类中心之间的距离,把每个对象分配给他最近的聚类中心。一旦全部对象被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直至满足某个终止条件。
用Python实现Kmeans的步骤:1.导入pandas,numpy,matplotlib等包,用read_csv/table等导入数据
2.数据预处理,用astype方法做类型转换;用duplicated方法加any方法识别冗余数据、并用drop duplicated清除冗余数据;用Python的isnull方法识别缺失值,并选用删除法/插补法/替补法等处理。
3.用dist()函数定义距离并计算,一般使用欧式距离
4.先用scatter()作数据散点图,根据散点图设定K值,用np.random,randint随机获得中心点
5.迭代,用while循环,一般需要设置最大迭代次数
6.用matplotlib.subplots()作图

11、
网易数据分析笔试题_第11张图片第一题sql有点写晕了

Alter table order add column ym varchar(255) not null;
Updateorderset ym=dateformat(paytime,%Y%m’)

Select A.ym,newcount,doublecount,doubecount/newcount 复购率
From
(Select ym,count(userid) as newcount
From(
Select userid,min(paytime),ym
From order
Group by userid) a1
Group by ym) A
Join
(Select a2.userid,a2.ym,count(a2.userid) doubltcount
from
(Select o.userid, o.ym,count(userid) count_u
(Select userid,min(paytime),ym
From order
Group by userid) a1
Join order o
On a1.userid=o.userid and a1.ym=o.ym
Group by o.userid
Having count(userid)>=2) a2
Group by a2.ym) B
On A.ym=B.ym;

  1. a.由于最近一周APP新访用户当天转化率都大幅下跌,所以可以排除偶然事件的影响,判定是产品侧出了问题需要改进。
    b.根据转化率公式=新访当天支付人数/新访用户数,首先判断是不是在新访用户数不变的基础上、新访当天支付人数减少了?是哪些人群的支付人数减少了?这些人是否存在渠道的差异?如果存在,那么是哪个渠道的人群转化率降低了?是不是这个渠道的素材出了问题?不同的渠道对应不同的人群,是不是产品策略最近有改变导致这个人群下单需求降低?可以通过查看分渠道新访用户数和转化率进行判断。
    然后继续判断,是不是新访用户数增多,但当天支付人数没有增多。新访用户数增多是所有渠道都增多还是个别渠道增多?如果是个别渠道新访客增多,那说明产品前期运营做的不错,对用户是有一定吸引力的。但为什么选择下单的用户少?是具体哪个功能模块出了问题?是相关推荐的算法不够精确还是购物车的设计不够方便支付?可以查看各渠道的新访用户数,当天支付用户数,各渠道的用户对各功能的使用情况来排查有问题的部分。

  2. a.用户分层指的是根据用户不同的消费倾向与消费偏好,针对性的提供营销和服务,以极化用户价值。这里用户分层的具体业务目标是,便于进行全生命周期的运营管理(拉新、活跃、留存、价值提升、忠诚)
    b.为了便于进行运营管理,根据全生命周期的几个阶段进行用户分层,以便对每个阶段的用户实施差异化的策略,将其向下个阶段转化。可以看到每个阶段都是对用户购物行为的一种描述,那么根据用户的购物模式来分层。根据用户的消费金额、最近消费频率、最近活跃天数、最近活跃行为等关键特征分为以下几层:
    客单≥500且最近七天有活跃(高质量用户,防流失) 近30天购买频次≥3且近7天未访问(活跃用户,提高留存) 近7天访问频次≥5且近7天未购买(需要价值提升) 七天内注册用户且无下单购买(新用户需要开单) 客单≥500且近7天未访问(提高活跃度)
    c.由于消费金额/频率/活跃天数这些都是连续型数据,且数据量较大,所以用Kmeans聚类算法。
    基本原理和步骤略

12、
在这里插入图片描述 1. a.构建居家品类用户画像的目的是,了解这类用户的特征进而了解他们的需求,从而作为参考帮助运营给用户提供区别化的对待、个性化的服务,达到提升用户购物体验进而提升平台流水的效果。
b.要具体的刻画购买居家品类的用户,要从和居家有关系的方面入手,涵盖尽可能多的方面。根据以上具体业务目标,我选用以下维度描述购买居家类目的用户:①自然属性 年龄,性别;②社会属性 职业,住在哪里,婚恋状况,教育程度; 三兴趣属性 喜欢进行的活动,花费时间最多的工作之外的活动,是否养宠物 ④消费属性 消费频次,消费额,最喜欢购买哪个品牌的居家类商品,购买次数最多的居家类商品是什么。这些数据平台本身容易获得,对于个别数据如婚恋状况、教育程度等可以通过问卷的形式收集得到。
2. a.从商品品类维度选,各种品类的商品都挑选,显示出网易严选商品的齐全、种类多。涉及到的指标有,覆盖到的商品类目有多少、商品类目有哪些。
b.从商品品质维度选,显示出网易严选定位的一大特点:品质优,这对于商品来说是一个硬核项。要直观的表示商品品质不太容易,可以利用品牌效应,选大牌商品,列举出网易严选平台上有多少垂直领域里的大牌,突出平台的定位。涉及到的指标有:网易严选有多少大牌/专业品牌,具体到每个领域的大牌有哪些
c.从商品性价比维度选,显示出网易严选定位的另一大特点:性价比高。涉及到的指标有:优质商品在网易严选的定价和在其他平台的定价对比
d.从商品好评率维度选,选好评率最高的,让用户的赞扬声感染更多的用户。涉及到的指标有:商品评价里好评个数/评价总数

13、
网易数据分析笔试题_第12张图片https://www.bilibili.com/video/av48045430?from=search&seid=2957501068077370222

c(20,10)/(10+1)

14、
网易数据分析笔试题_第13张图片https://baijiahao.baidu.com/s?id=1644158198885715432&wfr=spider&for=pc

15、
网易数据分析笔试题_第14张图片

二叉排序树的特点就是

若左子树不空,则左子树上所有结点的值均小于或等于它的根结点的值

若右子树不空,则右子树上所有结点的值均大于或等于它的根结点的值

左、右子树也分别为二叉排序树

看B选项的最后两个数,321 和 362 比较以后,明显321< 362 ,必然会去寻找362的左子树,此时应该去寻找362的左子树,但是366大于362肯定不是左子树

二叉排序树的算法就是

首先将待查关键字key与根节点关键字t进行比较: 
a.如果key = t, 则返回根节点指针。 
b.如果key < t,则进一步查找左子书。 
c.如果key > t,则进一步查找右子树。

B答案根节点为888,321<888在左子树寻找,左子树的所有值均小于根节点,911大于根节点,属于右子树,不可能在对根节点的左子树查找中出现

16、
在这里插入图片描述
先划分用户层,消费频数划分中
1、按照历史最大消费金额,消费频数,将用户划分为高消费,中消费,低消费用户
2.按照最近消费日期,消费频数,商品浏览数目,点击量将用户划分为高活跃用户,一般活跃用户,流失边缘用户。

针对1,统计分析各用户的平均消费金额,常购买的消费品类,为不同阶级用户推荐适合他们的商品。
针对2,对一般活跃用户和流失边缘用户采取激励方案,如发放优惠券,完成购买任务获得现金奖励等措施。对高活跃用户,即稳定购买用户,可以推出分享或晒单活动,通过他们吸引更多新用户

利用K-MEANS聚类方法对用户进行聚类划分,需要的特征是用户注册时间,用户购买次数,用户购买金额,用户浏览次数,用户浏览时长,用户最后一次登录等等,将用户分成四大类:
一类用户是核心用户,粘性大,不易流失,购买频率高,这样的用户需要显著推送办理会员其购买的商品会节省多少资金的信息,促使其购买会员。
二类用户是不易流失的用户,虽然购买率不如核心用户,但是会时不时进行浏览,寻求购买机会,这种用户看重优惠力度,因此推送相关的组合购买满减活动,以及下订单送优惠券的活动。
三类用户是较易流失的用户,购买频率低,浏览次数少,这类用户只有需要相关商品时才会打开考拉进行搜索,可以发送小金额的优惠券吸引这类用户的关注。
四类用户是流失用户。注册完从没进行购买的用户或者最后一次登陆距离现在时间很久,这样的用户需要发短信或者push,推荐最大优惠的活动或者一元换购类型的活动,促使用户的小订单购买。

你可能感兴趣的:(网易数据分析笔试题)