阿百百

数据分析师市场需求研究

本文是关于数据分析师市场需求的小研究。

在这篇分析里，我主要想解决两个问题：

哪一类人市场需求最高
什么因素能影响工资水平

这里就以深圳市的数据分析岗为例，分析一下数据分析师的市场需求状况。

### 拉勾数据分析招聘岗位分析 ###

# 本文针对拉勾网上深圳数据分析岗位的招聘信息做分析。
# Programmer: Dan Qin
# Date: 2019.08.30

# import libraries
# 基础包
import pandas as pd
import matplotlib.pyplot as plt

# 文件处理包
import json
import xmltodict
import os
import fnmatch

# 分词统计与词云包
import jieba
import jieba.analyse
from wordcloud import WordCloud

import re

# 对pandas和matplotlib的显示设置
pd.set_option('display.max_columns', 20)
plt.rcParams.update({
     "font.family":"SimHei"})
plt.style.use("tableau-colorblind10")
%matplotlib inline

1. 数据提取

万年不变的第一步，做分析前得先有数据。
本分析所用数据是借助爬虫工具从拉勾网爬取的，详细的爬取教程请参照下面的链接。

# 利用集搜客爬取拉勾网上深圳数据分析岗招聘信息，需采用层级爬取
# 基础爬取教程参见：https://zhuanlan.zhihu.com/p/38884768 ; 层级爬取教程：https://www.gooseeker.com/doc/article-75-1.html
# 爬取源数据为xml格式

# 将xml文件转为json方便处理
def xml_to_json(input):
    '''
    Convert Xml to Json file.
    :param input: input file path, xml
    :return: NaN, write json into file
    '''
    # load xml
    if not os.path.exists(input.replace(".xml", ".json")):
        with open(input, 'r', encoding = "UTF-8", errors = "ignore") as f:
            xmlString = f.read()

        # convert xml to json
        output = input.replace(".xml", ".json")
        jsonString = json.dumps(xmltodict.parse(xmlString), ensure_ascii=False)
        with open(output, 'w', encoding="utf-8") as f:
            f.write(jsonString)

# 将爬取数据整合成dataframe

# 获取文件夹中的所有文件
path = "data/拉勾/"
filenames = []
for file in os.listdir(path):
    if fnmatch.fnmatch(file, "*.xml"):
        filenames.append(file)

# 用来放数据的df
df = pd.DataFrame(columns = ["公司名","行业","融资","公司网址","薪资","职位",
                             "经验","学历","员工规模","关键词","发布时间","职位诱惑",
                            "职位描述","地点"])


# 遍历文件名
for file in filenames:
    file = path + file
    # 将xml转为json
    xml_to_json(file)
    
    # 将json转为df
    output = file.replace(".xml", ".json")
    with open(output,encoding="utf-8") as json_data:
        d = json.load(json_data)
    
    data = pd.io.json.json_normalize(d["extraction"]["数据分析详情"]["item"])
    
    # 合并df
    df = pd.concat([df, data], sort = "False")

df.head(1)

	公司名	公司网址	关键词	发布时间	员工规模	地点	学历	经验	职位	职位描述	职位诱惑	薪资	融资	行业
0	路行通	http://www.klicen.com	数据分析	2019-09-27 发布于拉勾网	500-2000人	深圳 -\n 南山区 -\n ...	本科及以上 /	经验3-5年 /	数据分析师（碰撞场景探索与...	岗位职责：\n1.负责车辆碰撞场景的深度探索及数据建模。\n2.负责车辆碰撞数据的新特征挖掘...	人性化管理,稳定平台,温馨化午餐	14k-20k	不需要融资	移动互联网,消费生活

# check df
df.info()


Int64Index: 216 entries, 0 to 0
Data columns (total 14 columns):
公司名     216 non-null object
公司网址    216 non-null object
关键词     215 non-null object
发布时间    216 non-null object
员工规模    216 non-null object
地点      216 non-null object
学历      216 non-null object
经验      216 non-null object
职位      216 non-null object
职位描述    216 non-null object
职位诱惑    216 non-null object
薪资      216 non-null object
融资      216 non-null object
行业      216 non-null object
dtypes: object(14)
memory usage: 25.3+ KB

从拉勾网上我们爬取了深圳市数据分析岗位的招聘信息，共216条，包括公司名称、员工规模、行业、学历要求、经验要求、薪资水平等属性。为了方便下一步分析，接下来需要对这些属性进行标准化处理。

2. 数据清洗

这里的数据清洗分几个步骤进行：

清理重复行。对于重复发布的岗位信息，我们只需要保留一条记录。
清除多余文字。将各属性值中多余的描述性文字和换行符去掉。
拆分薪资。这里给出的薪资是一个范围，我们将它拆成薪资上限和薪资下限，方便分析。
提取地区。从地点描述中提取出区划名。

# 清理重复行
df_clr = df.drop_duplicates({
     "公司名","职位","职位描述"}).copy()

# 清除多余字符
df_clr["员工规模"] = df_clr["员工规模"].str.replace("人","")
df_clr["经验"] = df_clr["经验"].str.replace(" /","")
df_clr["经验"] = df_clr["经验"].str.replace("经验","")
df_clr["学历"] = df_clr["学历"].str.replace("学历","")
df_clr["学历"] = df_clr["学历"].str[:2]
df_clr["职位描述"] = df_clr["职位描述"].str.replace(" ","")
df_clr["职位描述"] = df_clr["职位描述"].str.replace("\n","")

# 拆分薪资
df_clr["薪资"] = df_clr["薪资"].str.replace("k","000")
df_clr[["薪资下限","薪资上限"]] = df_clr.薪资.str.split("-", expand = True)

# 提取地区
df_clr["地点"] = df_clr["地点"].str.replace(" ","")
df_clr["地点"] = df_clr["地点"].str.replace("\n","")
df_clr["地点"] = df_clr["地点"].str.replace("查看地图","")
df_clr["区划"] = df_clr["地点"].str[3:5]

df_clr = df_clr.drop(columns = ["薪资","发布时间"])


df_clr.head(1)

	公司名	公司网址	关键词	员工规模	地点	学历	经验	职位	职位描述	职位诱惑	融资	行业	薪资下限	薪资上限	区划
0	路行通	http://www.klicen.com	数据分析	500-2000	深圳-南山区-大冲-深南大道9680号大冲商务中心A座	本科	3-5年	数据分析师（碰撞场景探索与...	岗位职责：1.负责车辆碰撞场景的深度探索及数据建模。2.负责车辆碰撞数据的新特征挖掘和衍生，...	人性化管理,稳定平台,温馨化午餐	不需要融资	移动互联网,消费生活	14000	20000	南山

df_clr.info()


Int64Index: 214 entries, 0 to 0
Data columns (total 15 columns):
公司名     214 non-null object
公司网址    214 non-null object
关键词     213 non-null object
员工规模    214 non-null object
地点      214 non-null object
学历      214 non-null object
经验      214 non-null object
职位      214 non-null object
职位描述    214 non-null object
职位诱惑    214 non-null object
融资      214 non-null object
行业      214 non-null object
薪资下限    214 non-null object
薪资上限    214 non-null object
区划      214 non-null object
dtypes: object(15)
memory usage: 26.8+ KB

# 保存表 - 方便下次使用
# df_clr.to_excel("data/data_job.xlsx", index = False)

# 载入表
df_clr = pd.read_excel("data/data_job.xlsx")
df_clr.head(1)

	公司名	公司网址	关键词	员工规模	地点	学历	经验	职位	职位描述	职位诱惑	融资	行业	薪资下限	薪资上限	区划
0	路行通	http://www.klicen.com	数据分析	500-2000	深圳-南山区-大冲-深南大道9680号大冲商务中心A座	本科	3-5年	数据分析师（碰撞场景探索与...	岗位职责：1.负责车辆碰撞场景的深度探索及数据建模。2.负责车辆碰撞数据的新特征挖掘和衍生，...	人性化管理,稳定平台,温馨化午餐	不需要融资	移动互联网,消费生活	14000	20000	南山

经过清洗后保留下来的记录还有214条。我们把这张洗好的表存起来，下一次分析就可以直接读取，而不用把上面的步骤再跑一遍。

3. 数据分析

接下来进入我们的正题。前面说过，这篇研究主要想解决两个问题：

哪一类人市场需求最高
什么因素能影响工资水平

首先我们先看一下深圳各区在招岗位数和薪资水平的差别。

3.1 深圳各区比较

3.1.1 各区在招岗位数

# 计算各区岗位数
count_region = df_clr.区划.value_counts().copy()

# 画图
plt.figure(1, figsize = (6,4))
plt.bar(count_region.index, count_region.values)
plt.title("深圳各区在招岗位数",fontsize = 18)
for i, v in enumerate(count_region.values):
    # 显示数字标签
    plt.text(i,v+1,v,color = "tab:blue",horizontalalignment='center', 
             fontsize = 12)  
plt.show()

可以看到，与预期一样，南山区不愧是深圳的科技中心，因为聚集了众多互联网企业，对数据分析师的需求远多于其它几个区。

不过这也可能因为数据来源是拉勾网，而拉勾网又以互联网公司为主，因此对结果产生了影响。

3.1.2 各区平均工资

# 由于源数据中薪资为区间分布，这里取区间均值作为薪资值
df_clr["平均薪资"] = (df_clr["薪资下限"] + df_clr["薪资上限"])/2

# 按区划对平均薪资数据分组
avgpay_region = df_clr.groupby(["区划"])["平均薪资"]

avgpay_region_values = []
for group in count_region.index:
    m = avgpay_region.get_group(group).values
    avgpay_region_values.append(m)

# 绘制箱型图
plt.figure(figsize = (6,4))
ax = plt.subplot(111)
ax.boxplot(avgpay_region_values, showmeans = True)
ax.set_xticklabels(count_region.index)
ax.set_ylabel("薪资（元/月）")
ax.set_title("深圳各区招聘薪资",fontsize = 18)

在平均薪资这方面，南山区为2万左右/月，属于正常水平。招聘岗位仅次于南山区的福田区平均薪资为1.5万，在六个区中处于中下水平。而宝安给出的平均薪资是最高的，达到了3万多。可见为了在吸引人才方面与南山区竞争，宝安区给出了较高的薪水诱惑。

3.2 哪类人市场需求较高

下面我们从招聘工作中最常考虑的四个要素，来分析哪一类人的市场需求较高。这四个要素分别是工作经验、学历背景、职业技能和所属行业。

3.2.1 工作经验

# “经验不限”和“应届毕业生”等同于1年以下，将其合并为一类
df_clr = df_clr.replace({
     "经验":{
     "不限":"1年以下","应届毕业生":"1年以下"}})

# 按经验年限对x轴标签排序
exp_val = df_clr["经验"].value_counts()
index = ["1年以下","1-3年","3-5年","5-10年","10年以上"]
values = [exp_val[x] for x in index]

# 绘制柱状图
plt.figure(figsize = (6,4))
plt.bar(index, values)
plt.title("工作经验分布",fontsize = 18)
for i, v in enumerate(values):
    plt.text(i,v+1,v,color = "tab:blue",horizontalalignment='center', 
             fontsize = 12)  # show values
plt.show()

可以看到，有3-5年工作经历的人市场需求是最高的，其次是拥有1-3年经验的人。

事实上，对数据分析师需求也是从近几年才渐渐兴起的，在行业还未成型的阶段，拥有一定经验的工作者确实会成为较为抢手的角色。而拥有三年以上工作经验，基本上已经可以独立完成项目，对于小公司和小团队来说会是优先考虑的类型。

3.2.2 学历

# 统计各学历背景的岗位数
edu_val = df_clr.学历.value_counts()

# 绘制柱状图
plt.figure(figsize = (6,4))
plt.bar(edu_val.index, edu_val.values)
plt.title("学历要求分布",fontsize = 18)
for i, v in enumerate(edu_val.values):
    plt.text(i,v+1,v,color = "tab:blue",horizontalalignment='center', 
             fontsize = 12)  # show values
plt.show()

超过85%的岗位都要求应聘者具备本科学历，这也与目前国内的行业形势相符。数据分析的工作对综合分析能力要求较高，因而对学历的要求也会相对高一些。

3.2.3 职业技能

# 由于职位描述中包含大量中文，这里只提取软件类的英文技能
def extract_eng(text):
    eng = re.compile("[^a-z^A-Z]")
    str = eng.sub(" ",text)
    return str
    
df_clr["技能要求"] = df_clr["职位描述"].apply(extract_eng)
df_clr["技能要求"] = df_clr["技能要求"].str.split()
df_clr.head(1)

	公司名	公司网址	关键词	员工规模	地点	学历	经验	职位	职位描述	职位诱惑	融资	行业	薪资下限	薪资上限	区划	平均薪资	技能要求
0	路行通	http://www.klicen.com	数据分析	500-2000	深圳-南山区-大冲-深南大道9680号大冲商务中心A座	本科	3-5年	数据分析师（碰撞场景探索与...	岗位职责：1.负责车辆碰撞场景的深度探索及数据建模。2.负责车辆碰撞数据的新特征挖掘和衍生，...	人性化管理,稳定平台,温馨化午餐	不需要融资	移动互联网,消费生活	14000	20000	南山	17000.0	[Python, MATLAB, R]

text = df_clr["技能要求"].dropna().to_string()

# 绘制词云图
plt.figure(figsize=(10,8))
wordcloud = WordCloud(font_path = "simhei.ttf",
                      background_color = "white",
                      min_font_size = 10,
                      color_func = lambda *args, **kwargs:(0,0,0),
                      width = 900, height = 600).generate(text)
plt.imshow(wordcloud)
plt.axis("off")

# 将技能规整到一个list中
temp_list = df_clr["技能要求"].tolist()
flat_list = [word for sublist in temp_list for word in sublist]
flat_list = [str.upper() for str in flat_list]

# 统计词频
word_freq = {
     word:flat_list.count(word) for word in flat_list}
word_freq = pd.DataFrame(list(word_freq.items()),columns = ["word","freq"])
word_freq = word_freq.sort_values(by = ["freq"],ascending = False)
word_freq.head(1)

	word	freq
3	SQL	126

# 绘制前20个高频技能条形图
plt.figure(figsize=(6,4))
plt.barh(word_freq.word[:20],word_freq.freq[:20])
plt.title("需求最大的前20个技能",fontsize = 18)
for i, v in enumerate(word_freq.freq[:20]):
    plt.text(v+1,i,v,color = "tab:blue",verticalalignment='center', 
             fontsize = 12)  # show values
plt.gca().invert_yaxis()
plt.show()

接下来是对于职业技能的分析。这里我们只考虑数据分析的通用技能（即编程语言、数据库语言等），而不考虑管理、行业经验等指向性明确的技能。

排名前三的技能分别是SQL、Python和R。超过半数的岗位都明确要求需要掌握SQL语言。作为数据分析的基础，了解一定的数据库提取和清洗方法是必要的。Spark作为开源的大规模数据处理框架，它的应用也越来越广泛，其市场需求甚至排在Hadoop之上。Excel就不用说了，老牌数据处理软件，我个人觉得它处理图表比Python和R更好用，在易操作性上甚至优于专业的报表软件Tableau。

3.2.4 行业

# 统计行业词频 
temp_list = df_clr["行业"].str.split(",")
flat_list = [word for sublist in temp_list for word in sublist]
word_freq_indstry = {
     word:flat_list.count(word) for word in flat_list}
word_freq_indstry = pd.DataFrame(list(word_freq_indstry.items()),columns = ["word","freq"])
word_freq_indstry = word_freq_indstry.sort_values(by = ["freq"],ascending = False)


# 绘图
plt.figure(figsize=(6,4))
plt.barh(word_freq_indstry.word[:10],word_freq_indstry.freq[:10])
plt.title("数据分析岗位的行业分布（前十）",fontsize = 18)
for i, v in enumerate(word_freq_indstry.freq[:10]):
    plt.text(v,i,v,color = "tab:blue",verticalalignment='center', 
             fontsize = 12)  # show values
plt.gca().invert_yaxis()
plt.show()

最后来看下哪些行业对数据分析师的需求较多。由上图可知，移动互联网、金融和电商是数据分析岗位分布最多的前三个行业，社交排名第四。这几个行业都有一个共同点，就是会产生大量的数据。

总结一下，回答我们在开头提出的第一个问题：哪类人的市场需求较高？

从分析得出的结论是，拥有3-5年经验、本科学历、掌握SQL语言且从事与移动互联网、金融或电商相关行业的人，在应聘工作时会比较有优势。

3.3 工资与什么挂钩

接下来看看我们最关心的一个问题：什么因素会影响工资水平？

影响工资的因素可分为内因和外因，其中内因包括个人自身的工作经验和学历，外因则包括所处行业和公司规模。

3.3.1 工作经验

# 按经验对薪资进行分组
avgpay_exp = df_clr.groupby(["经验"])["平均薪资"]

# 统计各经验组的薪资数据，index为先前已排序的经验分组
avgpay_exp_values = []
for group in index:
    m = avgpay_exp.get_group(group).values
    avgpay_exp_values.append(m)

# 绘制箱型图
plt.figure(figsize = (6,4))
ax = plt.subplot(111)
ax.boxplot(avgpay_exp_values, showmeans = True)
ax.set_xticklabels(index)
ax.set_ylabel("薪资（元/月）")
ax.set_title("经验与薪资关系",fontsize = 18)

首先是看起来对工资影响最大的工作经验。可以看到随着经验年限提升，薪资也不断提升。

在深圳，新人数据分析师的起薪一般可达到1万左右，三年是一个门槛，从三年到五年薪资是线性上升的。拥有三年以上经验平均可达到2万左右的薪资水平，五年以上可达3万。十年以上的岗位样本量太少，不具备参考价值。

3.3.2 学历

# 按学历对薪资进行分组
# 由于薪资是根据经验年限给的一个范围，这里仅看学历对薪资的影响，因而取薪资范围的最小值
pay_edu = df_clr.groupby(["学历"])["薪资下限"]

# 统计各学历组的薪资数据，edu_val为学历分组
edu_index = ["不限","大专","本科","硕士","博士"]
pay_edu_values = []
for group in edu_index:
    m = pay_edu.get_group(group).values
    pay_edu_values.append(m)

# 绘制箱型图
plt.figure(figsize = (6,4))
ax = plt.subplot(111)
ax.boxplot(pay_edu_values, showmeans = True)
ax.set_xticklabels(edu_index)
ax.set_ylabel("薪资（元/月）")
ax.set_title("学历与薪资关系",fontsize = 18)

接下来看看薪资与学历的关系。随着学历增长，薪资增长幅度比较明显。本科平均能达到1.2万左右的月薪，硕士是2万，博士是3.5万。可见教育经历对数据分析师薪资水平也有较大的影响。

3.3.3 职业技能

第三个看的是职业技能对工资的影响。

这里我们只看需求最多的前十个技能。由前面分析可知排行前十的技能如下：

word_freq[:10]

	word	freq
3	SQL	126
0	PYTHON	115
2	R	77
5	EXCEL	67
14	SPARK	43
4	SAS	43
6	SPSS	40
7	HADOOP	39
18	HIVE	37
9	PPT	30

# 同理，这里只取薪资下限进行统计
skill_pay = []
for skill in word_freq.word[:10]:
    temp_df = df_clr.loc[df_clr["职位描述"].str.contains(skill, case = False)]
    skill_pay.append(temp_df["薪资下限"].tolist())
    
# 绘制箱型图
plt.figure(figsize = (6,4))
ax = plt.subplot(111)
ax.boxplot(skill_pay, showmeans = True)
ax.set_xticklabels(word_freq.word[:10])
ax.set_ylabel("薪资（元/月）")
ax.set_title("职业技能与薪资关系",fontsize = 18)

从上图可以看出，几种常见的编程语言对薪资的影响没有太大差异。不管你用的是Python、SQL，还是SAS、SPSS，只要可以很好地完成工作，对工资都没有绝对的影响。

其中除了excel和ppt作为基本的办公工具，相较其他技能对薪资的贡献稍显劣势，Spark作为新兴的数据处理框架，人才较少，招聘岗位给出的工资也比较高。

3.3.4 行业

最后行业的分析与职业技能同理，这里只取需求最多的前十个行业来比较。

# 行业同理，只取前十进行分析，薪资只取下限
indstry_pay = []
for industry in word_freq_indstry.word[:10]:
    temp_df = df_clr.loc[df_clr["行业"].str.contains(industry, case = False)]
    indstry_pay.append(temp_df["薪资下限"].tolist())
    
# 绘制箱型图
plt.figure(figsize = (8,4))
ax = plt.subplot(111)
ax.boxplot(indstry_pay, showmeans = True)
ax.set_xticklabels(word_freq_indstry.word[:10])
ax.set_ylabel("薪资（元/月）")
ax.set_title("行业与薪资关系",fontsize = 18)

在行业的影响上，物流运输业和硬件制造相关行业平均薪资较高，月薪接近2万。紧随其后的是社交和生活消费相关的行业，平均月薪在1.5万左右。招聘岗位最多的移动互联网行业平均薪资反而较低，仅1万左右。

3.3.5 公司规模

emply_index = ["少于15","15-50","50-150","150-500","500-2000","2000以上"]

# 按员工规模对薪资进行分组
pay_emply = df_clr.groupby(["员工规模"])["薪资下限"]

pay_emply_values = []
for group in emply_index:
    m = pay_emply.get_group(group).values
    pay_emply_values.append(m)

# 绘制箱型图
plt.figure(figsize = (6,4))
ax = plt.subplot(111)
ax.boxplot(pay_emply_values, showmeans = True)
ax.set_xticklabels(emply_index)
ax.set_ylabel("薪资（元/月）")
ax.set_title("员工规模与薪资关系",fontsize = 18)

最后看一下公司规模对他们给出的岗位的薪资影响。

虽然从平均薪资来看公司规模对薪资水平的影响不大，但从中位数看，超过2000人的大公司提供的薪资水平比较高，50%的岗位都给到了1.5万以上。相较而言，小公司多为新兴公司，需要招纳人才，起薪给的也比较高，多在1.5万左右。而中间规模的公司从整体看给的薪水是最少的，150人以下的公司多数月薪给不到1万。

总结一下，有哪些因素会对工资产生影响？

首先工作经验和学历与工资的关系是正相关的，学历越高、工作年限越长，工资水平就越高。不同的数据分析语言或者软件的使用对工资的没有太大影响。公司的规模一定程度上也决定了它能提供的薪资范围。最后，不同行业对数据分析师的需求是不一样的，物流运输业与硬件制造业的岗位薪资较高。

3.4 延伸分析

最后再来一点延伸分析。看看哪家公司招的岗位最多、哪家钱给得最多以及哪家福利最好。

3.4.1 公司常见福利

# 公司福利词云
text = df_clr["职位诱惑"].dropna().to_string()

# 绘制词云图
plt.figure(figsize=(10,8))
wordcloud = WordCloud(font_path = "simhei.ttf",
                      background_color = "white",
                      min_font_size = 10,
                      color_func = lambda *args, **kwargs:(0,0,0),
                      width = 900, height = 600).generate(text)
plt.imshow(wordcloud)
plt.axis("off")

五险一金、带薪年假、周末双休这些本应是理所当然的工作条件，居然也可以作为公司福利在招聘时做宣传。

在这些福利之中，免费三餐、租房补贴是我觉得最有用的。温饱问题解决了，才能心无旁骛地工作。

3.4.2 该怎么选公司

招聘岗位最多的公司

df_clr["公司名"].value_counts()[:10]

腾讯              20
OPPO            12
顺丰科技有限公司         8
字节跳动             7
阿卡索外教网           6
微众银行             6
一面数据             6
京东集团             5
乐逗游戏             4
深圳白骑士大数据有限公司     4
Name: 公司名, dtype: int64

可以看到，招聘岗位最多的公司是腾讯，其次是OPPO，排第三的是顺丰。

给钱最多的公司

row_indexup = df_clr["薪资上限"].idxmax()
row_indexdn = df_clr["薪资下限"].idxmax()

print("给钱最多的公司：",df_clr["公司名"].iloc[row_indexup],"(",df_clr["薪资上限"].iloc[row_indexup],"万)")
print("起薪最高的公司：",df_clr["公司名"].iloc[row_indexdn],"(",df_clr["薪资下限"].iloc[row_indexdn],"万)")

给钱最多的公司： vivo ( 80000 万)
起薪最高的公司： vivo ( 50000 万)

不论条件看单一岗位，给钱最多和起薪最高的公司都是vivo。

下面是在同等学历和工作经验条件下，起薪最高的公司：

# 同等学历和工作经验条件下，起薪最多的公司
df_clr.groupby(["学历","经验"]).max(level = "薪资下限")

		公司名	公司网址	区划	员工规模	地点	职位	职位描述	职位诱惑	薪资上限	薪资下限	融资	行业
学历	经验
不限	1-3年	银雁金融服务	https://www.lagou.com/gon...	福田	500-2000	深圳-福田区-福田保税区市花路1号联合金融大厦B座	数据分析师(J12931)	工作职责:1、负责公司业务数据分析和挖掘工作；2、跟进业务各数据指标的计算和分析，运营数据分...	营销数据实践,服务500强客户	22000	11000	不需要融资	移动互联网,企业服务
	3-5年	超级猩猩健身	https://www.lagou.com/gon...	福田	50-150	深圳-福田区-福田区嘉里建设广场2座10楼	游戏数据分析师	岗位职责：1、负责规划、跟进、梳理微信游戏产品数据上报和测试；2、负责对微信游戏运营数据进行...	颜值高团队,扁平化管理,老板好,员工福利	30000	15000	未融资	金融,数据服务
	5-10年	阿卡索外教网	http://www.acadsoc.com.cn	罗湖	2000以上	深圳-罗湖区-国贸-嘉宾路2018号处深华大厦7楼	业务建模数据分析师	岗位职责：1.通过数据分析、监控和日常数据挖掘（语音和文本数据），提供相应的运营建议，并推动...	在线教育	30000	18000	C轮	教育,移动互联网
	不限	传易	http://transsnet.com	南山	150-500	深圳-南山区-科技生态园2栋C座7-8楼	数据分析专员(J10236)	工作职责:1、负责运营数据整理规划工作，监控日常关键数据并分析异常变化，提交数据分析报告；2...	五险一金,员工旅游,年终奖金,定期体检	15000	10000	不需要融资	移动互联网,社交
博士	5-10年	京东集团	https://www.jd.com	宝安	2000以上	深圳-宝安区-新安-海秀路21号龙光世纪大厦B座	广告数据分析师leader	工作内容:1、需求把控：较强的需求把控能力，能够准确的理解上级及同级的各类数据及分析需求，并...	500强，免费班车，五险一金，带薪年休假	60000	35000	上市公司	电商
大专	1-3年	阿卡索外教网	http://www.waladigi.com/	罗湖	50-150	深圳-罗湖区-深圳市罗湖区桃园路254号HALO广场四期5-9层	数据分析（渠道方向）	工作职责负责Now直播数据体系建设，包括搭建数据仓库，建立指标体系，完成数据分析，报表开发及...	福利好，大平台，待遇高	30000	18000	上市公司	移动互联网,金融
	1年以下	乐格信息	https://www.localgravity.com	福田	150-500	深圳-福田区-下沙-海松大厦B座3a01	初级数据分析师	【岗位职责】： 1、负责零售数据信息的搜集、整理、录入、编辑、更新与维护等工作； ...	13天婚假（法定仅3天）朝九晚六双休	5000	4000	A轮	企业服务,数据服务
	3-5年	华策	http://www.smart-dec.com	福田	50-150	深圳-福田区-岗厦-金田路3038号现代国际商务大厦32层	数据分析师	为项目外派驻岗，到深圳市罗湖区深业中心大厦上班（平安项目），介意慎投岗位职责：1、负责理解机...	五险一金,年终奖,通讯补贴,绩效奖金	15000	10000	未融资	移动互联网
	5-10年	爱问科技	https://www.lagou.com/gon...	龙华	500-2000	深圳-龙华新区-宝能科技园8栋16层	高级数据分析师（ AW)	工作职责： 1、负责游戏数据分析体系搭建，包括TLOG埋点、日志上报、分析系统的规划等；2、...	年底双薪，业务发展迅速，晋升空间大。	30000	20000	天使轮	移动互联网,社交
	不限	飞诺达	http://www.lagou.com/gong...	宝安	150-500	深圳-宝安区-新安-翻身地铁站金宝商务大厦	数据分析	任职资格：1、逻辑分析能力强，对数据敏感，良好的学习能力和抗压能力；2、可熟练使用Excel...	公司福利待遇好，转正后购买五险一金。	8000	6000	不需要融资	移动互联网,电商
	应届毕业生	阿卡索外教网	https://www.lagou.com/gon...	罗湖	2000以上	深圳-罗湖区-国贸-嘉宾路2018号处深华商业大厦7楼整层	数据分析师	工作职责：1，根据公司发展战略规划和部门工作情况，对价格进行管理与监控，保证平台商品价格优势...	周末双休、法定节假日	30000	15000	未融资	电商,其他
本科	1-3年	阿卡索外教网	https://www.yimian.com.cn	龙岗	500-2000	深圳-龙岗区-坂田-坂雪岗大道神舟承运大厦四楼东	部门数据分析师（管理运营）	负责对接用户需求，管理用户期望，将需求进行有效拆解；将商业语言转化成数据语言，能够自主进行数...	鹅厂福利	40000	20000	未融资	金融
	10年以上	平安智慧城	http://city.pingan.com	南山	2000以上	深圳-南山区-前海自贸大厦	4721FP-智慧法律-资深数据...	工作职责1、负责AI、BI项目的数据需求收集，需求分析、技术实现、规范制定；2、识别产品中数...	五险一金,绩效奖金,高温补贴,定期体检	30000	15000	不需要融资	移动互联网
	1年以下	舟恩信息	http://www.leyinetwork.com	福田	150-500	深圳-福田区-新洲-购物公园地铁站	数据分析	乐易网络是一家数据驱动的手游公司，诚邀您作为数据分析工程师加入我们的数据平台团队，使用数据模...	大神指导,高配团队,年终奖,带薪旅行	20000	12000	不需要融资	移动互联网,游戏
	3-5年	鹏开信息	www.szeastroc.com	龙华	少于15	深圳-龙华新区-港深国际中心	高级游戏数据分析师	资深数据分析师职位描述1、负责短视频产品业务及市场数据分析，搭建业务数据指标体系和分析框架；...	高额年终奖团建体检旅游	80000	50000	未融资	金融,移动互联网
	5-10年	顺丰科技有限公司	https://www.lagou.com/gon...	罗湖	500-2000	深圳-罗湖区-华润大厦	高级顾问 / 经理（财务数据...	负责系统的数据采集和数据分析展示.岗位任职资格：1、5年以上Java开发经验,精通数据结构/...	领导好	60000	30000	未融资	金融
	不限	长亮科技	https://www.yimian.com.cn	福田	500-2000	深圳-福田区-车公庙-东海国际中心A座	银行数据分析岗位	负责对接汽车客户需求，进行数据探索和挖掘；根据用户需求交付PPT、报告、Dashboard等...	扁平管理，过亿用户，职业大牛	70000	35000	不需要融资	金融
	应届毕业生	阿卡索外教网	https://www.yimian.com.cn	罗湖	500-2000	深圳-罗湖区-国贸-嘉宾路2018号处深华商业大厦7楼整层	管理运营部门-数据分析师	工作职责:1.参与公司业务的数据体系建设，梳理抽象业务的核心关键指标，建设业务的报表体系和监...	新加坡公司，东南亚电商，大牛多	25000	15000	不需要融资	移动互联网,数据服务
硕士	3-5年	腾讯	https://www.wesure.cn/ind...	南山	2000以上	深圳-南山区-科技园-高新园飞亚达大厦	风控（海外）策略及数据分析...	工作职责：负责腾讯计费平台海外交易的风险场景和数据分析工作；负责腾讯计费平台海外交易的风控策...	氛围和谐,福利齐全,长期激励,年度旅游	60000	30000	不需要融资	金融
	5-10年	深圳白骑士大数据有限公司	https://www.baiqishi.com	南山	50-150	深圳-南山区-科技园-科苑路讯美科技广场3号楼609	高级医疗数据分析师	工作职责：1.承担常规的数据抽取、清洗、转化等数据处理，负责数据的维护和更新，负责医学数据的...	期权计划,专业培训,出国交流,酷环境	65000	38000	B轮	医疗丨健康
	应届毕业生	深圳中原地产	http://hz.centanet.com/	南山	2000以上	深圳-南山区-后海-创业路1777号海信南方大厦	数据分析专员	【工作职责】1、负责收集和分析房地产成交数量、成交价格、成交频率、供应数量等信息，研究发展方...	带薪年假、团建旅游、五险一金、快速晋升	10000	7000	不需要融资	消费生活

福利最好的公司

在深圳，住房才是最重要的！所以我们就来看看提供住房补贴福利的公司有哪些。

df_clr[df_clr["职位诱惑"].str.contains(".房.",regex = True)]

	公司名	公司网址	关键词	员工规模	地点	学历	经验	职位	职位描述	职位诱惑	融资	行业	薪资下限	薪资上限	区划
26	字节跳动	http://www.bytedance.com	营销\n 数字...	2000以上	深圳-南山区-南海大道2163号来福士广场15层	本科	3-5年	数据分析师-游戏方向	职位职责：1、搭建游戏业务数据体系，通过数据分析挖掘用户需求，优化产品功能，推动业务目标达成...	弹性工作，免费三餐，餐补，租房补贴	C轮	文娱丨内容	20000	40000	南山
94	字节跳动	http://www.bytedance.com	产品经理	2000以上	深圳-南山区-创业路3023号公园一号办公楼	本科	3-5年	资深数据分析师-反作弊方向	职位职责：1、分析头条各产品线用户数据，发现用户异常问题，提高业务风控效果；2、有效利用公司...	六险一金，弹性工作，免费三餐，租房补贴	C轮	文娱丨内容	25000	50000	南山
95	字节跳动	http://www.bytedance.com	数据分析	2000以上	深圳-南山区-南海大道2163号来福士广场17层	本科	不限	数据分析实习生-用户增长方向	职位职责：1、负责数据表设计和生产；2、负责分析和试验等提供数据支持；3、负责建立用户数据分...	免费三餐，租房补贴，休闲下午茶，扁平管理	C轮	文娱丨内容	2000	4000	南山
120	字节跳动	http://www.bytedance.com	数据分析	2000以上	深圳-南山区-南海大道2163号来福士广场17层	本科	3-5年	高级数据分析师-faceu	职位职责：1、负责相机线产品用户增长、用户画像、以及变现等相关工作；2、分析各项影响产品提升...	六险一金，弹性工作，免费三餐，租房补贴	C轮	文娱丨内容	10000	20000	南山
193	字节跳动	http://www.bytedance.com	产品	2000以上	深圳-南山区-南海大道2163号来福士广场15层	本科	3-5年	游戏数据分析师	职位职责：1、负责产品经分平台（BI）需求的输出与实现，并跟进使用过种中问题和提出优化方案（...	弹性工作，免费三餐，租房补贴，带薪休假	C轮	文娱丨内容	15000	30000	南山
199	腾讯	http://hr.tencent.com	移动互联网\n ...	2000以上	深圳-南山区-腾讯大厦	本科	不限	腾讯音乐数据分析高级工程师	工作内容： 1、负责企业发展部数据分析工作，通过数据挖掘、大数据处理、数据分析等技术，对运...	免费班车；员工食堂；健身房；鹅厂福利	上市公司	社交	20000	40000	南山

可以看到，有提供房补的基本是像腾讯、字节跳动这样的大公司。一般中小公司都不会提供住房补贴。

总结

最后总结一下，积攒工作经验、提升学历都能帮我们找到更好的工作，拿到更高的薪水。至于你具体使用哪一门语言去做数据分析，影响则不是很大，重要的是在你掌握的语言里做精做深，将技能运用于实际业务。

在行业选择上，虽然不同行业的薪资水平有些微差异，但长远来看还是应思考该行业对数据分析师的要求是否与自己的职业规划相符。不管哪一门行业，数据分析都是为业务服务的。

(字数：3092字)

本文参考

浅谈深圳数据分析岗
数据分析师挣多少钱？“黑”了招聘网站告诉你！
SQL教你如何找到数据分析工作

你可能感兴趣的:(数据分析,python,招聘)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
写完作业的感觉很爽乡村算卦师
今天终于一口气把一个数据分析课的作业写完了。明天还要继续写一个，写完，就可以暂时轻松一下了。想想还是很开心的，哈哈哈。刚出去跑了一圈，结果下雨了，虽然不是很大，可是没办法跑，怕下大。现在在小区门口，吹吹风，也是极好的。希望一些都变的越来越好，加油！
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交