易筱昭

pandas 作图统计_绘图和可视化 Matplotlib，Pandas，Sseaborn, Pyecharts（数据蛙视频课摘录）...

数据蛙视频教程摘录

附加-数据可视化之美：

例子：地铁图，拟真距离，这是因为乘客关心的是从起点到终点，需要换乘哪几条线最方便，不会考虑行进了多少公里。所以地铁图，是一定程度上的模拟真实距离，但不是完全真实，不像baidu地图上左下脚有图标：一条横线表示距离。

让数据更高效的被阅读

突出数据背后的规律

突出重要因素

最后是美观。

基础概念：

Dimension：描述分析的角度，数学，分类数据，(时间，地理位置，产品类型)

Measure: 数值 (元，销量，金额等 )

跟踪app/网站用户的点击浏览路径。

揭示折线看不出来的规律。

社交关系

业绩目标

大数据分析，文本分析利器。

地理图：pyecharts上可以绘制动态地理图

三个绘图工具：

matplotlib绘图。(遇到复杂的制图需求时使用，最基础的库，所以每个函数的参数非常多并且复杂)

seaborn绘制统计图形。

基于matplotlib和pandas, 更高级，做了优化，可视化效果更好，

专业用于统计分析。

⚠️：可视化课程的重点是：利用图形去理解数据，而不是注重图形的美观。

Matplotlib

--Hello World

matplotlib.pyplot is a state-based interface to matplotlib. It provides a MATLAB-like way of plotting.

基于状态的接口，提供类似MATLAB样式的绘图工具。(MATLAB是收费绘图软件)

importnumpy as npimportmatplotlib.pyplot as plt

X= np.linspace(0, 2*np.pi, 100)

Y=np.sin(X)

Y1=np.cos(X)

plt.title("Hello World!") #给图形命名

plt.plot(X,Y) #画一个图

plt.plot(X,Y1)

生成：

第一行是储存的内存位置。

plt.show() #使用show函数可以生成画布

分开画2个图：

X = np.linspace(0,2*np.pi, 100)

Y=np.sin(X)

plt.subplot(2,1, 1) #为当前figure附加一个子画布。

plt.plot(X,Y)

plt.subplot(2,1,2)

plt.plot(X, np.cos(X), color= 'r')

解释：

subplot(nrows, ncols, index, **kwargs)

index是图的位置索引。

nrows, ncols是figure的行和列的数量，比如2行*2列，生成4块画布。

3 Bar Chart

一般用于表示种类的数据。

bar()

barh()，横向排列bar。

data = [5,25,50,20]

plt.bar(range(len(data)), data)#

3.03多个bar

data =[[5,25,50,20], [4,23,51,17],[6,22,52,19]] #2维数据。

X =np.arange(4)

plt.bar(X+0.00, data[0], color='b', width=0.25, label="A")

plt.bar(X+0.25, data[1], color='g', width=0.25, label="B")

plt.bar(X+0.50, data[2], color='r', width=0.25, label="C")

plt.legend()#图上显示标签

3.04 stacked

⚠️：bottom参数的作用就是当一个基座。新的数据的图从基座上绘制。

data[0]+np.array(data[1])#array([ 9, 48, 101, 37])

3.05 scatter

用于描述2个连续变量之间的关系。

matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, alpha=None , data=None, **kwargs)

s参数：scalar, The marker size in points**2.

c参数：color, sequence, or sequence of color

alpha参数，表示图像的透明度，希腊第一个字母。The alpha blending value, between 0 (transparent) and 1 (opaque). 从透明到浑浊。

#⚠️x, y ,colors, area的索引是一一对应的。

N = 50x=np.random.rand(N)

y=np.random.rand(N)

colors=np.random.randn(N)

# colors = np.random.randint(0,2, size=50) #根据数据分成2种颜色

area= np.pi * (15*np.random.rand(N))**2 #调整大小

plt.scatter(x,y, c=colors, alpha=0.5, s=area)

3.06Histogram 直方图

用来衡量连续变量的概率分布。首先要定义bins(值的范围)，需要把连续值分成不同等份，然后计算每一份里面数据的数量。

a = np.random.randn(10000)

plt.hist(a, bins=100) #绘制一个直方图, 参数bins分成100组。

plt.show()#plt.ylim(0,20) #Get or set the y-limits of the current axes. ylim(bottom, top)

一千个符合正态分布的数据，根据极值，分成100组，每组的数据量越大，图上显示的就越高。

6.boxplots

boxplots用于表达连续特征的百分位数分布。统计学上经常被用于检测单变量的异常值，或者用于检测离散特征和连续特征的关系。

x = np.random.randint(20,100, size=(30,3))

plt.boxplot(x)

plt.ylim(0,120) #设置y的值范围120.

plt.xticks([1,2,3], ["label_a", 'label_b', 'label_c']) # xticks在x轴设置标签。

如何在图上绘制是否是中位数？

np.median(x, axis=0) #行方向的中位数#array([55.5, 64. , 63. ])

np.mean(x,axis = 0)

上面的代码,增加一行：

plt.hlines(y=np.median(x, axis=0)[0], xmin=0, xmax = 4) #hlines()用于在图上画一条水平方向的线

7 colors/texts/annotate

使用颜色：颜色可以用gbp，也可以使用自带的。

fig, ax =plt.subplots(facecolor="darkseagreen")

data= [[5,25,50,20],

[4,23,51,17],

[6,22,52,19]]

X= np.arange(4)

plt.bar(X, data[0], color='darkorange', width=0.25, label="A")

plt.bar(X, data[1], color="steelblue", width=0.25, label="B", bottom=data[0])

plt.bar(X, data[2], color="violet", width=0.25, label="C", bottom=np.array(data[0] + np.array(data[1])))

ax.set_title('Figure 1')

plt.legend()

分析：

使用plt.subplots()，创建一个新的Figure和一组subplots集合，并返回一个含有已创建的subplot对象的NumPy数组。color=定义颜色

facecolor定义灰板的背景色。

nrows, ncols创建2维度的绘板，比如nrows=2, ncols=2,就是创建4个绘板

ax是

ax.set_title()设置标题。

增加文字

plt.text(x, y, s, fontdict=None, withdash=False, **kwargs)

x ,y 是绘版上的位置

s是要增加的字符串

fontdict是一个字体的设置集合：

fontsize=12字体大小

例子：

fig, ax = plt.subplots(facecolor='teal')

data= [[5,25,50,20],

[4,23,51,17],

[6,22,52,19]]

X= np.arange(4)

plt.bar(X+0.00, data[0], color = 'darkorange', width = 0.25,label = 'A')

plt.bar(X+0.25, data[1], color = 'steelblue', width = 0.25)

plt.bar(X+0.50, data[2], color = 'violet', width = 0.25,label = 'C')

ax.set_title("Figure 2")

plt.legend()

W= [0.00,0.25,0.50]for i in range(3):for a, b in zip(X+W[i], data[i]):

plt.text(a, b,"%.0f" % b, ha="center", va="bottom")

plt.xlabel("Group")

plt.ylabel("Num")

plt.text(0,48, "hello")

增加注释：annotate

(无需使用函数，用窗口化的工具(可以直接拖拉设置的那种工具)更方便。)

在数据可视化的过程中，图片中的文字经常被用来注释图中的一些特征。

plt.annotate()

被注释的地方xy(x, y)

插入文本的地方xytext(x, y)

绘图能表达意思即可。数据分析和数据挖掘，越简洁越好。

plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签

plt.rcParams['axes.unicode_minus']=False #用来正常显示负号

X= np.linspace(0, 2*np.pi, 100)

Y=np.sin(X)

Y1=np.cos(X)

plt.plot(X, Y)

plt.annotate("Points", xy=(1, np.sin(1)), xytext=(2, 0.4), fontsize=16, arrowprops = dict(arrowstyle="->"))

plt.title("一副测试图")

subplots

#调整绘画板大小

pylab.rcParams["figure.figsize"]= (x,y)

matplotlib.pyplot.subplots(nrows=1, ncols=1, sharex=False, sharey=False, squeeze=True, subplot_kw=None, gridspec_kw=None, **fig_kw)

官方文档有很多案例。

例子：

importnumpy as npimportmatplotlib.pyplot as pltimportmatplotlib.pylab as pylab

plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签

plt.rcParams['axes.unicode_minus']=False #用来正常显示负号

pylab.rcParams['figure.figsize'] = (10, 6) #调整大小

np.random.seed(156948)

n_bins= 10x= np.random.randn(1000,3)

fig, axes= plt.subplots(nrows=2, ncols=2,facecolor='darkslategray')#axes 是一个2维的数组。

ax0, ax1, ax2, ax3 = axes.flatten() #flatten()变一维，并赋值。

colors= ['red', 'tan', 'lime']

ax0.hist(x, n_bins, normed=1, histtype='bar', color=colors, label=colors)

ax0.legend(prop={'size': 10})

ax0.set_title('bars with legend')

ax1.hist(x, n_bins, normed=1, histtype='bar', stacked=True)

ax1.set_title('stacked bar')

ax2.hist(x, n_bins, histtype='step', stacked=True, fill=False)

ax2.set_title('stack step (unfilled)')

x_multi= [np.random.randn(n) for n in [10000, 5000, 2000]]

ax3.hist(x_multi, n_bins, histtype='bar')

ax3.set_title('different sample sizes')

fig.tight_layout()#让布局好看一点

plt.show()

pandas api

基础知识(进阶的需要看cookbook)

各种plots的使用

各种plots如何处理缺失值，以及如何自定义缺失值。

一些复杂的制图函数。各种奇形怪状的图

绘图格式，比如颜色，形状大小等。

直接使用matplotllib的情况，复杂的绘图，自定义时。

plt.axhline(0)

增加一条水平线，在y轴0的位置。

df2.plot.bar(stacked=True);stack参数设置堆叠。

bar(x, y) x默认是index， y默认是columns

DataFrame.hist()和pd.plot.hist()区别

前者创建多个subplots, 后者只创建一个plot。

hist()中by参数的用法：

根据传入值，分组，然后形成直方图。例子：

//1000个随机正态分布的数字。

data= pd.Series(np.random.randn(1000))//by参数得到一个array, 里面的元素，是整数0～3，共计1000个数字，对应data中的数字，因此被分成0～3四个组，最后形成4个图

data.hist(by=np.random.randint(0,4, 1000))

备注：基础没有看完，看到Area plot

基于matplotlib和pandas的数据可视化库。

提供高级交互操作来绘画统计图形

import seaborn as sns

sns.set

sns.set(

context='notebook',

style='darkgrid', #whitegrid, dark, white, ticks

palette='deep',

font='sans-serif',

font_scale=1,

color_codes=True,

rc=None,

)

一步设置，各种美化参数。它使用了 matplotlib rcParam system，对所有的plots外观生效，所以不使用sns，也会生效。

sns.load_dataset(name)

cache=True参数默认把数据下载到本地缓存

这个函数的参数name对应官网数据库的数据，执行函数后直接从官网下载样本数据集合到本地。

主要目的是为了seaborn提供数据支持，无需再花费时间来加载整理数据。

tips =sns.load_dataset("tips")

iris= sns.load_dataset("iris")

或者使用pandas.read_csv()加载数据。

relplot()

⚠️figure-level函数

figure层的接口。函数提供通道来使用不同的axes层函数。用于处理2个变量的关系relationship。 kind参数选择使用axes层函数：

默认"scatter": func:`scatterplot` (with ``kind="scatter"``; the default)

"line": func:`lineplot` (with ``kind="line"``

可选参数，这3个参数对分组数据产生不同的视觉效果：

hue 决定点图的颜色，

size 根据数据大小，表示点图的大小。

style 用不同符号表示数据点图，

可选参数，row, col:

使用分类变量(categorical variable)，会绝对平面网格的布局。

比如col="align"，align列有2个值(dots, sacc)，因此会绘制3张图。

categorical variable分类变量是一种可以采用有限数量(通常为固定数量)之一的变量，可以根据某些定性属性将每个观察单位或其他观察单位分配给特定组或名义类别。

例子：

sns.relplot(x="total_bill", y="tip", col="time",

hue="smoker", style="smoker", size="size",

data=tips);

distplot()

jointplot() 联合绘图

⚠️figure-level函数, jointplot()把多个绘图整合。

绘制出双变量的分析图，用于双变量分析和单变量分析，bivariate analysis是定量分析的最简单形式之一。

它涉及对两个变量的分析，目的是确定它们之间的经验关系。双变量分析有助于检验简单的关联假设。(wiki)

这个函数提供了类JointGrid的接口，和一些plot kind。这是轻量化的包裹器。如果希望使用更多的功能，直接使用JointGrid类。

参数

kind : { "scatter" | "reg" | "resid" | "kde" | "hex" }, 默认是scatter。

例子，可以文档的案例，这里举kind="reg"：

sns.jointplot("total_bill", "tip", data=tips, kind="reg")

除了基本的散点图scatter

增加了：line regression一元线性回归。(表示'total_bill'和'tip'两个变量之间的依赖关系。)

增加了：kernel density fit.在数据上固定核密度模型(概率论中，估计未知的密度函数。)

Seaborn.pairplot()

⚠️figure-level函数.

智能分对儿。把一个数据集合中的变量，两两分队儿，画出所有分对儿的关系图。

参数：

hue=None, 颜色分类，根据不同数值赋予不同颜色。

Plotting with categorical data

分类的数据的绘制。

Standard scatter and line plots visualize relationships betweennumerical variables, but many data analyses involve categorical variables.

标准散点和线性图可视化了可秤量变量之间的关系，但是一些数据分析涉及到分类变量。

numerical variables:可秤量的变量，比如降雨量，心跳速率，每小时的汉堡售出数量，都是可秤量变量。

Seaborn提供了对这种类型数据集的优化的plot工具,catplot()

catplot()

一个描述可秤量变量和一个(多个)分类变量之间关系的api。

参数kind:

Categorical scatterplots:

- :func:`stripplot` (with ``kind="strip"``; 默认的✔️)

- :func:`swarmplot` (with ``kind="swarm"``) ，和strip的区别是point之间不重叠。

Categorical distribution plots:

- :func:`boxplot` (with ``kind="box"``)

- :func:`violinplot` (with ``kind="violin"``) 用kernel density estimation来表现点的样本分布

- :func:`boxenplot` (with ``kind="boxen"``)

Categorical estimate plots:

- :func:`pointplot` (with ``kind="point"``)

- :func:`barplot` (with ``kind="bar"``) 在每个分类中显示均值和置信区间

- :func:`countplot` (with ``kind="count"``)

stripplot(x,y, hue, data, jitter=True,...) 带状条形图

Draw a scatterplot where one variable is categorical.如果其中一个变量是分类的，可以使用stripplot画散点图。

jitter=True，默认，把数据分散成散点图模式。当points是分散的时候，可以看到分布

hue 用不同色调区分不同类型的数据。

例子：

tips.columns//Index(['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size'], dtype='object')

sns.stripplot(x='day', y ="total_bill", data=tips, hue="smoker")

barplot()

Show point estimates and confidence intervals as rectangular bars.显示点的估值和置信区间，图形是长方形条。

bar plot代表了一个关于某一数值变量的集中趋势(均值)的估计。并且用error bars提供了一些关于估值的非确定标示。

⚠️a bar plot默认使用mean value. 通过estimator参数，可以设置中位数np.median。

Statistical estimation and error bars

估计统计量是一种数据分析框架，结合使用效应值effect size，置信区间confidence intervals，精确计划和元分析来计划实验，分析数据并解释结果。

当估计统计量发生时，seaborn会计算置信区间并画出error bars, 用来表示非确定的估算。

seaborn的Statistical estimation超出了描述统计的范围。比如，它使用lmplot()强化了散点图->加上了linear regression model

lmplot()

使用lmplot()可以把把线性关系可视化。

Plot data and regression model fits across a FacetGrid. 在平面网格上绘制数据和回归模型。

默认用线性回归: linear regression。

这个函数联合了regplot函数和FaceGrid类。

使用implot函数可以很方便的：通过一个数据集合的置信子集来固定回归模型。

sns.lmplot(x="total_bill", y="tip", data=tips) ## 账单越贵，小费越多。

参数：

ci=95，默认, 即95%的置信区间。范围是0～100

scatter=True，默认使用散点图

scatter_kws={"s": 80} 设置散点图的参数。

order参数，If ``order`` is greater than 1, use ``numpy.polyfit`` to estimate a polynomial regression. 多项式回归(作出曲线)。

robust=True参数，去掉离群点异常值，不算入样本分析。

涉及到的数理统计概念：

Figure-level and axes-level functions

relplot和catplot都是figure层的。

他们都会联合使用一种特别的axes-level函数和FaceGrid对象

scatterplot(), barplot()都是axes-level函数。这是因为他们是在单独的matplotlib axes上绘制的，并且不影响其他figure。

区别：

figure-level函数需要控制figure

axes-level会放到一个matplotlib figure内，它的周边的plot可以是用seaborn制造的，也可能不是。

例子：

# 通过matplotlib绘制2个展板，并使用seaborn在展板上绘图

import matplotlib.pyplotasplt

f, axes= plt.subplots(1, 2, sharey=True, figsize=(6, 4))

sns.boxplot(x="day", y="tip", data=tips, ax=axes[0])

sns.scatterplot(x="total_bill", y="tip", hue="day", data=tips, ax=axes[1]);

展板大小设置

figure-level函数使用height和aspect(ratio of width to height)来设置每个子展板facet。

比如设置height=4.5，然后设置aspect=2/3，即宽是高的2/3。

例子：

sns.relplot(x="time", y="firing_rate", col="align",

hue="choice", size="coherence", style="choice",

height=4.5, aspect=2/3,

facet_kws=dict(sharex=False),

kind="line", legend="full", data=dots);

每个变量是1列，每次观察是一行.

Next steps

你可能感兴趣的:(pandas,作图,统计)

C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
上半年居民消费榜出炉！这个城市的人最能花 BBM优选官方
上半年居民消费榜出炉哪个地方的人最能花钱？国家统计局公布的数据显示上海上半年居民人均可支配收入32612元居民人均消费支出21321元均为全国最高成为最能挣钱也最能花钱的城市1上海人均消费支出全国第一国家统计局公布的31省份居民人均消费支出数据显示，上海、北京、天津上半年居民人均消费支出排名前三。其中，上海上半年居民人均消费支出21321元，位居榜首。上海也是上半年全国仅有的居民人均消费支出突破2
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
【日更挑战】本季联盟50大球星（46-44）扁圆柱体
日更挑战当前排名：第153天，第2269名，较昨日前进10名。46.KrisLetang，后卫，匹兹堡企鹅上赛季，Letang在55场比赛中得到45分（7球，38助攻），在所有后卫中，和闪电的VictorHedman并列第三，他在同等人数下的净胜球是+20，位列全队第一。而这个成绩在联盟自2009-10赛季统计该项指标后，是个人第二好成绩（+22,2011-12赛季）。Letang平均每场有24分
【2025/07/20】GitHub 今日热门项目 Albert_Lsk Github推荐 github 开源协议人工智能开源
GitHub今日热门项目每日精选优质开源项目|发现优质开源项目，跟上技术发展趋势报告概览统计项数值说明报告日期2025-07-20(周日)GitHubTrending每日快照数据时间21:28:08实时爬取生成项目总数15个精选热门开源项目⭐总星数392.7K社区认可度指标今日热度+4.5K24小时新增关注数据洞察核心指标项目总览15个精选项目⭐社区认可392.7K总星标数今日热度4.5K新增关注
2018年投资总结小迷糊Lyla
新年的第三天，终于有空把所有的账户状况做个统计了，所有账户总体收益率为-14%左右，没错是负的啦，但是这样的结果我已经很满意了。毕竟上证综指、沪深300、中小板指、创业板指全年分别为-24.59％、-25.31％、-37.75％和-28.65％，我从2018年年初入市，年末能跑赢大盘，已经对自己满意啦。当然这期间多亏遇见了E大，可以说对我的投资学习过程中给了莫大的帮助，让我明白市场虽然是不能预测的
Qt 下拉框QComboBox控件：从入门到实战
一、QComboBox核心功能解析1.核心属性属性说明当前示例场景count列表项总数统计学历下拉框中的选项数量editable是否允许用户编辑学历选择时可输入自定义学历currentText当前选中项的文本获取用户选择的"硕士"文本currentData当前选中项的附加数据获取太原对应的区号"0351"currentIndex当前选中项的索引位置(从0开始)确定"硕士"在列表中的位置2.核心方法
使用Python操作Excel，删重复数据及keep参数用法并保存的例子白帽黑客艾登 python excel 开发语言 Python编程 Python学习技能分享
01Ex按列标题删重复的数据解析：我们使用了pandas库读取Excel文件，并使用drop_duplicates()函数删除重复数据。其中，subset参数指定了删除重复数据的列（列名），keep参数指定了保留哪个重复记录（默认为第一个记录）。inplace=True参数表示在原始数据上进行操作。最后，我们使用to_excel()函数将处理后的数据，保存到一个新的Excel文件中，其中index
日精进打卡第一百二十六天 7ce89867b4c2
陆晓磊～品质部日精进打卡第126天六项精进1遍大学0遍经典名句分享很多东西放到时间里去就能看清。要么越走越远，要么越走越近。行为实践一、修身：（对自己个人）锻炼半小时早睡早起二、齐家：（对家庭和家人）和爸爸妈妈聊天三、建工：（对工作）每日报表SRG数据统计【省～觉悟】每天坚持做一件重复的小事看似很，其实很难，但是当自己由坚持变为习惯后，每天的坚持就如同吃饭睡觉一样简单。【感谢】感谢爸爸妈妈付出培养
7.21 树＆递归 lvy- 随记note c++算法
最大的收获，不在于怎么做这道题，而在于面对一个递归的题目时，最高效的思维框架是什么。递推参数、终止条件、递推任务，脑子里要有这个框架lc3226抽象思考，统计1的个数差异就好了，无需关心前导0classSolution{public:intcntBits(intx){intcnt=0;while(x){if(x&1)cnt++;x=x>>1;}returncnt;}intminChanges(in
【Python高阶开发】1. Pandas工业级时序数据处理实战：从振动传感器数据到轴承故障预警系统 AI_DL_CODE python pandas 时序数据处理振动传感器工业数据清洗特征工程
摘要：在工业设备健康监测中，振动传感器数据是评估设备状态的核心依据，但高频噪声干扰、数据传输缺失、多设备时间戳错位等问题严重影响分析准确性。本文基于PythonPandas构建工业级时序数据处理流水线，提出"时间校正-缺失填充-噪声过滤-特征提取"四步清洗法，针对工业场景设计专用策略：短时缺失采用线性插值、长时缺失标记异常，振动数据结合移动平均与Z-score检测保留真实特征。通过时域（峰值、峭度
测试管理工具之禅道的安装释槐鸟～项目测试用例测试工具
一、测试管理工具的作用1.测试管理工具是在指在软件开发过程中，对测试需求、计划、用例和实施过程进行管理、对软件缺陷进行跟踪处理的工具。2.通过使用测试管理工具，测试人员或开发人员可以更方便地记录和监控每个测试活动、测试阶段的结果，找出软件的缺陷和错误，记录测试活动中发现的缺陷和改进建议。3.管理工具应该具有的基本功能如下：测试需求管理测试用例管理测试过程管理（计划、任务等）缺陷管理报表统计权限管理
基于C/S架构与JAVA SWING的简易酒店管理系统实现想法臃肿
本文还有配套的精品资源，点击获取简介：本系统名为“简易酒店管理操作系统”，采用C/S架构和JAVASWING工具开发，旨在提供高效的酒店业务流程管理。系统包括客房管理、餐饮服务、前台接待、财务管理、库存管理和报表统计等核心模块，旨在通过技术手段提升酒店运营效率和客户体验，同时注重系统安全和数据保护。1.酒店管理系统概念与C/S架构1.1酒店管理系统简介在当今数字化时代，酒店管理系统是酒店运营不可或
感染HPV后还可能生孩子吗？小茶_0974
感染HPV后还能生孩子吗?HPV的感染虽然具有一定的年龄高峰期，但是任何一个年龄段的女性都是有可能感染HPV的，而且只要出现长期感染，高危型的HPV都是有可能引发宫颈癌。统计显示，女性感染HPV的一个高峰年龄段为26-30岁，这个高峰期恰好也是女性结婚生子的黄金期。很多女性在黄金育龄期感染了HPV，相信很多人出来恐慌自己的健康外，最担心的就是“我以后还能不能生孩子”?总的来说，如果只是单纯的高危H
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
Python_day54Inception网络及其思考且慢.589 Python_60 python 开发语言
一、inception网络介绍今天我们介绍inception，也就是GoogleNet传统计算机视觉的发展史从上面的链接，可以看到其实inceptionnet是在resnet之前的，那为什么我今天才说呢？因为他要引出我们后面的特征融合和特征并行处理这些思想。Inception网络，也被称为GoogLeNet，是Google团队在2014年提出的经典卷积神经网络架构。它的核心设计理念是“并行的多尺度
影刀RPA_批量添加用户至企业微信_源码解读 RPA+AI十二工作室影刀 python 开发语言影刀 rpa 企业微信自动化
一、项目简介本项目是一个基于影刀RPA（RoboticProcessAutomation）开发的自动化工具，主要功能是通过手机号码批量添加用户至企业微信。项目利用企业微信客户端自动化操作，实现了从手机号导入、去重处理到批量发送好友请求的全流程自动化。项目特点：支持通过数据表格或Excel导入手机号自动去重和格式清洗企业微信窗口自动化控制操作结果分类统计与导出二、项目结构xbot_robot/├──
Linux 如何统计系统上各个用户登录（或者登出）记录出现的次数？我是唐青枫 Linux linux 服务器网络
命令last|grep-v"^$"|awk'{print$1}'|sort-nr|uniq-c逐段解析last从/var/log/wtmp（或者对应的系统登录日志）中读取并列出最近的登录、重启、关机等记录。每行开头通常是用户名，例如：alicepts/0192.168.1.5TueJul2210:15stillloggedinbobtty1MonJul2109:00-17:00(08:00)reb
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
2019-01-13 朱非凡
姓名：朱非凡上海361期《六项精进》反省二组【日精进打卡第292天】【知～学习】《六项精进》3遍共730遍《大学》1遍共255遍••••••【经典名句分享】自律给我自由【行～实践】一、修身：阅读二、齐家：与母亲视频三、建功：1.竞品网站分析2.fb广告数据统计3.数据线图片描述优化5.物流跟踪发货6.产品优化详情｛积善｝：发愿从2018年3月19日起1年内365善事。今日1善，累计139善。【省～
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 微博文章数据可视化分析-文章分类下拉框实现 java1234_小锋 NLP NLLP微博舆情分析 python 自然语言处理 flask
大家好，我是java1234_小锋老师，最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程，持续更新中，计划月底更新完，感谢支持。今天讲解微博文章数据可视化分析-文章分类下拉框实现视频在线地址：2026版【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts+爬虫)视频教程（火爆连载更
linux命令grep的实际应用
grep是Linux/Unix系统中用于文本搜索的超级工具，其核心功能是使用正则表达式匹配文本行并输出结果。下面结合具体场景，展示其强大而实用的应用技巧：一、基础搜索与过滤快速定位文件内容：grep"error"/var/log/syslog#查找syslog中所有含"error"的行grep-i"timeout"application.log#-i忽略大小写，查找"timeout"统计匹配行数：
【Python】pandas.cut()函数的用法
pandas.cut()函数是一个非常有用的工具，用于将数值型数据按照指定的分箱或区间进行分割，从而将连续的数值变量转换为离散的类别变量。这在数据分析和机器学习的特征工程中尤其有用，因为它可以帮助揭示不同区间内的数据分布特征，或者简化模型的输入。基本用法pandas.cut()的基本语法如下：pandas.cut(x,bins,right=True,labels=None,retbins=Fals
Redis如何解决大Key问题 TravisBytes #Redis 编程问题档案 redis 数据库缓存
目录**如何解决Redis大Key（BigKey）问题？****1.什么是大Key？****2.如何发现大Key？****（1）使用`SCAN`命令遍历所有Key****（2）统计Key的类型和大小****3.如何解决大Key问题？****方案1：大Key拆分（Sharding）****（1）String过大：分片存储****（2）List/Set/Hash过大：拆分Key****方案2：分页存储
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

pandas 作图 统计_绘图和可视化 Matplotlib，Pandas，Sseaborn, Pyecharts（数据蛙视频课摘录）...

你可能感兴趣的:(pandas,作图,统计)

pandas 作图统计_绘图和可视化 Matplotlib，Pandas，Sseaborn, Pyecharts（数据蛙视频课摘录）...