王国平

Python数据分析从小白到高手--数据可视化分析

Python是一种功能强大的编程语言，也是一种流行的数据分析工具，其数据可视化能力也非常强大，本章我们将结合实际案例介绍Python的主要数据可视化库，包括Matplotlib、Pyecharts、Seaborn、Plotly、Altair、NetworkX等。

7.1 Matplotlib

7.1.1 Matplotlib库简介

Matplotlib是Python中最流行的数据可视化库之一，基于Numpy的数组运算功能，提供了各种图形和图表的绘制工具，用户通过使用Matplotlib可以轻松地画一些简单或复杂的地图形，编写几行代码即可生成线图、直方图、功率谱、条形图、错误图、散点图等。Matplotlib的特点是功能强大、灵活性高、可定制性强，可以满足各种数据可视化的需求。

Matplotlib的主要功能包括：

绘制各种图形：Matplotlib支持多种图形的绘制，包括线图、柱状图、散点图、饼图、直方图等。

定制图形样式：Matplotlib提供了丰富的样式选项，用户可以自定义图形的颜色、线型、标签、字体等。

支持多种数据格式：Matplotlib支持多种数据格式，包括Python列表、NumPy数组、Pandas数据框等。

支持交互式操作：Matplotlib支持鼠标悬停、缩放、拖拽等交互操作，用户可以更加灵活地探索数据。

支持多种输出格式：Matplotlib支持多种输出格式，包括PNG、PDF、SVG等，用户可以根据自己的需求选择不同的输出格式。

Python绘图库众多，各有各的特点，但是Maplotlib是一个非常基础的Python可视化库，如果需要学习Python数据可视化，那么Maplotlib是非学不可的，之后再学习其他库就比较简单了。Matplotlib的中文学习资料比较丰富，其中最好的学习资料是其官方网站的帮助文档，用户可以在上面查阅自己感兴趣的内容。

安装Anaconda后，会默认安装Matplotlib库，如果要单独安装Matplotlib库，则可以通过pip命令实现，命令为pip install Matplotlib，前提是需要先安装pip包。

7.1.2 业绩考核误差条形图

误差条形图是一类特殊的条形图，由带标记的线条组成，用于显示有关图形中所显示数据的统计信息，误差条形图具有三个Y值，即平均值、下限误差值、上限误差值。

操作者可以将统计信息手动分配给每个点，但在大多数情况下，是根据其他序列中的数据来计算的，Y值的顺序十分重要，因为值数组中的每个位置都表示误差条形图上的一个数值。

Matplotlib绘制条形图，使用plt.bar()函数，参数如下：

plt.bar(x,height,width=0.8,bottom=None,*,align='center',data=None,**kwargs)

plt.bar()函数的参数说明如表7-1所示。

表7-1 plt.bar()函数参数

参数	说明
x	设置横坐标
height	条形的高度
width	条形图宽度，默认值为0.8
botton	条形的起始位置
align	条形的中心位置
color	条形的颜色
edgecolor	边框的颜色
linewidth	边框的宽度
tick_label	下标的标签
log	y轴使用科学计数法表示
orientation	是竖直条还是水平条

为了深入研究企业2022年不同地区的销售业绩是否达标，拟定的最低业绩目标是50万元，我们绘制了各地区销售额的误差条形图，具体代码如下：

#导入第三方包

import pymysql

import pandas as pd

import matplotlib as mpl

import matplotlib.pyplot as plt

from sqlalchemy import create_engine

mpl.rcParams['font.sans-serif']=['SimHei'] #显示中文

plt.rcParams['axes.unicode_minus']=False #正常显示负号

#连接MySQL数据库

conn = create_engine('mysql+pymysql://root:[email protected]:3306/sales')

#读取订单表数据

sql = "SELECT region,ROUND(SUM(sales)/10000,2) as sales, ROUND(SUM(sales)/10000-30,2) as err FROM orders where dt=2022 GROUP BY region order by err desc"

df = pd.read_sql(sql,conn)

#设置图形大小

plt.figure(figsize=(12,7))

colors = ['DarkSlateBlue','DarkBlue','DarkCyan','DarkGreen','MidnightBlue','Blue']

plt.bar(df['region'], df['sales'], yerr=df['err'], width=0.8, align=

'center', ecolor='Maroon', alpha=0.9,color=colors, label='地区销售额');

#添加数据标签

for a,b in zip(df['region'],df['sales']):

plt.text(a, b+0.05, '%.2f' % b, ha='center', va= 'bottom',fontsize=16)

#设置坐标轴刻度值大小以及刻度值字体

plt.tick_params(labelsize=16)

plt.rc('font',size=16)

#添加坐标轴标签

plt.xlabel('地区名称',size=16)

plt.ylabel('销售额',size=16)

plt.title('2022年各地区销售业绩完成情况',size=20)

plt.legend(loc='upper right',fontsize=16)

plt.show()

在JupyterLab中运行上述代码，生成如图7-1所示的各门店销售额的误差条形图，从图2-12中可以看出，在2020年，各地区的销售额与业绩目标50万元之间的差距，其中，只有西南和西北地区没有完成业绩，分别是47.54万元、31.10万元，其他地区均超额完成目标。

图7-1 误差条形图

7.2 Pyecharts

7.2.1 Pyecharts库简介

Pyecharts是一个基于Python语言的数据可视化库，它基于Echarts.js实现了各种图表的绘制，包括折线图、柱状图、散点图、地图等。Pyecharts以简单易用、美观大方、交互性强等优点受到了广泛的欢迎。截至2023年6月，Pyecharts的最新版本是2.0.3，注意Pyecharts的V2版本系列已从Echarts 4切换到Echarts 5，支持Python3.6至Python 3.11。

Pyecharts的主要功能包括：

数据可视化：Pyecharts支持各种图表的绘制，可以帮助用户将数据转化为可视化的图形，更直观地展示数据。

交互性强：Pyecharts支持鼠标悬停、缩放、拖拽等交互操作，用户可以更加灵活地探索数据。

简单易用：Pyecharts的API设计简单易懂，用户可以快速上手，实现自己想要的图表效果。

多种输出格式：Pyecharts支持多种输出格式，包括HTML、图片、SVG等，用户可以根据自己的需求选择不同的输出格式。

支持多种数据格式：Pyecharts支持多种数据格式，包括Python列表、字典、Pandas数据框等，用户可以根据自己的数据格式选择合适的API。

Pyecharts的主要图形包括：

（1）基本图形：共计13类，包括日历图、漏斗图、仪表盘、关系图、水球图、平行坐标系、饼图、极坐标系、雷达图、桑基图、旭日图、主题河流图、词云图。

（2）直角坐标系图形：共计9类，包括柱状图/条形图、箱形图、涟漪特效散点图、热力图、K线图、折线/面积图、象形柱状图、散点图、层叠多图。

（3）树形图表：共计2类，包括树图、矩形树图。

（4）地理图表：共计3类，包括地理坐标系、地图、百度地图。

（5）3D图表：共计7类，包括3D柱状图、3D折线图、3D散点图、3D曲面图、3D路径图、三维地图、GL关系图。

（6）组合图表：共计4类，包括并行多图、顺序多图、选项卡多图、时间线轮播多图。

（7）HTML组件：共计3类，包括通用配置项、表格、图像。

总之，Pyecharts是一个功能强大、易于使用的数据可视化库，可以帮助用户快速、直观地展示数据，提高数据分析的效率和准确性。

7.2.2 销售额主题河流图

主题河流图是一种特殊的流图，它主要用来表示事件或主题等在一段时间内的变化。它是一种围绕中心轴线移位的堆积面积图，显示了不同类别的数据随时间的变化情况，使用流动的有机形状，类似于河流的水流。

在主题河流图中，每个流的形状大小与每个类别中的值成比例，平行流动的轴变量一般用于显示时间，在时间序列数据的可视化分析中比较实用。主题河流图是显示大数据集的最优选择，可以显示数据随时间的变化趋势。

主题河流图在时间序列数据的可视化分析中比较实用，当我们需要探索几个不同主题的热度（或其他统计量）随时间的演变趋势，并在同时期进行比较时就可以使用该图形。

Pyecharts主题河流图的参数配置如表7-2所示。

表7-2 Pyecharts主题河流图参数

参数	说明
series_name	系列名称，用于 tooltip 的显示，legend 的图例筛选
data	系列数据项
is_selected	是否选中图例
label_opts	标签配置项
tooltip_opts	提示框组件配置项
singleaxis_opts	单轴组件配置项

为了分析2022年10月份某企业不同类型商品的利润额情况，可以绘制其不同商品利润额的主题河流图，代码如下：

#声明Notebook类型，必须在引入pyecharts.charts等模块前声明

from pyecharts.globals import CurrentConfig, NotebookType

CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LAB

import pymysql

from pyecharts import options as opts

from pyecharts.charts import Page, ThemeRiver

#连接MySQL表数据

conn = pymysql.connect(host='127.0.0.1',port=3306,user='root',password='root',db='sales',charset='utf8')

cursor = conn.cursor()

#读取MySQL表数据

sql_num = "SELECT order_date,ROUND(SUM(profit),2),category FROM orders WHERE order_date>='2022-10-01' and order_date<='2022-10-31' GROUP BY category,order_date"

cursor.execute(sql_num)

sh = cursor.fetchall()

v1 = []

v2 = []

for s in sh:

v1.append([s[0],s[1],s[2]])

#绘制主题河流图

def themeriver() -> ThemeRiver:

c = (

ThemeRiver()

.add(

["办公类","家具类","技术类"],

v1,

singleaxis_opts=opts.SingleAxisOpts(type_="time", pos_bottom="20%")

)

.set_global_opts(title_opts=opts.TitleOpts(title="不同类型商品利润额比较分析"),

toolbox_opts=opts.ToolboxOpts(),

legend_opts=opts.LegendOpts(is_show=True,pos_left ='center',pos_top ='top',item_width = 20,item_height = 20)

)

.set_series_opts(label_opts=opts.LabelOpts(position='top',color='black',font_size=15))

)

return c

#第一次渲染时候调用load_javasrcript文件

themeriver().load_javascript()

#展示数据可视化图表

themeriver().render_notebook()

在Jupyter lab中运行上述代码，生成如图7-2所示的主题河流图，从图形可以看出，在2022年10月份，3种类型商品的利润额波动性都较大。

图7-2 主题河流图

7.3 Seaborn

7.3.1 Seaborn库简介

Seaborn是Python中一款基于Matplotlib的高级数据可视化库，它提供了各种美观、多样化的图表，可以快速、方便地绘制统计图形和信息图表。Seaborn的特点是简单易用、美观实用、可定制性强，可以帮助用户快速、直观地展示数据，提高数据分析的效率和准确性。

Seaborn的主要功能包括：

绘制各种图形：Seaborn支持多种图形的绘制，包括线图、柱状图、散点图、热力图、箱线图等。

支持多种数据格式：Seaborn支持多种数据格式，包括Python列表、NumPy数组、Pandas数据框等。

自动化调整图形样式：Seaborn可以自动化调整图形的样式，包括颜色、字体、标签等，使得图形更加美观。

支持统计分析：Seaborn支持统计分析，可以绘制多种统计图形，如核密度图、分布图等。

支持多种输出格式：Seaborn支持多种输出格式，包括PNG、PDF、SVG等，用户可以根据自己的需求选择不同的输出格式。

相对于Matplotlib，Seaborn语法更简洁，两者的关系类似于Numpy和Pandas之间的关系。但是需要注意的是，应该把Seaborn视为Matplotlib的补充，而不是替代物。

安装Anaconda后，会默认安装Seaborn库，如果要单独安装Seaborn库，则可以通过pip install seaborn命令实现，前提是先安装pip包。

7.3.2 利润额增强箱型图

在Seaborn中，可以使用boxenplot()函数为大数据集绘制增强的箱型图，也被称为letter value plot或catbox plot，可以显示更多的数据分布信息，包括中位数、四分位数、百分位数等，具体用法如下：

seaborn.boxenplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, k_depth='proportion', linewidth=None, scale='exponential', outlier_prop=None, ax=None, **kwargs)

线性回归图boxenplot()函数参数说明如表7-3所示。

表7-3 boxenplot()函数参数

参数	说明
x	输入变量x
y	输入变量y
hue	用来指定第二次分类的数据类别（用颜色区分）
data	要显示的数据
order	显式变量y分类顺序
hue_order	显式第二分类的顺序
orient	设置图的绘制方向，垂直（v）或水平（h）
color	颜色
palette	用于对数据不同分类进行颜色区别
saturation	饱和度
width	指定箱线图的宽度。
dodge	指定是否对箱线图进行分组。
k_depth	指定箱线图的深度，即显示多少个箱体。默认值是4，可以根据数据分布进行调整。
linewidth	指定箱线图边缘线的宽度。
scale	指定箱线图的缩放比例，可以是"linear"（线性）或"log"（对数）。
outlier_prop	指定异常值的比例，即显示多少个异常值。默认值是0.007，可以根据数据分布进行调整。
ax	绘制到指定轴对象，否则在当前轴对象上绘图

为了研究不同类型商品在不同年份的利润额分布情况，下面利用Seaborn绘制了利润额的增强箱型图，具体代码如下：

#导入第三方包

import pymysql

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

from sqlalchemy import create_engine

#指定图片大小

plt.figure(figsize=[12,7])

#连接MySQL，读取订单表数据

conn = create_engine('mysql+pymysql://root:[email protected]:3306/sales')

sql = "SELECT dt as 年份,category as 商品类别,month(order_date) as 月份,cast(profit as float) as 利润额 FROM orders order by dt asc"

df = pd.read_sql(sql,conn)

#设置显示中文字体

rc = {'font.sans-serif': 'SimHei',

'axes.unicode_minus': False}

sns.set(context='notebook', style='whitegrid', rc=rc)

#设置x轴和y轴的标签大小

plt.xticks(fontsize=13)

plt.yticks(fontsize=13)

#给x轴和y轴加上标签

plt.xlabel("类别",size=16)

plt.ylabel("利润额",size=16)

#绘制增强箱型图

sns.boxenplot(x="商品类别", y="利润额", data=df,hue="年份",palette="Set3")

plt.legend(loc = 'upper right')

plt.show()

在JupyterLab中运行上述代码，生成如图7-3所示的增强箱型图，从图可以看出，不同类型商品的利润额，在2020年、2021年和2022年的数据分布差异不是很明显，但是不同类型商品之间的差异较大，尤其是办公类用品。

图7-3 增强箱图

7.4 Plotly

... ...

7.5 Altair

... ...

7.6 NetworkX

... ...

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
周日随笔梅子Mey
今天心情有点烦燥，但是在看到每天读点故事弹出信息之后，心情瞬间阳光起来。坚持的路上，就是这样，没有容易。你随时可以说暂停，或者放弃。但是，就意味着你看不到未来的果实。但是，坚持的话，真的很难。这次，我想坚持下来。我希望我能在一件事上坚持半年到一年。这次是写作，我希望我能持续地输入和输出。因为这是我的热爱，因为这是我想做一辈子的事，因为，这同样也是有市场的领域。只是，我不够坚持，就看不到成果。我的文
Matrix-Breakout 2 Morpheus靶场解题过程
信息收集目标探测靶机目标很明显就是61.139.2.141了扫描开放端口发现22、80、81访问端口主机访问80翻译一下，并没有发现什么审查源代码发现里面有一张图片，下载下来看看是否有图片的隐写wgethttp://61.139.2.141/trinity.jpegstegoveritas-itrinity.jpeg-o/home/kali/Desktop/11分解后发现什么都没有，里面的keep
北斗短报文兜底、5G-A增强：AORO P1100三防平板构建应急通信网络
公网中断的灾区现场，泥石流阻断了最后一条光缆。一支救援队却在废墟间有序穿行，队长手中的三防平板正闪烁着北斗卫星信号，定位坐标与伤亡信息化作一行行短报文，穿透通信孤岛直达指挥中心。这是AOROP1100三防平板搭载的北斗短报文功能在应急救援中的真实场景，更代表了工业移动终端在极端环境下的能力跃迁。AOROP1100三防平板作为遨游通讯2025年推出的旗舰三防设备，AOROP1100三防平板的技术基底
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
02-Breakout靶机攻略 ZLlllllll0 02-Breakout靶机
第一步搭建靶机下载地址：https://download.vulnhub.com/empire/02-Breakout.zip下载好了之后直接用VM打开然后右击虚拟机，把网络连接改成nat模式第二步，信息收集然后开启虚拟机，左上角编辑，虚拟网络编辑器里面看一下靶机是哪个网段。打开kali用nmap扫一下的这个网段的存活主机，也就是扫除这个靶机的具体ip地址nmap192.168.109.1/24扫
面对冷漠的成人世界，愿你做一个内心强大的人小西夜语
—在漫漫深夜里，遇见最真实的你—一个人的强大，无外乎是内心的强大，说到做一个内心强大的人，小西还是不得不提到丰子恺的漫画《无宠不惊过一生》。漫画中，还是小西喜欢的那一句——“不乱于心，不困于情。不畏将来，不念过往。如此，安好。”想来要成为一个内心强大的人，应该就是要做到这样吧！不乱于心，终日面对各种事务，接收各种信息，能够不被扰乱内心，依然坚定自己的想法，这就是内心强大。如今，我们都谈焦虑，因为总
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
uniapp微信小程序 - 详解微信小程序平台用户授权登录全流程，uniapp v3版本中小程序端开发下用户点击登录后获取手机号/昵称/性别/头像等信息完成登录（提供完整示例代码，一键复制开箱即用）十一猫咪爱养鱼前端组件与功能(开箱即用)uniapp常见问题解决 uniapp vue3 uniapp3小程序授权登录微信小程序登录获取用户信息教程获取用户昵称手机号头像信息登录 vue3版本小程序平台授权登录 uniap小程序端用户登录流程 uni完整的小程序平台登录源码
效果图在uniapp微信小程序端开发中，超详细实现用户授权登录完整功能源码，用户授权后获取手机号/昵称/头像/性别等，提供完整思路流程及逻辑讲解。uniappVue3和Vue2都能用，你也可以直接复制粘贴，然后改下参数放到你的项目中去就行。整体思路做功能之前，先来看一下整体流程是
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
K8s常用的命令尚未来- 运维 k8s
一、基础命令查看集群信息bashkubectlcluster-info#显示集群端点和服务信息查看节点bashkubectlgetnodes#列出所有节点kubectldescribenode#查看节点详细信息查看命名空间bashkubectlgetnamespaces#列出所有命名空间切换命名空间bashkubectlconfigset-context--current--namespace=二
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
百度地图雷达/地理编码功能使用安卓开发者
目录(?)[-]地图雷达基本使用首先你需要在你的API控制台注册你的雷达初始化并注入你的信息开始上传单次上传定时重复上传取回信息打完收工元古巨坑地理编码最近一直在优化软件的bug..然后后面可能又要大改..所以趁这两天有时间赶紧码两篇博文..=.=地图功能可以说是现在APP中最常用的功能…呃..之一..不管是电商,社交,o2o,b2c,p2p,锟斤拷,烫烫烫都需要用地图来辅助..博客里基本的地图实
Android通知(Notification)全面解析：从基础到高级应用
一、Android通知概述通知(Notification)是Android系统中用于在应用之外向用户传递信息的重要机制。当应用需要告知用户某些事件或信息时，可以通过通知在状态栏显示图标，用户下拉通知栏即可查看详细信息。这种机制几乎被所有现代应用采用，用于推送新闻、消息、广告等内容3。与Toast相比，Notification的优势在于：可以长时间停留在通知栏，适合内容较多且需要持久展示的信息支持丰
我应该如何使用直返APP才能获得更多的返利？氧惠好物
要想在直返APP获得更多返利，您可以尝试以下几个方法：氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。首先，注册并完善账户信息。注册后，您将获得新人专享优惠券，以及更多的返利机会。同时，确
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

Python数据分析从小白到高手--数据可视化分析

7.1 Matplotlib

7.1.1 Matplotlib库简介

7.1.2 业绩考核误差条形图

7.2 Pyecharts

7.2.1 Pyecharts库简介

7.2.2 销售额主题河流图

7.3 Seaborn

7.3.1 Seaborn库简介

7.3.2 利润额增强箱型图

7.4 Plotly

7.5 Altair

7.6 NetworkX

你可能感兴趣的:(信息可视化,python,数据分析,人工智能,大数据,数据挖掘,开发语言)