企研数据

Python 教学 | Pandas 数据合并（含目录文件合并案例）

目录

Part 1前言

Part2 Pandas 数据合并函数

1 df.append() 实现数据追加

（1）向表中追加相同结构的表

（2）向表中追加不同结构的表

（3）向数据中添加一行

2 pd.concat() 实现数据连接

（1）多个相同结构数据纵向合并

（2）多个结构不同的数据纵向合并

（3）多个数据横向合并

（4）不同类型数据合并

Part3 合并文件夹中所有数据

第一步：读取文件路径

第二步：根据获取的路径读取所有数据

第三步：使用pd.concat()函数合并数据

Part4 总结

Part5 Python教程

Part 1前言

在实际应用中，数据可能分散在不同的文件中，如下图所示。

为了处理或者分析需要把这些分散的数据合并到一个文件中或者放在一起分析，此时就需要使用函数来将它们合并在一起。除了上述情况以外，在处理一份数据时也经常需要分批分开处理，那么处理后的数据就需要拼合在一起。本期文章我们就学习如何使用 Pandas 的数据合并函数，顺便分享一个合并文件夹中多个文件的小案例。

本教程基于 pandas 1.5.3 版本书写。

本文中所有 Python 代码均在集成开发环境 Visual Studio Code (VScode) 中使用交互式开发环境 Jupyter Notebook 中编写，本文分享的代码请使用 Jupyter Notebook 打开。

点给原文链接即可查看如何获取本文所有演示代码以及演示用的数据：

Python 教学 | Pandas 数据合并（含目录文件合并案例）

Part2 Pandas 数据合并函数

数据合并即简单的拼接数据，但也主要分为两大类，三小种情况。首先是数据纵向拼接，即存两小种情况，一种是几份相同结构的数据进行合并，合并后表格结构（字段名称、数量）不变，数据量增加；另一种是几份字段不完全一样的数据进行拼接，合并后数据的字段数量和数据量都会增加。还有一类就是数据横向拼接，主要目的是扩充数据字段，但前提是纵向拼接的数据须保证统一顺序，因此这种情况并不多见。

1 df.append() 实现数据追加

在 Pandas 中，可以使用使用append()函数实现纵向的数据合并，该函数基本语法和参数含义如下。

data.append(other, ignore_index=False, verify_integrity=False, sort=False)

以上就是append()函数的用法和参数列表，代表将数据other追加到数据data的尾端（数据 data 是函数调用方），该函数会返回一个追加数据后的新对象，并不会直接修改合并数据中的任何一项。函数内各个参数的含义如下表所示。

参数名称	含义
other	必要的参数，代表要追到调用方的数据，该参数值可以是一个 DataFrame，也可以是一个含有多个 DataFrame 的列表，为后者时，表示一次性将列表中的所有 DataFrame 都追加到调用方。other 参数也可以是一个表示一行数据的 Series 或字典，此时表示向调用方的尾端追加一行数据。
ignore_index	常用参数，表示是否对返回的新对象重置索引，默认为 False，即保持原数据的索引，但可能造成行索引值重复。设置为 True，表示对追加后的数据重置索引。
verify_integrity	追加的所有数据中存在重复的行索引时，是否报错，默认为 False，不报错。
sort	是否对追加后返回的新对象进行排序，默认值为 False，不排序。

（1）向表中追加相同结构的表

从本文前言部分图中所示的文件中读取几个表格用作演示，代码如下。

## 读取三份演示数据
data_安徽 = pd.read_excel('./电子商务专题数据库企业规模（注册资金）分布情况（截止2020年04月）/安徽.xlsx')
data_北京 = pd.read_excel('./电子商务专题数据库企业规模（注册资金）分布情况（截止2020年04月）/北京.xlsx')
data_福建 = pd.read_excel('./电子商务专题数据库企业规模（注册资金）分布情况（截止2020年04月）/福建.xlsx')
# 查看安徽省样例数据
data_安徽

① 将data_北京追到data_安徽中，追加得到的数据使用data_沪皖为变量名。

# 导入 warnings 过滤警告信息
import warnings
warnings.filterwarnings('ignore')  # 始终忽略警告信息
# 合并（追加）数据
data_沪皖 = data_安徽.append(data_北京)
data_沪皖

注意，如上图所示，由于没有设置ignore_index=True，所以合并后的数据索引值并没有重置，而是保留了原来的行索引，如果希望合并后的数据索引值重置为 0,1,2,3,4,5……只需设置上述参数即可，将在下文演示。

如果你使用 df.append() 函数，大概率会收到一个警告信息：FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead. 大概意思是说 df.append() 受到大家的反对，将会在未来的一个 pandas 版本中移除这个函数，可以使用 pd.concat() 函数来代替。这个警告信息从 pandas 1.3.0 版本就存在了，不过目前仍有很多人觉得这个函数好用，如果我们使用 pandas 时希望继续使用这个函数，但又不想被警告信息骚扰，可以使用 Python 的标准库 warnings 过滤警告信息，可见上述代码的前两行。

如何查看已安装的 pandas（或其他第三方库）的版本呢？可以在导入 pandas 之后使用代码print(pd.__version__) 进行查看（极少部分库不支持），目前 pandas 的最新大版本为 2.0，次新大版本为 1.5 。

也可以一次性将多个数据追加到一个数据中，只需要将待追加的所有数据放在列表中传给other参数即可。

② 将上文中读取的数据data_北京和data_福建一次性追加到data_安徽中，追加得到的数据使用data_沪闽皖为变量名，且重置数据索引。

# 一次性将多个数据追加到一个数据中，相当于合并多个数据
data_沪闽皖 = data_安徽.append([data_北京, data_福建], ignore_index=True)
data_沪闽皖

（2）向表中追加不同结构的表

先读取一份与上文中数据data_安徽结构不完全一致的表格，代码和数据如下。

## 读取与 data_安徽 结构不完全一致的数据表
data_专利 = pd.read_excel('./工业互联网全国各省市分年度专利申请、专利授权情况（2000-2020.03）.xlsx')
data_专利

③ 将数据data_专利追加到结构不完全一致的数据data_安徽中，新生成的数据使用data_合并作为变量名。

# 合并两份不完全一致的数据
data_合并 = data_安徽.append(data_专利)
data_合并

观察上图可知，如果两份数据的字段名称信息不完全一致，那么只有共同的字段才会合并在一起。

（3）向数据中添加一行

在上文介绍参数时提到过，df.append()函数还可以实现向数据表中追加一行数据（只能在数据表的最末端添加数据）。例如向上文中数据data_安徽的末端追加一行可以使用下面的代码。

## 向数据中追加一行
# 方法 1：追加 Series
data_安徽.append(pd.Series(['340000', '安徽', '1亿以上', '--'], 
                         index=['省份代码', '省份名', '企业规模（注册资金）', '企业数量'], 
                         name=4))
# 方法 2：追加字典
data_安徽.append({'省份代码':'340000', '省份名':'安徽', 
                '企业规模（注册资金）':'1亿以上', '企业数量':'--'}, 
                ignore_index=True)

上述代码中的两种当时都可以向数据中追加一行，这种操作虽然稍麻烦些，但是当需要增加单条数据时会比较方便。需要注意的是，追加一行数据时最好主动设置参数ignore_index=True，如果是以字典的方式追加，则必须设置参数ignore_index=True，否则无法追加（因为字典对象作为一行数据时，没有行索引，追加后只能重置索引，否则程序会报错）。

2 pd.concat() 实现数据连接

上一节中，介绍了如何使用append()函数实现纵向数据合并，上文提到，使用append()函数可能会出现警告，警告中希望我们使用pandas.concat()函数来进行数据的合并。确实，在 pandas 中，使用 concat() 函数也可以合并数据，而且更受官方的推荐，下面我们就来学习这个函数的用法。

# 只介绍常用参数，这里的 pd 是导入 pandas 时起的别名
pd.concat(objs, axis=0, ignore_index=False, join='outer')

pd.concat()函数的作用是将参数objs中的所有数据连接在一起，并返回连接后的数据对象，不会修改objs中的任何数据。其中各主要参数的用法和含义如下表所示。

参数名称	含义
objs	必要的参数，必须是一个包含 DataFrame 或 Series 的列表（只要是可迭代对象即可），`pd.concat()`函数会将列表中的对象连接合并在一起。
axis	连接的轴，默认为 0 ，表示纵向连接；为 1 时表示横向连接，这是`df.append()`函数所没有的功能。
ignore_index	常用参数，表示是否对返回的新对象重置索引，默认为 False，即保持原数据的索引，但可能造成行索引值重复。设置为 True，表示对连接后的数据重置索引。
join	合并的方式，默认值为 'outer'，表示返回合并的数据并集；设置为 'inner' 时返回的合并后数据的交集。

（1）多个相同结构数据纵向合并

与介绍df.apppend()函数一样，这里使用上文中已经读入的几个变量data_安徽、data_北京、data_福建来做演示。

④ 使用pd.concat()函数将data_安徽``、data_北京、data_福建合并为一张表，合并后的新数据取变量名为concat_沪闽皖。

# 下面代码中，含有三个数据的列表就是 objs 参数，由于是必要参数且位于首位，所以直接位置参数，省略参数名称。
# 另外，axis 参数默认值为 0 ，表示数据纵向合并，所以这里不需要在设置 axis 参数
concat_沪闽皖 = pd.concat([data_安徽, data_北京, data_福建], ignore_index=True)
concat_沪闽皖

可以发现pd.concat()与df.append()在用法上的一大区别就是append()的调用方是数据，是将参数other指向的数据追加到调用方中，而concat()的调用方是pandas，作用是将参数objs指向的数据合并在一起。

（2）多个结构不同的数据纵向合并

⑤ 使用pd.concat()函数纵向合并data_安徽和data_专利。

concat_合并 = pd.concat([data_安徽, data_专利])
concat_合并

这里的结果与上文中使用df.append()得到的结果完全一致，不过pd.concat()函数中还有一个能够控制合并方式的参数join，默认值是'outer'，表示取合并后数据的并集，下面我们尝试合并数据并取交集。

concat_合并_inner = pd.concat([data_安徽, data_专利], join='inner')
concat_合并_inner

取交集后，只有参与合并的多份数据中的共有信息才会被保留。如果数据之间的连接方式是横向连接（即参数axis=1），那么这种情况下将会保留数据中共有的数据行，而不再是数据列。

（3）多个数据横向合并

数据纵向合并的实际使用场景极其少，因为其功能实用性不强，且容易受到数据量的影响，下面我们演示横向拼接两份数据。

⑥ 使用pd.concat()函数横向合并data_安徽和data_北京。

## 横向合并需要设置参数 axis=1
concat_横向合并 = pd.concat([data_安徽, data_北京], axis=1)
concat_横向合并

横向合并的作用是根据参与合并数据的行索引进行连接的，由于上述两份参与横向合并的数据的行索引都是0、1、2、3，所以合并时就像机械式的拼接在了一起。下面我们在合并过程中修改数据data_北京的行索引值为 2、3、4、5，看一下会发生什么。

concat_横向合并 = pd.concat([data_安徽, data_北京.reindex([2,3,4,5])], axis=1)
concat_横向合并

可以看到，使用reindex()函数修改行索引后，合并的结果中只有行索引值为 3、4 的数据才是完整的，其他数据行的值都是根据行索引进行调整的。

（4）不同类型数据合并

最后，在介绍pd.concat()函数的参数objs时提到objs中参与合并的数据还可以是 Series，但是根据笔者实测，pd.concat()函数并不支持 DataFrame 与 Series 类型的纵向拼接，即 Series 只能作为一列添加到 DataFrame 中，示例代码如下。

# 不再将结果赋值给变量，将直接返回合并结果
pd.concat([data_安徽, pd.Series(['--', '--', '--', '--'], name='其中上市公司数量')], axis=1)

Part3 合并文件夹中所有数据

上文我们已经介绍了 Pandas 中合并数据的操作方法，这一节我们介绍如何使用上述方法批量合并一个文件夹中的多个数据，当然，前提是这些数据的结构都是一样的，只是拆分保存而已。

首先我们应该清楚为什么要把一整份数据拆开保存，笔者认为有两大原因，一是为了方便查看、使用、传输数据，故而将数据按特点分开保存，比如分地区或分年份保存成多个文件；二是因为数据量太大，不得已才分批处理，所以保存时也按照特定数据量分批保存了。如果拆开保存数据的原因只是前者，那么可以使用 Pandas 直接进行合并数据，如果是后者，则需要考虑合并后的数据大小是否超过计算机的内存大小。这里的内存指的是运行内存，一般 8GB、16GB 居多，且还要考虑其他应用占用内存，以及硬盘空间与内存空间不对等的问题。文本演示的分地区数据是小数据集，所以不必考虑内存问题。

第一步：读取文件路径

在介绍 Python 常用标准库时，曾学习过使用glob库快速获取多个文件的路径，下面我们先获取文件夹中所有文件的路径，存放在一个列表中。

## 使用 glob 获取文件夹内所有 excel 表的文件路径，这里得到的是相对路径
import glob
Excelfile_paths = glob.glob('./电子商务专题数据库企业规模（注册资金）分布情况（截止2020年04月）/*.xlsx')
# 输出符合要求的路径的个数
print(len(Excelfile_paths))    # 输出：31
Excelfile_paths

使用 Python 读取文件路径时，不要使用 office 软件打开要读取的文件，因为 Excel 等软件打开表格时，会在文件的同文件夹生成一个临时文件，这个临时文件在文件夹中不可见，但是却会被 Python 读取到。由于生成的临时文件中不含数据，所以会对处理造成影响。临时文件的文件名一般以符号~$开头，请注意识别。

第二步：根据获取的路径读取所有数据

循环上一步得到的路径列表，读取表格为 DataFrame，然后将所有的 DataFrame 存入一个列表中。

ALL_datas = []     # 先创建一个用于存放读取结果的空列表
for filepath in Excelfile_paths:     # 循环路径列表
    data = pd.read_excel(filepath)   # 根据循环的路径读取文件
    ALL_datas.append(data)           # 读取的结果添加到列表中

这是常规的写法，比较容易理解，不过代码也比较繁琐。其实我们还可以使用列表推导式来完成这个操作，只需要一行代码即可。

# 使用列表推导式，过程和作用完全等价于上面的代码
ALL_datas = [pd.read_excel(filepath) for filepath in Excelfile_paths]

第三步：使用`pd.concat()`函数合并数据

## 合并所有数据
data_ALL = pd.concat(ALL_datas)
data_ALL

合并完成之后，我们就可以对数据进行筛选、分析、写入等其他操作了。

Part4 总结

df.append()函数和pd.concat()函数都可以实现数据的拼接合并，但是前者只能纵向追加，功能比较单一，但是用法比较简单，可惜的是 Pandas 官方最终可能还是会抛弃这个函数；而后者的功能则更加系统和完整，但是当合并的数据格式不统一时，会出现较多很难理解的现象。无论使用哪种方式，数据合并都是 Pandas 中很基础和重要的功能，需要熟练掌握。下期文章我们将学习如何使用 Pandas 做数据匹配。

Part5 Python教程

向下活动查看更多

Python教学 | 学习 Python 第一步——环境安装与配置
Python教学 | Python 基本数据类型
Python教学 | Python 字符串操作（上）
Python教学 | Python 字符串操作（下）
Python教学 | Python 变量与基本运算
Python教学 | 组合数据类型-列表
Python教学 | 组合数据类型-集合（内含实例）
Python教学 | 组合数据类型 - 字典&元组
Python教学 | Python 中的分支结构（判断语句）
Python教学 | Python 中的循环结构（上）
Python教学 | Python 中的循环结构（下）
Python教学 | Python函数的定义与调用
Python教学 | Python 内置函数
Python教学 | 最常用的标准库之一 —— os
Python教学 | 盘点 Python 数据处理常用标准库
Python 教学 | “小白”友好型正则表达式教学（一）
Python 教学 | “小白”友好型正则表达式教学（二）
Python 教学 | “小白”友好型正则表达式教学（三）
Python 教学 | 数据处理必备工具之 Pandas（基础篇）
Python 教学 | 数据处理必备工具之 Pandas（数据的读取与导出）
Python 教学 | Pandas 数据索引与数据选取
Python 教学 | Pandas 妙不可言的条件数据筛选
Python 教学 | Pandas 缺失值与重复值的处理方法
Python 教学 | Pandas 表格数据行列变换
Python 教学 | Pandas 表格字段类型精讲（含类型转换）
本期

你可能感兴趣的:(Python教学,python,pandas,开发语言)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
漫步，跳出藩篱张巧金沙
最近的教学，倍感不爽。一为这国庆之假，把这课上得支离破碎的。放假前，上了四天课，但我却只上了三天，9月30日，我工作室在搞活动，全天的活动，课当然未能上。10月8日学生回校，上了两天课，学生又放回家了。就觉得学生刚有点状态，又回去逍遥去了。感觉吧，教学内容也不敢大胆甩开膀子去教学，所以呀，这教学内容还真上不走，而且学生学下来效果特差。这不，国庆放假前的一个周，测试了两次，均为第一单元，是自考试以来
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
聊斋那些事儿徒步取经人
网上听一网友说他爸胆子很大，还无神论者，去他们以前得中学看学校了，听他说有一次晚上11点多，他爸爸去关教学楼的大门，走到楼口的时候清晰的听见有人在哭，声音好像在三四楼的样子传出来的，总共就四楼，那个学校，他爸爸一想，谁呀，这么晚了不会有女孩子被男的欺负了吧？就拿着手电筒还有棍子，想着自己一个人还是有点怕，就跑上去了，跑到三楼一听不对，应该是在四楼，就又往上爬上去了，为了给自己壮胆，跑到四楼就喊，谁
语文教学反思 ——一单元测试一抹_绿茶香
我喜欢上语文课，现在最开心的时刻也就是课上那45分钟了。它可以让我和孩子们骑上骏马驰骋在知识的草原上，可以让我们乘着巨轮在书籍的海洋里任意航行……周三举行了一单元测试，今晚一单元的所有内容暂时告一段落。对于这单元我有如下思考：本单元的主题词是“读书”，几篇课文都是围绕着读书来编排的。里面有讲读书乐趣的，讲读书方法的，还有孩子们第一次接触的访谈录等。微笑班级从一年级下学期就开始阅读“闲书”，所以教学
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
《数字时代的学与教》第三模块共读心得恭昌
第三模块的主题是教法学法，主要用十一讲来阐述，分别是：同侪教学法、创造学习的新状态、讨论对话还是合作、解锁“拼图法”、把握合作学习五要素、TBL团队合作学习法、游戏式小组合作学习法、差异化教学法、从学科课堂开始的“创客教育”、探究式学习法及搭建“教学脚手架”。难度适中，同伴互助，学到知识，成就感强。教师要创造学生学习的新状态，让学生养成矫正性学习的新状态，即认识错误到自我改正错误，形成新的正确认识
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
读《教学勇气》有感 c养一盆铜钱草
帕尔默的《教学勇气》这本书买了已有几年，记得以前拿起读过，总感觉晦涩难懂，没看几页就被劝退。而如今再次拾起它，是因为眼睛里的血丝，不再适合对着手机和电脑，只能转战纸质书。第一章所提到的教学中自身认同和完整，不就是这个暑假写作课当中反复听到的从我出发吗？对自己进行剖析，找到自己的长处与短处，然后与教学进行结合，只有从“我”出发，才能有底气。书中说：我们更多地了解了自我独特性，我们就能学到展示而非掩饰
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &