Jay_fearless

Pandas 02- DataFrame

1.DataFrame结构

DataFrame的每一列数据都可以看成一个Series结构，只不过，DataFrame为每列数据值增加了一个列标签。因此DataFrame其实是从Series的基础上演变而来,并且他们有相同的标签,在数据分析任务中DataFrame的应用非常广泛，因为它描述数据的更为清晰、直观。
以一个学生表为例：

下面对 DataFrame数据结构的特点做简单地总结，

DataFrame每一列的标签值允许使用不同的数据类型;
DataFrame是表格型的数据结构，具有行和列;
DataFrame 中的每个数据值都可以被修改。
DataFrame结构的行数、列数允许增加或者删除;
DataFrame有两个方向的标签轴，分别是行标签和列标签;
DataFrame 可以对行和列执行算术运算。

创建DataFrame

index:行标签，如果没有传递index值，则默认行标签是Rangelndex(0,1,2,…,n)
columns:列标签，如果没有传递columns值，则默认列标签是Rangelndex(0,1,…,n)
dtype:数据类型,dtype只能设置一个，设置多个列的数据类型需要使用其他方式。

import pandas as pd
import numpy as np

a=np.arange(5)
df=pd.DataFrame(a) # 不设置列标签默认从0开始递增
print(df)

# 嵌套创建数据，列表中每个元素代表一行数据
data = [['a', 90],['b', 50],['c', 75]]
df=pd.DataFrame(data,columns=['Name','Score'])  # 设置列称签
print(df)

'''
   0
0  0
1  1
2  2
3  3
4  4
  Name  Score
0    a     90
1    b     50
2    c     75
'''

# dtype不能设置多个值，否则会报错
# df=pd.DataFrame(data,columns=['Name','Score'],dtype=[str,int])
'''
TypeError: Field elements must be 2- or 3-tuples, got ''
'''
df = pd.DataFrame(data,columns=['Name','Score'],dtype=str)

列表嵌套字典创建DataFrame对象，其中字典的键为列标签，没有的值会默认为NaN

data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]

df = pd.DataFrame(data,index=['x','y']) #设置行标签
print(df)

'''
   a   b     c
x  1   2   NaN
y  5  10  20.0
'''

df2=pd.DataFrame(data,index=['x','y'],columns=['c','a']) # 设定展示列
print(df2)

'''
      c  a
x   NaN  1
y  20.0  5
'''

Series创建DataFrame(每个Series为1列元素，列名为该Series名称)

$N a N$ 默认为浮点类型。

d = {'one': pd.Series([1,2,3], index=['a','b','k']),
     'two': pd.Series([1,2,3,4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame (d)
print(df)

'''
   one  two
a  1.0  1.0
b  2.0  2.0
c  NaN  3.0
d  NaN  4.0
k  3.0  NaN
'''

2.列操作DataFrame

data = {'Name':['关羽','刘备','张飞','曹操'],'Age':[28,34,29,42]} 
index = ["rank1", "rank2","rank3","rank4"]  # 设定行标签
df = pd.DataFrame(data,index=index) # 通过字典创建DataFrame
print(df)
print ("========df['Name']:取得Name列================")
print(df['Name'])
print("=========df['Age']:取得Age列================")
print(df['Age'])
print("=========df[['Name','Age']]:取得多列==============")
print(df[['Name','Age']])
# 注意列不能使用切片选取多列，否则会返回空DataFrame
print("=========df['Name':'Age']:切片不能取得多列==============")
print(df['Name':'Age'])

'''
      Name  Age
rank1   关羽   28
rank2   刘备   34
rank3   张飞   29
rank4   曹操   42
========df['Name']:取得Name列================
rank1    关羽
rank2    刘备
rank3    张飞
rank4    曹操
Name: Name, dtype: object
=========df['Age']:取得Age列================
rank1    28
rank2    34
rank3    29
rank4    42
Name: Age, dtype: int64
=========df['Name','Age']:取得多列==============
      Name  Age
rank1   关羽   28
rank2   刘备   34
rank3   张飞   29
rank4   曹操   42
=========df['Name':'Age']:切片不能取得多列==============
Empty DataFrame
Columns: [Name, Age]
Index: []
'''

# 通过df['列名']=pd.Series() 添加列
df['Score']=pd.Series([89,21,68],index=["rank1", "rank2","rank4"])
# 列之间的运算操作
df['Age+Score']=df['Age']+df['Score']
print(df)

'''
      Name  Age  Score  Age+Score
rank1   关羽   28   89.0      117.0
rank2   刘备   34   21.0       55.0
rank3   张飞   29    NaN        NaN
rank4   曹操   42   68.0      110.0
'''

# 通过()insert函数在DataFrame中插入列
# df.insert(loc,column,value,allow_duplicates=False) loc:整型,插入的位置,必须验证0<=loc<=len (列)
info=[["王杰",18],["李杰",19],["刘杰",17]]
df=pd.DataFrame(info,columns=["name","age"])
print(df)
#数值1代表插入到coluans列表的索引位置
df.insert(2,column='score',value=[91,90,75])
print("-----df.insert插入数据:-------")
print(df)
# allow_duplicates=True 代表可以插入重复的列
df.insert(2,column='score',value=[91,90,75],allow_duplicates=True)
print("-----df.insert插入重复的列数据:-------")
print(df)

'''
  name  age
0   王杰   18
1   李杰   19
2   刘杰   17
-----df.insert插入数据:-------
  name  age  score
0   王杰   18     91
1   李杰   19     90
2   刘杰   17     75
-----df.insert插入重复的列数据:-------
  name  age  score  score
0   王杰   18     91     91
1   李杰   19     90     90
2   刘杰   17     75     75
'''

pop()弹出列、del删除列都可以改变原DataFrame

data = {'Name':['关羽','刘备','张飞','曹操'],'Age':[28,34,29,42]}
index = ["rank1", "rank2","rank3","rank4"]  # 设定行标签
df = pd.DataFrame(data,index=index) # 通过字典创建DataFrame
print ("========df:初始的DataFrame================")
print(df)
# pop(name) 弹出名为Name的列，可以把弹出的元素赋值给一个变量
df2=df.pop('Name')
print ("========df2:弹出的Name列================")
print(df2)

print ("========df:剩下的DataFrame=================")
print(df)

# del 删除列
print ("========df:剩下的DataFrame=================")
del df['Age']
print(df)

'''
========df:初始的DataFrame================
      Name  Age
rank1   关羽   28
rank2   刘备   34
rank3   张飞   29
rank4   曹操   42
========df2:弹出的Name列================
rank1    关羽
rank2    刘备
rank3    张飞
rank4    曹操
Name: Name, dtype: object
========df:剩下的DataFrame=================
       Age
rank1   28
rank2   34
rank3   29
rank4   42
========df:剩下的DataFrame=================
Empty DataFrame
Columns: []
Index: [rank1, rank2, rank3, rank4]
'''

3.行操作DataFrame

info=[["王杰",18],["李杰",19],["刘杰",17]]
df=pd.DataFrame(info,columns=["name","age"],index=['b','c','a'])
# loc使用标签获取行数据
print(df.loc['b'])

# loc允许接受两个参数分别是行和列
print(df.loc['b','age'])
# 行和列还可以使用切片
print(df.loc['b':'a','age'])
# 取单独几列几行的数据
print(df.loc[['b','a'],['name']])

'''
name    王杰
age     18
Name: b, dtype: object
18
b    18
c    19
a    17
Name: age, dtype: int64
  name
b   王杰
a   刘杰
'''

# iloc 使用索引查找数据
print(df.iloc[0])
# iloc允许接受两个参数分别是行和列
print(df.iloc[0,1])
# 行和列还可以使用切片
print(df.iloc[0:3,1])
# 取单独某几行某几列的数据
print(df.iloc[[0,2],[0]])

'''
name    王杰
age     18
Name: b, dtype: object
18
b    18
c    19
a    17
Name: age, dtype: int64
  name
b   王杰
a   刘杰
'''

4.其他操作

转置

info=[["王杰",18],["李杰",19],["刘杰",17]]
df=pd.DataFrame(info,columns=["name","age"])
print ("========df:初始的DataFrame================")
print(df)
df2=df.T
print ("========df2:df转置后的DataFrame================")
print(df2)
# axes 返回一个行标签、列标签组成的列表。
print(df.axes)
# 返回每一列属性Series的数据类型。
print(df.dtypes)

'''
========df:初始的DataFrame================
  name  age
0   王杰   18
1   李杰   19
2   刘杰   17
========df2:df转置后的DataFrame================
       0   1   2
name  王杰  李杰  刘杰
age   18  19  17
[RangeIndex(start=0, stop=3, step=1), Index(['name', 'age'], dtype='object')]
name    object
age      int64
dtype: object
'''

rename()修改行列标签名称，info() 显示信息

# 修改行标签
print(df.rename(index={'rank1':"r2",'rank3':"r3"}))
# 修改列标签
print(df.rename(columns={'Name':'n','Age':'a'}))
print(df)
# inplace=True时，会修改源数据
df.rename(index={'rank1':"r2",'rank3':"r3"},columns={'Name':'n','Age':'a'},inplace=True)
print(df)

'''
      Name  Age
r2      关羽   28
rank2   刘备   34
r3      张飞   29
rank4   曹操   42
        n   a
rank1  关羽  28
rank2  刘备  34
rank3  张飞  29
rank4  曹操  42
      Name  Age
rank1   关羽   28
rank2   刘备   34
rank3   张飞   29
rank4   曹操   42
        n   a
r2     关羽  28
rank2  刘备  34
r3     张飞  29
rank4  曹操  42
'''

# info() 输出该DataFrame的基本信息
print ("========df的摘要信息================")
print(df.info())

'''
========df的摘要信息================

Index: 4 entries, r2 to rank4
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   n       4 non-null      object
 1   a       4 non-null      int64 
dtypes: int64(1), object(1)
memory usage: 96.0+ bytes
None
'''

标签排序sort_index()、值排序sort_values()

作用:默认根据行标签对所有行排序，或根据列标签对所有列排序，或根据指定某列或某几列对行排序。
注意: df.sort_index()可以完成和df.sort_values()完全相同的功能，
但python更推荐用只用df.sort_index()对“根据行标签"和"根据列标签"排序，其他排序方式用df.sort_values()。

axis: 0按照行名排序;1按照列名排序
ascending:默认True升序排列;False降序排列
inplace:默认False，否则排序之后的数据直接替换原来的数据

df = pd.DataFrame({'b':[1,2,2,3], 'a':[4,3,2,1],'c':[1,3,8,2]},index=[2,0,1,3])
print ("========源df================")
print(df)
# 默认按“行标签”升序排序,
print ("========行排序df================")
print(df.sort_index())

# 按“列标签”升序排序,并修改数据源 inplace=True
print ("========列排序df================")
df.sort_index(axis=1,inplace=True)
print(df)

'''
========源df================
   b  a  c
2  1  4  1
0  2  3  3
1  2  2  8
3  3  1  2
========行排序df================
   b  a  c
0  2  3  3
1  2  2  8
2  1  4  1
3  3  1  2
========列排序df================
   a  b  c
2  4  1  1
0  3  2  3
1  2  2  8
3  1  3  2
'''

# sort_values() 值排序
print ("========按'a'列的值升序排序================")
print(df.sort_values(by='a'))
print ("========按'b'列的值降序,'c'列的值升序排序================")
print(df.sort_values(by=['b','c'],ascending=[False,True]))
print ("========按2行的值升序排序================")
print(df.sort_values(by=2,axis=1))
print ("========按2行的值升序,1行的值降序排序================")
df.sort_values(by=[2,1],axis=1,ascending=[True,False],inplace=True,kind='quicksort')
print(df)

'''
========按'a'列的值升序排序================
   a  b  c
3  1  3  2
1  2  2  8
0  3  2  3
2  4  1  1
========按'b'列的值降序,'c'列的值升序排序================
   a  b  c
3  1  3  2
0  3  2  3
1  2  2  8
2  4  1  1
========按2行的值升序排序================
   b  c  a
2  1  1  4
0  2  3  3
1  2  8  2
3  3  2  1
========按2行的值升序,1行的值降序排序================
   c  b  a
2  1  1  4
0  3  2  3
1  8  2  2
3  2  3  1
'''

5.分组groupBy、聚合agg

import pandas as pd

df = pd.DataFrame({'Country': ['China', 'China', 'India', 'India', 'America', 'Japan', 'China', 'India'],
                   'Income': [10000, 10000, 5000, 5002, 40000, 50000, 8000, 5000],
                   'Age': [28, 23, 25, 26, 40, 25, 45, 23]})
'''
 Age  Country  Income
0  28    China   10000
1  23    China   10000
2  25    India    5000
3  26    India    5002
4  40  America   40000
5  25    Japan   50000
6  45    China    8000
7  23    India    5000
'''


df_gb = df.groupby('Country')
for index, data in df_gb:
    print(index)
    print(data)
'''
America
   Age  Country  Income
4  250  America   40000
China
    Age Country  Income
0  5000   China   10000
1  4321   China   10000
6  4500   China    8000
India
    Age Country  Income
2  1234   India    5000
3  4010   India    5002
7  4321   India    5000
Japan
   Age Country  Income
5  250   Japan   50000
'''

df_gb = df.groupby(['Country', 'Income'])
for (index1, index2), data in df_gb:
    print((index1, index2))
    print(data)

'''
('America', 40000)
   Age  Country  Income
4  250  America   40000
('China', 8000)
    Age Country  Income
6  4500   China    8000
('China', 10000)
    Age Country  Income
0  5000   China   10000
1  4321   China   10000
('India', 5000)
    Age Country  Income
2  1234   India    5000
7  4321   India    5000
('India', 5002)
    Age Country  Income
3  4010   India    5002
('Japan', 50000)
   Age Country  Income
5  250   Japan   50000
'''

df_agg = df.groupby('Country').agg(['min', 'mean', 'max'])
print(df_agg)

'''
        Income                      Age               
           min          mean    max min       mean max
Country                                               
America  40000  40000.000000  40000  40  40.000000  40
China     8000   9333.333333  10000  23  32.000000  45
India     5000   5000.666667   5002  23  24.666667  26
Japan    50000  50000.000000  50000  25  25.000000  25
'''
# 查看某一个属性的最小，最大，平均值
df_agg = df.groupby('Country').agg({'Income':['min', 'mean', 'max']})
print(df_agg)

'''
        Income                     
           min          mean    max
Country                            
America  40000  40000.000000  40000
China     8000   9333.333333  10000
India     5000   5000.666667   5002
Japan    50000  50000.000000  50000
'''
# 以列表形式返回Age和Income的值
df_agg = df.groupby('Country').agg([list])[['Age','Income']]
print(df_agg)
'''
                  Age                Income
                 list                  list
Country                                    
America          [40]               [40000]
China    [28, 23, 45]  [10000, 10000, 8000]
India    [25, 26, 23]    [5000, 5002, 5000]
Japan            [25]               [50000]
'''

6.iterrows()、iteritems()、itertuples()

iterrows(): 将DataFrame迭代为(insex, Series)对。
iteritems(): 将DataFrame迭代为(列名, Series)对
itertuples(): 将DataFrame迭代为元祖。

import pandas as pd

inp = [{ 'c1':10,'c2':100},{ 'c1':11,'c2':120},{ 'c1':12,'c2':123}]
df = pd.DataFrame(inp)

print(df)
'''
   c1   c2
0  10  100
1  11  120
2  12  123
'''

for index,row in df.iterrows():
    print(row)
'''
c1     10
c2    100
Name: 0, dtype: int64
c1     11
c2    120
Name: 1, dtype: int64
c1     12
c2    123
Name: 2, dtype: int64
'''

for index,row in df.iteritems():
    print(row)

'''
0    10
1    11
2    12
Name: c1, dtype: int64
0    100
1    120
2    123
Name: c2, dtype: int64
'''

for row in df.itertuples():
    print(row)

'''
Pandas(Index=0, c1=10, c2=100)
Pandas(Index=1, c1=11, c2=120)
Pandas(Index=2, c1=12, c2=123)
'''
for row in df.itertuples():
    print(getattr(row,'c1'),"  ",getattr(row,'c2'))

'''
10    100
11    120
12    123
'''

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
写完作业的感觉很爽乡村算卦师
今天终于一口气把一个数据分析课的作业写完了。明天还要继续写一个，写完，就可以暂时轻松一下了。想想还是很开心的，哈哈哈。刚出去跑了一圈，结果下雨了，虽然不是很大，可是没办法跑，怕下大。现在在小区门口，吹吹风，也是极好的。希望一些都变的越来越好，加油！
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s