陈先生学代码

Python三剑客之Pandas库(一)

Pandas库是数据分析的三剑客之一(另外两个是Numpy库,Matplotlib库),是Python的核心的数据分析库.它为我们提供了快速、灵活、明确的数据结构，能够简单、直观、快速地处理各种类型的数据。

.1.安装Pandas库

打开系统搜索框(快捷键:win+R)–> 输入cmd，点击确定进入命令框–>输入代码安装pandas库

pip install Pandas

2.走进Pandas

Pandas有两个重要的对象和数据结构:

维数	名称	描述
1	Series	带标签,一维同构数组结构
2	DataFrame	带标签,大小可变,二维数组,二维异构表格

2.1导入Pandas库

import Pandas as pd #导入Pandas库,并将其另命名为pd

2.2创建一个Series结构

data=[1,"B",3,"D",5,6,"G",8,9]
s1=pd.Series(data)
print(s1)

0    1
1    B
2    3
3    D
4    5
5    6
6    G
7    8
8    9
dtype: object

可以看出,在没有指定索引情况下,创建Series对象时会自动生成整数索引.默认值从0开始到长度减1.那么索引我们能根据我们的需求手动设定吗?当然可以.

inlst=[11,12,13,14,15,16,17,18,19] #手动设置索引 数值类型
inlst1=["陈","先","生","学","代","码","的","博","客"]#手动设置索引 字符类型
s2=pd.Series(data,index=inlst)
s3=pd.Series(data,index=inlst1)
print(s2)
print("."*30+"我是分割线1号"+"."*30)
print(s3)

11    1
12    B
13    3
14    D
15    5
16    6
17    G
18    8
19    9
dtype: object
..............................我是分割线1号..............................
陈    1
先    B
生    3
学    D
代    5
码    6
的    G
博    8
客    9
dtype: object

由输出结果看出,原来自动创建的数值型索引(0-8)分别依次换成了(11-19)和(“陈”,“先”,“生”,“学”,“代”,“码”,“的”,“博”,“客”)
创建了第一个Series对象后,我们发现,物流是否设定索引,都会有对应的索引生成,那么索引有什么用处呢?索引可以是我们任意的获取Series对象中的数据.那么怎么使用索引呢?
位置索引
正整数是从0开始,由左向右依次递进.,[0]表示Series的第1个数,[1]表示第2个数,依次类推.
负整数是从-1开始,由右向左边依次递进,[-1]表示Series的倒数第1个,[-5]表示倒数第5个.

import pandas as pd
ss=pd.Series([100,95,88,97,99,86],index=["小陈","小明","小李","王五","小邱","小何"])
print("从左往右第1个数,即正数第1位" , ss[0]) #通过一个正整数从左往右获取索引值

print("从右往左第1个数,即倒数第1位" , ss[-1]) #通过一个负整数从右往左获取索引值

print("从左往右第4个数" , ss[3]) #通过一个正整数从左往右获取索引值

print("从右往左第4个数" , ss[-4]) #通过一个正整数从左往右获取索引值

从左往右第1个数,即正数第1位 100

从右往左第1个数,即倒数第1位 86

从左往右第4个数 97

从右往左第4个数 88

通过标签获取索引值

import pandas as pd
ss=pd.Series([100,95,88,97,99,86],index=["小陈","小明","小李","王五","小邱","小何"])
print("标签名为'小明'的索引值" , ss["小明"]) #通过一个标签获取索引值
print("."*30+"我是分割线1号"+"."*30)
print( ss[["小明","小李"]]) #通过多个标签获取索引值

标签名为'小明'的索引值 95
..............................我是分割线1号..............................
小明    95
小李    88
dtype: int64

除了通过位置索引和标签索引获取索引值外,我们还能通过切片来获取索引值.而切片可以是标签切片,也可以是位置切片.

#通过切片索引获取索引值
import pandas as pd
ss=pd.Series([100,95,88,97,99,86],index=["小陈","小明","小李","王五","小邱","小何"])
#通过标签切片获取索引值
print("通过切位置切片获取索引值:",ss["小明":"王五"])
print("."*30+"我是分割线1号"+"."*30)
print("前面的标签位于后面的标签的前面输出结果是空:",ss["王五":"小明"])
print("."*50+"我是分割线2号"+"."*50)
#通过位置切片获取索引值
print("位置索引是整数")
print(
'''
Series[star:end:step]
star:开始位置,包含,省略默认为0;
     正整数表示由左边往右边数的位置,[0]表示第1位,[1]表示第二位.
     负整数表示从右往左边的数的位置,[-1]倒数第1位,[-2]倒数第2位,依次类推
end:结束位置,不包含,省略默认为len(Series)长度
    正整数表示由左边往右边数的位置,[0]表示第1位,[1]表示第二位.
    负整数表示从右往左边的数的位置,[-1]倒数第1位,[-2]倒数第2位,依次类推
step:步长,正整数,由左往右取值,负整数,由右往左取值,省略默认长度1,步长不能是0哦

当第三参数是整数时,开始端的位置不能在结束端的右边
当第三参数是负数时,开始断的位置不能在借宿段的左边

以下五条语句表示的内容都是一样的(顺序有差异)
'''
     )

print(ss[-1:-4:-1])
print("."*30+"我是分割线1号"+"."*30)
print(ss[6:-4:-1])
print("."*30+"我是分割线1号"+"."*30)
print(ss[3::])
print("."*30+"我是分割线1号"+"."*30)
print(ss[3::1])
print("."*30+"我是分割线1号"+"."*30)
print(ss[-1:2:-1])

通过切位置切片获取索引值: 小明    95
小李    88
王五    97
dtype: int64
..............................我是分割线1号..............................
前面的标签位于后面的标签的前面输出结果是空: Series([], dtype: int64)
..................................................我是分割线2号..................................................
位置索引是整数

Series[star:end:step]
star:开始位置,包含,省略默认为0;
     正整数表示由左边往右边数的位置,[0]表示第1位,[1]表示第二位.
     负整数表示从右往左边的数的位置,[-1]倒数第1位,[-2]倒数第2位,依次类推
end:结束位置,不包含,省略默认为len(Series)长度
    正整数表示由左边往右边数的位置,[0]表示第1位,[1]表示第二位.
    负整数表示从右往左边的数的位置,[-1]倒数第1位,[-2]倒数第2位,依次类推
step:步长,正整数,由左往右取值,负整数,由右往左取值,省略默认长度1,步长不能是0哦

当第三参数是整数时,开始端的位置不能在结束端的右边
当第三参数是负数时,开始断的位置不能在借宿段的左边

以下五条语句表示的内容都是一样的(顺序有差异)

小何    86
小邱    99
王五    97
dtype: int64
..............................我是分割线1号..............................
小何    86
小邱    99
王五    97
dtype: int64
..............................我是分割线1号..............................
王五    97
小邱    99
小何    86
dtype: int64
..............................我是分割线1号..............................
王五    97
小邱    99
小何    86
dtype: int64
..............................我是分割线1号..............................
小何    86
小邱    99
王五    97
dtype: int64

获取Series的索引和值可以使用eries对象的index方法和Values方法获得.

#获取Series的索引和值
import pandas as pd
ss=pd.Series([100,95,88,97,99,86],index=["小陈","小明","小李","王五","小邱","小何"])
print("索引是:",ss.index)
print("索引值是:",ss.values)

索引是: Index(['小陈', '小明', '小李', '王五', '小邱', '小何'], dtype='object')
索引值是: [100  95  88  97  99  86]

2.3创建一个DataFrame对象

DataFrame是Pandas库中的一种数据结构,它是有多重类型的列组成的二维表数据结构,类似于Excel,SQL或者Series对象构成的字典.在处理DataFrame表格数据时,把index理解成行,column理解成列,这样更加直观易理解.
创建DataFrame对象可以普通方式创建也可以使用字典创建.

import pandas as pd
#解决数据输出时列名对不起的问题
pd.set_option('display.unicode.east_asian_width',True)
data=[[105,115,120],[106,107,119],[110,111,112],[109,104,114],[108,98,118]]
index=[0,1,2,3,4]
columns=["小德","亚瑟","鲁班"]
#构建DataFrame数据
#pandas.DateFrame(data,index,columns,dtype,copy)
#参数说明:
#    data:数据,nadrray数组,series对象,列表,字典等.
#    index:表示行标签,即行索引
#    columns:表示列标签,即列索引
#    dtype:每一列数据的数据类型,和Python的数据类型有点差异,具体如下:
#            Pandas数据类型|Python数据类型
#            object|str
#            int64|int
#            float64|float
#            bool|bool
#            datetime64|datetime64[ns]
#            timedelta[ns]|NA
#            category|NA
#    copy:用于复制数据
#普通创建DataFrame对象
df=pd.DataFrame(data=data,index=index,columns=columns)
print(df)
print("."*30+"我是分割线1号"+"."*30)
#使用字典创建DataFrame对象
#pandas.DateFrame({dickey1:dicvalue1,dickey2:dicvalue2,dickey3:dicvalue3})
df1=pd.DataFrame({
     "小德":[105,106,110,109,108],"亚瑟":[115,107,111,104,98],"鲁班":[120,119,112,114,118]})
print(df1)
print("."*30+"我是分割线1号"+"."*30)
#遍历#DataFrame数据的每一列
for col in df.columns:
    ss=df[col]
    print(ss)

小德  亚瑟  鲁班
0   105   115   120
1   106   107   119
2   110   111   112
3   109   104   114
4   108    98   118
..............................我是分割线1号..............................
   小德  亚瑟  鲁班
0   105   115   120
1   106   107   119
2   110   111   112
3   109   104   114
4   108    98   118
..............................我是分割线1号..............................
0    105
1    106
2    110
3    109
4    108
Name: 小德, dtype: int64
0    115
1    107
2    111
3    104
4     98
Name: 亚瑟, dtype: int64
0    120
1    119
2    112
3    114
4    118
Name: 鲁班, dtype: int64

DataFrame的重要属性

属性	说明	举例
values	查看所有元素	df.values
index	查看所有行名,重命名行名	df.index df.index=[1,2,3,4,5]
columns	查看所有列名,重命名列名	df.columns df.columns=[“小刚”,“小强”,“小明”]
T	行列数据转换	df.T
head	查看前n调数据,默认5条	df.head() df.head(20)
tail	查看后n条数据,默认5条	df.tail() df.tail(20)
shape	查看行数和列数,[0]表示行数,[1]表示列数	df.shape df.shape[0] df.shape[1]

DataFrame的重要函数

属性	说明	举例
describe	查看每列的统计汇总信息,DataFrame类型	df.describe()
count	返回每一列中的非空值的个数	df.count()
sum	返回每一列的和,无法计算返回空值	df.sum()
man\|min	返回每一列的最大(小)值	df.max \|df.min
argmax\|argmin	返回最大值(小)所在的自动索引位置	df.argmax()\|df.argmin() df[“鲁班”][df[“小德”].argmax()] df[“亚瑟”][df[“小德”].argmin()]
idxmax\|idxmin	返回最大(小)值所在的自定义索引位置	df.dixmax()\|df.dixmin()
mean	返回每一列的平均值	df.mean()
median	返回每一列的中位数(中值)	df.median()
var	返回每一列的方差方差用于度量单个随机变量的离散程度(不连续程度)	df.var()
std	返回每一列的标准差 (标准差是方差的算是平方根,反映数据集的离散程度)	df.std()
isnull	检查df中的空值,空值返回True,否则返回Flase,返回布尔型	df.isnull()
notnull	检查df中的空值,非空值为True,否则为Flase,返回布尔型	df.notnull()

2.4从外部导入数据

撒也不说,先来一张表.

方法	描述
read_excel	将一个Excel表读入DataFrame
read_csv()	将CSV(逗号分隔)文件读入DataFrame
read_sql()	将SQL查询或数据库中的表读入DataFrame
read_sql_table()	将SQL数据库中的表读入DataFame
read_sql_query()	将SQL查询读入DataFrame
Excelfile.parser()	将Excel表读入DataFrame
read_plckle()	读取plckle文件
read_table()	将带分隔符的常规文件读入DataFrame
read_fwf()	将固定宽度的格式化行标读入DataFrame
read_cllpboard()	将剪贴板读取文本并传递到read_table
read_json	将JSON字符串转换为Pandas对象
read_html	将HTML表读入DataFrame对象
read_hdf	读取haf5文件

我们现在就导入Excel接着往下写
pandas.read_excel(ph,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeese=False,dtype=None,skiprows=None,skipfooter=None)
参数说明:
ph:xls或者xlsx文件路径或类文件对象
sheet_name:MORENZHI WEI 0

值	描述
sheet_name=0 [默认值]	第一个Sheet页中的数据作为DataFrame
sheet_name=1	第二个Sheet页中的数据作为DataFrame
sheet_name=“Sheet1”	名称为"Sheet1"的Sheet页中的数据作为DataFrame
sheet_name=[0,1,“Sheet3”	第一个,第二个和名称为"Sheet1"的Sheet页中的数据作为DataFrame

相对路径:
以当前文件为基准,然后一级级目录指向被引用的资源文件.
../ : 表示当前文件所在文件的上一级目录.
  ./   : 表示当前文件所在的目录
  /  : 表示当前文件的根目录
 绝对路径:
 文件真正存在的路径,是完整的从根目录开始一级一级指向文件的完整路径.

header:指定作为列名的行,默认值为0,即取值第一行为列名.数据为出列名以外的数据;header=None表示数据不包含列名.
names:默认值为None,要使用的列名列表
index_col:指定列为索引列.默认值为None.索引为0是DataFrame的行标签.
usecols:int，list或者字符串，默认值为None。
usecols=None表示解析所有列
usecols为int则解析最后一列
usecols为list列表，则解析列表在列表内的列
usecols为字符串，则表示以逗号分割Excel列字母和列返回列表。范围包含双方，例如“A:F”表示从A列到F列
squeeze:布尔值，默认值为Flase,如果解析的数据只有一列，则返回一个Series对象。
dtype：列的数据类型名称或字典，默认值为None。例如{“A”:np.float64,“B”：np.int64}
skiprows:省略指定行数的数据,从第一行开始.
skipfooter:省略指定行数的数据,从尾部数的行开始.

第一次使用pandas导入一张Excel表

import pandas as pd
#解决数据输出是列名不对齐的问题
pd.set_option("display.unicode.east_asian_width",True)
df=pd.read_excel('order_data.xlsx')
print(df.head())

  产品id   产品类型   产品名称    产品单价    产品成本价
0  p1047     冬装     围巾      29.9          19
1  p4429     冬装     棉袜       9.9           3
2  p2893     秋装     裤子      98.9          60
3  p1898     冬装     帽子      28.9          17
4   p979     冬装     毛衣      39.9          18

我们现在导入工作簿中的第二张表,订单表

#现在我们来导入第二个Sheet页
import pandas as pd
#解决数据输出是列名不对齐的问题
pd.set_option("display.unicode.east_asian_width",True)
df=pd.read_excel('order_data.xlsx',sheet_name=1)
#或者df=pd.read_excel('order_data.xlsx',sheet_name="订单表")
print(df.head())

产品ID    订单ID    客户ID       订单日期             发货日期           销售经理ID  \
0  p1047       1   10221  2017-01-01 00:00:00  2017-01-02 00:00:00    sale003   
1  p1614       2   10706  2017-01-01 00:00:00  2017-01-10 00:00:00    sale007   
2  p1614       3   10420  2017-01-01 00:00:00  2017-01-11 00:00:00    sale001   
3  p1898       4   10372  2017-01-01 00:00:00  2017-01-04 00:00:00    sale003   
4  p1898       5   10250  2017-01-01 00:00:00  2017-01-07 00:00:00    sale003   

     利润   折扣    数量    是否退回    计划发货天数 销售额     实际发货天数 产品类型  \
0   10.90   1.0     1         0             2    29.9             1     冬装   
1  249.50   1.0     5         0             1   499.5             9     冬装   
2   29.92   0.8     1         0             1    99.9            10     冬装   
3   12.24   0.8     2         0             2    57.8             3     冬装   
4    0.34   0.6     1         0             1    28.9             6     冬装   

   产品名称    产品单价    产品成本价  
0      围巾      29.9          19  
1  保暖内衣      99.9          50  
2  保暖内衣      99.9          50  
3      帽子      28.9          17  
4      帽子      28.9          17

现在我们将订单表的订单ID制定成行索引

import pandas as pd
#解决数据输出是列名不对齐的问题
pd.set_option("display.unicode.east_asian_width",True)
df=pd.read_excel('order_data.xlsx',sheet_name=1,index_col=1)
#df=pd.read_excel('order_data.xlsx',sheet_name="订单表",index_col="订单ID")
print(df.head())

       产品ID  客户ID             订单日期             发货日期      销售经理ID  \
订单ID                                                                       
1       p1047   10221  2017-01-01 00:00:00  2017-01-02 00:00:00    sale003   
2       p1614   10706  2017-01-01 00:00:00  2017-01-10 00:00:00    sale007   
3       p1614   10420  2017-01-01 00:00:00  2017-01-11 00:00:00    sale001   
4       p1898   10372  2017-01-01 00:00:00  2017-01-04 00:00:00    sale003   
5       p1898   10250  2017-01-01 00:00:00  2017-01-07 00:00:00    sale003   

          利润    折扣   数量    是否退回     计划发货天数  销售额    实际发货天数  \
订单ID                                                                     
1        10.90   1.0     1         0             2    29.9             1   
2       249.50   1.0     5         0             1   499.5             9   
3        29.92   0.8     1         0             1    99.9            10   
4        12.24   0.8     2         0             2    57.8             3   
5         0.34   0.6     1         0             1    28.9             6   

       产品类型    产品名称    产品单价    产品成本价  
订单ID                                           
1          冬装      围巾      29.9          19  
2          冬装  保暖内衣      99.9          50  
3          冬装  保暖内衣      99.9          50  
4          冬装      帽子      28.9          17  
5          冬装      帽子      28.9          17

我们自己制定第一行做列名称

#现在我们来导入第二个Sheet页
import pandas as pd
#解决数据输出是列名不对齐的问题
pd.set_option("display.unicode.east_asian_width",True)
df=pd.read_excel('order_data.xlsx',sheet_name=1,index_col=1,header=1)#header=1指定第一行为列名,如果header=None,折原始数据的列名(产品ID那列)变成数据第一列,列索引自动生成数字.
print(df.head())

   p1047  10221  2017-01-01 00:00:00  2017-01-02 00:00:00  sale003    10.9  \
1                                                                            
2  p1614  10706  2017-01-01 00:00:00  2017-01-10 00:00:00  sale007  249.50   
3  p1614  10420  2017-01-01 00:00:00  2017-01-11 00:00:00  sale001   29.92   
4  p1898  10372  2017-01-01 00:00:00  2017-01-04 00:00:00  sale003   12.24   
5  p1898  10250  2017-01-01 00:00:00  2017-01-07 00:00:00  sale003    0.34   
6  p1898  10628  2017-01-01 00:00:00  2017-01-07 00:00:00  sale007   83.64   

    1.1  1.2  0  2   29.9  1.3  冬装      围巾  29.9.1  19  
1                                                           
2  1.00    5  0  1  499.5    9  冬装  保暖内衣    99.9  50  
3  0.80    1  0  1   99.9   10  冬装  保暖内衣    99.9  50  
4  0.80    2  0  2   57.8    3  冬装      帽子    28.9  17  
5  0.60    1  0  1   28.9    6  冬装      帽子    28.9  17  
6  0.95    8  0  3  231.2    6  冬装      帽子    28.9  17

如果我们不想要这么多列,那么可以使用参数usecols
例如:

#指定列
import pandas as pd
#解决数据输出是列名不对齐的问题
pd.set_option("display.unicode.east_asian_width",True)
df=pd.read_excel('order_data.xlsx',usecols=[0,3])#指定列索引
#df=pd.read_excel('order_data.xlsx',sheet_name=1,usecols=['产品ID','客户ID'])指定列名称
print(df.head())

  产品ID  客户ID
0  p1047   10221
1  p1614   10706
2  p1614   10420
3  p1898   10372
4  p1898   10250

2.5导入.CSV文件

pd.read_csv(ph,sep=",",delimiter=None,header=0,names=None,index_col=None,usecols=None,dtype=None,parse_dates=Flase,enconding=None)

 参数说明:
 ph:字符串,设置需要访问的文件的有效路径,或者URL链接
 sep:指定读取文件的分隔符.支持自定义分隔符.
delimiter:定界符.备选分隔符（如果指定该参数，则sep参数失效）
header:指定作为整个数据集列名的行.如果数据集中没有列名，则需要设置header=None.对有表头的数据识别第一行作为header.
names:默认值为None,要使用的列名列表.用于结果的列名列表，如果数据文件中没有列标题行，就需要执行header=None。
index_col:指定列为索引列.默认值为None.索引为0是DataFrame的行标签.
usecols:int，list或者字符串，默认值为None。
			usecols=None表示解析所有列
			usecols为int则解析最后一列
			usecols为list列表，则解析列表在列表内的列
			usecols为字符串，则表示以逗号分割Excel列字母和列返回列表。范围包含双方，例如“A:F”表示从A列到F列
dtype：列的数据类型名称或字典，默认值为None。例如{"A":np.float64,"B"：np.int64}
parse_dates:布尔类型值,int类型值的列表,列表或者字典.默认值为False.parse_dates参数直接降某列转换成datetuime64的日期类型.
    parse_dates为True,尝试解析索引,
    parse_dates为int类型值组成的列表时,如[1,2,3],则解析1,2,3列index_col值作为独立的日期列.
    parse_dates为列表组成的列表,如[[1,3]],则将1,3列index_col并,作为一个日期列使用.
    parse_dates为字典时,如{"总计":{[1,3]},则将1、3列合并，合并后的列为"总计"}.
enconding:指定字符集类型，默认值为None,通常指定为'utf-8'，支持切换其它格式.

2.6导入.txt文件

pd.csv(ph,sep=’\t’,enconding=‘gbk’)

.txt文本文件的分隔符为"\t"

2.7导入Html文件

在使用read_html方法前,首先要确定网页表格是否为table标签.
pd.read_html(ph,match=’.+’,flavor=None,header=None,index_col=None,enconding=None)

参数说明:
ph:字符串,文件路径或者URL链接.不支持https,可以修改成http.
match:正则表达式,返回与正则表达式相匹配的表格.
flavor:解析器,默认为"lxml"
header:指定列标题所在的行,列表list为多重索引
index_col:指定行标题对应的列,列表list为多重索引.
enconding:字符串,默认值None,文件的编码格式

你可能感兴趣的:(Python,python,数据分析)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
写完作业的感觉很爽乡村算卦师
今天终于一口气把一个数据分析课的作业写完了。明天还要继续写一个，写完，就可以暂时轻松一下了。想想还是很开心的，哈哈哈。刚出去跑了一圈，结果下雨了，虽然不是很大，可是没办法跑，怕下大。现在在小区门口，吹吹风，也是极好的。希望一些都变的越来越好，加油！
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen