python 的 Pandas库学习(1)

    最近学习了Python的科学分析库,接触到了Python-pandas。

    对处理格式化的数据而言,pandas是一个非常方便的工具,它开发的初衷就在于数据分析。

    我使用了Ubuntu-Kylin作为桌面环境,安装一个pandas库是非常方便的。同时,也可以安装下绘图库:matplotlib。

sudo apt-get install python-pandas
sudo apt-get install python-matplotlib

    之后就可以开始使用了。

    pandas可以从很多对象中加载数据,比如list, dictionary, Series, *.csv文件等。

    加载具有格式的文件可以使用pandas.read_table();

import pandas as pd;
dict  = {'a':1,'b':2,'c':3};
frame = pd.DataFrame(dict,index=[1,2,3]);
frame;

    

    读取后,生成了一个以字典索引和index作为列、行索引的DataFrame. 获取了DataFrame 对象之后,可以通过索引访问对应的数据。

frame['a'];

    

    可以通过索引计算某一列数据的和、平均数、最大值、最小值,统计项数等。

frame['a'].sum();
frame['a'].count();
frame['a'].max();
frame['a'].min();

     目前就说到这吧,嘿嘿。    


你可能感兴趣的:(dataFrame,Python;,pandas;)