22 | Tablib

本文链接 : https://www.jianshu.com/p/4b55f385e602
作者:shark
参考:

  • 官方文档指南
  • 官方 API 文档

一、基本介绍

tablib为requests作者kennethreitz(肯内特·雷特兹)维护,支持python2到python3.简单的说就是一个通用的数据集,操作类似数据库,但又不是一个数据库的代替,因为缺少查操作,但是可以通过tablib将数据集轻松转为xls、csv、yaml等格式。简单的来说就是用来处理tabular dataset,为这些不同格式的数据集提供一个统一的格式。

image.png
image.png

二、安装

pip  install tablib

当有新版本可用时,升级很简单:

$ pip install tablib --upgrade

三、获取数据

1. 添加行数据

In [6]: from tablib import Dataset

In [7]: data = Dataset()

In [8]: row = ('shark', 18)

In [9]: data.append(row)

In [10]: data.dict
Out[10]: [['shark', 18]]

In [11]: row = ('xiguatian', 18)

In [12]: data.append(row)

In [13]: data.dict
Out[13]: [['shark', 18], ['xiguatian', 18]]

这个相当于创建了一个这样的表

shark 18
xiguatian 18

2. 可以给这个表添加表头

In [14]: headers = ('name', 'age')

In [15]: data.headers=headers

In [16]: data.dict
Out[16]:
[OrderedDict([('name', 'shark'), ('age', 18)]),
 OrderedDict([('name', 'xiguatian'), ('age', 18)])]

可以看到内部的数据变成了有序字典。

这个相当于这样的表

name age
shark 18
xiguatian 18

3. 添加列

In [18]: data.append_col(['Cute girl', 'RMB'], header='hobby')

In [19]: data.append_col(['做个俗人', '贪财好色'], header='desc')

In [20]: data.dict
Out[20]:
[OrderedDict([('name', 'shark'),
              ('age', 18),
              ('hobby', 'Cute girl'),
              ('desc', '做个俗人')]),
 OrderedDict([('name', 'xiguatian'),
              ('age', 18),
              ('hobby', 'RMB'),
              ('desc', '贪财好色')])]

表格变成这样

name age hobby desc
shark 18 Cute girl 做个俗人
xiguatian 18 RMB 贪财好色

其实也可打印出更好看的格式

In [22]: print(data)
name     |age|hobby    |desc
---------|---|---------|----
shark    |18 |Cute girl|做个俗人
xiguatian|18 |RMB      |贪财好色

四、输出数据的格式

1. 输出Json

import io

with io.open('my.json', 'w', encoding='utf-8') as f:
    f.write(data.json)

2. 输出 Yaml

import io

with io.open('my.yaml', 'wb', encoding='utf-8') as f:
    f.write(data.yaml)

3. 输出 CSV

import io

# window 版本中注意字符串使用  gbk 或者 gb2312
import io

with io.open('my.csv', 'w', newline='', encoding='gb2312') as f:
    f.write(data.csv)

Dataset.csv 默认情况下行尾使用 \r\n,因此,请确保包含newline ='',否则在Excel中打开文件时,每行之间会出现空白行。

4. 输出 Excel

xls

import io

# Dataset.xls 包含二进制数据,因此请确保以二进制模式写入:
with io.open('my.xls', 'wb') as f:
    f.write(data.xls)

xlsx

import io

# Dataset.xlsx 包含二进制数据,因此请确保以二进制模式写入:
with io.open('my.xlsx', 'wb') as f:
    f.write(data.xlsx)

更多参考官方 API 文档,点我直达

你可能感兴趣的:(22 | Tablib)