Python读取.parquet文件

提示:在MacOS 和 Jupyter notebook环境下的用法

Device: MacOS
Python: 3.10.9
Pandas: 1.5.3
Jupyter notebook


问题描述

直接用pandas 中pd.read_parquet()即可,但是这个方法在和read_csv一样用之前需要先安装fastparquet活着pyarrow,方法如下:

打开MacOS的终端,输入:

pip install fastparquet
# 或者
pip install pyarrow

解决方案:

Fast parquet 和Pyarrow安装之后,只需要在Jupyter notebook中正常地 import pandas 就可以像用pandas读取CSV文件那样读取parquet文件了。

import pandas as pd
file = pd.read_parquet(filename) # filename指的是你要读取的parquet的路径

具体的其他参数依据需求详见官方文档.

你可能感兴趣的:(python,pandas)