在Python里使用SQL语句操作Pandas

pandasql可以在Python中运行SQL,对于那些想在Python里使用SQL语句的人来说,pandasql提供了这种方法。

1.安装pandasql

安装pandasql的方法非常简单,你只需要在你的Shell中键入pip install -U pandasql,即

pip install -U pandasql

2. pandasql中的主要函数是sqldf,它接受两个参数,一个便是SQL查询语句,还有一组环境变量globals()或locals()。我们来看个例子。

import pandas as pd
from pandasql import sqldf
books = pd.DataFrame({'书名':['Python编程从入门到实践','Python学习手册','流畅的Python','利用Python进行数据分析','Python编程快速上手'],
          '价钱':[89,219,139,119,69]})
# 这里为了方便,我们使用lambda创建了一个表达式
pysqldf = lambda sql : sqldf(sql,globals())
 sql = 'SELECT * FROM books WHERE "书名" = "Python编程从入门到实践"'
SQL = pysqldf(sql)
print(SQL)

=======output=======

              书名  价钱
0  Python编程从入门到实践  89

这个例子中,我们对"书名"="Python编程从入门到实践"的记录行进行输出,这里再说一下lambda,lambda用来定义一个表达式。具体的使用形式为:


lambda argument_list: expression

这个例子中,我们输入的参数是sql,返回的结果是sqldf对sql的运行结果。

你可能感兴趣的:(SQL,数据分析)