【5】数据库操作-1-python连接PostgreSQL--psycopg2

python可以处理不同数据库。PostgreSQL至少有三个python接口程序可以实现访问,包括PsyCopg、PyPgSQL、PyGreSQL(PoPy已经整合在PyGreSQL中),三个接口程序各有利弊。我这里介绍的时psycopg2。psycopg2是Python编程语言的PostgreSQL数据库的适配器。 其程序代码少,速度快,稳定。

一、安装

一般不需要单独安装这个模块,因为它默认情况下被运往随着Python版本在2.5.x一起的。如果不把它安装在机器上,然后可以使用yum命令安装它,如下所示:

$yum install python-psycopg2

centos7 python3安装

pip install --upgrade pip
pip install psycopg2

这个时候,如果报错提醒:

/psycopg/psycopg.h:35:22: fatal error: libpq-fe.h: No such file or directory
   #include <libpq-fe.h>

则可以:

for Ubuntu systems: sudo apt-get install libpq-dev
on RHEL systems: yum install postgresql-devel
for Mac: brew install postgresql

二使用

官网介绍

2.1 连接到数据库

import psycopg2
conn = psycopg2.connect(database="testdb", user="postgres", password="pass123", host="127.0.0.1", port=“5432")
这个API打开一个连接到PostgreSQL数据库。如果成功打开数据库时,它返回一个连接对象conn。

2.2 创建表

import psycopg2
conn = psycopg2.connect(database="testdb", user="postgres", password="pass123", host="127.0.0.1", port="5432")
cur = conn.cursor()
#该程序创建一个光标将用于整个数据库使用Python编程。
cur.execute('''CREATE TABLE COMPANY
  	(ID INT PRIMARY KEY NOT NULL,
 	NAME TEXT NOT NULL,
 	AGE INT NOT NULL,
 	ADDRESS CHAR(50),
 	SALARY REAL);''')

#cursor.execute(sql [, optional parameters])
此例程执行SQL语句。可被参数化的SQL语句(即占位符,而不是SQL文字)。 psycopg2的模块支持占位符用%s标志。例如:cursor.execute(“insert into people values (%s, %s)", (who, age))    

conn.commit() #connection.commit() 此方法提交当前事务。如果不调用这个方法,无论做了什么修改,自从上次调用#commit()是不可见的,从其他的数据库连接。

conn.close() 
#connection.close() 此方法关闭数据库连接。请注意,这并不自动调用commit()。如果你只是关闭数据库连接而不调用commit()方法首先,那么所有更改将会丢失

参数传递注意问题:

cur.execute("select chrom,pos from %s where rs='%s'" % (default_database['SNP_database'],identifier))
cur.execute("select chrom,pos from dbsnp142_1000g_v1 where rs=%s", (identifier,))

第一行命令我通过%来传递参数,但有的传递进来的参数得加引号,所以第二个参数又给他加上了引号;

第二个命令引物传递的参数需要时元组,所以需要加一个逗号,或者去掉括号也行

2.3 INSERT 操作

Python程序显示了我们如何创建表COMPANY 在上面的例子中创建表中的记录:

import psycopg2
conn = psycopg2.connect(database="testdb", user="postgres", password="pass123", host="127.0.0.1", port="5432")
cur = conn.cursor()
cur.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
 	VALUES (1, 'Paul', 32, 'California', 20000.00 )");
cur.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
 	VALUES (2, 'Allen', 25, 'Texas', 15000.00 )");
cur.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
 	VALUES (3, 'Teddy', 23, 'Norway', 20000.00 )");
cur.execute("INSERT INTO COMPANY (ID,NAME,AGE,ADDRESS,SALARY) \
 	VALUES (4, 'Mark', 25, 'Rich-Mond ', 65000.00 )");
conn.commit()
conn.close()

2.4 SELECT 操作

import psycopg2
conn = psycopg2.connect(database="testdb", user="postgres", password="pass123", host="127.0.0.1", port="5432")
cur = conn.cursor()
cur.execute("SELECT id, name, address, salary from COMPANY")
rows = cur.fetchall()
#cursor.fetchall() 这个例程获取所有查询结果(剩余)行,返回一个列表。空行时则返回空列表。
for row in rows:
	print "ID = ", row[0]
 	print "NAME = ", row[1]
	print "ADDRESS = ", row[2]
	print "SALARY = ", row[3], "\n"   
 	print "Operation done successfully";
conn.close()

2.5 UPDATE 操作

import psycopg2
conn = psycopg2.connect(database="testdb", user="postgres", password="pass123", host="127.0.0.1", port="5432")
print "Opened database successfully"
cur = conn.cursor()
cur.execute("UPDATE COMPANY set SALARY = 25000.00 where ID=1")
conn.commit
cur.execute("SELECT id, name, address, salary from COMPANY")
rows = cur.fetchall()
for row in rows:
 	print "ID = ", row[0]
	print "NAME = ", row[1]
	print "ADDRESS = ", row[2]
	print "SALARY = ", row[3], "\n"
	print "Operation done successfully";
conn.close()

2.7 DELETE 操作

Python代码显示了如何我们可以使用DELETE语句删除记录,然后获取并显示COMPANY 表剩余的记录:

import psycopg2
conn = psycopg2.connect(database="testdb", user="postgres", password="pass123", host="127.0.0.1", port="5432")
cur = conn.cursor()
cur.execute("DELETE from COMPANY where ID=2;")
conn.commit
cur.execute("SELECT id, name, address, salary from COMPANY")
rows = cur.fetchall()
for row in rows:
	print "ID = ", row[0]
	print "NAME = ", row[1]
	print "ADDRESS = ", row[2]
	print "SALARY = ", row[3], "\n"
conn.close()

2.8 其他一些命令

curosr.executemany(sql, seq_of_parameters)

该程序执行SQL命令对所有参数序列或序列中的sql映射。

curosr.callproc(procname[, parameters])

这个程序执行的存储数据库程序给定的名称。该程序预计为每一个参数,参数的顺序必须包含一个条目。

cursor.rowcount

这个只读属性,它返回数据库中的行的总数已修改,插入或删除最后 execute*().

connection.rollback()

此方法会回滚任何更改数据库自上次调用commit()方法。

cursor.fetchone()

这种方法提取的查询结果集的下一行,返回一个序列,或者无当没有更多的数据是可用的。

cursor.fetchmany([size=cursor.arraysize])

这个例程中取出下一个组的查询结果的行数,返回一个列表。当没有找到记录,返回空列表。该方法试图获取尽可能多的行所显示的大小参数。

三、其他小技巧

3.1 提取所有列名

cur.execute("Select * FROM gencode")
colnames = [desc[0] for desc in cur.description]

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn