我有一组要处理的 .csv 文件。使用 SQL 查询处理它会容易得多。我想知道是否有某种方法可以加载 .csv 文件并使用 SQL 语言使用脚本语言(如 python 或 ruby)来查看它。用类似于 ActiveRecord 的东西加载它会很棒。
问题是我不想在运行脚本之前在某处运行数据库。除了脚本语言和一些模块之外,我不需要额外的安装。
我的问题是我应该为这项任务使用哪种语言和哪些模块。我环顾四周,找不到任何适合我需要的东西。有没有可能?
最佳答案
有sqlite3
,包含在python中。有了它,您可以创建一个数据库(在内存中)并向其中添加行,并执行 SQL 查询。
如果您想要简洁的类似 ActiveRecord 的功能,您应该添加一个外部 ORM,例如 sqlalchemy .这是一个单独的下载
使用 sqlalchemy 的快速示例:
from sqlalchemy import create_engine, Column, String, Integer, MetaData, Table
from sqlalchemy.orm import mapper, create_session
import csv
CSV_FILE = 'foo.csv'
engine = create_engine('sqlite://') # memory-only database
table = None
metadata = MetaData(bind=engine)
with open(CSV_FILE) as f:
# assume first line is header
cf = csv.DictReader(f, delimiter=',')
for row in cf:
if table is None:
# create the table
table = Table('foo', metadata,
Column('id', Integer, primary_key=True),
*(Column(rowname, String()) for rowname in row.keys()))
table.create()
# insert data into the table
table.insert().values(**row).execute()
class CsvTable(object): pass
mapper(CsvTable, table)
session = create_session(bind=engine, autocommit=False, autoflush=True)
现在您可以查询数据库,按任何字段过滤等。
假设你在这个 csv 上运行上面的代码:
name,age,nickname
nosklo,32,nosklo
Afila Tun,32,afilatun
Foo Bar,33,baz
这将在内存中创建并填充一个表,其中包含字段 name
、age
、nickname
。然后您可以查询该表:
for r in session.query(CsvTable).filter(CsvTable.age == '32'):
print r.name, r.age, r.nickname
这将自动创建并运行 SELECT
查询并返回正确的行。
使用 sqlalchemy 的另一个优点是,如果您决定将来使用另一个更强大的数据库,您可以在不更改代码的情况下实际这样做。
关于python - 使用脚本语言动态数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2580497/