Datasette 生态系统

Datasette 是一个不断壮大的开源工具生态系统的中心,这些工具旨在尽可能轻松地收集、分析和发布有趣的数据。

这些工具主要分为两类:用于构建 SQLite 数据库(供 Datasette 使用)的工具和扩展 Datasette 功能的插件。

Datasette 项目网站包含一个插件目录和一个工具目录。

sqlite-utils

sqlite-utils 是更广泛的 Datasette 生态系统的关键组成部分。它提供了一系列用于操作 SQLite 数据库的实用工具,既可以作为 Python 库,也可以作为命令行工具。功能包括

  • 将 JSON、CSV 或 TSV 数据插入到 SQLite 数据库中,自动创建具有正确模式的表或修改现有表以添加缺失的列。

  • 配置表以便与 SQLite 全文搜索一起使用,包括创建保持搜索索引最新的所需触发器。

  • 以 SQLite 默认的 ALTER TABLE 语法不支持的方式修改表——例如更改列的类型或为表选择新的主键。

  • 向现有数据库表添加外键。

  • 将数据列提取到单独的查找表中。

Dogsheep

Dogsheep 是一个使用 SQLite 和 Datasette 进行个人分析的工具集合。该项目提供了诸如 github-to-sqlitetwitter-to-sqlite 等工具,可以从不同来源导入数据,以创建一个个人数据仓库。个人数据仓库:重新掌握你的数据是一场解释 Dogsheep 并展示其实际应用的演讲。