Zotero_Duckdb处理sqlite数据

Zetero 数据库的位置

Zotero 设置的“高级”选项卡 中选择了自定义数据目录,
   Zotero 数据将存储在以下依赖于操作系统的目录中 C:\Users\test\Zotero

数据目录内容

数据库文件 
 zotero.sqlite文件,它是包含大部分数据的数据库:项目元数据、注释、标签等
 zotero.sqlite.bak(的自动备份zotero.sqlite,如果现有zotero.sqlite.bak文件在过去 12 小时内未更新,则会定期更新)
 zotero.sqlite.[number].bak文件 例如 zotero.sqlite.1.bak  Zotero 更新期间创建的的自动备份

数据文件夹
    storage文件夹,其中包含 8 个字符的子文件夹(例如“N7SMB24A”),
	    其中包含您的所有文件附件,例如 PDF、网页快照、音频文件或您导入的任何其他文件
Zotero 启动时自动创建的 文件夹,
    locate   styles translators temp logs

备份数据

  从备份恢复Zotero数据

恢复数据

分析数据

 访问 Zotero SQLite 数据库
01.查看插件 
     SELECT extension_name, installed, description FROM duckdb_extensions();

02.加载插件 
  INSTALL sqlite;
 LOAD sqlite;    sqlite_scanner

03.使用插件 
 use the ATTACH statement with the sqlite or sqlite_scanner type
   ATTACH 'D:\tero.sqlite' (TYPE sqlite); 
   PRAGMA database_list;	   
    USE tero;   ## 要使用对应文件名的这个
	SHOW TABLES;
04.使用 DESCRIBE 命令来查看表的结构。这个命令会显示表的列名、数据类型以及其他相关信息	
      describe users;
	  
	  
05.查看表数据
    select * from version;
    ┌───────────────┬────────────┐
    │    schema     │  version   │
    │    varchar    │   int64    │
    ├───────────────┼────────────┤
    │ globalSchema  │         2  │
    │ system3  │
    │ userdata      │        12  │
    │ triggers      │         1  │
    │ compatibility │          7 │
    │ delete7  │
    │ translators   │   │
    │ styles        │   │
    │ repository    │   │
    │ lastcheck     │   │
    │ fulltext_1    │ │
    │ lastsync      │   │
    ├───────────────┴────────────┤
    │ 12 rows          2 columns	
	
 select * from collections;	
	
    		  
DuckDB 借鉴了 Pandas 中的 describe 函数,实现了 SUMMARIZE 关键字,
该关键字可以计算数据集中每一列的各种统计数据,以便快速、高水平地概览数据。
只需在任何表格或 SELECT 语句中预置 SUMMARIZE 即可		

控制参考文献样式

Zotero的参考文献格式文件(.csl) 采用XML语言编写,
  CSL 是基于 XML语言编写的用于控制参考文献样式的语言,是一些开源文献管理软件采用的文献样式管理方案
  CSL 全称citation stytle Language,顾名思义就是编写参考格式的语言,本身在XML格式上发展而来

 Find and edit CSL citation styles	
     将CSL文件分段,分成 info, locale, maco, citation, bibliography 六大部分,每部分分行以保持清晰
	代码结构的最高级是style,其次级组件包括 
	 //info组件用于描述style的信息  //locale组件用于声明语言信息
	     //macro 组件是功能组件,这里声明了author的信息
	     //macro 组件是功能组件,这里声明了出版年的信息
	 //citation     组件声明了 文内引用的格式	 
	 //bibliography 组件声明了 参考文献的格式
 webpage 网页

参考文献

1.文内引用就是我们正文部分使用的引用,这些引用一般在文末的“参考文献”部分重新排列
    “文内引用”和“参考文献”是一种联动的格式系统	  in-text格式   citation-format
    例如:   
       世界就是一个混沌的系统。(Doe et al. 2002, Smith 1997)
    
       参考文献:
          Doe L, et al.(2002) This is a example of references. Journal of references 156:12-13.
    格式:格式称之为“author-date”格式   下是另一种常见的格式“numeric”:  尾注格式
       这句话使用了文内引用,且使用了numeric格式。[1]
     
        世界就是一个混沌的系统。[1]
    
       参考文献:
          [1]Doe L, et al.(2002) This is a example of references. Journal of references 156:12-13.
	  
2.变量和内容	  
	CSL文件的基本结构

参考

 https://www.zotero.org/support/zotero_data
 https://www.zotero.org/support/dev/client_coding/direct_sqlite_database_access
 https://aurimasv.github.io/z2csl/typeMap.xml
 使用DuckDB更友好的SQL(二)  https://zhuanlan.zhihu.com/p/654425272
 Find and edit CSL citation styles  https://editor.citationstyles.org/about/	
 https://docs.citationstyles.org/en/stable/	 
posted @   辰令  阅读(8)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示