GraphRAG是微软研究院开发的一种创新型检索增强生成(RAG)方法,旨在提高大语言模型LLM在处理复杂信息和私有数据集时的推理能力

命令

  1. down graph rag

  2. pip install graphrag

  3. 在根目录下创建一个 ragtest/input 文件夹,在input下放入文件

  4. python -m graphrag.index --init --root ./ragtest --resume data
    python -m graphrag.index --init --root ./ragtest
    --resume data => 如果上一次运行失败,下一次运行的时候,就会接着上次失败的哪里接着运行,而不会重新运行
    初始化完毕之后,会创建一些文件

    • .env => 针对某一些模型,对某一些模型的 api_key 的配置
    • settings.yaml => 其他的配置,比如模型,key,类型...
    • prmpts/entity_extraction.txt => 实体抽取
    • summarize_desctriptions.txt => 摘要总结
    • claim_extraction.txt => 社区报告
    • community_report.txt => 社区描述
  5. python -m graphrag.index --root ./ragtest
    --data ./ragtest/output/doupo/artifacts => 指定具体加载的那个一个索引

  6. 查询
    全局查询
    python -m graphrag.query --root ./ragtest --method global "What are the top themes in this story?"
    本地的
    python -m graphrag.query --root ./ragtest --method local "Who is Scrooge, and what are his main relationships?"

  • _document_workflows
    • base_documents => 基本文档
    • final_documents => 最终文档

问题①
❌ create_summarized_entities
❌ Errors occurred during the pipeline run, see logs for more details.

问题②
❌ create_base_entity_graph
❌ Errors occurred during the pipeline run, see logs for more details.
解决 =>
 在.env环境当中填入你的key即可
 或者切换模型

问题③
❌ create_base_text_units
❌ Errors occurred during the pipeline run, see logs for more details.
解决 => 没有输入 知识库

问题④
❌ create_final_covariates
❌ Errors occurred during the pipeline run, see logs for more details.
解决 => 在.env文件下添加GRAPHRAG_CLAIM_EXTRACTION_ENABLED=True

posted on 2024-09-19 21:19  文种玉  阅读(154)  评论(0编辑  收藏  举报