小白也能看懂，手把手教你启动graphrag-369IT编程

admin管理员组
文章数量:1036090

小白也能看懂，手把手教你启动graphrag

最近我基于微软GraphRAG，编写了一个支持极速流式输出的Web服务graphrag-server，还支持可访问的参考文档链接。然而很多粉丝说之前的视频不够傻瓜，今天我就带你手把手安装graphrag-server，并配合桌面应用使用，告别使用命令行傻等结果。极速流式输入的演示效果，可参考上一个视频《不要再傻等了GraphRAG查询极速流式输出，秒速回复》。本文分为安装、配置、索引、启动web服务和配置桌面应用。可视化请参考前文《喂饭教程！全网首发Neo4J可视化GraphRAG索引》，脚本已经内置在graphrag-server的script中。

我最近还建立了微信群，方便大家交流，有需要的同学可以后台回复进群即可。

1. 安装

克隆本项目

代码语言：javascript代码运行次数：0运行复制

git clone .git
cd graphrag

使用conda建立虚拟环境

代码语言：javascript代码运行次数：0运行复制

conda create -n graphrag python=3.10
conda activate graphrag

安装poetry

代码语言：javascript代码运行次数：0运行复制

curl -sSL  | python3 -

如果poetry你安装不上，你可以直接下载这个安装文件[1]，并保存为.py文件，假设叫做installer-poetry.py，然后执行python installer-poetry.py也可以安装。

对于Windows用户，你还需要根据Poetry安装之后的提示，将poetry的执行路径添加到系统的环境变量中。

安装依赖

代码语言：javascript代码运行次数：0运行复制

poetry install

考虑国内用户，可能下载依赖较慢，咱们可以设置环境变量设置镜像源。mac或者linux

代码语言：javascript代码运行次数：0运行复制

export POETRY_REPOSITORIES_TUNA_URL=";
export POETRY_REPOSITORIES_TUNA_NAME="tuna"
poetry install

windows用户

代码语言：javascript代码运行次数：0运行复制

set POETRY_REPOSITORIES_TUNA_URL=
set POETRY_REPOSITORIES_TUNA_NAME=tuna
poetry install

安装webserve依赖

代码语言：javascript代码运行次数：0运行复制

pip install -r webserver/requirements.txt

如果以上安装都没问题，接下来就可以开始初始化了。

初始化GraphRAG

代码语言：javascript代码运行次数：0运行复制

poetry run poe index --init --root .

初始化成功后，会在当前目录中新增以下几个目录：prompts、output、.env和settings.yaml。要想索引，我们还需要进行一番详细配置。

2. 配置

首次跑，我建议你采用线上的大模型和本地的Embedding模型服务，这样能确保你一次通过，之后你再尝试修改为本地的大模型服务。

2.1 安装本地Embedding服务

我这里使用的是LM Studio，可以到官网[2]进行下载。然后我们下载嵌入模型，LM Studio只支持GGUF格式的嵌入模型。如果你的文档主要是中文，咱们可以使用bge-large-zh-v1.5，下载地址：.5-gguf。

接下来，我们打开LM Studio，左侧选择目录，将我们下载bge模型放入进入。

接下来进入模型服务页面，我们选择刚才下载的模型，然后点击左下角的Start Server启动模型嵌入服务，该服务兼容OpenAI Embedding API。

2.2 配置settings.yaml

首先你需要将你的LLM API Token，设置到.env中进去。

代码语言：javascript代码运行次数：0运行复制

GRAPHRAG_API_KEY=sk-xxxxx

我们主要需要配置settings.yaml中llm和embedding两项。这里我使用的是deepseek线上的大模型，首次注册赠送500万Token额度，足够玩耍。那么llm中

api_base设置为deepseek的API地址或者你自己的大模型API地址
max_tokens设置为4096，表示你的大模型最大输出token数量，注意这不是模型的上下文窗口长度。
tokens_per_minute 和 requests_per_minute 表示大模型的限制，本地模型无需配置
top_p 可以设置0.99，有些模型诸如通义千问一定要设置比1小的数值。
concurrent_requests 并发，也需要根据你线上模型的限制，deepseek其实没限制，你设置100也没关系，本地模型如果能力比较弱，尽量设置1
sleep_on_rate_limit_recommendation 表示说遇到线上并发限制时候，它可以按照建议进行等待时间再次发送请求，所以最好设置为true。

代码语言：javascript代码运行次数：0运行复制

encoding_model: cl100k_base
skip_workflows: []
llm:
  api_key: ${GRAPHRAG_API_KEY}
  type: openai_chat # or azure_openai_chat
  model: deepseek-chat
  model_supports_json: true # recommended if this is available for your model.
  api_base: 
  max_tokens: 4096
  concurrent_requests: 100 # the number of parallel inflight requests that may be made
  tokens_per_minute: 500000 # set a leaky bucket throttle
  requests_per_minute: 100 # set a leaky bucket throttle
  top_p: 0.99
  # request_timeout: 180.0
  # api_version: 2024-02-15-preview
  # organization: <organization_id>
  # deployment_name: <azure_model_deployment_name>
  max_retries: 3
  max_retry_wait: 10
  sleep_on_rate_limit_recommendation: true # whether to sleep when azure suggests wait-times

接下来，咱们配置embeddings项。对于LM Studio，你只需要将api_base设置为http://localhost:1234/v1即可，然后batch_size和concurrent_requests最好是设置为1，本地机器能力有限，不然容易卡住，具体合适的数值需要你自行测试。

代码语言：javascript代码运行次数：0运行复制

embeddings:
  ## parallelization: override the global parallelization settings for embeddings
  async_mode: threaded # or asyncio
  llm:
    api_key: ${GRAPHRAG_API_KEY}
    type: openai_embedding # or azure_openai_embedding
    model: text-embedding-ada-002
    api_base: http://localhost:1234/v1
    batch_size: 1 # the number of documents to send in a single request
    concurrent_requests: 1 # the number of parallel inflight requests that may be made
    # batch_max_tokens: 8191 # the maximum number of tokens to send in a single request
...

然后简单配置一下全局查询和局部查询的参数，其实主要是max_tokens和llm_max_tokens，graphrag在这里比较模型，他们混用了最大输出和上下文窗口，导致这里其实配置起来比较歧义，具体还是要看代码。

代码语言：javascript代码运行次数：0运行复制

local_search:
  # text_unit_prop: 0.5
  community_prop: 0.1
  # conversation_history_max_turns: 5
  # top_k_mapped_entities: 10
  # top_k_relationships: 10
  max_tokens: 4096

global_search:
   max_tokens: 4096
   top_p: 0.99
   temperature: 0
   data_max_tokens: 128000
   map_max_tokens: 2000
  # reduce_max_tokens: 2000
  # concurrency: 32

更多的配置说明可以参考GraphRAG官方文档[3]

3. 索引

GraphRAG默认的输入目录是input，因此你需要手动在当前目录中新增该目录。然后将你的文本文件放入其中，如果你的输入文件是csv，你可以参考我之前的文章《GraphRAG如何配置处理csv文件》进行配置。开始索引

代码语言：javascript代码运行次数：0运行复制

poetry run poe index --root .

如果模型能力没问题，那么基本能够一把通过。如果使用本地模型，可能会有指令跟随的问题，即无法按照要求的格式输出，导致解析错误，从而出现各种索引失败的情况。

4. 启动web服务

如果索引成功，咱们就可以启动web服务了，基本上默认的配置即可启动，它会自动读取settings.yaml中的配置，并在20213端口上启动web服务。

代码语言：javascript代码运行次数：0运行复制

class Settings(BaseSettings):
    server_port: int = 20213
    website_address: str = f"http://127.0.0.1:{server_port}"
    data: str = (
        "./output"
    )
    lancedb_uri: str = (
        "./lancedb"
    )

在graphrag-server根目录，执行以下命令启动服务

代码语言：javascript代码运行次数：0运行复制

python -m uvicorn webserver.main:app --reload --port 20213 --host 0.0.0.0

服务采用FastAPI编写，因此自带API文档，方便查看。

5. 配置桌面应用

这里我们推荐使用Cherry-Studio[4]这样一个桌面应用，它对GraphRAG的一些使用进行了一些优化，比如支持建议提问。在安装好之后，我们开始配置Cherry-Studio，使他能够将graphrag-server作为大模型一样使用。

点击Cherry-Studio左下角的设置，点击中间的加号，设置api base为http://localhost:20213，然后点击管理加载模型列表。我将所有索引输出的目录分别配置为global和local，这样方便选择不同的索引目录。

分别选中你刚才的目录，然后添加local和global模型。为了便于使用，我最近增加了最新模型，即它会自动选择最新的索引输出目录进行回答，从而方便经常使用索引的同学。

模型选择好之后，我们在该页面的右上角有个按钮，使能它。然后在侧边栏选择对话窗口。在上面选择模型，我们选择最新的local模型进行问答。

你将能够在1秒内获得流式输出的答案，并且在输出结束后，显示参考的实体、关系、报告等可访问链接，从而方便我们确认信息是否可靠。

同时在回答完毕后，它会默认根据输入的历史问题，推荐5个可能问题，从我的使用来看，推荐问题都是非常相关的问题，还是非常好用的。

6. 总结

本文主要讲解了如何安装graphrag-server的依赖、安装模型嵌入服务LM Studio、配置settings.yaml、启动web服务和使用Cherry Studio进行流畅体验GraphRAG，希望本文能够帮助各位更快更好的体验和使用GraphRAG。

此外，我最近在给各种文档Prompt Tune的时候，我认为想要让GraphRAG表现的更好一些，我强烈推荐你阅读这本书，了解一下到底什么是实体，什么是三元组，你如何定义实体，是你想要提取的信息就是实体吗？ 参考资料

[1]

poetry安装文件:

[2]

LM Studio官网: /

[3]

GraphRAG官方配置文档: /

[4]

Cherry-Studio: /

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2024-08-08，如有侵权请联系 cloudcommunity@tencent 删除服务模型配置索引server

小白也能看懂，手把手教你启动graphrag

我最近还建立了微信群，方便大家交流，有需要的同学可以后台回复进群即可。

1. 安装

克隆本项目

代码语言：javascript代码运行次数：0运行复制

git clone .git
cd graphrag

使用conda建立虚拟环境

代码语言：javascript代码运行次数：0运行复制

conda create -n graphrag python=3.10
conda activate graphrag

安装poetry

代码语言：javascript代码运行次数：0运行复制

curl -sSL  | python3 -

如果poetry你安装不上，你可以直接下载这个安装文件[1]，并保存为.py文件，假设叫做installer-poetry.py，然后执行python installer-poetry.py也可以安装。

对于Windows用户，你还需要根据Poetry安装之后的提示，将poetry的执行路径添加到系统的环境变量中。

安装依赖

代码语言：javascript代码运行次数：0运行复制

poetry install

考虑国内用户，可能下载依赖较慢，咱们可以设置环境变量设置镜像源。mac或者linux

代码语言：javascript代码运行次数：0运行复制

export POETRY_REPOSITORIES_TUNA_URL=";
export POETRY_REPOSITORIES_TUNA_NAME="tuna"
poetry install

windows用户

代码语言：javascript代码运行次数：0运行复制

set POETRY_REPOSITORIES_TUNA_URL=
set POETRY_REPOSITORIES_TUNA_NAME=tuna
poetry install

安装webserve依赖

代码语言：javascript代码运行次数：0运行复制

pip install -r webserver/requirements.txt

如果以上安装都没问题，接下来就可以开始初始化了。

初始化GraphRAG

代码语言：javascript代码运行次数：0运行复制

poetry run poe index --init --root .

初始化成功后，会在当前目录中新增以下几个目录：prompts、output、.env和settings.yaml。要想索引，我们还需要进行一番详细配置。

2. 配置

首次跑，我建议你采用线上的大模型和本地的Embedding模型服务，这样能确保你一次通过，之后你再尝试修改为本地的大模型服务。

2.1 安装本地Embedding服务

接下来，我们打开LM Studio，左侧选择目录，将我们下载bge模型放入进入。

接下来进入模型服务页面，我们选择刚才下载的模型，然后点击左下角的Start Server启动模型嵌入服务，该服务兼容OpenAI Embedding API。

2.2 配置settings.yaml

首先你需要将你的LLM API Token，设置到.env中进去。

代码语言：javascript代码运行次数：0运行复制

GRAPHRAG_API_KEY=sk-xxxxx

我们主要需要配置settings.yaml中llm和embedding两项。这里我使用的是deepseek线上的大模型，首次注册赠送500万Token额度，足够玩耍。那么llm中

api_base设置为deepseek的API地址或者你自己的大模型API地址
max_tokens设置为4096，表示你的大模型最大输出token数量，注意这不是模型的上下文窗口长度。
tokens_per_minute 和 requests_per_minute 表示大模型的限制，本地模型无需配置
top_p 可以设置0.99，有些模型诸如通义千问一定要设置比1小的数值。
concurrent_requests 并发，也需要根据你线上模型的限制，deepseek其实没限制，你设置100也没关系，本地模型如果能力比较弱，尽量设置1
sleep_on_rate_limit_recommendation 表示说遇到线上并发限制时候，它可以按照建议进行等待时间再次发送请求，所以最好设置为true。

代码语言：javascript代码运行次数：0运行复制

encoding_model: cl100k_base
skip_workflows: []
llm:
  api_key: ${GRAPHRAG_API_KEY}
  type: openai_chat # or azure_openai_chat
  model: deepseek-chat
  model_supports_json: true # recommended if this is available for your model.
  api_base: 
  max_tokens: 4096
  concurrent_requests: 100 # the number of parallel inflight requests that may be made
  tokens_per_minute: 500000 # set a leaky bucket throttle
  requests_per_minute: 100 # set a leaky bucket throttle
  top_p: 0.99
  # request_timeout: 180.0
  # api_version: 2024-02-15-preview
  # organization: <organization_id>
  # deployment_name: <azure_model_deployment_name>
  max_retries: 3
  max_retry_wait: 10
  sleep_on_rate_limit_recommendation: true # whether to sleep when azure suggests wait-times

代码语言：javascript代码运行次数：0运行复制

embeddings:
  ## parallelization: override the global parallelization settings for embeddings
  async_mode: threaded # or asyncio
  llm:
    api_key: ${GRAPHRAG_API_KEY}
    type: openai_embedding # or azure_openai_embedding
    model: text-embedding-ada-002
    api_base: http://localhost:1234/v1
    batch_size: 1 # the number of documents to send in a single request
    concurrent_requests: 1 # the number of parallel inflight requests that may be made
    # batch_max_tokens: 8191 # the maximum number of tokens to send in a single request
...

代码语言：javascript代码运行次数：0运行复制

local_search:
  # text_unit_prop: 0.5
  community_prop: 0.1
  # conversation_history_max_turns: 5
  # top_k_mapped_entities: 10
  # top_k_relationships: 10
  max_tokens: 4096

global_search:
   max_tokens: 4096
   top_p: 0.99
   temperature: 0
   data_max_tokens: 128000
   map_max_tokens: 2000
  # reduce_max_tokens: 2000
  # concurrency: 32

更多的配置说明可以参考GraphRAG官方文档[3]

3. 索引

代码语言：javascript代码运行次数：0运行复制

poetry run poe index --root .

4. 启动web服务

如果索引成功，咱们就可以启动web服务了，基本上默认的配置即可启动，它会自动读取settings.yaml中的配置，并在20213端口上启动web服务。

代码语言：javascript代码运行次数：0运行复制

class Settings(BaseSettings):
    server_port: int = 20213
    website_address: str = f"http://127.0.0.1:{server_port}"
    data: str = (
        "./output"
    )
    lancedb_uri: str = (
        "./lancedb"
    )

在graphrag-server根目录，执行以下命令启动服务

代码语言：javascript代码运行次数：0运行复制

python -m uvicorn webserver.main:app --reload --port 20213 --host 0.0.0.0

服务采用FastAPI编写，因此自带API文档，方便查看。

5. 配置桌面应用

模型选择好之后，我们在该页面的右上角有个按钮，使能它。然后在侧边栏选择对话窗口。在上面选择模型，我们选择最新的local模型进行问答。

你将能够在1秒内获得流式输出的答案，并且在输出结束后，显示参考的实体、关系、报告等可访问链接，从而方便我们确认信息是否可靠。

同时在回答完毕后，它会默认根据输入的历史问题，推荐5个可能问题，从我的使用来看，推荐问题都是非常相关的问题，还是非常好用的。

6. 总结

[1]

poetry安装文件:

[2]

LM Studio官网: /

[3]

GraphRAG官方配置文档: /

[4]

Cherry-Studio: /

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。原始发表：2024-08-08，如有侵权请联系 cloudcommunity@tencent 删除服务模型配置索引server

本文标签：小白也能看懂，手把手教你启动graphrag

版权声明：本文标题：小白也能看懂，手把手教你启动graphrag 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://it.en369.cn/jiaocheng/1748224799a2271885.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

小白也能看懂，手把手教你启动graphrag

小白也能看懂，手把手教你启动graphrag

1. 安装

2. 配置

2.1 安装本地Embedding服务

2.2 配置settings.yaml

3. 索引

4. 启动web服务

5. 配置桌面应用

6. 总结

小白也能看懂，手把手教你启动graphrag

1. 安装

2. 配置

2.1 安装本地Embedding服务

2.2 配置settings.yaml

3. 索引

4. 启动web服务

5. 配置桌面应用

6. 总结

更多相关文章

小白也能看懂，手把手教你启动graphrag

发表评论

推荐文章

什么是监视器

刚刚，DeepSeek公布推理时Scaling新论文，R2要来了？

《深度剖析：关联规则挖掘与SQL的奇妙融合》

15毫秒检测缺陷！ResNet34

133.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解（四）：MySwiperItem类实现

热门文章

Eclipse出现Tomcat无法启动：Server Tomcat v8.5 Server at localhost failed to start问题

哪些实时数据特征对猜误率影响最大

做跟随式的科研有意义吗？（原文来自于章冰（美国贝勒医学院））

FFMpegCore：.NET 中进行音视频处理解决方案

李建忠：智能体正将互联网从信息网络重构为行动网络

配置 UOSdeepin 系统远程桌面，实现多台电脑协同办公

​​​48days强训——day5

如何选择最佳的智慧校园管理系统？

3款 .NET 开源的编辑器，包含代码、文本和Markdown编辑功能！

win2008服务器虚拟内存设置,电脑虚拟内存设置（Win 7810、Windows Server 2003 - 2019）...

最新文章

重学Java基础篇—Java泛型深度使用指南

重学Java基础篇—Java类加载顺序深度解析

【python】模块导入

社交媒体分析：破解无限滚动的技术实践

hn如何查看内存分配和释放的次数？

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

48days强训——day5

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow