大模型本地化部署（一）——Ollama保姆级安装教程-369IT编程

admin管理员组
文章数量:1130349

文章目录

- 大模型本地化部署（一）——Ollama安装教程（Windows版）
- - 环境要求
  - 安装步骤
  - - 1. 下载安装包
    - 2. 运行安装程序
  - 环境变量配置
  - - 1. 基础路径配置
    - 2. 高级环境变量配置
    - 3. 验证配置
  - Ollama常用指令
  - 基础使用示例
  - - 1. 运行Llama 2模型
    - 2. 通过API调用
  - 常见问题处理
  - - 1. 命令未识别 (`'ollama' is not recognized`)
    - 2. 模型下载失败
    - 3. 显存不足 (`CUDA out of memory`)
  - 附：推荐模型列表
  - 总结

大模型本地化部署（一）——Ollama安装教程（Windows版）

环境要求

操作系统: Windows 10/11（64位）
内存: 建议8GB及以上（运行大模型需更高内存）
存储空间: 至少10GB可用空间（模型文件通常较大）
网络: 需稳定连接（下载模型依赖网络）

安装步骤

1. 下载安装包

访问 Ollama官网下载页，选择 Download for Windows 获取安装程序（OllamaSetup.exe）。

2. 运行安装程序

双击安装包，按提示完成安装（默认路径为 C:\Users\<用户名>\.ollama）。
安装完成后，验证是否成功：
```
ollama --version
```
若输出版本号（如 ollama version 0.xx.xx），则安装成功。

环境变量配置

1. 基础路径配置

目的: 确保命令行全局调用 ollama 命令。
步骤:
1. 右键 此电脑 → 属性 → 高级系统设置 → 环境变量。
2. 在 系统变量 中选中 Path → 编辑 → 新建，添加路径：
```
C:\Users\<你的用户名>\.ollama\bin
```
3. 替换 <你的用户名> 为实际用户名（如 C:\Users\John\.ollama\bin）。

2. 高级环境变量配置

通过以下变量优化存储、性能和网络行为：

变量名	作用说明	默认值	推荐设置示例
OLLAMA_MODELS	模型文件存储路径（避免占用C盘空间）	`C:\Users\%username%\.ollama\models`	`D:\OllamaModels`
OLLAMA_HOST	服务监听地址（允许局域网访问需修改）	`127.0.0.1`	`0.0.0.0`（开放所有IP）
OLLAMA_PORT	服务监听端口	`11434`	`8080`（端口冲突时修改）
OLLAMA_ORIGINS	允许的HTTP请求来源（`*`表示允许所有）	无（默认仅本地访问）	`*`
OLLAMA_KEEP_ALIVE	模型内存驻留时间（减少重复加载耗时）	`5m`（5分钟）	`24h`（24小时）
OLLAMA_NUM_PARALLEL	并发请求处理数（提升吞吐量）	`1`（单并发）	`4`（根据CPU核心数调整）
OLLAMA_MAX_QUEUE	最大请求队列长度（队列满时丢弃新请求）	`512`	`1024`（高并发场景调整）
OLLAMA_DEBUG	启用调试日志（排查问题时开启）	无（默认关闭）	`1`
OLLAMA_MAX_LOADED_MODELS	内存中同时加载的最大模型数量	`1`	`2`（根据内存容量调整）

配置方法（任选其一）：

图形界面：通过系统属性添加环境变量

命令行（管理员权限）：

setx OLLAMA_MODELS "D:\OllamaModels" /M
setx OLLAMA_HOST "0.0.0.0" /M
setx OLLAMA_KEEP_ALIVE "24h" /M

3. 验证配置

打开新命令行窗口，检查变量是否生效：
```
echo %OLLAMA_MODELS%
echo %OLLAMA_HOST%
```
启动服务验证监听状态：
```
ollama serve
```
若输出显示 Listening on 0.0.0.0:11434（或自定义端口），则配置成功。

Ollama常用指令

指令	功能描述	示例
`ollama run <模型名>`	运行指定模型	`ollama run llama2`
`ollama list`	列出已下载的模型	`ollama list`
`ollama ps`	查看当前运行的模型实例	`ollama ps`
`ollama pull <模型名>`	下载模型（不直接运行）	`ollama pull mistral`
`ollama rm <模型名>`	删除指定模型	`ollama rm llama2`
`ollama serve`	启动本地API服务（默认端口11434）	`ollama serve`

基础使用示例

1. 运行Llama 2模型

ollama run llama2

首次运行会自动下载模型文件（约4GB）。
输入 /? 查看交互帮助，按 Ctrl+D 退出。

2. 通过API调用

启动服务后，可通过HTTP请求调用：

curl http://localhost:11434/api/generate -d '{
  "model": "llama2",
  "prompt": "Hello"
}'

常见问题处理

1. 命令未识别 (`'ollama' is not recognized`)

原因: 环境变量未生效。
解决:
1. 检查环境变量路径是否正确。
2. 重启命令行工具或系统。

2. 模型下载失败

原因: 网络连接问题。
解决:
1. 使用代理工具（如配置HTTP_PROXY环境变量）。
2. 尝试手动下载模型文件。

3. 显存不足 (`CUDA out of memory`)

解决:
1. 选择更小模型（如 tinyllama）。
2. 关闭其他占用GPU资源的程序。

附：推荐模型列表

模型名称	大小	适用场景
`llama2`	4GB	通用文本生成
`mistral`	5GB	多语言支持
`codellama`	7GB	代码生成与补全
`tinyllama`	1.1GB	低资源环境

总结

本文档提供了Ollama在Windows系统的完整安装与配置流程，涵盖基础指令和常见问题解决方案。后续将深入探讨模型微调、API集成及性能优化。如有问题，请参考 Ollama官方文档。

文章目录

- 大模型本地化部署（一）——Ollama安装教程（Windows版）
- - 环境要求
  - 安装步骤
  - - 1. 下载安装包
    - 2. 运行安装程序
  - 环境变量配置
  - - 1. 基础路径配置
    - 2. 高级环境变量配置
    - 3. 验证配置
  - Ollama常用指令
  - 基础使用示例
  - - 1. 运行Llama 2模型
    - 2. 通过API调用
  - 常见问题处理
  - - 1. 命令未识别 (`'ollama' is not recognized`)
    - 2. 模型下载失败
    - 3. 显存不足 (`CUDA out of memory`)
  - 附：推荐模型列表
  - 总结

大模型本地化部署（一）——Ollama安装教程（Windows版）

环境要求

操作系统: Windows 10/11（64位）
内存: 建议8GB及以上（运行大模型需更高内存）
存储空间: 至少10GB可用空间（模型文件通常较大）
网络: 需稳定连接（下载模型依赖网络）

安装步骤

1. 下载安装包

访问 Ollama官网下载页，选择 Download for Windows 获取安装程序（OllamaSetup.exe）。

2. 运行安装程序

双击安装包，按提示完成安装（默认路径为 C:\Users\<用户名>\.ollama）。
安装完成后，验证是否成功：
```
ollama --version
```
若输出版本号（如 ollama version 0.xx.xx），则安装成功。

环境变量配置

1. 基础路径配置

目的: 确保命令行全局调用 ollama 命令。
步骤:
1. 右键 此电脑 → 属性 → 高级系统设置 → 环境变量。
2. 在 系统变量 中选中 Path → 编辑 → 新建，添加路径：
```
C:\Users\<你的用户名>\.ollama\bin
```
3. 替换 <你的用户名> 为实际用户名（如 C:\Users\John\.ollama\bin）。

2. 高级环境变量配置

通过以下变量优化存储、性能和网络行为：

变量名	作用说明	默认值	推荐设置示例
OLLAMA_MODELS	模型文件存储路径（避免占用C盘空间）	`C:\Users\%username%\.ollama\models`	`D:\OllamaModels`
OLLAMA_HOST	服务监听地址（允许局域网访问需修改）	`127.0.0.1`	`0.0.0.0`（开放所有IP）
OLLAMA_PORT	服务监听端口	`11434`	`8080`（端口冲突时修改）
OLLAMA_ORIGINS	允许的HTTP请求来源（`*`表示允许所有）	无（默认仅本地访问）	`*`
OLLAMA_KEEP_ALIVE	模型内存驻留时间（减少重复加载耗时）	`5m`（5分钟）	`24h`（24小时）
OLLAMA_NUM_PARALLEL	并发请求处理数（提升吞吐量）	`1`（单并发）	`4`（根据CPU核心数调整）
OLLAMA_MAX_QUEUE	最大请求队列长度（队列满时丢弃新请求）	`512`	`1024`（高并发场景调整）
OLLAMA_DEBUG	启用调试日志（排查问题时开启）	无（默认关闭）	`1`
OLLAMA_MAX_LOADED_MODELS	内存中同时加载的最大模型数量	`1`	`2`（根据内存容量调整）

配置方法（任选其一）：

图形界面：通过系统属性添加环境变量

命令行（管理员权限）：

setx OLLAMA_MODELS "D:\OllamaModels" /M
setx OLLAMA_HOST "0.0.0.0" /M
setx OLLAMA_KEEP_ALIVE "24h" /M

3. 验证配置

打开新命令行窗口，检查变量是否生效：
```
echo %OLLAMA_MODELS%
echo %OLLAMA_HOST%
```
启动服务验证监听状态：
```
ollama serve
```
若输出显示 Listening on 0.0.0.0:11434（或自定义端口），则配置成功。

Ollama常用指令

指令	功能描述	示例
`ollama run <模型名>`	运行指定模型	`ollama run llama2`
`ollama list`	列出已下载的模型	`ollama list`
`ollama ps`	查看当前运行的模型实例	`ollama ps`
`ollama pull <模型名>`	下载模型（不直接运行）	`ollama pull mistral`
`ollama rm <模型名>`	删除指定模型	`ollama rm llama2`
`ollama serve`	启动本地API服务（默认端口11434）	`ollama serve`

基础使用示例

1. 运行Llama 2模型

ollama run llama2

首次运行会自动下载模型文件（约4GB）。
输入 /? 查看交互帮助，按 Ctrl+D 退出。

2. 通过API调用

启动服务后，可通过HTTP请求调用：

curl http://localhost:11434/api/generate -d '{
  "model": "llama2",
  "prompt": "Hello"
}'

常见问题处理

1. 命令未识别 (`'ollama' is not recognized`)

原因: 环境变量未生效。
解决:
1. 检查环境变量路径是否正确。
2. 重启命令行工具或系统。

2. 模型下载失败

原因: 网络连接问题。
解决:
1. 使用代理工具（如配置HTTP_PROXY环境变量）。
2. 尝试手动下载模型文件。

3. 显存不足 (`CUDA out of memory`)

解决:
1. 选择更小模型（如 tinyllama）。
2. 关闭其他占用GPU资源的程序。

附：推荐模型列表

模型名称	大小	适用场景
`llama2`	4GB	通用文本生成
`mistral`	5GB	多语言支持
`codellama`	7GB	代码生成与补全
`tinyllama`	1.1GB	低资源环境

总结

本文标签：保姆模型教程 ollama

版权声明：本文标题：大模型本地化部署（一）——Ollama保姆级安装教程内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1754782935a2727774.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

369IT编程

大模型本地化部署（一）——Ollama保姆级安装教程

文章目录

大模型本地化部署（一）——Ollama安装教程（Windows版）

环境要求

安装步骤

1. 下载安装包

2. 运行安装程序

环境变量配置

1. 基础路径配置

2. 高级环境变量配置

3. 验证配置

Ollama常用指令

基础使用示例

1. 运行Llama 2模型

2. 通过API调用

常见问题处理

1. 命令未识别 ('ollama' is not recognized)

2. 模型下载失败

3. 显存不足 (CUDA out of memory)

附：推荐模型列表

总结

文章目录

大模型本地化部署（一）——Ollama安装教程（Windows版）

环境要求

安装步骤

1. 下载安装包

2. 运行安装程序

环境变量配置

1. 基础路径配置

2. 高级环境变量配置

3. 验证配置

Ollama常用指令

基础使用示例

1. 运行Llama 2模型

2. 通过API调用

常见问题处理

1. 命令未识别 ('ollama' is not recognized)

2. 模型下载失败

3. 显存不足 (CUDA out of memory)

附：推荐模型列表

总结

更多相关文章

Blender入门之各版本下载教程（windows系统）

BIM Revit2017下载安装教程及安装包

mac 软件打包流程 packages打包教程

carsim2020.0安装教程，并与matlab 2021b关联

文件搜索神器-Everything下载安装及使用教程

入侵手机教程是怎么通过木马程序入侵你的手机的

keil3 安装教程

三星SM-T325平板ROOT权限获取完整教程

华硕电脑怎么配置java环境变量_win10系统JDK8安装环境配置教程

超详细教程：如何在笔记本上run起大模型？没有GPU也可以！

MacBook Pro M4 Max vs. RTX 40905090笔记本：个人开发者如何选择大模型训练推理设备？

火车头采集中英文翻译教程

Windows 安装配置及卸载MySQL8超详细保姆级教程

MySQL 8 安装教程(windows 64位)

Windows 中的 Ollama

大模型【Qwen2-7B本地部署（WEB版）】（windows）

【2021819-最新教程】Windows安装MongoDB及配置（超详细）

深度学习PyTorch，TensorFlow中GPU利用率较低，CPU利用率很低，且模型训练速度很慢的问题总结与分析

神舟战神换cpu教程_神舟战神能换什么cpu 神舟战神Z7可以换CPU吗

计算机怎么弄64位,64位系统怎么装？安装64位系统教程

发表评论

推荐文章

安卓200道面试题

C盘清理瘦身就这三招，收好下次不必到处找。

恢复我的计算机,SONY China Service-如何使用VAIO Care恢复和还原我的计算机？

用手机模拟加密门禁卡【不用电脑】

QT6.1.2下载和安装教程

热门文章

宇宙最强下载器：IDM 俄罗斯大神版

RK3568与TTL读卡器的适配之旅：解锁高效数据交互新姿势

手机怎么升级android版本,安卓系统怎么升级？三种手机安卓系统升级方法教程...

新文档

AccuRev开发流程

中望CAD 机械 v2024 激活版详细安装教程 (CAD三维制图)

在windows下利用docker从私有库上传下载镜像

技术文档如何做到针对性保护|文件加密软件推荐八款好用加密软件

视频去声音 免费中文版声音处理软件 轻松教你去除视频声音

1. 命令未识别 (`'ollama' is not recognized`)

3. 显存不足 (`CUDA out of memory`)

1. 命令未识别 (`'ollama' is not recognized`)

3. 显存不足 (`CUDA out of memory`)

视频去声音免费中文版声音处理软件轻松教你去除视频声音

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程