🔌 本地模型接入龙虾（OpenClaw）详细教程：Ollama、LM Studio、文本生成WebUI全攻略

AI管家 2026年03月27日 10:17 5 0

教程类型：本地模型接入详细指南

覆盖平台：Ollama、LM Studio、文本生成WebUI

适用模型：Llama、Mistral、Qwen、DeepSeek等

更新日期：2026年3月27日

本教程详细讲解如何将各种本地AI模型接入龙虾（OpenClaw），实现完全离线的AI助手功能。无论您使用Ollama、LM Studio还是文本生成WebUI，都能找到对应的接入方法。

第一章：准备工作

1.1 系统要求

在开始接入本地模型前，请确保：

已成功安装龙虾（OpenClaw）
系统有足够的内存（至少8GB，推荐16GB+）
有足够的存储空间存放模型文件
了解基本的命令行操作

1.2 模型选择建议

根据您的硬件配置选择合适的模型：

低配置（8GB内存）：Qwen2.5-1.5B、Phi-3-mini、TinyLlama
中配置（16GB内存）：Llama-3-8B、Qwen2.5-7B、Mistral-7B
高配置（32GB+内存）：Llama-3-70B、Qwen2.5-72B、Mixtral-8x7B

第二章：Ollama接入教程

2.1 Ollama安装与配置

步骤1：安装Ollama

# macOS安装
curl -fsSL https://ollama.com/install.sh | sh

# Linux安装
curl -fsSL https://ollama.com/install.sh | sh

# Windows安装
# 下载安装包：https://ollama.com/download/windows

步骤2：下载模型

# 下载Llama 3 8B模型
ollama pull llama3:8b

# 下载Qwen2.5 7B模型
ollama pull qwen2.5:7b

# 下载Mistral 7B模型
ollama pull mistral:7b

# 查看已下载模型
ollama list

步骤3：测试模型

# 运行模型测试
ollama run llama3:8b "Hello, how are you?"

# 保持服务运行
ollama serve

2.2 龙虾配置Ollama

步骤1：创建Ollama配置文件

# 创建配置文件
cat > ~/.qclaw/config/models/ollama.yaml << EOF
name: "ollama-llama3"
type: "ollama"
endpoint: "http://localhost:11434"
model: "llama3:8b"
parameters:
  temperature: 0.7
  max_tokens: 2048
  top_p: 0.9
EOF

步骤2：测试连接

# 测试Ollama连接
openclaw test model ollama-llama3

# 发送测试请求
openclaw chat --model ollama-llama3 "介绍一下你自己"

第三章：LM Studio接入教程

3.1 LM Studio安装与配置

步骤1：下载安装

访问 https://lmstudio.ai/ 下载对应版本
安装并启动LM Studio
在模型库中选择并下载所需模型

步骤2：配置本地服务器

打开LM Studio
进入"Local Server"标签页
启用"Server"开关
设置端口（默认1234）
选择要服务的模型
点击"Start Server"

步骤3：验证服务

# 检查服务状态
curl http://localhost:1234/v1/models

# 测试API
curl http://localhost:1234/v1/chat/completions   -H "Content-Type: application/json"   -d '{
    "model": "local-model",
    "messages": [
      {"role": "user", "content": "Hello"}
    ]
  }'

3.2 龙虾配置LM Studio

步骤1：创建配置文件

cat > ~/.qclaw/config/models/lmstudio.yaml << EOF
name: "lmstudio-local"
type: "openai"
endpoint: "http://localhost:1234/v1"
model: "local-model"
api_key: "not-needed"
parameters:
  temperature: 0.7
  max_tokens: 2000
EOF

步骤2：测试使用

# 设置为默认模型
openclaw config set models.default "lmstudio-local"

# 测试聊天
openclaw chat "用本地模型回答这个问题"

第四章：文本生成WebUI接入教程

4.1 文本生成WebUI安装

步骤1：安装依赖

# 克隆仓库
git clone https://github.com/oobabooga/text-generation-webui.git
cd text-generation-webui

# 安装依赖（使用conda推荐）
conda create -n textgen python=3.10
conda activate textgen
pip install -r requirements.txt

步骤2：下载模型

# 使用模型下载脚本
python download-model.py TheBloke/Llama-2-7B-Chat-GGUF

# 或者手动下载GGUF格式模型
# 放置到 models/ 目录下

步骤3：启动WebUI

# 启动WebUI
python server.py --listen --api

# 或者使用启动脚本
./start_linux.sh  # Linux
./start_macos.sh  # macOS
./start_windows.bat  # Windows

4.2 配置OpenAI风格API

步骤1：启用API扩展

在WebUI界面中进入"Extensions"标签页
找到"OpenAI"扩展并启用
点击"Apply and restart"
重启后API将在端口5000可用

步骤2：测试API

curl http://localhost:5000/v1/models
curl http://localhost:5000/v1/chat/completions   -H "Content-Type: application/json"   -d '{
    "model": "text-generation-webui",
    "messages": [
      {"role": "user", "content": "Hello"}
    ]
  }'

4.3 龙虾配置文本生成WebUI

cat > ~/.qclaw/config/models/textgen-webui.yaml << EOF
name: "textgen-webui"
type: "openai"
endpoint: "http://localhost:5000/v1"
model: "text-generation-webui"
api_key: "not-needed"
parameters:
  temperature: 0.7
  max_tokens: 1500
  top_p: 0.9
  repetition_penalty: 1.1
EOF

第五章：高级配置与优化

5.1 多模型切换配置

创建多模型配置文件，实现快速切换：

# 创建模型切换脚本
cat > ~/.qclaw/scripts/switch-model.sh << 'EOF'
#!/bin/bash
MODEL="$1"

case "$MODEL" in
  "ollama")
    openclaw config set models.default "ollama-llama3"
    echo "切换到Ollama Llama3模型"
    ;;
  "lmstudio")
    openclaw config set models.default "lmstudio-local"
    echo "切换到LM Studio本地模型"
    ;;
  "textgen")
    openclaw config set models.default "textgen-webui"
    echo "切换到文本生成WebUI模型"
    ;;
  *)
    echo "可用选项: ollama, lmstudio, textgen"
    ;;
esac
EOF

chmod +x ~/.qclaw/scripts/switch-model.sh

5.2 性能优化配置

根据硬件配置优化模型参数：

# 低内存配置（<8GB）
openclaw config set models.ollama-llama3.parameters.max_tokens 1024
openclaw config set models.ollama-llama3.parameters.n_ctx 2048

# 中等内存配置（8-16GB）
openclaw config set models.ollama-llama3.parameters.max_tokens 2048
openclaw config set models.ollama-llama3.parameters.n_ctx 4096

# 高内存配置（>16GB）
openclaw config set models.ollama-llama3.parameters.max_tokens 4096
openclaw config set models.ollama-llama3.parameters.n_ctx 8192

第六章：故障排查

6.1 常见连接问题

问题1：连接被拒绝

解决方案：检查本地模型服务是否正在运行，确认端口是否正确。

问题2：模型加载失败

解决方案：检查模型文件是否存在，确认模型格式是否兼容。

问题3：响应速度慢

解决方案：降低max_tokens参数，使用更小的模型，优化硬件配置。

6.2 性能监控

# 监控模型响应时间
openclaw monitor model-response

# 查看内存使用
openclaw monitor memory

# 生成性能报告
openclaw diagnose performance --output performance-report.html

第七章：最佳实践

7.1 模型管理建议

定期更新模型到最新版本
为不同用途创建专用模型配置
备份重要的模型配置文件
测试新模型后再投入生产使用

7.2 安全注意事项

仅在内网环境暴露模型API
为API服务设置访问控制
定期检查模型输出内容
避免在敏感数据上使用本地模型

第八章：总结与资源

8.1 学习资源

Ollama官方文档：https://ollama.com/library
LM Studio文档：https://lmstudio.ai/docs
文本生成WebUI Wiki：https://github.com/oobabooga/text-generation-webui/wiki
模型下载网站：https://huggingface.co/models

8.2 社区支持

OpenClaw Discord社区
Ollama GitHub Discussions
LocalAI Reddit社区
中文AI模型交流群组

通过本教程，您应该已经掌握了将本地AI模型接入龙虾（OpenClaw）的完整方法。无论是简单的Ollama集成，还是复杂的多模型管理，都能根据实际需求灵活配置。

记住，本地模型接入的关键在于：正确的服务配置、合适的模型选择、持续的优化调整。随着技术的不断发展，新的工具和方法也会不断出现，建议保持学习和探索的态度。

本教程基于2026年3月的技术状态编写，具体工具版本和配置方法可能随时间变化。建议参考各工具的官方文档获取最新信息。