Tabula相册整理工具2026
27.5MB · 2026-04-07
诸神缄默不语-个人技术博文与视频目录
在这一章介绍的是,已经有了AI大模型推理服务(不管是云端API还是本地服务),想要一个像聊天框那样的界面来跟大模型聊天、或者让大模型做更复杂的工作。
本章主要考虑的功能还是AI对话,包括工具调用、知识检索增强。现在有一批以OpenClaw为首的、更重视聊天通道接入+本地工具操作的智能体工具,关注点不太一样,但是都可以做一样的事,我随后的文章会更详细地针对不同的角度进行介绍。OpenClaw使用腾讯云部署的操作教程可以参考我写的另一篇博文:如何用腾讯云轻量应用服务器内置OpenClaw应用搭建OpenClaw并接入QQ、飞书机器人,下载skill,开启对话
| 工具 | 一句话定位 | 最佳场景 | 特色功能 | 上手难度 |
|---|---|---|---|---|
| AnythingLLM | 企业级 RAG 知识库应用 | 文档问答、私有知识管理 | 全文档格式支持、多工作区、内置网页爬虫 | ⭐⭐ 较低 |
| Cherry Studio | 全能型多模型 AI 工作平台 | 多模型切换、跨平台使用 | 300+ 预置助手、知识库、本地数据存储 | ⭐ 极低 |
| ChatBox | 轻量级跨平台 AI 聊天客户端 | 日常对话、多端同步 | 极简设计、多模型支持、本地存储 | ⭐ 极低 |
| FastGPT | 开源 LLM 应用开发平台 | 复杂工作流编排、Agent 构建 | 可视化工作流、RAG 检索、搜索引擎集成 | ⭐⭐⭐ 中等 |
| OpenClaw | 全权限 AI 智能体(原 Clawdbot) | 自动化任务、代码生成执行 | 控制电脑执行命令、插件生态 | ⭐⭐⭐ 中等 |
| Memu | 具备长期记忆的主动式助手 | 个人助理、习惯学习 | 本地知识图谱、跨会话记忆 | ⭐⭐⭐ 中等 |
| Nanobot | 基于 MCP 的超轻量 CLI 智能体 | 开发者自定义工具链 | MCP 协议、模块化、极低资源 | ⭐⭐⭐⭐ 较难 |
| LM Studio | 开箱即用的桌面 GUI | 模型探索与可视化交互 | 内置模型市场、API 服务 | ⭐ 极低 |
| Jan | 开源跨平台桌面应用 | 日常使用、简单对话 | 完全开源、本地优先 | ⭐ 极低 |
| Open WebUI | 浏览器端 ChatGPT 克隆 | 团队共享、多用户访问 | 类 ChatGPT 界面、多模型切换 | ⭐⭐ 较低 |
核心定位: 一款隐私优先的 AI 应用,特别擅长做一件事——让你与自己的文档对话。支持 PDF、TXT、DOCX、Excel 等几乎所有文档格式,还能爬取网页内容构建知识库。
优点:
缺点:
核心定位: 一款支持 Windows、macOS、iOS 的 AI 客户端,主打“一个工具,调用所有模型”。内置 300+ 预配置的 AI 助手,覆盖写作、编程、翻译等场景。
优点:
缺点:
核心定位: 一款轻量级的 AI 聊天客户端,主打“小而美”。支持 Windows、macOS、Linux,还能在移动端使用。
优点:
缺点:
核心定位: 一款开源的 LLM 应用开发平台,强调可视化工作流编排。可以像搭积木一样构建复杂的 AI 应用,支持 RAG 检索、工具调用和多步推理。
优点:
缺点:
核心定位: 一个赋予 AI 操控你电脑权限的智能体框架。它可以执行命令、操作文件、发送消息、部署代码——前提是你敢给它这个权限。
优点:
缺点:
核心定位: 一个具备长期记忆能力的 AI 助手。传统聊天工具在会话结束后就“失忆”了,但 Memu 会构建本地知识图谱,记录你的偏好、过往项目和习惯。
优点:
缺点:
核心定位: 一个基于模型上下文协议(MCP)构建的超轻量级命令行智能体。它不试图包揽一切,而是让你像搭积木一样组装自己的 AI 工具链。
优点:
缺点:
本地模型的知识截止于训练完成那一刻,要让 AI 获取最新信息,就需要联网搜索能力。
主流方案对比:
| 方案 | 实现方式 | 优点 | 缺点 |
|---|---|---|---|
| SearXNG | 自托管元搜索引擎 | 隐私友好、免费、聚合多引擎结果 | 需要自己部署 |
| 内置搜索插件 | 工具自带(如 FastGPT) | 开箱即用 | 依赖特定工具 |
| 自定义搜索 API | 接入 Bing/Google API | 结果质量高 | 需要 API Key、有费用 |
实战案例——FastGPT + SearXNG:
RAG(检索增强生成)是目前本地知识库的核心技术。简单说就是:用户提问 → 去知识库里找相关内容 → 把问题和相关内容一起发给 AI → AI 基于这些信息回答。
主流工具 RAG 能力对比:
| 工具 | 文档格式支持 | 分块策略 | 嵌入模型 | 重排序 |
|---|---|---|---|---|
| AnythingLLM | PDF/Word/Excel/TXT/网页 | 可配置 | 多种可选 | 支持 |
| Cherry Studio | 文本为主 | 内置 | 内置 | 不支持 |
| FastGPT | 丰富(需配置) | 可配置 | bge-m3 等 | 支持 reranker |
| ChatBox | 基础 | 简单 | 依赖模型 | 不支持 |
实战案例——FastGPT 知识库搭建:
工具调用是区分“聊天机器人”和“AI 智能体”的关键能力。让 AI 不仅能回答问题,还能执行操作——发送邮件、创建文件、调用 API 等。
工具调用能力对比:
| 工具 | 调用方式 | 安全性 | 适用场景 |
|---|---|---|---|
| OpenClaw | 直接执行系统命令 | ️ 高风险 | 自动化开发任务 |
| Nanobot | MCP 协议调用 | 较高(容器隔离) | 开发者工具链 |
| FastGPT | 工作流内置工具 | 可控 | 企业应用 |
| Memu | 内置执行器 | 中等 | 个人助理 |
MCP(模型上下文协议)是什么? MCP 是一种新兴的标准化协议,让 AI 应用可以像调用 API 一样调用外部工具。Nanobot 就是基于 MCP 构建的代表性工具。
根据你的实际需求,沿着这条路径找到最适合的工具:
开始
│
├─ 你需要什么?
│ │
│ ├─ 纯聊天 + 多模型切换
│ │ └─ 要跨平台同步?→ Cherry Studio
│ │ └─ 只要轻量、极简?→ ChatBox
│ │ └─ 想要开源的桌面端?→ Jan
│ │
│ ├─ 知识库问答(读懂我的文档)
│ │ └─ 企业级、格式多、要私有化?→ AnythingLLM
│ │ └─ 需要复杂工作流 + 搜索引擎?→ FastGPT
│ │ └─ 个人用、简单知识库?→ Cherry Studio
│ │
│ ├─ AI 智能体(让 AI 干活)
│ │ └─ 你是极客、追求最强能力?→ OpenClaw(记得上 Docker)
│ │ └─ 你要长期记忆、个人助理?→ Memu
│ │ └─ 你是开发者、要定制工具链?→ Nanobot
│ │
│ └─ 模型探索、可视化体验
│ └─ 要开箱即用、完全离线?→ LM Studio
│
└─ 不确定?从 AnythingLLM + Ollama 开始,这是最稳妥的组合
以 AnythingLLM + Ollama 为例,30 分钟搭建一个能读懂你文档的 AI 助手。
ollama pull llama3.2访问 anythingllm.com 下载对应平台的安装包。
效果测试: 上传一份公司内部制度文档后,问:“我们的年假有几天?”AI 会基于文档内容回答,而不是凭空猜测。
从本地模型部署到友好的 Chat UI,再到能理解你文档、执行你任务的智能体——2026 年的本地 AI 工具生态已经相当成熟。
一个务实的建议:从“AnythingLLM + Ollama”开始。这是最低门槛的组合,能让你立即体验到本地知识库问答的魅力。当你需要更复杂的能力(联网搜索、工作流编排、工具调用)时,再逐步引入 FastGPT 或探索 OpenClaw 等智能体工具。
AI 的能力再强,也需要一个入口让你使用它。选择合适的 UI 和智能体工具,就是为你的本地 LLM 配上“嘴巴”和“手脚”,让它真正为你所用。