您的位置: 首页> 数据库

React 开发者进阶：RAG 核心——手把手带你玩转 Milvus 向量数据库

匿名上传

发布时间:2026-03-09 08:00:01

前言：给 React 开发者的“降维打击”

嗨，前端的小伙伴们！作为 React 开发者，你一定对 State、Props、Component 如数家珍。但在这个 AI 席卷一切的时代，你是否想过：如何给你的应用装上一个“无限容量的大脑”？

你可能已经接入了 OpenAI 的 API，做过 Chatbot。但你有没有发现，当你问 AI 一些它训练数据之外的知识（比如你们公司的内部文档、你的私人日记）时，它就开始一本正经地胡说八道了？这就是 “幻觉” (Hallucination)。

为了解决这个问题，RAG (Retrieval-Augmented Generation，检索增强生成) 技术横空出世。而在 RAG 的架构中，有一个核心组件，它像海马体一样负责长时记忆，它就是——向量数据库 (Vector Database)。

今天，我们将以 Milvus 为例，带你从零开始构建一个“AI 日记助手”的后端核心。别担心，我们用的是大家最熟悉的 JavaScript (Node.js)！Let's Rock!

第一部分：什么是 Milvus？它和 MySQL 有什么区别？

Milvus 是世界上最流行的开源向量数据库之一。在 AI Agent 产品（如 Agentci AI）中，Milvus 几乎是标配。

️ 向量数据库 vs 普通数据库

想象一下你走进图书馆：

普通数据库 (MySQL/PostgreSQL) 像是一个严谨的图书管理员。你告诉它：“我要找《哈利波特与魔法石》第 10 页第 5 行”，它能精准地给你。但如果你问：“我要找一本关于勇敢的小男孩打败坏蛋的书”，它可能就懵圈了，除非书名里刚好有这几个字。
向量数据库 (Milvus) 像是一个懂你的朋友。你问：“找点热血的、魔法感强的书”，它能立刻理解你的意图，哪怕书名里没有“热血”这两个字，它也能通过语义相似度把《哈利波特》推荐给你。

特性	普通数据库 (Relational DB)	向量数据库 (Vector DB)
核心数据	结构化数据 (String, Int, Boolean)	向量 (Vectors/Embeddings)
查询方式	精确匹配 (`WHERE id = 1`)	相似度搜索 (KNN, ANN)
擅长领域	事务处理、精确记录	非结构化数据检索 (文本、图像、视频搜索)
底层逻辑	B+ 树等索引	倒排索引、量化索引 (IVF, HNSW)

对于前端开发者来说，你可以这样理解：

前端：负责展示文章列表、详情页、Chatbot 界面。
后端：
- MySQL：负责 CRUD（增删改查）基础业务数据。
- Milvus：负责 Embedding（文本嵌入）和 Retriever（检索），解决“根据意思找内容”的问题。

️ 第二部分：实战代码详解 —— 打造你的 AI 日记本

我们将基于一段真实的 Node.js 代码 demo/1.mjs 来讲解。这段代码演示了如何将几篇日记存入 Milvus，并根据用户的自然语言描述（比如“我想看户外的日记”）找到对应的记录。

1️⃣ 引入 SDK 与定义数据类型

首先，看代码的前几行。这就像我们在 React 里引入组件一样，我们要引入 Milvus 的 SDK。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
import {
    MilvusClient,
    DataType,
    IndexType,
    MetricType
} from '@zilliz/milvus2-sdk-node';

深度解析：

MilvusClient: 我们的主角，用于连接 Milvus 服务器。
DataType: 划重点！ 这是 Milvus 的数据类型定义。
- FloatVector: 核心中的核心，浮点向量。用来存储 Embedding 后的数组。
- VarChar, Int64: 标量字段，用于存储元数据（比如日记的标题、日期）。
- Array: 数组类型，比如标签 ['开心', '旅游']。
IndexType: 索引类型。没有索引，查询就像在图书馆一本本翻书；有了索引，就像查目录。
MetricType: 度量类型。决定了怎么计算两个向量像不像（是算距离还是算角度）。

2️⃣ 关键常量：维度的秘密

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
const VECTOR_DIM = 1536;

硬核知识点：为什么是 1536？ 这个数字不是随便写的！它必须与你使用的 Embedding 模型输出的维度严格一致。

如果你用 OpenAI 的 text-embedding-3-small 或 text-embedding-ada-002，它们生成的向量就是 1536 维的数组。
切记：建表时的维度如果和插入数据的维度不一致，报错会让你怀疑人生！

3️⃣ 实例化客户端：连接云端大脑

接下来，我们要连接到 Milvus 实例。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
const client = new MilvusClient({
    address: ADDRESS,
    token: TOKEN,
});

这里的 ADDRESS 和 TOKEN 可以在 Zilliz Cloud (Milvus 的托管云服务) 上获取。 Zilliz Cloud: 这是一个全托管的 Milvus 服务，省去了自己维护 Docker/K8s 的痛苦。

Address: 类似于 in03-ebb1...zilliz.com.cn:19530。
Token: 鉴权密钥，保护你的数据不被偷看。

连接之后，一定要做健康检查！这就好比 React 组件 componentDidMount 后先看看数据回没回来。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
console.log("正在连接Milvus...");
const checkHealth = await client.checkHealth();
if(!checkHealth) {
    console.error('连接Milvus失败');
    return;
}
console.log('连接Milvus成功');

4️⃣ 建表 (Create Collection)：设计你的记忆宫殿

在 Milvus 里，Table 被称为 Collection（集合）。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
     await client.createCollection({
         collection_name: COLLECTION_NAME,
         fields: [
             {
                 name: 'id',
                 data_type: DataType.VarChar, // 主键
                 max_length: 50,
                 is_primary_key: true,
             },
             {
                 name: 'vector',
                 data_type: DataType.FloatVector, // 核心：存储向量
                 dim: VECTOR_DIM, // 必须匹配！1536
             },
             {
                 name: 'content',
                 data_type: DataType.VarChar, // 存储原始文本
                 max_length: 5000,
             },
             // ... 其他字段 (date, mood, tags)
         ]
     });

设计哲学： 我们不仅存了 vector，还存了 content、mood 等。为什么？这叫 “标量与向量混合查询” (Hybrid Search)。比如用户搜：“开心的户外运动”。

向量搜索负责找到“户外运动”语义相关的记录。
标量过滤负责筛选 mood == 'happy' 的记录。 Milvus 支持在一次查询中同时搞定这两件事，效率极高。

5️⃣ 创建索引 (Create Index)：让查询飞起来

数据存进去了，如果不建索引，查询就是暴力扫描（Brute-force），速度慢且消耗资源。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
     await client.createIndex({
         collection_name: COLLECTION_NAME,
         field_name: 'vector', // 对向量字段建索引
         index_type: IndexType.IVF_FLAT,
         metric_type: MetricType.COSINE,
         params: {
             nlist: VECTOR_DIM, // 聚类参数
         }
     })

硬核参数解析：

IndexType.IVF_FLAT: 倒排文件索引。
- 原理：把向量空间切分成很多个“格子”（Cluster）。查询时，先看查询向量落在哪个格子里，然后只搜这个格子和它附近的格子。
- HNSW: 另一种更高级的索引，在内存充足时，查询速度和精度通常优于 IVF。
MetricType.COSINE (余弦相似度):
- L2 (欧式距离): 计算两点之间的直线距离。
- COSINE (余弦): 关注方向。在 NLP (自然语言处理) 中，我们通常只关心两段话的话题方向是否一致，而不关心文本长短，所以 Cosine 是 RAG 的首选。

6️⃣ 加载集合 (Load Collection)：热身运动

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
    await client.loadCollection({
        collection_name: COLLECTION_NAME,
    })

️ 注意：在 Milvus 中，数据存储（磁盘）和计算（内存）是分离的。创建了 Collection 和 Index 后，数据只是静静地躺在磁盘里。要进行搜索，必须显式地调用 loadCollection 把索引加载到内存中。不 Load 直接搜，会报错！

7️⃣ 数据准备与 Embedding：赋予机器理解力

这里我们准备了一些日记数据。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
     const diaryContents = [
               {
                 id: 'diary_001',
                 content: '今天天气很好，去公园散步了...',
                 // ...
                 tags: ['生活', '散步']
               },
               // ... 更多日记
             ];

接下来是最关键的一步：Embedding。我们需要调用 OpenAI 的接口，把 content 里的中文变成 1536 维的向量。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
     const diaryData = await Promise.all(
         diaryContents.map(async (entry) => ({
             ...entry,
             vector: await getEmbeddings(entry.content), // 转换核心
         }))
     );

这一步是 RAG 的“写入”流程：Raw Text -> Embedding Model -> Vector -> DB。

8️⃣ 插入数据 (Insert)：记忆存储

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
     const inserRes = await client.insert({
         collection_name: COLLECTION_NAME,
         data: diaryData
     })

insert 操作是原子的。Milvus 是列式存储，但在 SDK 层面，我们通常以行（Row-based）的形式传入 JSON 数组，SDK 会自动帮我们转换。

9️⃣ 语义检索 (Search)：见证奇迹的时刻

用户输入了：“我想看看关于户外活动的日记”。这句自然语言，数据库是看不懂的。我们必须先把它也变成向量！

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
    const query = "我想看看关于户外活动的日记";
    const queryVector = await getEmbeddings(query); // 1. 问题向量化

然后，拿着这个 queryVector 去数据库里找“长得像”的向量。

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
    const searchResult = await client.search({
        collection_name: COLLECTION_NAME,
        vectors: queryVector, // 注意这里可以一次传多个向量进行批量搜
        limit: 3, // Top K：只返回最相似的 3 条
        metric_type: MetricType.COSINE, // 必须和建表时一致
        output_fields: ['id', 'content', 'date', 'mood', 'tags'], // 类似于 SQL 的 SELECT *
    })

最后，打印结果：

// c:UsersMRDesktopworkspacelesson_jpaiagentmilvus-testdemo1.mjs
    searchResult.results.forEach(result => {
        console.log(`n 日记ID: ${result.id}`);
        console.log(`内容: ${result.content}`);
        console.log(`日期: ${result.date}`);
        console.log(`心情: ${result.mood}`);
        console.log(`标签: ${result.tags}`);
    })