用自然语言玩转 AI 原生数据库 —— seekdb MCP Server

引言

想象一下:你只需要用自然语言描述你的需求,AI 就能自动帮你完成数据库操作 —— 创建文档集合、插入数据、执行复杂查询,甚至构建一个完整的知识库应用。这不是未来,而是现在就能实现的能力。

seekdb MCP Server 就是实现这一愿景的桥梁。它基于 Anthropic 提出的 MCP(Model Context Protocol)协议,让 AI 助手能够直接与 seekdb 数据库交互,将 “自然语言” 转化为 “数据库操作”。

本文将带你上手 seekdb MCP Server,并通过一个实战案例 —— 通过自然语言构建 AI 应用,让你亲身体验 AI 原生数据库的魅力。

seekdb MCP Server

什么是 seekdb MCP Server?

seekdb 是一款 AI 原生搜索数据库,在统一架构下融合了关系数据、向量数据、全文索引、JSON 和 GIS 能力,支持混合检索和库内 AI 工作流。

MCP Server 则是连接 AI 工具与数据库的”适配器”。通过 MCP 协议,Cursor、Claude Code、Cline 等 AI 工具可以直接访问和操作 seekdb 数据库。

核心能力一览

能力分类 工具列表 功能说明
向量集合管理 create_collectionquery_collectionadd_data_to_collection 创建向量集合、语义搜索、文档管理
高级搜索 full_text_searchhybrid_search 全文搜索、混合搜索(BM25 + 向量)
AI 函数 ai_completeai_rerankcreate_ai_model 调用 LLM 生成文本、重排序搜索结果
AI 记忆系统 seekdb_memory_queryseekdb_memory_insert 跨会话持久化记忆,让 AI “记住”你
数据导入导出 import_csv_file_to_seekdbexport_csv_file_from_seekdb CSV 文件与数据库表/向量集合互转

安装 seekdb 数据库

在使用 seekdb MCP Server 之前,你需要先准备好 seekdb 数据库。seekdb 提供两种部署模式:

模式一:嵌入式模式(零配置,仅限 Linux)

嵌入式模式无需单独安装 seekdb 数据库!seekdb MCP Server 启动时会自动初始化一个本地嵌入式数据库,开箱即用。

适用场景:个人学习、快速原型开发、边缘设备运行。

⚠️ 提示
macOS 和 Windows 用户需要使用「客户端 / 服务器模式」,需要先部署 seekdb 数据库(推荐 Docker 方式),然后配置连接参数。

模式二:客户端/服务器模式(生产推荐)

如果你需要在测试或生产环境部署 seekdb,可以选择以下方式:

方式 1:使用 yum 安装(RPM 系统)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 1. 添加 seekdb 镜像源
sudo yum-config-manager --add-repo https://mirrors.aliyun.com/oceanbase/OceanBase.repo

# 2. 安装 seekdb 和客户端
sudo yum install seekdb obclient

# 3. 启动 seekdb
sudo systemctl start seekdb

# 4. 检查启动状态(状态为 "Service is ready" 表示启动成功)
sudo systemctl status seekdb

# 5. 连接测试
mysql -h127.0.0.1 -uroot -P2881 -A oceanbase

方式 2:使用 Docker(最快捷)

1
2
3
4
5
6
# 一行命令启动 seekdb
sudo docker run -d -p 2881:2881 oceanbase/seekdb

# 如果拉取失败,可使用备用镜像源:
# sudo docker run -d -p 2881:2881 quay.io/oceanbase/seekdb
# sudo docker run -d -p 2881:2881 ghcr.io/oceanbase/seekdb

系统要求

  • CPU:最低 1 核
  • 内存:最低 2 GB 可用内存
  • 支持的操作系统:CentOS 7/8、Ubuntu 20+、Debian 9+、Anolis OS 8、麒麟 V10 等

更多部署方式请参考 seekdb 部署文档[1]


安装 seekdb MCP Server

安装 uv 包管理器

1
2
# 安装 uv 包管理器
curl -LsSf https://astral.sh/uv/install.sh | sh

配置 AI 工具连接

Stdio 模式

以 Cursor 为例,在 Cursor 中打开设置 → Tools & MCP → New MCP Server,根据你的操作系统选择配置方式:

Linux 用户(嵌入式模式)

1
2
3
4
5
6
7
8
{
"mcpServers": {
"seekdb": {
"command": "uvx",
"args": ["seekdb-mcp-server"]
}
}
}

就这么简单!嵌入式模式无需任何配置,服务器启动时会自动初始化一个本地 seekdb 数据库。

macOS / Windows 用户(服务器模式)

macOS 和 Windows 不支持嵌入式模式,需要先部署 seekdb 数据库(推荐使用 Docker),然后配置连接参数:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
{
"mcpServers": {
"seekdb": {
"command": "uvx",
"args": ["seekdb-mcp-server"],
"env": {
"SEEKDB_HOST": "127.0.0.1",
"SEEKDB_PORT": "2881",
"SEEKDB_USER": "",
"SEEKDB_PASSWORD": "",
"SEEKDB_DATABASE": "test"
}
}
}
}

参数说明

参数 说明 默认值
SEEKDB_HOST seekdb 服务器地址 127.0.0.1
SEEKDB_PORT seekdb 服务端口 2881
SEEKDB_USER 数据库用户名
SEEKDB_PASSWORD 数据库密码
SEEKDB_DATABASE 数据库名称

SSE 模式

Linux 用户(嵌入式模式)

直接启动 SSE 服务器:

1
uvx seekdb-mcp-server --transport sse --port 6000

macOS / Windows 用户(服务器模式)

先配置环境变量,再启动服务器:

1
2
3
4
5
6
7
8
9
# 配置 seekdb 连接信息
export SEEKDB_HOST=127.0.0.1
export SEEKDB_PORT=2881
export SEEKDB_USER=
export SEEKDB_PASSWORD=
export SEEKDB_DATABASE=test

# 启动 SSE 服务器
uvx seekdb-mcp-server --transport sse --port 6000

然后在客户端配置:

1
2
3
4
5
6
{
"sse-seekdb": {
"type": "sse",
"url": "http://127.0.0.1:6000/sse"
}
}

实战案例:用 AI 对话构建个人笔记知识库

现在让我们通过一个完整的实战案例,体验 seekdb MCP Server 的强大能力。我们将构建一个个人笔记知识库,实现:

  • ✅ 用自然语言存储笔记
  • ✅ 语义搜索相关内容
  • ✅ 混合搜索精准定位
  • ✅ AI 智能问答

场景设定

假设你是一名技术工作者,平时会记录各种学习笔记、工作心得。现在你希望用 AI 帮你管理这些笔记,并能通过自然语言快速找到需要的内容。

第一步:创建笔记集合

在 AI 工具(如 Cursor)的对话框中输入:

1
创建一个名为 "my_notes" 的知识库集合

AI 响应示例:

我已成功创建名为 “my_notes” 的集合:

  • 维度: 384(向量大小)
  • 距离度量: L2(欧几里得距离)

就这样,一个支持语义搜索的向量集合就创建好了!

第二步:添加笔记内容

继续输入:

1
2
3
4
5
6
7
向 my_notes 中添加以下笔记:

1. "seekdb 支持向量搜索和全文搜索的混合检索,可以同时利用关键词匹配和语义理解"
2. "MCP 协议是 Anthropic 在 2024 年 11 月提出的开源协议,让大模型可以与外部工具交互"
3. "Python 的 asyncio 模块提供了异步编程能力,适合 I/O 密集型任务"
4. "Docker 容器化技术可以实现应用的快速部署和环境隔离"
5. "RAG(检索增强生成)是目前最流行的 AI 应用架构,结合检索和生成能力"

AI 响应示例:

完成!已成功向 “my_notes” 集合添加 5 条笔记:

ID 内容
doc1 seekdb 支持向量搜索和全文搜索的混合检索…
doc2 MCP 协议是 Anthropic 在 2024 年 11 月提出的…
doc3 Python 的 asyncio 模块提供了异步编程能力…
doc4 Docker 容器化技术可以实现应用的快速部署…
doc5 RAG(检索增强生成)是目前最流行的 AI 应用架构…

第三步:语义搜索

现在,让我们用自然语言搜索笔记:

1
在 my_notes 中搜索与 "AI 应用开发" 相关的笔记

AI 响应示例:

以下是与 “AI 应用开发” 相关的笔记,按相关性排序:

排名 内容 相关度
1 RAG(检索增强生成)是目前最流行的 AI 应用架构… 最高
2 MCP 协议是 Anthropic 在 2024 年 11 月提出的…
3 seekdb 支持向量搜索和全文搜索的混合检索…

注意:我们搜索的是 “AI 应用开发”,但笔记中并没有这个确切的词。seekdb 的向量搜索能够理解语义相似性,自动找到相关内容!

第四步:混合搜索

混合搜索结合了关键词匹配语义理解,效果更精准:

1
2
3
对 my_notes 执行混合搜索:
- 全文关键词:"Python"
- 语义查询:"异步编程和并发处理"

AI 响应示例:

排名 内容
1 Python 的 asyncio 模块提供了异步编程能力,适合 I/O 密集型任务
2 Docker 容器化技术可以实现应用的快速部署和环境隔离

混合搜索使用 RRF(倒数排名融合) 算法,综合关键词匹配(BM25)和向量相似度得分,排名结果更准确。

第五步:让 AI 记住你的偏好

seekdb MCP Server 还提供了 AI 记忆系统,让 AI 能够跨会话记住你的信息:

1
记住我是一名 Python 开发者,主要使用 seekdb 做向量搜索应用

AI 响应示例:

已记录!我会记住:

  • 你是一名 Python 开发者
  • 主要使用 seekdb 做向量搜索应用

下次对话时,你可以直接问:

1
根据我的技术背景,推荐一些学习资源

AI 会自动检索你的偏好,给出个性化推荐!

功能一览

向量集合管理

工具 功能
create_collection 创建向量集合
list_collections 列出所有集合
has_collection 检查集合是否存在
peek_collection 预览集合中的文档
add_data_to_collection 添加文档(自动生成向量)
update_collection 更新文档
delete_documents 删除文档
query_collection 向量相似性搜索
delete_collection 删除集合

高级搜索

工具 功能
full_text_search 全文搜索(基于关键词)
hybrid_search 混合搜索(结合全文和向量搜索)

AI 模型工具

工具 功能
create_ai_model 注册 AI 模型(嵌入、文本生成或重排序)
create_ai_model_endpoint 创建将模型连接到 API 服务的端点
drop_ai_model 移除已注册的 AI 模型
drop_ai_model_endpoint 移除 AI 模型端点
ai_complete 调用 LLM 进行文本生成
ai_rerank 使用 AI 模型按相关性重排文档
get_registered_ai_models 列出所有已注册的 AI 模型
get_ai_model_endpoints 列出所有 AI 模型端点

AI 记忆系统

seekdb MCP Server 提供了强大的 AI 记忆功能,让 AI 助手能够跨会话记住信息:

工具 功能
seekdb_memory_query 语义搜索记忆
seekdb_memory_insert 存储新记忆
seekdb_memory_update 更新记忆
seekdb_memory_delete 删除记忆

使用场景

  • AI 记住你的技术栈偏好(如 “我习惯使用 Python”)
  • AI 记住项目信息(如 “这个项目使用 FastAPI”)
  • AI 记住个人偏好(如 “我喜欢简洁的代码风格”)

数据导入导出

工具 功能
import_csv_file_to_seekdb 导入 CSV 文件
export_csv_file_from_seekdb 导出数据到 CSV

SQL 操作

工具 功能
execute_sql 执行 SQL 查询
get_current_time 获取数据库当前时间

更多工具探索

除了本文介绍的功能,seekdb MCP Server 还支持:

  • AI 函数调用
    • 使用 AI 模型分析这段文本的情感倾向:”今天天气真好,心情愉悦!”
  • CSV 数据导入
    • 将 /path/to/products.csv 导入为向量集合,使用第 2 列(产品描述)作为文档

常见问题

Q: 需要安装 seekdb 吗?

A: 不需要!seekdb MCP Server 使用嵌入式模式,seekdb 已经包含在内,无需单独安装。

Q: 数据存储在哪里?

A: 数据存储在本地文件系统中,默认在当前用户家目录下。你的数据完全在本地,不会上传到任何云端。

Q: 支持哪些操作系统?

A: 目前支持 Linux(glibc >= 2.28),支持 x86_64 和 aarch64 架构。

Q: 如何升级?

A: 使用 uvx 时会自动使用最新版本。

总结

seekdb MCP Server 让数据库操作变得前所未有的简单:

传统方式 MCP 方式
学习 SQL 语法 用自然语言描述需求
编写代码调用 API AI 自动执行操作
手动管理向量嵌入 自动生成和索引
分别处理搜索逻辑 一句话混合搜索

无论你是想快速构建 RAG 应用,还是想让 AI 助手拥有”长期记忆”,seekdb MCP Server 都是你的最佳选择。

开始你的 AI 原生数据库之旅吧! 🚀

参考资料

[1] seekdb 部署文档: https://www.oceanbase.ai/docs/deploy-overview/