数据统一问答层 — 连接所有系统,用自然语言跨源查询

你的数据散落在 MySQL、PostgreSQL、Oracle 等不同系统中。 DataWeaver 是唯一能让你在钉钉、企微、Slack 里用一句话同时查遍所有数据库的中间层 —— 不用写 SQL,不用装 BI,不用等 IT 排期。

0 Data Sources
0 Channels
0 Query Layer

数据统一问答入口

一层连接所有数据库,一句话代替所有 SQL。DataWeaver 部署在你的数据库和聊天工具之间, 让每个人都能用自然语言获取跨系统的数据洞察。

连接数据库
支持 PostgreSQL、MySQL、Oracle、SQL Server、ClickHouse、DuckDB
接入渠道
钉钉、企微、Slack、飞书、Telegram、微信个人号等 13+ 渠道
用自然语言提问
"上月各门店销售额排名" — AI 自动转为精准 SQL 查询
获得数据洞察
表格、图表、分析摘要即时返回到你的聊天窗口

自然语言 = 数据查询

用日常语言提问,AI 自动理解意图、找到相关表、生成精准 SQL 并执行。 支持简单查询到多表关联的复杂分析,4 层安全防护确保准确性。

在你熟悉的工具中使用

不需要额外装软件。在钉钉、企微、Slack、飞书、Telegram 等你已经在用的工具里直接查数据, 图表自动适配每个平台的消息格式。

报表自动化 告别手工

用一句话创建定时报表:"每天早上 9 点把销售日报发到运营群"。 系统自动查询、生成图表、按时推送 —— 无需人工干预。

管理软件做不到的三件事

ERP、CRM、BI 工具各管一个系统。DataWeaver 站在所有系统之上,解决它们解决不了的问题。

1
跨系统联合查询
你的订单在 MySQL,客诉在 PostgreSQL,客户档案在 Oracle。 没有任何一个管理工具能同时查这三个库 —— DataWeaver 可以。 一句自然语言,跨库并行查询,内存合并,统一返回。
管理软件:每个系统各看各的,手动对数据
DataWeaver:一句话查遍所有库,自动合并结果
2
随时随地即时回答
想看数据?不用打开电脑,不用登录 BI 系统,不用找报表页面。 在钉钉群里、企微对话中、Slack 频道上 —— 问一句,10 秒出结果。 数据在你已经打开的窗口里。
BI 工具:打开浏览器 → 登录 → 找仪表盘 → 筛选
DataWeaver:聊天窗口问一句 → 10 秒出结果
3
临时问题即问即答
"复购率前 10 的客户有什么共同特征?" —— 这种问题没有预置报表, 以前只能提工单等数据组排期。NL2SQL 让你随时问任何问题, AI 自动推理出 SQL,不需要提前建报表。
预置报表:只能看固定维度,新问题要排期开发
DataWeaver:随时问任何问题,AI 实时生成查询
跨系统查询实例
一句话,三个数据库,一个结果
MySQL 订单系统
SELECT store, SUM(amount) AS revenue FROM orders GROUP BY store
PostgreSQL 客服系统
SELECT store, COUNT(*) AS complaints FROM tickets GROUP BY store
Oracle CRM 系统
SELECT store, ROUND(SUM(CASE WHEN level='VIP' THEN 1 ELSE 0 END)*100.0/COUNT(*),1) AS vip_pct FROM customers GROUP BY store
DataWeaver 内存合并 (Join by store)
门店销售额投诉数VIP 占比
北京旗舰店¥1,280,0001238.5%
上海中心店¥960,000842.1%
深圳科技园店¥720,0001528.3%

强大而灵活的功能集

从自然语言到 SQL、从原始数据到可视化图表、从即时查询到定时报表 —— 数织云 DataWeaver 覆盖数据智能的完整链路。

NL2SQL 多步推理

DIN-SQL 风格多步推理链、HybridRetriever 混合检索、4 层幻觉防护、语义摘要 RAG。

  • 查询分类 (simple / join / complex)
  • Schema 关联
  • 多步 SQL 生成
  • 自纠错 + 重试

数据可视化

Chart.js 服务端渲染、智能图表类型推断、双 Y 轴检测、全渠道图片分发。

  • 柱状图 / 折线图 / 饼图 / 散点图
  • 智能列过滤
  • 启发式配色调色板
  • 图表图片全渠道推送

智能报表

对话式创建定时报表、Cron 调度、多段查询 + 图表组合、精准推送。

  • 自然语言创建 / 修改
  • cron 表达式调度
  • channel:peer 精准推送
  • Markdown + 图表输出

7+ 数据源 + 跨库联合查询

内置 7 种数据库插件 + 跨数据源联合查询,更多数据源持续扩展。

  • PostgreSQL / MySQL / ClickHouse / DuckDB
  • Oracle / SQL Server / MongoDB
  • 跨库联合查询 (Federated Query)
PostgreSQL MySQL Oracle SQL Server ClickHouse DuckDB MongoDB REST API Excel/CSV

Schema 自动发现

LLM 语义摘要、TF-IDF 向量检索、增量同步、MD5 checksum 缓存。

  • 自动扫描数据库结构
  • LLM 生成中文摘要
  • 混合检索 (关键词 + 向量 + 语义)
  • 增量更新

SQL 安全防护 + 权限引擎

14 种 SQL 注入拦截、白名单操作控制、Levenshtein 表名校验、角色级权限执行。

  • SELECT / INSERT / UPDATE 白名单
  • 表名校验 + 建议
  • 表级 + 行级权限控制
  • WHERE 条件自动注入

每个角色都有自己的数据超能力

不是只有技术人员才能用数据。看看不同岗位的人如何通过 DataWeaver 改变工作方式。

运营总监 · 李总
某连锁零售品牌
"以前想看各门店昨天的销售额,要找 IT 排期写 SQL,至少等两天。现在我在钉钉群里问一句'昨天各门店销售额排名',10 秒就出结果,还自动带图表。"
以前:提工单 → 等 IT → 排期 2-3 天
现在:钉钉群发一句话 → 10 秒出结果
财务经理 · 张经理
某制造企业
"每周五做经营周报,以前要从 3 个系统导数据、拼 Excel、做图表,一整天时间。现在 DataWeaver 自动汇总 + 出图,我只需要一句'生成本周经营周报'。"
以前:3 个系统导数据 → Excel → 做图 → 8 小时
现在:定时自动推送 → 0 人工 → 每周五 9:00 准时到达
仓库主管 · 王哥
某电商物流中心
"库存预警以前靠人盯,经常漏了才发现断货。现在设了自动告警,库存低于安全线直接推送到我企微,从没再断过货。"
以前:人工巡检 → 靠经验 → 断货才发现
现在:自动监控 → 低于阈值即时告警 → 零断货
CEO · 陈总
某连锁餐饮企业
"出差路上想看今天各区域的营收,打开 Slack 问一句就行。不用打开电脑、不用等人发邮件,随时掌握经营动态。"
以前:等秘书整理 → 等邮件 → 次日才看到
现在:手机问一句 → 实时数据 + 图表 → 随时随地
销售主管 · 刘姐
某 SaaS 公司
"复购率前 10 的客户特征是什么?以前这种跨表分析要等数据组排期。现在飞书里直接问,30 秒出结果,还能生成趋势图。"
以前:提分析需求 → 数据组排队 → 一周出报告
现在:飞书直接问 → 跨表分析 → 30 秒出结果
IT 负责人 · 赵工
某集团信息中心
"以前每天处理大量'帮我查个数据'的工单。上了 DataWeaver 后,80% 的临时取数需求业务自己解决了,IT 终于能专注做正事。"
以前:每天接 10+ 临时取数工单 → 疲于应付
现在:80% 需求业务自助 → IT 聚焦核心架构

不止于查询 — 数据驱动行动

DataWeaver 的终极目标不是"查数据",而是让数据自动触发业务动作,成为你的数据产品层。

NEXT
数据 + 行动:查询触发动作
不只是查到数据,更要基于数据自动执行业务动作。 当查询结果满足条件时,自动通知、自动创建工单、自动调用外部 API。 从"看数据"升级为"数据驱动业务流转"。
自然语言查询 条件判断 触发动作
  • "库存低于安全线 → 自动通知采购经理"
  • "客诉超 3 次 → 自动创建升级工单"
  • "日销售额破纪录 → 自动发全员庆祝消息"
VISION
数据产品层:让客户自己查
SaaS 公司和平台型企业的新可能:把 DataWeaver 嵌入你的产品, 让你的客户直接用自然语言查询他们自己的数据。 不是"帮客户导报表",而是给客户一个数据问答能力。
你的 SaaS 产品 DataWeaver 层 客户自助查数据
  • 电商平台:商家用自然语言查自己的销售数据
  • 物流公司:客户实时查包裹状态和时效分析
  • HR SaaS:企业管理员查员工数据和离职预警

多行业落地实践

从零售电商到政务数据,从智慧物流到医疗健康 —— 数织云 DataWeaver 适配多种业务场景。

零售电商

自然语言驱动的销售数据分析与运营决策支持。

  • 销售数据实时查询
  • 库存预警自动告警
  • 客户消费画像分析
  • 每日销售日报自动推送

政务数据

政府数据资产盘活与公共服务决策支撑。

  • 民生指标自助查询
  • 政策执行效果分析
  • 跨部门数据汇总报表
  • 专项工作进展定时推送

企业运营

跨部门数据协作与管理决策智能化。

  • HR 数据自助查询
  • 财务指标看板
  • 跨部门数据协作
  • OKR 追踪定时汇报

智慧物流

智能仓储管理与物流自动化数据中枢。

  • 入库智能盘点查询
  • 库存周转率分析
  • 物流时效异常告警
  • 仓储日报自动推送

智能图书馆

借还书智能化管理与阅读数据分析。

  • 馆藏与借阅自助查询
  • 逾期自动提醒推送
  • 借阅热度分析看板
  • 运营日报自动推送

医疗健康

医疗数据智能查询与院内运营分析。

  • 门诊量与床位自助查询
  • 药品库存预警告警
  • 科室绩效分析看板
  • 院内运营日报推送

端到端智能管线

从用户消息到数据洞察,一个请求的完整旅程。

CHANNELS Web Chat Slack DingTalk WeChat Telegram GATEWAY DataWeaver Gateway Session + Queue ROUTER Agent Router AGENTS NL2SQL Agent Viz Agent Knowledge Agent Report Agent Monitor Agent TOOLS sql_execute chart_render hybrid_search cron_scheduler alert_notify OUTPUT DataSource Plugin Chart.js Image pgvector Knowledge DB Channel Push Multi-ch Alert Channel Gateway Agent Tool / Output Data Flow

用户消息从任意渠道进入 Gateway,经会话隔离和队列管理后,由 AgentRouter 基于意图分类分发到对应 Agent。每个 Agent 调用专属 Tool 执行操作,最终将结果(数据表格、图表、知识回答、告警)回传至原始渠道。

智能 Agent 编排

意图路由 + Agent 调度,声明式 YAML 配置 + Markdown 知识驱动。

NL2SQL Agent
数据查询 (fallback)

多步推理链(DIN-SQL 风格),混合检索(关键词 + 向量 + 语义摘要),自纠错 + Levenshtein 幻觉防护。支持 SELECT/INSERT/UPDATE 多操作类型。

sql_execute schema_lookup chart_render
Viz Agent
数据可视化

自然语言 → SQL → Chart.js 图表。智能列过滤(排除 ID/时间戳),双 Y 轴检测,启发式配色,全渠道图片分发。

sql_execute chart_render
Report Agent
定时报表

对话式创建定时报表:自然语言创建/修改,Cron 调度,多段查询+图表组合,channel:peer 精准推送。

sql_execute chart_render alert_notify
Monitor Agent
监控告警

定时巡检数据库,阈值触发自动告警,多渠道通知推送。支持自定义告警规则和检查间隔。

sql_execute alert_notify
Knowledge Agent
知识库问答

基于 RAG 的文档知识库问答。PostgreSQL + pgvector 混合检索(关键词 + 向量 + trigram),LLM 生成带引用来源的回答。支持目录分类管理文档。

hybrid_search llm_qa
workspace/agents/nl2sql/agent.yaml
# workspace/agents/nl2sql/agent.yaml
name: nl2sql
description: 自然语言查询数据库,将用户问题转化为 SQL 并执行
type: builtin
enabled: true
triggers:
  keywords: [查询, 统计, 分析, 多少, 排名]
  intent: nl2sql
  intentDescription: 用户想查询数据库中的数据...
  fallback: true
llm:
  temperature: 0.1
  maxTokens: 2000
tools:
  - sql_execute
  - schema_lookup
  - chart_render
permissions:
  allowedOps: [SELECT]
  maxRows: 10000
  timeout: 30

声明式知识框架

知识文件放置在 workspace/agents/{name}/ 目录,由 AgentConfigLoader 自动加载并注入 LLM prompt。

AGENT.md

Agent 角色定义、行为准则、输出格式规范

SKILL.md

专业技能描述(如图表设计最佳实践、SQL 编写规范)

TOOLS.md

工具使用说明、参数约定、示例调用

多步推理链

从自然语言到精确 SQL,5 步智能管线。

查询分类

LLM 分析查询复杂度,分为 simple(单表)、join(多表关联)、complex(子查询/聚合)三类。不同类型触发不同步数的推理链:simple = 1 次 LLM 调用,join = 2 次,complex = 3 次。

Schema 检索

HybridRetriever 三路融合:KeywordRetriever(BM25 关键词匹配)+ VectorRetriever(TF-IDF 向量相似度)+ 语义摘要匹配。RRF 排序融合,Top-K 返回最相关表结构。当表数 <= 30 时全量发送,> 30 时 RAG 检索 Top 12。

多步 SQL 生成

DIN-SQL 风格分步提示:先 Schema 关联(识别相关表和列),再 SQL 草稿生成,最后 SQL 优化和修正。每步 LLM 调用都携带 databaseType(PostgreSQL/MySQL)和业务词汇表(glossary),确保生成正确方言。

4 层幻觉防护

Layer 1: Prompt 规则约束(只使用已知表和列)。Layer 2: extractTableNames 提取 SQL 中的表名。Layer 3: Levenshtein 相似度匹配,为不存在的表名提供最近建议。Layer 4: 执行错误反馈 → 自动重试,携带错误信息重新生成。

结果返回

查询结果格式化为 Markdown 表格,附带自然语言解释。可选图表渲染(VizAgent 协作)。错误分为 7 种类别(NL2SQLErrorCategory),每种返回友好的用户提示。降级链:合并失败 → 独立分类,多步失败 → 单步,无 LLM → 关键词匹配。

查询示例
用户: "上个月销售额最高的前5个产品是什么?"

 分类: join (涉及 orders + products 表)
 检索: HybridRetriever → orders, products, order_items (Top 3)
 生成:
  Step 1 - Schema Link: orders.total, products.name, order_items.product_id
  Step 2 - SQL Draft:  SELECT p.name, SUM(oi.quantity * oi.price) ...
  Step 3 - SQL Refine: 添加 DATE_TRUNC, GROUP BY, ORDER BY, LIMIT 5
 校验: 表名 , 列名 , 语法 
 执行: 返回 5 行数据 + Markdown 表格 + 柱状图

13+ 消息渠道

一次部署,全渠道触达。

Web API
HTTP/WebSocket
WebChat
Web UI
Slack
Events API
DingTalk
Webhook
企业微信
Callback API
飞书
Event v2
Telegram
Bot API
微信公众号
XML Push
微信中继
Relay
Discord
Bot Gateway
WhatsApp
Cloud API
微信个人号
QClaw / OpenClaw
Webhook
HTTP POST
渠道 协议 富文本 图表推送 双向对话
Web API HTTP + WebSocket Markdown JSON 数据 Yes
WebChat Web UI Markdown 内嵌图表 Yes
Slack Events API Block Kit files.uploadV2 Yes
DingTalk Webhook Markdown Markdown 内嵌 Yes
企业微信 Callback Markdown 临时素材上传 Yes
飞书 Event v2 卡片消息 im.image.create Yes
Telegram Bot API HTML sendPhoto Yes
微信公众号 XML Push 纯文本 文本降级 Yes
微信中继 Relay 纯文本 文本降级 Yes
Discord Bot Gateway Markdown Attachment Yes
WhatsApp Cloud API 纯文本 Media Upload Yes
微信个人号 QClaw Long-Poll 纯文本 Yes
Webhook HTTP POST Markdown JSON 数据 单向

插件化架构

数据源和 LLM 提供商通过插件接入,支持运行时热加载。

目录结构
plugins/                          # 内置插件
  datasource-postgresql/          # PostgreSQL 数据源
    package.json                  # "dataweaver": {"plugin":true,"type":"datasource"}
    index.js
  datasource-mysql/               # MySQL 数据源
    package.json
    index.js
  llm-openai/                     # OpenAI LLM
    package.json                  # "dataweaver": {"plugin":true,"type":"llm"}
    index.js
  llm-anthropic/                  # Anthropic LLM
    package.json
    index.js
workspace/plugins/                # 用户自定义插件(gitignore 安全)
  datasource-sqlite/              # 示例:自定义 SQLite 插件
    package.json
    index.js

数据源插件

  • PostgreSQL — 内置,通过 POSTGRESQL_URLDATABASE_URL 配置
  • MySQL — 内置,通过 MYSQL_URLDATABASE_URL 配置
  • 自定义 — 实现 DatasourcePlugin 接口,package.json 声明 "dataweaver": {"plugin":true,"type":"datasource"}

LLM 插件

  • OpenAI — 内置,通过 OPENAI_API_KEY + OPENAI_MODEL + OPENAI_BASE_URL 配置
  • Anthropic — 内置,通过 ANTHROPIC_API_KEY + ANTHROPIC_MODEL 配置
  • 自定义 — 实现 LLMPlugin 接口,package.json 声明 "dataweaver": {"plugin":true,"type":"llm"}

业务插件 NEW

  • Clinic 表单 — 健康建档、家庭医生签约、体检预约
  • 可插拔 — 包含 Agent + 静态页面 + API,删目录即移除
  • 自定义 — 实现 BusinessPlugin 接口,package.json 声明 "type":"business"

插件支持 Admin API 管理:列表查看、运行时加载、上传安装、连接测试、热重载。API Key 等敏感配置持久化至 workspace/config/plugin-configs.yaml

声明式 YAML 配置

Agent、业务、网关 — 所有配置集中管理。

workspace/agents/viz/agent.yaml
name: viz
description: 根据查询结果自动生成可视化图表
type: builtin
enabled: true
triggers:
  keywords:
    - 图表
    - 画图
    - 可视化
    - 柱状图
    - 折线图
    - 饼图
  intent: viz
  intentDescription: 用户想生成可视化图表
tools:
  - sql_execute
  - chart_render
permissions:
  allowedOps: [SELECT]
  timeout: 30
workspace/config/businesses.yaml
businesses:
  - id: default
    description: 示例业务
    database:
      type: postgresql
      url: postgresql://user:pass@localhost/mydb
    security:
      allowedOps: [SELECT]
    schema:
      autoDiscover: true
    reports:
      - id: daily-sales
        name: 每日销售统计
        cron: "30 8 * * *"
        sections:
          - title: 总销售额
            query: "SELECT SUM(amount) FROM orders WHERE date = CURRENT_DATE"
        targets:
          - telegram:12345678
        enabled: true

Agent 知识文件约定:每个 Agent 目录下可放置 AGENT.md(角色定义)、 SKILL.md(专业技能)、 TOOLS.md(工具说明)。 AgentConfigLoader 自动加载并注入 LLM prompt,无需修改代码。通过 Admin API 可在线编辑知识文件。

生产环境部署

从开发到生产,三种部署方式。

快速开始

bash
# 1. 克隆仓库
git clone https://github.com/nickliu2002/dataweaver.git
cd dataweaver

# 2. 安装依赖
pnpm install

# 3. 配置环境变量
cp .env.example .env
# 编辑 .env 填入数据库连接和 LLM API Key

# 4. 构建并启动
pnpm build
pnpm start

# 开发模式(热重载)
pnpm dev

Docker 部署

Dockerfile
FROM node:20-alpine AS builder
WORKDIR /app
COPY package.json pnpm-lock.yaml ./
RUN corepack enable && pnpm install --frozen-lockfile
COPY . .
RUN pnpm build

FROM node:20-alpine
WORKDIR /app
COPY --from=builder /app/dist ./dist
COPY --from=builder /app/node_modules ./node_modules
COPY --from=builder /app/package.json ./
COPY --from=builder /app/public ./public
EXPOSE 18790
CMD ["node", "dist/index.js"]
bash
docker build -t dataweaver .
docker run -d \
  -p 18790:18790 \
  -e DATABASE_URL="postgresql://..." \
  -e OPENAI_API_KEY="sk-..." \
  -e ADMIN_KEY="your-admin-key" \
  --name dataweaver \
  dataweaver

环境变量

数据源

DATABASE_URL 默认数据库连接串
POSTGRESQL_URL PostgreSQL 连接串
MYSQL_URL MySQL 连接串

LLM

OPENAI_API_KEY OpenAI API 密钥
OPENAI_MODEL 模型名称 (默认 gpt-4o)
OPENAI_BASE_URL API 地址
ANTHROPIC_API_KEY Anthropic API 密钥
ANTHROPIC_MODEL 模型名称

系统

ADMIN_KEY Admin API 认证密钥
ADMIN_PORT Admin 端口 (默认 18790)
LOG_LEVEL 日志级别 (默认 info)
NODE_ENV 运行环境

51 个管理端点

完整的 RESTful API,覆盖插件、Schema、会话、报表全生命周期管理。

Health & Monitoring

MethodPathDescription
GET/admin/health系统健康检查
GET/admin/stats运行时统计(队列、缓存、限流器)
GET/admin/metricsPrometheus 指标(支持 ?format=json)
GET/admin/config运行时配置摘要
GET/admin/channels渠道列表及健康状态

Plugin Management

MethodPathDescription
GET/admin/plugins已注册插件列表
POST/admin/plugins/load从路径加载插件
GET/admin/plugins/catalog插件市场目录
POST/admin/plugins/install/upload上传 ZIP 安装插件
POST/admin/plugins/reload热重载所有插件
DELETE/admin/plugins/datasource/:name卸载数据源插件
DELETE/admin/plugins/llm/:name卸载 LLM 插件
POST/admin/plugins/datasource/:name/configure配置数据源连接
POST/admin/plugins/datasource/:name/test测试数据源连接
POST/admin/plugins/llm/:name/initialize初始化 LLM 插件
POST/admin/plugins/llm/:name/test测试 LLM 插件

Schema Management

MethodPathDescription
GET/admin/schemas/:businessId业务表结构列表
POST/admin/schemas/:businessId新增/更新表结构
DELETE/admin/schemas/:businessId/:tableName删除表结构
POST/admin/schemas/:businessId/discover自动发现 Schema(异步)

Business Configuration

MethodPathDescription
GET/admin/businesses所有业务配置
GET/admin/businesses/:id单个业务配置
POST/admin/businesses创建/更新业务
PUT/admin/businesses/:id更新业务配置
DELETE/admin/businesses/:id删除业务
POST/admin/businesses/reload重新加载配置

Session & History

MethodPathDescription
GET/admin/sessions活跃会话列表
DELETE/admin/sessions/:sessionId终止会话
DELETE/admin/sessions清除所有会话
GET/admin/history/sessions历史会话列表
GET/admin/history/sessions/:sessionId会话详情
GET/admin/history/search搜索查询历史

Reports

MethodPathDescription
GET/admin/reports/:businessId报表列表
PUT/admin/reports/:businessId/:reportId编辑报表
DELETE/admin/reports/:businessId/:reportId删除报表
POST/admin/reports/:businessId/:reportId/run立即执行报表

Permission Management

MethodPathDescription
GET/admin/permissions/:businessId权限规则列表(角色映射 + 表级/行级规则)
POST/admin/permissions/:businessId创建权限规则
PUT/admin/permissions/:businessId/:role更新权限规则
DELETE/admin/permissions/:businessId/:role删除权限规则

Agents & Tools

MethodPathDescription
GET/admin/agentsAgent 列表及状态
GET/admin/agents/:name/knowledge读取 Agent 知识文件
PUT/admin/agents/:name/knowledge/:file更新 Agent 知识文件
GET/admin/tools工具列表

Knowledge Base

MethodPathDescription
POST/admin/knowledge/:bizId/documents上传文档(支持 folder 字段)
GET/admin/knowledge/:bizId/documents文档列表(?folder= 目录筛选)
GET/admin/knowledge/:bizId/documents/:id文档详情 + 分片预览
DELETE/admin/knowledge/:bizId/documents/:id删除文档
GET/admin/knowledge/:bizId/folders目录列表
PATCH/admin/knowledge/:bizId/documents/:id/folder移动文档到目录
DELETE/admin/knowledge/:bizId/folders/:name删除目录(文档归入未分类)
PUT/admin/knowledge/:bizId/folders/:name重命名目录
POST/admin/knowledge/:bizId/reindex重新生成向量嵌入
POST/admin/knowledge/:bizId/search混合检索测试

Other

MethodPathDescription
GET/admin/jobs异步任务列表
GET/admin/jobs/:jobId任务详情
POST/admin/cache/clear清除查询缓存
POST/admin/query/test测试 NL 查询
GET/admin/channels/configurable可配置渠道表单
GET/admin/channels/:name/config渠道配置
POST/admin/channels/:name/configure配置渠道
POST/admin/channels/:name/disconnect断开渠道

持续进化,每次更新都有价值

跟踪 DataWeaver 的成长历程,了解最新功能和改进。

v3.13 Latest 2026-03
微信个人号 QClaw + 业务智能路由 + 知识库批量操作
  • 微信个人号 QClaw 渠道 — 基于腾讯 OpenClaw 官方 API,长轮询模式,独立扫码登录脚本
  • 业务关键词路由 — BusinessConfig 新增 keywords,消息自动匹配业务(如"咖啡"→default,"医保"→clinic)
  • 知识库批量操作 — 多选 checkbox + 全选 + 批量删除 + 批量移动,后端 batch-delete API
  • 通义千问 Embedding — EmbeddingService 支持 text-embedding-v3,QIANWEN_API_KEY 自动 fallback
  • Ubuntu 一键部署 — install.sh(最简)+ install-full.sh(交互式,含 Cloudflare Tunnel)
  • 渠道总数 12→13,新增 22 个单元测试(总计 1801)
v3.12 2026-03
Business 插件系统 + Clinic 表单插件
  • Business 插件系统 — 第三种插件类型,支持 Agent + 静态文件 + API 路由自动注册,删目录即移除
  • Clinic 表单插件 — 健康建档 + 家庭医生签约 + 体检预约,首个 business 插件实现
  • BusinessPlugin 接口 — agents[] + publicDir(/biz/{name}/) + registerRoutes() + 生命周期管理
  • 开发指南文档 — 完整的 Business 插件开发规范与参考实现
  • 插件类型 2→3,新增 26 个单元测试(总计 1779)
v3.11 2026-03
Discord + WhatsApp 渠道 & 钉钉历史修复
  • Discord 渠道 — discord.js Bot Gateway,Markdown 原生支持,Embed 长消息,图表 Attachment 推送
  • WhatsApp 渠道 — Meta Cloud API v21.0,Webhook 验证,文本+图片消息,Media Upload 图表推送
  • 钉钉历史记录修复 — SessionPersistence 文件名安全编码,解决含 |/?: 特殊字符的 sessionId 无法检索的问题
  • Admin UI — 新增 Discord/WhatsApp 渠道配置表单,支持动态加载
  • 渠道总数 10→12,新增 55 个单元测试
v3.10 2026-03
知识库目录分类 — 文档归档管理 + Admin UI 目录栏
  • 目录分类系统 — 基于 JSONB metadata.folder 字段,零数据库迁移,完全向后兼容
  • Admin API — 目录 CRUD(列表 / 移动 / 删除 / 重命名),上传与查询支持 folder 参数
  • Admin UI 目录栏 — 芯片式标签筛选(全部 / 未分类 / 各目录),一键新建与删除目录
  • 文档移动 — 操作列下拉菜单,拖拽式文档归类到任意目录
  • 上传自动归档 — 选中目录时上传文档自动归入,FormData 附加 folder 字段
v3.9 2026-03
知识库 RAG 问答 — PostgreSQL + pgvector 向量检索
  • KnowledgeAgent — 第 5 个 Agent,基于 RAG 的文档知识库问答,自动引用来源
  • PostgreSQL + pgvector 向量存储 — HNSW 索引、SQL 级 RRF 混合检索(tsvector + 向量 + pg_trgm)
  • Token 感知文档分片 — 中英文自适应 token 估算,段落/句子边界智能切割
  • 异步向量嵌入 — 上传即返回,后台批量嵌入,进度实时追踪
  • 多模型支持 — 兼容 OpenAI / Qwen / 智谱 / Ollama 嵌入模型,维度可配置
  • Admin UI 知识库管理页面 — 拖拽上传、文档状态、分片预览、检索测试
  • PDF 文档支持 — pdf-parse 解析,自动提取文本与元数据标题,可选依赖动态导入
  • NL2SQL 术语增强 — 知识库自动提取业务词汇表,注入 PromptBuilder 辅助 SQL 生成
  • 优雅降级 — 无 pgvector 时纯关键词检索,无 KNOWLEDGE_DB_URL 时不加载
v3.8 2026-03
企业级加固 — 查询安全 + 审计日志 + 数据导出 + Admin API 加固
  • 查询安全防护 — 可配置超时 (queryTimeoutMs) + 结果行数限制 (maxResultRows) + 异步任务取消
  • 审计日志系统 — 结构化事件记录(查询/管理/认证/权限拒绝),每日 JSONL 轮转,Admin API 查询
  • 数据导出 — CSV (UTF-8 BOM Excel 兼容) / JSON 双格式,WebChannel + Admin API 双端点
  • Admin API 加固 — 密钥作用域 (admin/readonly)、CORS 可配置、ADMIN_KEYS 环境变量
  • Admin UI 审计日志页面 — 按类型/用户/时间过滤审计事件
  • 查询历史导出按钮 — SQL 结果一键下载 CSV/JSON
v3.7 2026-03
MongoDB 数据源插件
  • MongoDB 数据源插件 — 首个 NoSQL 数据源,SQL→聚合管道自动翻译,集合 Schema 采样推断
  • PluginLoader 支持 mongodb://mongodb+srv:// 协议自动识别
  • Admin UI 新增 MongoDB 数据库类型卡片与连接配置
v3.6 2026-03
权限执行引擎
  • 权限执行引擎 (Permission Enforcement) — peer→role 映射 + 表级/行级访问控制
  • 行级 WHERE 条件自动注入 — rowFilters 精确过滤敏感数据
  • NL2SQL / VizAgent / SQLExecuteTool 全链路权限集成
  • Admin API 权限 CRUD — GET/POST/PUT/DELETE 完整管理
  • Admin UI 权限管理 — 角色映射编辑器 + 权限规则可视化
  • 向后兼容 — 无权限配置时行为完全不变,零侵入升级
v3.5 2026-03
跨数据源联合查询
  • 跨数据源联合查询引擎 (Federated Query) — 并行执行 + 内存合并
  • 支持 concat / join 两种合并策略,自动检测多数据源场景
  • VizAgent 联合查询图表可视化
  • ReportAgent 报表段落级数据源指定
  • PromptBuilder 多数据源感知 — 按数据源分组 Schema
  • LLM 响应解析增强 — 识别 federated 类型输出
v3.4 2026-02
数据库扩展 + 场景模板
  • 新增 Oracle 数据源插件 (动态导入 oracledb)
  • 新增 SQL Server 数据源插件 (动态导入 mssql)
  • 6 个行业场景模板 — 餐饮/电商/制造/仓储/酒店/诊所
  • 模板一键创建业务配置 + 自动 Schema 发现
  • 用户权限系统基础 — 表级 + 行级访问控制类型定义
  • Anthropic 模型 ID 更新 — 废弃模型替换为最新版
v3.3 2026-01
全面优化 + 图表增强
  • P0-P2 共 12 项优化 — 并发安全、代码去重、性能提升
  • ChartImageRenderer 服务端图表渲染 — chartjs-node-canvas
  • 全渠道图片分发 — Slack/企微/飞书/Telegram/钉钉适配
  • VizAgent 分析摘要 — LLM 自动生成数据洞察
  • WebChannel SSE ECONNRESET — 统一 reply.hijack() 接管响应
  • 定时报表改用 node-cron 精确调度
v3.2 2025-12
NL2SQL 多步推理 + Agent 框架
  • DIN-SQL 风格多步推理链 — 意图分类 + Schema 关联 + 多步生成
  • HybridRetriever 混合检索 — 关键词 + TF-IDF 向量 + 语义摘要
  • 4 层幻觉防护 — Prompt 规则 + 表名抽取 + Levenshtein + 自动重试
  • Agent 框架重构 — BaseAgent + AgentRouter 智能路由
  • ReportAgent 对话式定时报表 — 自然语言创建/修改 + cron 调度
  • Gateway async acknowledge-first 模式
v3.1 2025-11
多渠道接入 + Admin UI
  • 10+ 渠道统一接入 — 钉钉/企微/Slack/飞书/Telegram/Web Chat
  • Admin UI 管理平台 — OpenClaw 风格深色主题
  • 插件市场 — 运行时加载、上传安装
  • ClickHouse / DuckDB 数据源插件
  • LLM 编排链 — 多供应商优先级 + 运行时 Fallback
v3.0 2025-10
DataWeaver 3.0 发布
  • 全新架构 — Fastify 4 + TypeScript + ESM
  • NL2SQL 自然语言查询引擎
  • 插件化数据源 + LLM 接入
  • PostgreSQL + MySQL + OpenAI + Anthropic 内置插件
  • 声明式 YAML 配置体系

商务合作 & 技术交流

扫码添加微信,获取定制化部署方案与技术支持。

微信二维码
微信联系
扫码添加,备注「DataWeaver」