
微信

飞书
选择您喜欢的方式加入群聊

扫码添加咨询专家
如果你在过去两年使用过任何基于大语言模型的 Text-to-SQL 产品,你可能会对这样一个现象深有体会:
它们足够聪明,但不够精确。
一个 AI 数据分析工具可以流畅地回答"本月销售额是多少"这样的简单问题,却可能在处理"对比华东和华南地区 Q1 与 Q2 的客单价变化趋势,并找出 Top 3 下滑品类"这样的复合查询时给出错误答案。它可以生成能执行的 SQL,却无法保证语义完全正确。它偶尔能完成复杂分析,但稳定性差到让你不敢把关键决策交给它。
这就是数据分析 AI 行业普遍面临的精确度瓶颈。
大语言模型的理解能力和编程能力其实是两个不同的维度。
理解能力体现在:模型能听懂你说什么,能把握你的意图,能理解"客单价"、"环比"、"Top N"这些业务概念。
编程能力体现在:模型能把理解到的意图,翻译成语法正确、逻辑严密、可执行的代码(SQL、Python 等),并且每一个表名、每一个字段、每一个 JOIN 条件、每一个 WHERE 子句,都毫厘不差。
大多数通用大模型在过去一年里取得了理解能力的巨大进步,但编程能力的提升相对缓慢。这就导致了一个尴尬的局面:模型知道你想查什么,但生成的 SQL 就是差那么一点——多了一个逗号、少了一个条件、JOIN 方向反了、聚合函数用错了。
而在数据分析场景中,差一点就是完全错误。
这个瓶颈带来的实际代价是巨大的:
解决这个问题的关键,不在于让模型"更聪明"——它们已经够聪明了。而在于让模型的编程能力实现跃升。
直到 Qwen 3.6-Plus 的发布,这个局面开始改变。
2026 年 4 月 2 日,阿里巴巴千问团队正式发布了新一代大语言模型 Qwen 3.6-Plus。这是千问 3.6 系列推出的第一款模型,与 3.5 系列侧重多模态视觉理解和极致性价比不同,3.6 系列将核心矛头直指两大能力:编程与智能体(Agent)。
Qwen 3.6-Plus 在编程能力上的提升不是渐进式的,而是跨越式的。
在 SWE-bench 等真实世界编程任务评测中,Qwen 3.6-Plus 的表现较上一代超越了 2 倍至 3 倍,直接逼近全球最强编程模型 Claude Opus 4.5 系列。这是一个具有里程碑意义的信号——国产大模型在编程这一核心能力维度上,已经站到了全球第一梯队。
具体来说,Qwen 3.6-Plus 在以下几个编程子领域表现尤为突出:
| 评测项目 | 表现 |
|---|---|
| SWE-bench 系列 | 接近 Claude Opus 4.5 系列 |
| Terminal-Bench 2.0 | 大幅超越上一代 |
| NL2Repo | 国产模型领先 |
这些评测涵盖的能力维度包括:
1. 代码生成与理解
Qwen 3.6-Plus 能够高质量地生成 SQL、Python、JavaScript 等多种语言的代码。更重要的是,生成代码的可执行性大幅提升——不仅语法正确,而且逻辑合理,能够直接运行。
在 Text-to-SQL 场景中,这意味着:模型不仅知道 SELECT、FROM、WHERE 怎么写,还知道什么时候该用 LEFT JOIN 而不是 INNER JOIN,什么时候该用 HAVING 而不是 WHERE,什么时候该用窗口函数而不是子查询。
2. 复杂代码库理解
Qwen 3.6-Plus 对大规模代码仓库的理解能力显著提升,能准确把握跨文件的逻辑关系。这对应到数据分析场景,就是模型能更好地理解复杂的数据库 Schema——多个表之间的外键关系、业务逻辑约束、数据质量规则等。
3. Bug 定位与修复
Qwen 3.6-Plus 能够快速定位问题根因,并给出精确的修复方案。这正是 AskTable Agent 自我纠错机制所需要的核心能力——当生成的 SQL 执行失败时,模型需要快速理解错误信息,找到问题所在,并生成修正后的代码。
在 Claw-Eval、QwenClawBench 等真实世界 Agent 评测中,Qwen 3.6-Plus 同样表现卓越。其核心突破在于Agentic Coding——在前端与仓库级场景中,模型可以自主拆解任务、规划路径、测试修改,直至任务完成。
这不再是简单的"你问它答"的交互模式,而是模型具备了自主规划和执行复杂多步骤任务的能力。
具体来说,Qwen 3.6-Plus 的 Agent 能力体现在:
理解 Qwen 3.6-Plus 的价值,需要将它与 3.5 Plus 放在一起对比:
| 维度 | Qwen 3.5 Plus | Qwen 3.6-Plus |
|---|---|---|
| 核心定位 | 多模态 + 性价比 | 编程 + 智能体 |
| 编程能力 | 优秀 | 接近 Claude Opus 4.5,提升 2-3 倍 |
| Agent 能力 | 良好 | 卓越,支持自主任务规划 |
| 多模态 | 强项 | 原生多模态,保持优秀水平 |
| 价格 | 每百万 Token 0.8 元起 | 每百万 Token 2 元起 |
3.5 Plus 的强项在于多模态视觉理解和极致性价比,而 3.6-Plus 则在代码生成和自主智能体能力上实现了质的飞跃。两者各有所长,但对于 AskTable 这样的 AI 数据分析平台来说,3.6-Plus 的编程能力跃升和 Agent 能力突破,恰好击中了最核心的需求点。
Text-to-SQL 是 AskTable 的核心技术之一,也是所有 AI 数据分析产品的基石。它的质量直接决定了用户体验——用户用自然语言提问,系统生成对应的 SQL 查询并返回结果。
而 Text-to-SQL 的本质,是将自然语言翻译成精确的编程代码(SQL)。这意味着:模型的编程能力越强,生成的 SQL 就越精准。
在 AskTable 内部测试中,我们对比了 Qwen 3.5 Plus 和 Qwen 3.6-Plus 在几类典型 Text-to-SQL 场景中的表现,差距非常明显。
场景一:多表关联 + 窗口函数
用户问:"列出每个地区销售额 Top 3 的产品类别,并计算每个类别占该地区总销售额的百分比"
Qwen 3.5 Plus 生成这类 SQL 时,经常出现的问题包括:
PARTITION BY 字段错误ROW_NUMBER 语法错误而 Qwen 3.6-Plus 能够准确生成:
WITH regional_sales AS (
SELECT
u.region,
p.category,
SUM(o.amount) as category_sales,
SUM(SUM(o.amount)) OVER (PARTITION BY u.region) as region_total
FROM orders o
JOIN users u ON o.user_id = u.user_id
JOIN products p ON o.product_id = p.product_id
WHERE o.status = 'paid'
GROUP BY u.region, p.category
)
SELECT
region,
category,
category_sales,
ROUND(category_sales * 100.0 / region_total, 2) as percentage
FROM regional_sales
WHERE category IN (
SELECT category FROM (
SELECT category,
ROW_NUMBER() OVER (PARTITION BY region ORDER BY category_sales DESC) as rn
FROM regional_sales
) WHERE rn <= 3
)
ORDER BY region, percentage DESC;
这个 SQL 包含了 CTE、窗口函数、子查询、多表 JOIN,逻辑复杂但完全正确。
场景二:时间序列对比
用户问:"对比今年和去年同期每个月的销售额增长率"
这是一个典型的同比增长分析查询,需要精确处理时间范围和同比计算。Qwen 3.5 Plus 经常犯的错误:
Qwen 3.6-Plus 能够正确识别"去年同期"的含义,生成准确的 SQL:
SELECT
MONTH(this_year.created_at) as month,
SUM(this_year.amount) as this_year_gmv,
SUM(last_year.amount) as last_year_gmv,
ROUND(
(SUM(this_year.amount) - SUM(last_year.amount)) * 100.0 / SUM(last_year.amount),
2
) as growth_rate
FROM orders this_year
LEFT JOIN orders last_year
ON MONTH(this_year.created_at) = MONTH(last_year.created_at)
AND YEAR(last_year.created_at) = YEAR(this_year.created_at) - 1
AND last_year.status = 'paid'
WHERE YEAR(this_year.created_at) = YEAR(CURDATE())
AND this_year.status = 'paid'
GROUP BY MONTH(this_year.created_at)
ORDER BY month;
场景三:复合条件聚合
用户问:"本月新增用户中,有多少人在注册后 7 天内完成了首次付费?付费用户的平均客单价是多少?"
这个查询需要跨表关联、时间窗口计算和条件聚合。Qwen 3.6-Plus 的编程能力在此类场景中展现出显著优势:
SELECT
COUNT(DISTINCT CASE WHEN first_pay.pay_date IS NOT NULL THEN u.user_id END) as paid_users,
COUNT(DISTINCT u.user_id) as new_users,
ROUND(
COUNT(DISTINCT CASE WHEN first_pay.pay_date IS NOT NULL THEN u.user_id END) * 100.0
/ COUNT(DISTINCT u.user_id),
2
) as conversion_rate,
ROUND(AVG(first_pay.amount), 2) as avg_order_value
FROM users u
LEFT JOIN (
SELECT user_id, MIN(created_at) as pay_date, amount
FROM orders
WHERE status = 'paid'
GROUP BY user_id
) first_pay ON u.user_id = first_pay.user_id
AND first_pay.pay_date <= DATE_ADD(u.created_at, INTERVAL 7 DAY)
WHERE u.created_at >= DATE_FORMAT(CURDATE(), '%Y-%m-01')
AND u.created_at < DATE_ADD(DATE_FORMAT(CURDATE(), '%Y-%m-01'), INTERVAL 1 MONTH);
在 AskTable 的测试框架中,我们使用三个维度来衡量 Text-to-SQL 的质量:
| 维度 | 说明 | Qwen 3.5 Plus | Qwen 3.6-Plus |
|---|---|---|---|
| 语法正确率 | SQL 能否成功执行 | ~85% | ~96% |
| 语义正确率 | 结果是否符合用户意图 | ~70% | ~88% |
| 业务正确率 | 是否应用了正确的业务规则 | ~60% | ~80% |
这三个维度的全面提升,意味着用户在使用 AskTable 时,能够更频繁地获得准确、可用的分析结果。
AskTable 的 AI 引擎架构设计之初就考虑到了多模型支持。我们不绑定单一模型,而是构建了一个模型即插即用的引擎层。这意味着:
这种架构设计让我们能够在 Qwen 3.6-Plus 发布后第一时间完成适配,让用户快速体验到编程能力提升带来的 Text-to-SQL 质量飞跃。
关于 AskTable AI Agent 架构的更多细节,可以参考我们之前的技术解析:AskTable AI Agent 工作原理:从架构到实现。
如果说编程能力的提升让 Qwen 3.6-Plus 在 Text-to-SQL 精度上有了质的飞跃,那么其卓越的 Agent 能力则为 AskTable 打开了另一扇门:自主分析工作流。
传统的数据分析工具是"你问我答"的模式——用户提出一个具体问题,系统返回一个具体答案。但真实场景中的数据分析往往是探索性的、多步骤的、需要推理的。
例如,当业务负责人问:"这个月销售额为什么下降了?"
这不仅仅是一个 SQL 查询问题,而是一个需要多步骤推理的分析任务:
这就是 AskTable Canvas 中多 Agent 协作架构要解决的核心问题。
在 AskTable Canvas 中,不同类型的分析节点由不同的 Agent 处理:
graph TB
A[用户问题] --> B[任务拆解 Agent]
B --> C{任务类型}
C -->|数据查询| D[DataNodeAgent]
C -->|图表生成| E[ChartNodeAgent]
C -->|数据加工| F[PythonNodeAgent]
D --> G[SQL 引擎]
E --> H[图表引擎]
F --> I[Python 沙箱]
G --> J[结果聚合]
H --> J
I --> J
J --> K[最终结果]
Qwen 3.6-Plus 的 Agent 能力提升,让每个 Agent 节点的执行质量都得到了显著改善:
更精准的工具调用
Agent 需要准确选择和使用 AskTable 内置的各种工具(查询引擎、图表引擎、数据处理引擎等)。Qwen 3.6-Plus 的工具调用能力增强,减少了无效调用和幻觉,让 Agent 能够更准确地匹配工具和能力。
在 AskTable 内部测试中,Qwen 3.6-Plus 的工具调用准确率比上一代提升了约 30%,无效调用(调用后未使用结果或调用错误工具)减少了约 50%。
更合理的任务拆解
面对"分析本月销售趋势"这样模糊的指令,Qwen 3.6-Plus 能够自主将其拆解为多个子任务:数据查询 → 趋势计算 → 图表生成 → 洞察总结,并合理安排执行顺序和依赖关系。
以"分析本月销售趋势"为例,Qwen 3.6-Plus 的拆解过程如下:
用户问题:分析本月销售趋势
Qwen 3.6-Plus 拆解:
├── 子任务 1:获取本月每日销售额
│ ├── 需要查询 orders 表
│ ├── 过滤条件:本月、已支付
│ └── 输出:每日销售额时间序列
├── 子任务 2:计算环比和同比数据
│ ├── 获取上月同期销售额
│ ├── 获取去年同期销售额
│ └── 计算环比、同比变化率
├── 子任务 3:生成趋势图表
│ ├── 选择折线图类型
│ ├── 配置双 Y 轴(销售额 + 增长率)
│ └── 输出可视化图表
└── 子任务 4:生成分析洞察
├── 识别关键趋势
├── 标记异常波动
└── 输出文字总结
这种自动化的任务拆解能力,大幅降低了用户构建复杂分析流程的门槛。
更强的多步骤推理
在数据异常检测和根因分析场景中,模型需要具备链式推理能力。Qwen 3.6-Plus 在这方面的提升,让 AskTable 的分析 Agent 能够像资深数据分析师一样,一步步深入挖掘数据背后的原因。
关于 AskTable Canvas 多 Agent 协作的详细实现,可以阅读:AskTable Canvas Agent 分工协作:多 Agent 系统的设计与实现。
再强大的模型也会犯错。AskTable 的核心竞争力之一,是建立了一套完整的Agent 自我纠错机制。
完整的纠错流程如下:
graph TB
A[生成 SQL] --> B[执行 SQL]
B --> C{执行成功?}
C -->|是| D[返回结果]
C -->|否| E[解析错误信息]
E --> F[错误分类]
F --> G{错误类型}
G -->|表名错误| H[检索相似表名]
G -->|字段错误| I[检索相似字段]
G -->|语法错误| J[语法修复]
G -->|权限错误| K[提示用户]
H --> L[修正 SQL 并重试]
I --> L
J --> L
K --> M[返回错误信息]
L --> B
当 AI 生成的 SQL 执行失败时,系统不会直接把错误信息甩给用户,而是:
Qwen 3.6-Plus 的编程能力提升,让这个过程更加高效——它不仅能更快地理解错误原因,还能更准确地生成修正后的代码。这意味着重试次数减少、响应速度提升、用户体验改善。
在 AskTable 的测试中,使用 Qwen 3.6-Plus 后,SQL 生成的一次通过率提升了约 25%,平均重试次数从 1.8 次降低到 1.2 次。
关于自我纠错机制的技术实现,详见:AskTable Agent 自我纠错机制:从错误中学习的 AI 系统。
Qwen 3.6-Plus 除了编程和 Agent 能力的显著提升外,还保留了前代模型在原生多模态方面的优势。这对于数据分析场景来说,打开了一扇全新的交互之门。
这是多模态能力在数据分析中最直接的应用场景。
想象这样一个场景:业务负责人在微信上收到了一张业务报表的截图,他想知道截图中的数据背后的更多信息。过去,他需要手动将截图中的数据录入系统,或者转发给数据团队让他们重新查询。
现在,借助 Qwen 3.6-Plus 的原生多模态能力,AskTable 用户可以直接上传截图:
用户操作:上传一张销售日报截图
用户提问:这张报表里,哪个产品线的销售额最高?和上周比怎么样?
AskTable 处理流程:
1. 视觉识别:AI 识别截图中的表格结构、数值、指标名称
2. 语义理解:结合 AskTable 的语义层,映射到对应的数据库表和字段
3. 数据查询:生成 SQL 查询,获取更详细的分析数据
4. 结果输出:返回对比分析结果和趋势洞察
这种"所见即所查"的交互方式,极大降低了数据分析的门槛。
除了识别截图中的数据,多模态能力还可以用于理解和分析现有图表:
示例场景:
用户上传:一张用柱状图展示的月度销售趋势图
AI 分析:
- 识别图表类型:柱状图
- 识别数据趋势:1-3 月增长,4 月下降,5 月回升
- 识别异常点:4 月数据明显低于其他月份
AI 建议:
- 建议改用折线图 + 柱状图组合(折线展示趋势,柱状展示绝对值)
- 建议添加同比参考线
- 建议标注 4 月异常数据点
在更复杂的场景中,多模态能力可以与其他分析能力结合:
这种多模态 + 数据分析的组合,是 AskTable 在 AI 数据分析领域持续探索的重要方向。
在技术能力之外,Qwen 3.6-Plus 还有一个不可忽视的优势:价格。
阿里云百炼平台上,Qwen 3.6-Plus 的定价为每百万 Tokens 低至 2 元。这个数字看似简单,但放在企业 AI 分析的成本语境下,意义重大。
让我们算几笔不同规模企业的账。
小型团队(日查询 200 次)
日消耗量:200 × 5,000 = 1,000,000 Tokens = 1M Tokens
月消耗量:1M × 30 = 30M Tokens
月成本(Qwen 3.6-Plus):30 × 2 = 60 元/月
年成本:60 × 12 = 720 元/年
中型企业(日查询 1,000 次)
日消耗量:1,000 × 5,000 = 5,000,000 Tokens = 5M Tokens
月消耗量:5M × 30 = 150M Tokens
月成本(Qwen 3.6-Plus):150 × 2 = 300 元/月
年成本:300 × 12 = 3,600 元/年
大型企业(日查询 5,000 次)
日消耗量:5,000 × 5,000 = 25,000,000 Tokens = 25M Tokens
月消耗量:25M × 30 = 750M Tokens
月成本(Qwen 3.6-Plus):750 × 2 = 1,500 元/月
年成本:1,500 × 12 = 18,000 元/年
对比使用某些海外模型(每百万 Tokens 约 50-100 元),同样的消耗量年成本将大幅攀升。对于大型企业,差距可能从 18,000 元扩大到 450,000-900,000 元。
Qwen 3.6-Plus 的定价策略之所以值得关注,是因为它打破了"便宜没好货"的惯性思维。
在编程能力接近 Claude Opus 4.5 的前提下,每百万 Tokens 2 元的价格,使得 Qwen 3.6-Plus 成为全球性价比最高的编程级大模型之一。这对于 AskTable 和所有需要大规模调用大模型的企业级应用来说,是一个极具吸引力的选择。
更关键的是,低成本意味着更高的使用频次和更广的应用场景。当每次查询的成本几乎可以忽略不计时,用户会更愿意使用 AI 分析来探索数据,而不是因为成本顾虑而减少查询。这种"用得越多,发现越多"的正循环,是 AI 数据分析产品成功的关键。
对于企业决策者来说,选择 AI 引擎通常考虑三个维度:
| 维度 | Qwen 3.6-Plus | 其他模型 |
|---|---|---|
| 能力 | 编程接近全球顶级,Agent 卓越 | 因模型而异 |
| 成本 | 每百万 Token 2 元 | 2-100 元不等 |
| 合规 | 国产模型,数据合规风险低 | 部分海外模型有合规考量 |
Qwen 3.6-Plus 在这三个维度上都给出了有竞争力的答案。特别是对于有数据合规要求的企业(金融、医疗、政务等),国产模型的选择更加稳妥。
在了解了 Qwen 3.6-Plus 的优势之后,一个自然的问题是:既然它这么好,AskTable 为什么不全面切换到 Qwen 3.6-Plus?
答案是:不同的场景需要不同的模型,多模型策略才是最优解。
AskTable 的 AI 引擎支持多种模型,因为不同的分析场景对模型能力的需求是不同的:
| 场景类型 | 模型需求 | 推荐模型 |
|---|---|---|
| 简单查询(单表、基础聚合) | 速度快、成本低 | Qwen 3.5 Plus / 轻量模型 |
| 复杂分析(多表关联、窗口函数) | 编程能力强 | Qwen 3.6-Plus |
| 多模态任务(截图查数) | 原生多模态 | Qwen 3.6-Plus |
| 创意探索(开放性分析) | 推理能力强 | Claude 系列 |
依赖单一模型供应商对企业来说存在风险:
AskTable 的多模型架构天然支持模型切换和降级策略,确保在任何情况下都能为用户提供稳定的分析服务。当某个模型服务不可用时,系统可以自动切换到备用模型,保证业务连续性。
大模型行业正在以令人瞩目的速度进化。AskTable 的多模型架构让我们能够:
这种"模型即插即用"的架构设计,是 AskTable 能够始终保持技术领先的基础。
关于 AskTable 如何支持 20+ 种数据库以及多模型引擎的详细设计,可以参考:AskTable 数据源接入指南。
回顾整篇文章,我们试图回答一个核心问题:为什么 Qwen 3.6-Plus 的发布,对 AskTable 和 AI 数据分析领域意义重大?
答案可以归结为一句话:数据分析的精确度瓶颈,本质上是编程能力的瓶颈。而 Qwen 3.6-Plus 在编程能力上的跃升,直接打破了这个瓶颈。
具体来说:
在 Text-to-SQL 层面,编程能力的提升意味着更复杂的查询能够"一次跑通"——多表关联、窗口函数、CTE、子查询,这些曾经让 Text-to-SQL 频频出错的复杂场景,现在可以稳定生成正确的 SQL。语法正确率从 ~85% 提升到 ~96%,语义正确率从 ~70% 提升到 ~88%。
在 Agent 协作层面,Agent 能力的突破意味着 AskTable 的分析智能体能够从"执行指令"进化到"自主分析"——面对模糊的问题,能够自主拆解、推理、执行、总结。工具调用准确率提升约 30%,无效调用减少约 50%。
在自我纠错层面,编程能力的提升让纠错过程更加高效——SQL 一次通过率提升约 25%,平均重试次数从 1.8 次降低到 1.2 次。这意味着更快的响应速度和更好的用户体验。
在多模态交互层面,原生多模态能力为数据分析打开了"截图查数"、"图表理解"等全新的交互方式,进一步降低了使用门槛。
在性价比层面,每百万 Tokens 2 元的价格,让企业级 AI 分析的成本大幅降低,使大规模应用成为可能。同时,低成本也意味着更高的使用频次和更广的应用场景。
在多模型策略层面,AskTable 的架构设计让我们能够持续接入最强模型,同时保持灵活性和风险控制。
Qwen 3.6-Plus 的发布,不仅仅是国产大模型在编程能力上的一次突破,更是对整个 AI 数据分析行业的一次信号:
当编程能力不再是短板,AI 数据分析的精确度瓶颈将被打破。未来的竞争,不再是谁的模型"更聪明",而是谁的系统"更可靠"。
AskTable 选择 Qwen 3.6-Plus 作为 AI 引擎,正是基于对这一趋势的判断。我们相信,最强的编程模型 + 最专业的数据分析平台,将为中国企业带来前所未有的数据洞察能力。
技术文章中的数字和对比终究是理论上的。真正衡量 Qwen 3.6-Plus 在数据分析场景中价值的标准,是你在实际使用中的体验。
我们建议你尝试以下几个场景来亲自验证:
最好的验证方式,就是亲自试一试。
了解更多: