语义原生智能问数系统落地实现（一）：从亚马逊选品与竞品评论开始

前面我写了一系列关于智能问数的技术解读文章：

《智能问数技术路线与选型》
《智能问数语义层框架：Cube Core 介绍》：Cube 是一个开源语义层，可以让组织“define metrics once and use them everywhere”，从 BI、嵌入式分析到 AI agents 都能复用同一套指标定义。
《从 Anthropic Financial-Services 看通用企业 Agent 架构》：说明智能问数可以看作业务 Agent 的一种典型实例，智能问数遇到的问题，很多业务 Agent 也都会遇到。
《智能问数没有失败，只是需要换一种落地方式》：寻找那些历史包袱更轻、语义边界更清楚、结果更容易验证的新场景，例如 AI-native 系统。

接下来，我准备以一个 AI-native 示例项目《面向个人跨境卖家的亚马逊选品与竞品评论智能问数系统》为例，使用公开数据，从零实现一个语义原生智能问数系统。这个项目会以“智能问数”作为第一入口，但底层不是简单 NL2SQL，而是基于 Cube 构建统一语义层，让人类、AI Agent、Dashboard 和后续机器学习模型都通过同一套业务语义访问数据。由于内容较多，这个项目会做成一个系列。每篇文章都会对应一部分开源内容，随着系列推进，逐步把完整代码和文档开源出来。

本系列对应的开源代码已发布在 GitHub：xuanagi/semantic-native-nlq-demo。

这个项目想验证几件事：

1）智能问数不是一个孤立功能，而是业务 Agent 落地时经常需要具备的一类基础能力。业务 Agent 要从辅助分析走向业务自动化，首先要能正确取数、理解统一口径，并让人类能够审核它基于哪些数据、哪些指标和哪些证据做出了判断。

2）不少智能问数项目，尤其是开源项目，仍然把重点放在 Text2SQL 上，但真实落地时，更难的是业务语义、指标口径和多入口一致性。当前项目使用 Cube 实现语义层，相比直接 Text2SQL，更有利于指标治理、口径复用和多入口一致性；同时，Cube 的缓存和预聚合能力也为后续性能优化提供了空间。

3）语义层的价值不只是服务人类问数。无论是人类查询、业务 Agent 调用、Dashboard 展示，还是后续机器学习特征生成，都应该复用同一套业务语义，而不是在不同提示词、SQL 脚本和 Notebook 里各算各的。

4）这也是对之前提出的“语义原生”路径的一次实践：传统路径是“先乱后治”，AI-native 路径应该是“边建边沉淀语义”。

一、这不是一个普通的亚马逊评论分析工具

在正式介绍项目之前，必须先澄清一点：

这个项目不是为了再做一个 Amazon Review Analyzer。

因为这个方向已经有很多成熟产品。

Amazon 自己就有 Product Opportunity Explorer，用于帮助卖家理解 niche、搜索词、点击、购买、评论和定价等信息；Amazon 的 Customer Feedback API 也提供来自 customer reviews 和 returns 的洞察，并且说明其提供的信息与 Seller Central 和 Vendor Central 中 Product Opportunity Explorer 的信息一致。

VOC AI 这类工具也已经把 Amazon 评论洞察做得很产品化，公开页面显示其强调分析大量 Amazon reviews，帮助卖家发现 product gaps、监控品牌和理解消费者反馈。

因此，这个项目不是把“更全的数据、更实时的监控、更完整的卖家运营功能”作为第一目标，而是：

用亚马逊选品和竞品评论这个具体业务场景，做一个语义原生智能问数的开源参考实现。

这是当前项目的定位。

换句话说，现有工具主要回答的是：

卖家怎样更高效地分析评论、理解市场、辅助选品？

而这个项目更想回答的是：

如果我们要把“问数”这件事做成一个可复用、可验证、可被 Agent 调用的系统，底层应该怎么设计？

所以它选择了一个已经被验证有价值的业务场景，但真正要沉淀的，是一套语义原生智能问数的参考实现方法。

二、更大的意义：数据智能体的可信取数基础设施

这个项目旨在展示语义原生智能问数系统应该如何实现。

在 AI-native 场景下，智能问数不只是人类用自然语言查数，更是数据智能体可信运行的基础能力。智能体要从辅助分析走向业务自动化，首先要能取到正确的数据、理解统一的业务口径，并且让人类能够审核它基于哪些数据、哪些指标、哪些证据做出了判断。

因此，这个项目真正想展示的是：如何通过语义层，把业务对象、指标口径、查询逻辑、证据链和智能体调用统一起来，让人类可以问数，Agent 可以调用，机器学习可以复用，而所有结果都基于同一套业务语义。

三、为什么选择个人跨境卖家和亚马逊评论场景

虽然亚马逊评论分析工具已经很多，但这个场景依然非常适合作为智能问数的落地样板。

主要有四个原因。

1. 问题具体，且与真实经济价值高度相关

“个人跨境卖家”这个场景足够具体，且天然有选品、竞品、评论、Listing 优化等高频分析需求。

这个群体通常会关心非常具体的问题：

我应该做哪个类目？哪些商品最近需求增长快？哪些竞品虽然卖得不错，但用户不满意？差评集中在哪些方面？ Listing 应该突出哪些卖点？哪些风险应该提前规避？

2. 数据相对容易公开复现

可以使用 Amazon Reviews 2023 这样的公开数据集。这个数据集由 McAuley Lab 收集，包含 user reviews、ratings、text、helpfulness votes、item metadata、descriptions、price、images 和 bought-together graphs 等内容；其 2023 版本包含 571.54M reviews、54.51M users、48.19M items、33 个 domain，时间范围到 2023 年 9 月。

这意味着项目可以开源复现，不必依赖实时爬虫、私有数据或第三方 API。

3. 问题天然适合智能问数

跨境卖家不是只想看一张报表，而是想围绕选品和竞品做决策。

例如：

最近 90 天 Beauty 类目里，哪个价格带评论增长最快？竞品差评主要集中在哪些方面？用户正面评价中最常提到的卖点是什么？哪些商品有需求增长，但用户满意度不高？

这些问题不是简单 SQL，也不是纯文本总结，而是需要把商品、评论、评分、时间、价格带、竞品、用户痛点和证据链组合起来。

这也是智能问数适合发挥价值的地方。

4. 后续可以自然扩展到监控、预警和辅助决策

评论数据既有结构化部分，也有非结构化文本，适合逐步引入：

痛点聚类负面评价异常检测评论增长预测机会分数模型

也就是说，基于智能问数，后续可以自然结合机器学习等算法，进一步增强辅助决策能力。后续这些能力可以被 Agent 或业务工作流调用，进一步形成监控、预警和辅助决策闭环。

也说明从第一天就要想清楚：

机器学习特征也应该从语义层获取，而不是训练脚本自己写一套 SQL。

四、系统整体架构

这个项目的整体架构可以分成六层。

公开数据 / 用户导入数据 ↓ 数据清洗与标准化 ↓ 数据仓库层：商品、评论、评论洞察、商品日指标 ↓ Cube 语义层：指标、维度、口径、关系 ↓ 智能问数层：自然语言 → Cube Query → 答案生成 ↓ Agent / Dashboard / ML Pipeline

结语

第一篇先讲清楚项目背景、定位和整体架构。

从下一篇开始，我们会进入具体实现：先准备 Amazon Reviews 2023 的样本数据，把商品、评论、评分、价格、类目等信息整理成可分析的数据模型。后续再逐步实现 Cube 语义层、智能问数接口、评论语义增强、Agent 调用和机器学习增强。

所属专题智能问数 Agent / 语义层

所属系列语义原生智能问数系统落地实现系列

发布时间2026-05-19 20:53

微信公众号智能大时代

一、这不是一个普通的亚马逊评论分析工具 ​

二、更大的意义：数据智能体的可信取数基础设施 ​

三、为什么选择个人跨境卖家和亚马逊评论场景 ​

1. 问题具体，且与真实经济价值高度相关 ​

2. 数据相对容易公开复现 ​

3. 问题天然适合智能问数 ​

4. 后续可以自然扩展到监控、预警和辅助决策 ​

四、系统整体架构 ​

结语 ​