观远数据零售行业BI实践

观远数据

公告

业内领先的一站式智能分析平台与服务提供商

让业务用起来,让决策更智能

统计

今日访问:869

总访问量:1713179

自然堂集团×观远数据问数GPT项目获评2024中国大模型+数据分析最佳实践案例

06月25日 10:58

评论数(0)

近日,权威数字化研究与知识服务平台沙丘社区重磅发布《2024中国“大模型+数据分析”最佳实践案例TOP10》榜单,该榜单旨在探索大模型在数据分析中的无限潜力,了解它们如何帮助企业优化决策、提升效率、创造新价值。入选案例均经过严格筛选和评估,从价值性、实用性、创新性、示范性四个维度精选出的10大案例,代表了当前大模型在数据分析领域的最佳实践。自然堂集团×观远数据问数GPT项目凭借创新实践与卓越成果,成功入围《2024中国“大模型+数据分析”最佳实践案例TOP10》。

自然堂集团作为中国领先的数字化驱动的科技美妆企业,一直致力于通过科技创新提升产品质量和用户体验。为了快速响应数据变化带来的分析需求变化,让用户随时随地获得数据分析结果,辅助敏捷决策,自然堂集团与观远数据合作开展问数GPT项目,将LLM与BI相结合,打造生成式数据分析产品,有效提升了数据利用效率和决策质量,同时使得数据分析师从技术性工作中解放,转型知识训练师,进一步促进数据驱动文化。

此次观远数据与自然堂集团合作共创的问数GPT项目入围榜单,充分展现了观远数据在大模型领域的创新实力,以及自然堂集团对观远Chat BI的认可。未来,双方将继续深化合作,不断探索大模型在数据分析领域的创新应用,推动更多行业大模型的落地应用,共同为更多企业的大模型应用打造创新典范。

自然堂集团×观远数据问数GPT项目

1、案例背景

随着科技不断进步,美妆行业迎来前所未有的革新。自然堂集团作为数字化驱动的科技美妆企业,不断加大数字化转型力度,构建全新的竞争力。在数字化过程中,自然堂集团面临着以下痛点:

  • 各业务系统相对孤立,数据口径不一致,数据孤岛导致跨部门协作沟通成本较高;

  • 业务数据变化快且频繁,分析需求也要随之变化,IT/数据部门无法快速满足业务提出的繁多、琐碎且紧急的分析需求;

  • 数据分析工作有门槛,要求经验沉淀积累。

2、设计思路

一方面,借助LLM的学习、理解、泛化能力,让业务用自然语言进行提问,近乎零门槛的方式实现业务用数自由。

另一方面,借助BI底座的计算引擎、分析引擎、安全引擎,有效保障数据查询的效率和性能,并严格按照企业所需进行数据权限控制,做到高效查数,安全看数。

3、解决方案

将大语言模型和BI基座能力相结合,应用大语言模型的底层能力,学习企业业务知识(表知识、业务逻辑、问答知识、洞察知识等),实现问答式数据分析。

通过设计多Agent体系提高任务完成质量,并通过Agent实现知识管理与训练:

  • 数据分析Agent:基于数据分析垂直领域的业务流程,自研智能体系统。在接收到用户请求后,会进行一系列意图识别,需求澄清,问题改写,知识检索,相关代码/文本内容生成,自我检查与修复等工作,支持数据分析领域中的各类任务,如取数,洞察等。

  • Agent知识管理与训练:支持接入企业中各类数据分析领域知识,包括数据集信息,业务知识,问答知识,洞察知识等几大类,提供给Agent进行“长期记忆”的获取与持续更新。其挖掘模块能够从企业已有BI、指标平台等系统中进行各类知识挖掘、预处理与导入。管理模块提供了完善的分析主题管理,效果测试与优化,用户使用情况追踪等能力。Agent的核心推理能力来自于各类开源、闭源大模型API的对接。Agent的各类任务执行能力,如SQL/Python代码执行等,是将BI平台已有的API封装成工具提供给Agent。能够很好地支持各类企业级需求,如数据权限,各类数据库查询对接,并发控制,任务审计等。

通过该方案,观远Chat BI具备了以下功能:

1、及时响应提问,缩短数据获取周期:

① 业务用户可以在任何时间通过对话的方式,获取数据结果。

② 对于用户提问模糊的问题,AI会进行语义理解与澄清,对模糊项进行追问,用户可以通过多轮对话将问题表达明确。

③ 该产品也能够支持移动办公、OA集成场景。

2、AI自学习知识运营体系,让知识库实现快速的更新迭代:

① 在创建主题时能够快速接入数据知识、业务知识和问答知识,AI自动进行学习。

② 训练师可以追溯对话中的有效知识,将知识加入知识库中。

③ AI持续对知识进行学习,逐步提升回答准确性。

进一步,AI可挖掘BI用户行为数据,了解用户分析资产,将指标平台等企业数据资产接入到知识库中,加速知识库冷启动。

4、案例技术

使用的大模型:Azure OpenAI GPT-4o,GPT-3.5-turbo等。

本案例使用到的大模型相关技术:

  • 提示词工程:包括Chain-of-Thought,emotional prompt,结构化prompt,基于用例驱动提示词开发与管理等。

  • RAG:知识预处理与索引,查询改写,混合召回,重排序,事实性检查等。

  • Function call:基于大模型的function call能力,支持各类工具调用,提升特定回复结构的稳定性。

  • 基于状态机的Agent流程设计:基于LLM来进行流程与逻辑控制,提升灵活性与最终效果。

  • 多Agent体系:针对不同任务场景设计独立Agent,通过多Agent交互来协作完成任务。提升每个单独任务的完成质量。

  • 记忆管理与自我提升:通过Agent来自动管理用户对话、记忆召回、记忆更新等动作,实现自我能力提升。

5、价值与效果

  1. 产品上线3个月后活跃用户占比52%,覆盖业务部门10+,处理取数需求1k+,业务部门的数据需求满足周期从原来的0.5小时~3天不等,缩短到1~5分钟,有效提升数据分析需求的响应效率。

  2. 提升数据分析师的服务半径,转变数据分析师的工作角色,从原来的SQL工程师变成企业知识训练师。数据支持部门与业务部门进行更紧密合作。

  3. 沉淀营销、销售、市场、库存和财务等业务数据,快速响应综合性业务分析需求,加速知识调取与流通,降低跨部门沟通协作成本

  4. 培养业务数字化思维,规范业务需求描述,大大降低其他需要开发的数据需求的沟通成本。

6、案例亮点

  1. 及时响应为企业敏捷决策赋能:用户提问后,能够快速提供数据分析结果。为业务进行临时、紧急的决策调整提供及时准确的数据支撑。

  2. 提升企业员工数字化意识:业务用户通过自然语言提问即可获得数据结果,在弱化SQL等技术环节的同时,也培养了业务用户在描述需求时严谨规范的思维方式,降低开发需求的沟通成本,提升报表看板的开发效率。

  3. 知识库自运营体系为训练师减负增效:知识库可实现冷启动和自迭代,实现知识的更新、自检自查和在企业资产沉淀,不断强化产品问答能力。


文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+观远数据。