点击下方“JavaEdge”,选择“设为星标”
第一时间关注技术干货!
免责声明~
任何文章不要过度深思!
万事万物都经不起审视,因为世上没有同样的成长环境,也没有同样的认知水平,更「没有适用于所有人的解决方案」;
不要急着评判文章列出的观点,只需代入其中,适度审视一番自己即可,能「跳脱出来从外人的角度看看现在的自己处在什么样的阶段」才不为俗人。
怎么想、怎么做,全在乎自己「不断实践中寻找适合自己的大道」
0 业务痛点
标准搜索查询通常会因复杂问题而失效。学术论文、市场分析或代码调试,要找到完整答案通常需拼凑数十个单独搜索。这正是深度研究的用武之地——它能够直面这一日常挑战。Google Gemini、ChatGPT 和 DeepSeek-R1 等领先 AI 平台已提供这项强大功能。
深度研究凭借其智能反馈循环脱颖而出:它能够识别知识缺口,锁定特定问题,进行系统性探索,并提供全面的报告。不同于传统的碎片化信息搜索,深度研究提供的答案既广泛又深入。
本文展示咋用 Dify 构建深度研究工作流,主要包含三个关键组件: 循环变量、结构化输出和代理节点 。创建一个能够独立进行研究并提供有意义见解的工作流。
工作流概述
Dify 中的深度研究工作流程分三阶段:
意图识别 :工作流程捕捉您的研究主题,收集初始背景,并分析目标以确定明确的方向。
迭代探索 :工作流程使用循环变量来评估知识以发现差距、运行有针对性的搜索并逐步建立发现。
综合 :所有收集到的信息都成为一份带有适当引用的结构化报告。
它反映了专家研究人员的思考:“我已经知道什么?缺少什么?下一步我应该研究什么?”
1 第一阶段:研究基础
1.1 起始节点
应首先用基本输入参数配置开始节点:
研究主题 :需要探索的核心问题
最大循环 :本次研究会话的迭代预算
背景知识获取
建议使用 Exa Answer 工具收集初步信息,确保模型在深入研究之前理解术语。
意图分析
需使用 LLM 节点来挖掘用户的真实意图,从而区分表面问题和进一步的信息需求。
2 第二阶段:动态研究周期
循环节点:研究引擎
循环节点驱动着整个研究。在 Dify 中,它跨迭代传递信息,因此每个循环都建立在先前的发现之上。
Dify的深度研究工作流程跟踪六个关键变量:
findings: 每个周期发现的新知识
executed_querys: 以前使用的搜索查询(防止冗余)
current_loop: 迭代计数器
visited_urls: 正确引用的来源跟踪
image_urls: 视觉内容引用
knowledge_gaps: 已确定的信息需求
循环变量 V.S 标准变量
正常参考遵循线性路径:节点 1 → 节点 2 → 节点 3
循环引用前一次迭代创建一个知识网络:节点可以访问当前迭代和前一次迭代的输出
这种设计可以积累知识,避免重复工作,并在每个周期中增强焦点。
推理节点:提出更好的问题
推理节点采用结构化输出格式:
ounter(lineounter(lineounter(lineounter(lineounter(line{ "reasoning": "Detailed justification for the chosen action path...", "search_query": "Specific follow-up question targeting knowledge gaps", "knowledge_gaps": "Information still needed to answer the original question"}
通过在 LLM 节点中启用 Dify 的结构化输出编辑器,您将收到一致的 JSON,以便下游节点能够可靠地处理。这可以清晰地提取推理路径、搜索目标和知识缺口。
代理节点:进行研究
好的问题只是开始。有效的研究需要果断的行动,而这正是 Agent node 所擅长的。
这些节点充当自主研究人员的角色,根据具体情况选择最合适的工具。工作流为代理提供了以下功能:
发现工具
exa_search: 进行网络搜索并收集结果
exa_content: 从特定来源获取完整内容
分析工具
think :作为系统的反思引擎,灵感源自 Claude 的 Think Tool。它使代理能够评估发现、识别模式并确定后续步骤,这与研究人员暂停工作以整合笔记并规划其方法非常相似。
可通过仅向代理提供其所需的内容来优化性能:仅提供来自上一个 LLM 节点的 search_query,而不是整个上下文。这种专注的方法可以提高工具选择的准确性。
URL 提取
工作流自动识别代理响应中的 URL 和视觉参考,从而正确跟踪所有信息源。
在每次迭代中,代理通过收集信息、处理内容和整合研究结果来完成一个完整的研究周期。
变量赋值
每个周期结束后, 变量分配器节点都会更新研究状态。这确保每次迭代都建立在先前工作的基础上,而不是重复工作。
3 第三阶段:研究综合
一旦多个探索周期完成, 最终摘要节点就会采用所有累积变量(发现、来源和支持数据)来生成综合报告。
设置此节点是为了维护正确的 Markdown 引用并编制完整的参考文献列表。该工作流程还在关键节点设置了答案节点,以便在整个研究过程中提供流式更新。这些更新将最终报告构建成全面的分析和有效的参考文献,兼具分析深度和学术可信度。
总结
本《深度研究指南》展示了 Dify 代理工作流程的卓越成就。Dify将专家研究方法数字化,并通过自动化加速其进程。
未来的研究不仅仅在于拥有更多数据,更在于以更智能的方式探索数据。立即借鉴这些模式,构建您的研究引擎。
参考:
https://github/dzhng/deep-research
https://github/jina-ai/node-DeepResearch
https://github/langchain-ai/local-deep-researcher
https://github/nickscamara/open-deep-research
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
加我好友,一起AI探索交流!
写在最后
编程严选网:
http://www.javaedge/
专注分享AI时代下软件开发全场景最新最佳实践,点击文末【阅读原文】即可直达~
发布者:admin,转转请注明出处:http://www.yc00.com/web/1754770208a5200055.html
评论列表(0条)