AI炼丹日志-29 - 字节跳动 DeerFlow 深度研究框架 私有部署 测试上手 架构研究

点一下关注吧!!!非常感谢!!持续更新!!! &#x1

点一下关注吧!!!非常感谢!!持续更新!!!

🚀 AI篇持续更新中!(长期更新)

目前2025年06月13日更新到:
AI炼丹日志-28 - Audiblez 将你的电子书epub转换为音频mp3 做有声书,持续打造实用AI工具指南!📐🤖

💻 Java篇正式开启!(300篇)

目前2025年06月11日更新到:
Java-44 深入浅出 Nginx - 底层进程机制 Master Worker 机制原理 常用指令
MyBatis 已完结,Spring 已完结,深入浅出助你打牢基础!

📊 大数据板块已完成多项干货更新(300篇):

包括 Hadoop、Hive、Kafka、Flink、ClickHouse、Elasticsearch 等二十余项核心组件,覆盖离线+实时数仓全栈!
目前2025年06月13日更新到:
大数据-278 Spark MLib - 基础介绍 机器学习算法 梯度提升树 GBDT案例 详解

DeerFlow(Deep Exploration and Efficient Research Flow)是字节跳动 2025 年 5 月正式开源的「深度研究」多智能体框架。它将 LLM 能力与网页搜索、爬虫、代码执行、RAG、TTS 等工具整合在同一工作流中,帮助用户把一句查询自动转化成结构化的研究报告、PPT 乃至播客音频,同时保留“人在回路”(Human-in-the-Loop)机制,允许你随时插手调整计划或润色结果。

官网介绍

https://deerflow.tech/
DeerFlow(Deep Exploration and Efficient Research Flow)是一个社区驱动的深度研究框架,它建立在开源社区的杰出工作基础之上。我们的目标是将语言模型与专业工具(如网络搜索、爬虫和 Python 代码执行)相结合,同时回馈使这一切成为可能的社区。

命名与定位

  • 名称来源:单词首字母缩写,强调“深度探索 + 高效流程”。
  • 目标用户:需要系统化信息收集、分析与内容生产的研究者、开发者、内容团队。
  • 定位:对标 OpenAI DeepResearch,但完全开源,可本地或云端私有部署。

核心特点

  • 多智能体架构:Coordinator → Planner → Researcher/Coder → Reporter
  • 工具即服务:Tavily/Brave/DuckDuckGo/Arxiv 搜索,Jina 爬虫,Python REPL,RAGFlow
  • Human-in-the-Loop:计划生成后可 [ACCEPTED] / [EDIT PLAN] 自然语言反馈
  • 多模态输出:Markdown/Notion-块报告、Marp-PPT、一键播客(Volcengine TTS)
  • 部署形态:本地 CLI、Web UI、Docker Compose、火山引擎 FaaS 一键部署

主要功能

  • 深度研究报告:“量子计算对密码学的冲击” → 结构化长文(含引文、图表)
  • 学术文献快速综述:Arxiv API 快速定位高影响因子论文,自动提炼贡献与局限
  • 企业竞品洞察:抓取新闻/专利/招聘信息,生成竞争分析 PPT
  • 播客脚本 & 音频:报告内容 → 双主持人对话脚本 → 自动配音导出 MP3
  • 代码检索与复现:让 Coder 代理下载、运行并测试开源仓库中的示例

配置项目

克隆项目

git clone https://github/bytedance/deer-flow.git

安装依赖

这里使用 UV,之前在 MCP 的章节也使用过:

uv sync

配置参数

拷贝环境文件,配置自己的API KEY:

cp .env.example .env

vim .env

https://app.tavily/home
我这里配置的搜索是:Tavily 的 API (上次在 Deep Research项目中使用过):

模型配置

配置 LLM 的相关内容,先拷贝配置文件

cp conf.yaml.example conf.yaml

vim conf.yaml

我这里就使用 DeepSeek 的模型了,自行按照自己的来配置:

marp-cli

在 MacOS 下用来生成 PPT 的,如果你需要的话,可以按照这个来安装:

brew install marp-cli

Web依赖

如果你使用【控制台】的方式则跳过该部分,如果你使用【Web页面】,则请安装依赖。
前端的页面依赖安装需要使用 Node.js:

cd web

pnpm install

耐心等待:

测试使用

./bootstrap.sh -d

一键启动项目:

访问项目:

让它调研一个话题:

对图像进行向量化的检索方案有哪些?


任务开始,将持续进行检索任务:

架构流程

DeerFlow 实现了一个模块化的多智能体系统架构,专为自动化研究和代码分析而设计。该系统基于 LangGraph 构建,实现了灵活的基于状态的工作流,其中组件通过定义良好的消息传递系统进行通信。

主要的几个结构组成如下:

协调器

管理工作流生命周期的入口点
● 根据用户输入启动研究过程
● 在适当时候将任务委派给规划器
● 作为用户和系统之间的主要接口

规划器

负责任务分解和规划的战略组件
● 分析研究目标并创建结构化执行计划
● 确定是否有足够的上下文或是否需要更多研究
● 管理研究流程并决定何时生成最终报告

研究团队

执行计划的专业智能体集合:
● 研究员:使用网络搜索引擎、爬虫甚至 MCP 服务等工具进行网络搜索和信息收集。
● 编码员:使用 Python REPL 工具处理代码分析、执行和技术任务。 每个智能体都可以访问针对其角色优化的特定工具,并在 LangGraph 框架内运行

报告员

研究输出的最终阶段处理器
● 汇总研究团队的发现
● 处理和组织收集的信息
● 生成全面的研究报告

技术架构

  • Coordinator:入口,维护线程上下文,决定何时交由 Planner。
  • Planner:将用户问题拆解为最多 N 个步骤,若信息不足会循环回补。
  • Research Team
  • Researcher:调用搜索 / 爬虫 / 私域 MCP 接口抓取原始资料。
  • Coder:在需要代码分析或数据处理时运行 Python REPL。
  • Reporter:汇总/去重/结构化内容,调用 LLM 生成引文、摘要、结论,并可触发 PPT & TTS。

整个链路在 LangGraph Studio 可视化,支持本地或云端调试。

发布者:admin,转转请注明出处:http://www.yc00.com/web/1754772218a5200195.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信