点一下关注吧!!!非常感谢!!持续更新!!!
🚀 AI篇持续更新中!(长期更新)
目前2025年06月13日更新到:
AI炼丹日志-28 - Audiblez 将你的电子书epub转换为音频mp3 做有声书,持续打造实用AI工具指南!📐🤖
💻 Java篇正式开启!(300篇)
目前2025年06月11日更新到:
Java-44 深入浅出 Nginx - 底层进程机制 Master Worker 机制原理 常用指令
MyBatis 已完结,Spring 已完结,深入浅出助你打牢基础!
📊 大数据板块已完成多项干货更新(300篇):
包括 Hadoop、Hive、Kafka、Flink、ClickHouse、Elasticsearch 等二十余项核心组件,覆盖离线+实时数仓全栈!
目前2025年06月13日更新到:
大数据-278 Spark MLib - 基础介绍 机器学习算法 梯度提升树 GBDT案例 详解
DeerFlow(Deep Exploration and Efficient Research Flow)是字节跳动 2025 年 5 月正式开源的「深度研究」多智能体框架。它将 LLM 能力与网页搜索、爬虫、代码执行、RAG、TTS 等工具整合在同一工作流中,帮助用户把一句查询自动转化成结构化的研究报告、PPT 乃至播客音频,同时保留“人在回路”(Human-in-the-Loop)机制,允许你随时插手调整计划或润色结果。
官网介绍
https://deerflow.tech/
DeerFlow(Deep Exploration and Efficient Research Flow)是一个社区驱动的深度研究框架,它建立在开源社区的杰出工作基础之上。我们的目标是将语言模型与专业工具(如网络搜索、爬虫和 Python 代码执行)相结合,同时回馈使这一切成为可能的社区。
命名与定位
- 名称来源:单词首字母缩写,强调“深度探索 + 高效流程”。
- 目标用户:需要系统化信息收集、分析与内容生产的研究者、开发者、内容团队。
- 定位:对标 OpenAI DeepResearch,但完全开源,可本地或云端私有部署。
核心特点
- 多智能体架构:Coordinator → Planner → Researcher/Coder → Reporter
- 工具即服务:Tavily/Brave/DuckDuckGo/Arxiv 搜索,Jina 爬虫,Python REPL,RAGFlow
- Human-in-the-Loop:计划生成后可 [ACCEPTED] / [EDIT PLAN] 自然语言反馈
- 多模态输出:Markdown/Notion-块报告、Marp-PPT、一键播客(Volcengine TTS)
- 部署形态:本地 CLI、Web UI、Docker Compose、火山引擎 FaaS 一键部署
主要功能
- 深度研究报告:“量子计算对密码学的冲击” → 结构化长文(含引文、图表)
- 学术文献快速综述:Arxiv API 快速定位高影响因子论文,自动提炼贡献与局限
- 企业竞品洞察:抓取新闻/专利/招聘信息,生成竞争分析 PPT
- 播客脚本 & 音频:报告内容 → 双主持人对话脚本 → 自动配音导出 MP3
- 代码检索与复现:让 Coder 代理下载、运行并测试开源仓库中的示例
配置项目
克隆项目
git clone https://github/bytedance/deer-flow.git
安装依赖
这里使用 UV,之前在 MCP 的章节也使用过:
uv sync
配置参数
拷贝环境文件,配置自己的API KEY:
cp .env.example .env
vim .env
https://app.tavily/home
我这里配置的搜索是:Tavily 的 API (上次在 Deep Research项目中使用过):
模型配置
配置 LLM 的相关内容,先拷贝配置文件
cp conf.yaml.example conf.yaml
vim conf.yaml
我这里就使用 DeepSeek 的模型了,自行按照自己的来配置:
marp-cli
在 MacOS 下用来生成 PPT 的,如果你需要的话,可以按照这个来安装:
brew install marp-cli
Web依赖
如果你使用【控制台】的方式则跳过该部分,如果你使用【Web页面】,则请安装依赖。
前端的页面依赖安装需要使用 Node.js:
cd web
pnpm install
耐心等待:
测试使用
./bootstrap.sh -d
一键启动项目:
访问项目:
让它调研一个话题:
对图像进行向量化的检索方案有哪些?
任务开始,将持续进行检索任务:
架构流程
DeerFlow 实现了一个模块化的多智能体系统架构,专为自动化研究和代码分析而设计。该系统基于 LangGraph 构建,实现了灵活的基于状态的工作流,其中组件通过定义良好的消息传递系统进行通信。
主要的几个结构组成如下:
协调器
管理工作流生命周期的入口点
● 根据用户输入启动研究过程
● 在适当时候将任务委派给规划器
● 作为用户和系统之间的主要接口
规划器
负责任务分解和规划的战略组件
● 分析研究目标并创建结构化执行计划
● 确定是否有足够的上下文或是否需要更多研究
● 管理研究流程并决定何时生成最终报告
研究团队
执行计划的专业智能体集合:
● 研究员:使用网络搜索引擎、爬虫甚至 MCP 服务等工具进行网络搜索和信息收集。
● 编码员:使用 Python REPL 工具处理代码分析、执行和技术任务。 每个智能体都可以访问针对其角色优化的特定工具,并在 LangGraph 框架内运行
报告员
研究输出的最终阶段处理器
● 汇总研究团队的发现
● 处理和组织收集的信息
● 生成全面的研究报告
技术架构
- Coordinator:入口,维护线程上下文,决定何时交由 Planner。
- Planner:将用户问题拆解为最多 N 个步骤,若信息不足会循环回补。
- Research Team
- Researcher:调用搜索 / 爬虫 / 私域 MCP 接口抓取原始资料。
- Coder:在需要代码分析或数据处理时运行 Python REPL。
- Reporter:汇总/去重/结构化内容,调用 LLM 生成引文、摘要、结论,并可触发 PPT & TTS。
整个链路在 LangGraph Studio 可视化,支持本地或云端调试。
发布者:admin,转转请注明出处:http://www.yc00.com/web/1754772218a5200195.html
评论列表(0条)