BIMONTHLY REPORT

实习双月(8周)工作内容总结

刘晓枫

2025年6月 - 2025年7月

汇报目录

1. 双月工作历程总览

2. 核心成果一:双轨并行的 Agentic Workflow 构建

3. 核心成果二:一体化知识库体系建设

4. 核心成果三:MCP工具链拓展与平台实践

5. 挑战、反思与未来展望

1. 双月工作历程总览

第1-4周:探索与原型

熟悉业务,启动向量知识库探索。基于LangGraph构建了“代码理解与注释”工作流的雏形,实现核心功能并完成初步的MCP工具封装。

第5-6周:并行与演进

工作分化为两条主线:1. 启动全新的 **ReAct Agent** 构建,并迅速完成MCP封装与Dify平台初步测试。 2. 对现有MCP服务进行重构拆分,切换至Nacos,并优化“代码助手”知识库。

第7-8周:深化与融合

两条主线均取得突破:1. **ReAct Agent** 持续优化并成功应用于“算法问题排查”工作流。 2. **“代码助手”工作流** 的知识库从本地(Chroma/Faiss)全面升级并接入RAGFlow。同时,大量MCP工具被开发和完善,深化了与Dify平台的融合。

2. 核心成果一:双轨并行的 Agentic Workflow 构建

工作流 A: 代码助手

目标:提升代码理解、注释与审查效率

  • 核心功能: 自动化代码理解、生成注释、返回代码溯源(文件名+行号)。
  • 技术演进:
    • 执行方式: 同步 -> 异步,提升响应速度。
    • 知识库后端: 本地ChromaDB -> 本地Faiss -> 云端RAGFlow,持续优化检索性能与管理能力。
  • 最终状态: 一个接入企业级RAG平台的、功能稳定的代码领域专用助手。

工作流 B: 通用ReAct Agent

目标:构建能自主调用工具解决复杂问题的智能体

  • 核心架构: 基于ReAct模式(推理->行动->观察),实现自主决策循环。
  • 技术演进:
    • 服务接口: Flask -> FastAPI,提升性能。
    • 工具调用: 从特定功能到能调用任意MCP工具,实现通用化。
  • 最终状态: 成功应用于“算法问题排查”场景,并作为高阶MCP工具沉淀,具备广泛应用潜力。

3. 核心成果二:一体化知识库体系建设

从本地探索到接入企业级RAG平台,为不同AI应用提供精准数据支持

本地化探索 (v1.0)

使用 ChromaDBFaiss 进行本地知识库构建,重点攻克代码分块策略(从按字符到按行+Token),保证了代码块语义完整性。

云端化升级 (v2.0)

全面转向 RAGFlow 平台,构建了服务于不同工作流的多个专用知识库(如代码助手库、历史问答库、CodeReview库),实现统一管理和权限控制。

自动化维护

开发了多个MCP工具(如上传QA对、上传文档chunk),实现了从Dify工作流到RAGFlow知识库的自动化、闭环式知识沉淀。

4. 核心成果三:MCP工具链拓展与平台实践

为Agent提供强大的“双手”,实现与企业内部系统的高效交互

MCP 工具集拓展

  • 服务化重构:与同事协作完成MCP服务拆分与Nacos注册中心切换。
  • 新增核心工具:开发GitLab文件获取、RAGFlow QA上传等关键工具。
  • 封装Agent:将代码助手与ReAct Agent本身封装为高阶MCP工具,实现能力复用。

Dify 平台实践

  • 工作流闭环:利用新建工具打通“算法问题排查 -> RAGFlow知识沉淀”的全流程。
  • 插件化探索:调研并实践Dify的Nacos插件,简化MCP工具调用链路。
  • 经验输出:沉淀Nacos集成SOP,为团队提供可复用的标准操作流程。

5. 挑战、反思与未来展望

主要挑战与解决方案

  • Agent工具调用丢失: 早期版本中ToolCall丢失,通过优化提示词与正则匹配解决。
  • 代码知识库分块策略: 从按字符数切分优化为按行+Token数,保证了代码块的语义完整性。
  • RAGFlow上传异常: 通过在内存中创建虚拟Excel二进制文件解决特殊字符分块错误问题。

反思与未来展望

  • 架构思考:提出分层MCP架构(轻度/中度/重度使用),应对不同场景的部署需求。
  • 权限管理:建议由管理员统一创建知识库,解决信息孤岛问题,便于团队协作。
  • 未来计划:将Agent拓展为更通用的形态,深入参与具体业务(如代码审查),持续探索AI在工程领域的应用。

谢谢!

期待您的批评指正