项目经历
GraphRAG 大规模本地知识库搭建
技术栈:Python + Microsoft GraphRAG + LitServe + Neo4j + Faiss
项目背景:企业级知识库面临多模态数据(PDF/PPT/CSV)检索效率低(准确率<65%)、响应慢的问题,需构建高性能混合检索系统。该项目致力于解决传统RAG系统在处理大规模复杂文档时的局限性,通过图谱增强检索技术实现知识的深度关联和精准召回。
核心职责:
-
负责多源和多模式本地知识库的基建,包括原始数据的预处理、文档解析、知识图谱的构建及问答的召回评估全流程
-
主导Microsoft GraphRAG项目的二次开发,针对企业级应用场景进行深度定制和优化
- 设计并实现高并发、低延迟的知识检索架构,支持实时数据更新和混合检索模式
技术突破点:
-
智能文档解析:二次开发Microsoft
GraphRAG项目,针对CSV和PDF格式自定义动态切分策略,完成Auto Prompt
Tuning自适应垂类领域提示优化,整体索引准确率显著提升
-
多GPU并行优化:基于LitServe构建多GPU并行解析优化服务接口,支持图像、表格、公式等复杂数据结构的解析,解析速度提升5倍以上
-
四阶段提示优化:实现意图识别→查询生成→结果过滤→精炼的完整优化流程,实体关系提取和社区报告生成准确率提升至80%以上
-
实时增量更新:支持自定义增量重构索引构建流程,增强知识库的分钟级实时更新能力
项目成果:
- 构建支持PDF、CSV、Word、PPT等多格式文件的一键上传解析系统
- 开发多线程批量导入工具,实现100万+节点/关系数据10分钟内入库
- 知识更新延迟从小时级优化至分钟级,支持高并发实时查询
-
实现.parquet→Neo4j自动映射的一键式图谱数据导入界面,完全满足企业实时数据需求
达人撮合平台
技术栈:React + TypeScript + 微服务架构
项目背景:达人撮合平台是抖音本地生活用于管理达人与商家业务撮合的核心系统,涵盖抖音来客、抖音集星、抖音林客及抖音达人带货等多个产品,支持App和PC双端。
核心职责:
- 全程参与项目业务的全流程开发,确保功能实现的高效性与稳定性
- 深度参与技术评审和代码审查,保障代码质量并推动最佳实践的落地
- 主要负责计划模块的开发及其在各端各产品中的适配工作
技术挑战与解决方案:
-
多端适配难题:设计统一的组件库和状态管理方案,实现一套代码多端运行
-
性能优化挑战:通过代码分割、懒加载、缓存优化等手段,首屏加载时间优化50%
-
代码质量保障:建立自动化测试体系和代码审查流程,确保代码质量稳定可控
项目成果:
- 提供多端多平台的复用能力,显著提升开发效率和代码一致性
- 构建抖音来客、抖音集星、抖音林客等多产品统一技术底座
- 实现计划模块在各端各产品中的无缝适配,保证功能一致性与稳定性
- 优化多项关键性能指标,包括CLCP(首屏渲染完成时间)和页面卡顿率等
AddoOne平台
技术栈:Node.js + gulux + MySQL + Redis
项目背景:AddoOne是一个专为业务研发人员打造的平台,服务于中国区商业化和房产部门。它整合需求管理、开发流程、FaaS和BaaS功能,帮助开发者高效实现业务目标,无需构建后端。
核心职责:
- 负责平台整体架构设计,采用微服务架构支持高并发业务场景
- 参与开发专为业务研发人员打造的一体化平台
-
整合需求管理、开发流程、运行时等核心模块,提供租户隔离、权限管控等企业级能力
架构设计亮点:
- 微服务架构:设计可扩展的微服务架构,支持高并发业务场景
- FaaS引擎:自研轻量级FaaS执行引擎,支持多语言函数运行时
-
BaaS服务:构建完整的后端即服务能力,提供数据库、存储、认证等基础服务
项目成果:
- 高效支持多部门研发,显著提升研发团队的开发效率,项目上线周期大幅缩短
-
通过自研的Node.js FaaS和BaaS能力,帮助开发者实现低成本、高效率的业务研发
- 平台上线一年内,累计支持超千次代码迭代和需求交付,覆盖多个核心业务场景
运维自动化平台
技术栈:React + SVG + WebSocket
项目背景:运维自动化平台是一款面向大中型企业的综合性运维管理产品,致力于解决传统运维工作中效率低下、人工操作风险高、标准化程度不足等核心痛点。平台通过可视化流程编排技术,将复杂的运维操作标准化、自动化,支持服务器批量管理、应用部署、监控告警、故障处理等全生命周期运维场景。
核心职责:
- 负责整个项目的前端开发和前端团队管理工作
- 通过编排常规运维能力,实现动态化作业和参数化配置
- 开发可视化界面,便于实时监控运维进度,配备完善的回滚机制
技术突破点:
-
动态可视化:基于SVG技术构建动态流程图,实现复杂运维流程的可视化展示
-
实时监控:通过WebSocket实现实时数据推送,运维状态实时可见
- 交互设计:创新的拖拽式流程编辑器,大幅提升用户操作体验
项目成果:
- 构建企业级运维自动化平台,支持动态化作业和参数化配置
- 实现完善的回滚机制和实时监控能力,确保系统高可用性
- 可视化技术方案在行业内具备领先性,系统稳定性和用户体验获得客户高度认可