Peng Luo
Senior ML Platform & LLM Engineer
Senior ML Platform & LLM Engineer with 7+ years building data-driven AI systems end to end — from data pipelines, evaluation platforms, and Airflow-orchestrated ML workflows to production LLM services and model fine-tuning. Comfortable owning the platform layer that turns models into reliable products.
ShangHai China
技术技能
我在 ML 工程全栈中使用的核心技术与工具。
ML Platform & MLOps
LLM Engineering
Fine-tuning & Training
Data Engineering
Backend & Languages
精选项目
在 LLM 系统、RAG 和 ML 基础设施领域的精选工作。
GraphRAG 智能客服
LangGraph 对话状态管理 + 业务意图路由 + Function Calling + 意图切换恢复,企业级客服对话引擎
基于 FastAPI + LangGraph 构建的企业级智能客服系统。核心亮点:LangGraph StateGraph 编排对话流程,支持业务意图识别(退款/退货/订单查询/物流追踪/投诉)、多轮槽位收集、Function Calling 工具执行、意图切换与任务恢复、RAG 知识检索三路路由。集成知识图谱检索、安全防护与全链路可观测性。
4-bit QLoRA Post-Training
跨平台 LLM 后训练平台:FSDP/DeepSpeed 多卡分布式训练 + MLflow Model Registry 模型生命周期管理。支持 SFT/DPO/领域适配 + Streamlit 全生命周期面板 — NVIDIA GPU + Apple Silicon
面向消费级到多卡集群的 LLM 后训练平台,覆盖模型全生命周期。 分布式训练(业界标准 2026 方案):FSDP(PyTorch 原生)为主、DeepSpeed ZeRO 为 scale-beyond、DDP 为基线。配置驱动,零训练循环改动,通过 torchrun 一键启动多卡。 模型生命周期闭环:微调 → 评测 → merge → 注册(Staging/Production)→ 血缘追溯。基于 MLflow Model Registry,每个版本可追溯回训练 run(参数 + 指标)。 跨平台训练引擎:NVIDIA(4-bit QLoRA)、Apple Silicon(bf16 MPS)、CPU,自动平台检测。SFT/DPO/领域适配三种后训练技术,配套 MLflow 追踪 + Streamlit 可视化。 内置医疗实体匹配领域示范:微调 Qwen3(0.6B-14B)实现药品/医院名归一化匹配。
Stock Analysis Multi-Agent System
双架构股票分析系统,LangGraph 流水线 + ReAct 自主 Agent,支持美股 & A股
生产级股票分析系统,采用两种互补的 Agent 架构。 顺序流水线通过 LangGraph StateGraph 编排 8 个专业 Agent:数据采集(yfinance)、 A股数据(AkShare)、技术分析(RSI、MACD、Bollinger Bands、K线形态)、 基本面分析(盈利能力、估值、财务健康)、舆情分析(新闻关键词评分)、 风险评估(VaR、最大回撤、仓位管理)、决策制定(多因子加权评分)、 报告生成(结构化投资报告)。 ReAct 自主 Agent 采用 Reason-Act-Observe-Reflect 循环,自主选择并执行 LangChain 工具, 内置安全机制:最大迭代限制、重复检测、成本追踪和上下文截断。
RAG Evaluation Pipeline
基于 Airflow 的 RAG 自动化评测流水线,覆盖检索质量、生成质量和基线对比
基于 Apache Airflow + CeleryExecutor 构建的 RAG 自动化评测流水线。 评测维度覆盖检索质量(MRR、NDCG、HitRate)和生成质量(ROUGE、BLEU、BERTScore)。 核心特性:Docker Compose 容器化编排、PostgreSQL 结果存储、 自动化报告生成(JSON/HTML)以及 Baseline 对比与统计显著性检验。