feat(doc-parser): 添加文档解析系统架构文档和豆包预处理支持
## 新增 - 文档解析系统架构文档 (docs/doc-parser-architecture.md) - 完整的三层架构说明 - 8 种字段提取模式详解 - 优缺点分析和优化建议 - 豆包预处理快速通道 - 新增 preprocessed/ 目录支持 - 自动识别文档来源 - 优化 MD 文件解析提示 - 混合解析方案 - 少量文档用豆包预处理 - 批量文档用 MCP 直接解析 - 按来源分组显示文档列表 ## 更新 - README.md: 添加文档解析工具说明 - docs/to-parse/README.md: 添加豆包预处理指南和对比表 ## 移除 - scripts/doc-parser/QUICKSTART.md (内容已整合) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
Showing
5 changed files
with
145 additions
and
218 deletions
docs/doc-parser-architecture.md
0 → 100644
This diff is collapsed. Click to expand it.
This diff is collapsed. Click to expand it.
scripts/doc-parser/QUICKSTART.md
deleted
100644 → 0
-
Please register or login to post a comment