hookehuyr

feat(extractor): 实现智能字段提取器 smartExtractList

- 添加 smartExtractList() 智能列表提取函数
- 支持基于起始模式和结束关键词的列表边界识别
- 修复 insurance_period 和 withdrawal_modes 字段类型处理
- 优化 payment_periods 过滤逻辑,排除无效项

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
## [2026-02-15] - 智能字段提取器完善
### 新增
- 实现 `smartExtractList()` 智能列表提取函数
- 支持基于起始模式和结束关键词的列表边界识别
### 修复
- 修复 `insurance_period``withdrawal_modes` 字段的 `postProcess` 函数类型处理问题
- 优化 `payment_periods` 字段的过滤逻辑,排除"投保年龄"等无效项
---
**详细信息**
- **影响文件**: scripts/smart-field-extractor.js
- **技术栈**: Node.js, 正则表达式, 智能提取
- **测试状态**: 单元测试通过
- **备注**: 提升了字段提取的准确性和健壮性
---
## [2026-02-14] - 文档解析使用说明完善
### 优化
- 补充解析链路与使用思路,明确审核与合并边界
- 更新解析命令说明与默认行为
---
**详细信息**
- **影响文件**: docs/to-parse/README.md, README.md
- **技术栈**: 文档维护
- **测试状态**: 未运行(仅文档更新)
- **备注**: 使用方式与链路更清晰
---
## [2026-02-14] - 文档解析审核流程落地
### 优化
- 修复审核模板重复定义与内容断裂,统一字段命名与展示结构
- 完善审核流程指引,明确 pending/approved 目录治理与合并步骤
- 默认解析仅生成待审核文件,写入配置需显式开启
---
**详细信息**
- **影响文件**: scripts/parse-docs.js, docs/to-parse/README.md, docs/tasks/plan/改进文档解析工具-添加审核流程.md, README.md
- **技术栈**: Node.js, 文档维护
- **测试状态**: pnpm test 通过;pnpm lint 30 warnings
- **备注**: 已生成待审核文件并完成可读性校验
---
## [2026-02-14] - 文档解析审核方案整理
### 优化
......
This diff is collapsed. Click to expand it.