Name Last Update
..
README.md Loading commit data...
测试计划书-智享未来2.md Loading commit data...

文档解析工具

📁 文件夹说明

此文件夹用于存放需要解析的保险产品文档,脚本将自动读取并生成配置。

🚀 使用方法

1. 添加文档

将客户提供的 PDF/Word 文档复制到此文件夹:

docs/to-parse/
├── WIOP3E 产品说明书.pdf
├── 宏挚传承保障计划.docx
└── MBC PRO 保障计划.pdf

2. 执行解析脚本

# 查看待处理的文档
pnpm run parse:docs:list

# 解析所有文档
pnpm run parse:docs

# 解析指定文档
pnpm run parse:docs:file -- --file="产品说明书.pdf"

3. 查看结果

解析成功后,配置会自动添加到 src/config/plan-templates.js

📋 支持的文档格式

  • ✅ PDF (.pdf)
  • ✅ Word (.doc, .docx)
  • ✅ 纯本文档 (.txt, .md)

🧪 Fixtures 文档样本说明

用于测试的样本文档建议放在此目录,命名规则建议包含产品名与类型,便于回归验证:

docs/to-parse/
├── fixtures-life-insurance-sample.pdf
├── fixtures-critical-illness-sample.docx
└── fixtures-savings-sample.txt

执行测试前请确认样本文档内容完整且可被抽取为文本。

📊 解析摘要与审计日志

每次解析都会输出成功/失败/耗时摘要,并在以下位置记录审计日志:

docs/parsed-backup/parse-audit.jsonl

日志包含解析汇总与本次变更摘要,便于回溯与排查。

🔧 配置 AI 服务

脚本使用 skill 工具调用 AI 服务,支持:

  • OpenAI GPT-4o Vision
  • Anthropic Claude 3.5 Sonnet

你需要配置 API Key(首次使用时脚本会提示)

⚠️ 注意事项

  1. 文档命名:建议使用有意义的文件名,方便识别产品
  2. 手动审核:生成后请检查配置是否正确
  3. 版本控制:生成的配置会自动备份