wangzaijun 3becbeac61 s преди 1 седмица
..
.mvn 3b20c86533 init преди 4 месеца
db bbe3186ae3 fix:确认单ocr解析时的逻辑优化 преди 1 седмица
src 3becbeac61 s преди 1 седмица
.gitattributes 3b20c86533 init преди 4 месеца
.gitignore 3b20c86533 init преди 4 месеца
mvnw 3b20c86533 init преди 4 месеца
mvnw.cmd 3b20c86533 init преди 4 месеца
pom.xml 9d96c26880 只保留确认单解析 преди 1 седмица
readme.md bbe3186ae3 fix:确认单ocr解析时的逻辑优化 преди 1 седмица

readme.md

邮件采集+解析

  • 数据库初始化文件在 db/init.sql 中,记得调整 daq_mailbox_info 表的配置信息,其他不用改
  • 任务每天4点执行一次,往前找一天的邮件来解析
  • 解析规则是文件名必须包含“确认单”\“确认函” 才能进入到代码解析
  • 优先用Java来解析,当Java无法解析时调用openai上传文件并解析
  • 解析结果表全部用file_id字段关联,所以可能存在很多重复数据,需要对数据按需求清洗再使用