wangzaijun 41cb6c80d0 fix:邮件解析结果优化 1 deň pred
..
.mvn 3b20c86533 init 4 mesiacov pred
db bd8bacac86 feat:保证邮件都能下载并存表,托管方不校验印章 3 dní pred
src 41cb6c80d0 fix:邮件解析结果优化 1 deň pred
.gitattributes 3b20c86533 init 4 mesiacov pred
.gitignore 3b20c86533 init 4 mesiacov pred
mvnw 3b20c86533 init 4 mesiacov pred
mvnw.cmd 3b20c86533 init 4 mesiacov pred
pom.xml c878e92994 fix:一些优化 1 deň pred
readme.md 9f83d09758 doc:文档 4 mesiacov pred

readme.md

邮件采集+解析

  • 数据库初始化文件在 db/init.sql 中,记得调整 mo_mailbox_info 表的配置信息,其他不用改
  • 任务每天4点执行一次,往前找一天的邮件来解析
  • 解析规则是文件名必须包含“确认单”\“确认函” 才能进入到代码解析
  • 优先用Java来解析,当Java无法解析时调用openai上传文件并解析
  • 解析结果表全部用file_id字段关联,所以可能存在很多重复数据,需要对数据按需求清洗再使用