wangzaijun преди 2 месеца
родител
ревизия
9f83d09758
променени са 4 файла, в които са добавени 98 реда и са изтрити 0 реда
  1. 2 0
      .gitignore
  2. 89 0
      mo-daq-openai/readme.md
  3. 0 0
      mo-daq-openai/新建文本文档.txt
  4. 7 0
      mo-daq/readme.md

+ 2 - 0
.gitignore

@@ -31,3 +31,5 @@ build/
 
 ### VS Code ###
 .vscode/
+
+.logs

+ 89 - 0
mo-daq-openai/readme.md

@@ -0,0 +1,89 @@
+# 提供 阿里ai来上传文件并解析部分pdf
+
+## POST 上传文件并解析
+
+POST /upload-file
+
+> Body 请求参数
+
+```yaml
+file: ""
+file_id: ""
+user_msg: ""
+
+```
+
+### 请求参数
+
+|名称|位置|类型|必选|说明|
+|---|---|---|---|---|
+|token|header|string| 否 |none|
+|body|body|object| 否 |none|
+|» file|body|string(binary)| 否 |待解析文件|
+|» file_id|body|string| 否 |ai上传文件的id,为空时file必传|
+|» user_msg|body|string| 否 |ai提示词|
+
+> 返回示例
+
+> 200 Response
+
+```json
+{
+  "file_id": "string",
+  "content": "string"
+}
+```
+
+### 返回结果
+
+|状态码|状态码含义|说明|数据模型|
+|---|---|---|---|
+|200|[OK](https://tools.ietf.org/html/rfc7231#section-6.3.1)|none|Inline|
+
+### 返回数据结构
+
+状态码 **200**
+
+|名称|类型|必选|约束|中文名|说明|
+|---|---|---|---|---|---|
+|» file_id|string|true|none|ai上传的文件id|none|
+|» content|string|true|none|ai解析结果|none|
+
+## GET 上传文件绝对路径并解析
+
+GET /upload-filepath
+
+### 请求参数
+
+|名称|位置|类型|必选|说明|
+|---|---|---|---|---|
+|filepath|query|string| 否 |文件绝对路径,file_id为空时必传|
+|file_id|query|string| 否 |ai上传的文件id|
+|user_msg|query|string| 否 |ai提示词,不传时有默认值|
+|token|header|string| 否 |none|
+
+> 返回示例
+
+> 200 Response
+
+```json
+{
+  "file_id": "string",
+  "content": "string"
+}
+```
+
+### 返回结果
+
+|状态码|状态码含义|说明|数据模型|
+|---|---|---|---|
+|200|[OK](https://tools.ietf.org/html/rfc7231#section-6.3.1)|none|Inline|
+
+### 返回数据结构
+
+状态码 **200**
+
+|名称|类型|必选|约束|中文名|说明|
+|---|---|---|---|---|---|
+|» file_id|string|true|none|ai上传的文件id|none|
+|» content|string|true|none|ai解析内容|none|

+ 0 - 0
mo-daq-openai/新建文本文档.txt


+ 7 - 0
mo-daq/readme.md

@@ -0,0 +1,7 @@
+# 邮件采集+解析
+
+- 数据库初始化文件在 db/init.sql 中,记得调整 `mo_mailbox_info` 表的配置信息,其他不用改
+- 任务每天4点执行一次,往前找一天的邮件来解析
+- 解析规则是文件名必须包含“确认单”\“确认函” 才能进入到代码解析
+- 优先用Java来解析,当Java无法解析时调用openai上传文件并解析
+- 解析结果表全部用file_id字段关联,所以可能存在很多重复数据,需要对数据按需求清洗再使用