基于文档内容的知识抽取
本项目旨在利用InternLM的能力,构建文档内容知识抽取的功能。用户通过上传pdf文档或者text文档或者输入一段内容,并构建知识抽取prompt,利用InternLM抽取文档知识。主要功能包括:
- 文件上传功能:支持pdf、text等格式文档、支持内容输入。
- 知识抽取prompt:支持用户自定义知识抽取prompt
- 文件类型:支持doc、excel等格式文件解析。
- 模型微调:使用XTuner工具对模型进行LoRA、QLoRA或全量参数微调,提升知识抽取效果。
| Name | Name | Last commit date | ||
|---|---|---|---|---|