V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
510908220
0.02D
V2EX  ›  分享创造

玩转个人知识库! Paperless-ngx 增强版: VLM 视觉识别、无限树形目录、Chat with Doc 文档对话

  •  
  •   510908220 ·
    CallStorm · 3 天前 · 1516 次点击

    大家好,

    相信很多 V 友都有管理发票、说明书、合同和旧纸质文件的烦恼。Paperless-ngx 是目前开源界强大的文档管理系统,支持 OCR 、自动打标签和全文搜索。

    但是官方原版在实际部署中(尤其是中文环境下)可能会遇到一些门槛以及 AI 功能支持不足。所以我维护了一个优化版本:CallStorm/paperless-ngx

    🚀 相比原版,这个 Fork 解决了什么?

    我主要针对中文环境和智能化做了以下核心增强:

    1. 真正的“看图说话” (VLM 视觉模型)

    原版 Tesseract OCR 面对手机随手拍的歪歪扭扭的票据、皱巴巴的纸张,识别率往往惨不忍睹。

    • 增强后:引入了 VLM (视觉模型)。它不是死板地识别字符,而是像人眼一样“理解”图片。
    • 效果:哪怕照片光线不好、有折痕,它也能精准提取出“发票金额”、“保修日期”等关键信息。

    2. 支持无限级“树形目录”

    原版 Paperless 强推“标签( Tag )”逻辑,但对于很多习惯 Windows 资源管理器一层层文件夹分类的朋友来说,非常反直觉。

    • 增强后:实现了直观的树形目录体系。你可以像在电脑上一样创建无限层级的文件夹,文件上传到目录后会自动继承标签,既有目录的结构,又有标签的灵活。

    3. 文档对话 (Chat with Doc)

    文档存进去不再是死数据。

    • 增强后:集成 LLM 。你可以在文档详情页直接问它:“这份保险合同涵盖哪些大病?”、“这个宽带什么时候到期?”,它会基于文档内容回答你,不用自己去翻几千字的小字条款。

    4. 优化部署

    • 预置了中文 OCR 语言包配置,解决了原版常见的中文乱码或识别率低的问题。
    • 优化了 Dockerfile 镜像开箱即用,省去了繁琐的环境配置。

    📸 截图预览

    🚧 后续计划

    目前的版本已经可以稳定满足日常归档需求。后续计划加入语义搜索(不再依赖关键词,搜意思也能搜到)和全局 AI 助手。

    希望能帮到同样有收纳强迫症、或者喜欢折腾 NAS 的朋友、或者喜欢打造自己的知识库的人。 如果有 Bug 或建议,欢迎在 GitHub 提 Issue 或 PR ,感谢!

    传送门:https://github.com/CallStorm/paperless-ngx


    TeslaM3
        1
    TeslaM3  
       2 天前
    总之,很牛逼的开源。 👍
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2535 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 15:26 · PVG 23:26 · LAX 07:26 · JFK 10:26
    ♥ Do have faith in what you're doing.