大家好,
相信很多 V 友都有管理发票、说明书、合同和旧纸质文件的烦恼。Paperless-ngx 是目前开源界强大的文档管理系统,支持 OCR 、自动打标签和全文搜索。
但是官方原版在实际部署中(尤其是中文环境下)可能会遇到一些门槛以及 AI 功能支持不足。所以我维护了一个优化版本:CallStorm/paperless-ngx。
我主要针对中文环境和智能化做了以下核心增强:
原版 Tesseract OCR 面对手机随手拍的歪歪扭扭的票据、皱巴巴的纸张,识别率往往惨不忍睹。
原版 Paperless 强推“标签( Tag )”逻辑,但对于很多习惯 Windows 资源管理器一层层文件夹分类的朋友来说,非常反直觉。
文档存进去不再是死数据。
目前的版本已经可以稳定满足日常归档需求。后续计划加入语义搜索(不再依赖关键词,搜意思也能搜到)和全局 AI 助手。
希望能帮到同样有收纳强迫症、或者喜欢折腾 NAS 的朋友、或者喜欢打造自己的知识库的人。 如果有 Bug 或建议,欢迎在 GitHub 提 Issue 或 PR ,感谢!
传送门:https://github.com/CallStorm/paperless-ngx
1
TeslaM3 2 天前
总之,很牛逼的开源。 👍
|