一款功能强大的文档管理系统 Paperless-ngx | #笔记工具 #工具

它能够将你的纸质文档转换成在线可搜索的文档,并进行分类和索引,方便随时搜索查阅。

主要有如下特性:

- 通过 OCR 技术自动扫描处理文档,同时能添加可搜索和可选文本。
- 能够利用标签、类型等多种方式来管理和分类文档,可利用机器学习技术自动分类。
- 文档保存为 PDF 格式,并同时保留未更改的原始文件。
- 支持识别超过 100 多种语言。
- 支持多种文件类型,如 PDF 文档、图像、纯文本文件或各类办公文档等。
- 界面美观、提供全文搜索功能、邮件处理功能。
- 有强大的多用户权限系统,支持全局权限和针对单独文档设置权限。 GitHub - paperless-ngx/paperless-ngx: A community-supported supercharged version of paperless: scan, index and archive all your…
自托管的网页数据抓取工具,让用户通过指定XPath来抓取网页元素,支持提交URL和元素进行数据抓取,并将结果以表格形式展示,用户还可以下载结果的Excel表格,并重新运行抓取任务。

Summary | #工具
Chat UI:为大型语言模型(LLM)应用设计的聊天界面组件库,提供预构建的聊天组件,支持高度定制化,易于与LLM后端集成
智能会议记录与分析工具,能够将音视频内容转换为文本,同时识别不同发言人,生成结构化会议报告

npx offmute | #工具
OmniGen-ComfyUI:一个为OmniGen定制的界面友好型节点,让你轻松实现文本到图像的转换,编辑图片,以及进行图像分割等操作,特色在于简化的图像处理流程和直观的用户界面
solidtime - 现代开源时间追踪应用:专为自由职业者和代理机构设计,提供时间跟踪、项目管理、任务分配等多功能的现代界面
为数据科学爱好者提供的学习资源库,包含从入门到进阶的各类免费和付费资源,助力数据科学家学习成长和职业发展

Data Scientist Handbook 2024 | #手册
Back to Top