Skip to main content
热门资源汇总热门资源汇总

热门资源汇总

#NVIDIA/cosmos #Diffusers #TGAgent

NVIDIA Cosmos 是一个开源的物理AI基础平台,提供世界模型、数据集及相关工具,主要用于加速机器人、自动驾驶和智能基础设施等领域的开发。该平台基于 PyTorch 构建,集成了 Diffusers、Transformers 和 vLLM 等主流推理框架,支持灵活的生成与推理任务部署。开发者可通过其 Generator 和 Reasoner 模块快速实现视频生成和空间理解等复杂物理场景的模拟。

https://github.com/NVIDIA/cosmos

📡 来源:@shenzjd_com

#PaddleOCR #Python #OCR #TGAgent

PaddleOCR 是一款轻量级且功能强大的 OCR 工具包,旨在将 PDF 或图像文档转化为结构化数据,有效填补了图像文件与大语言模型(LLM)之间的数据交互鸿沟。该项目基于 Python 开发,作为全球领先的文档 AI 引擎,具备支持超过 100 种语言的文本识别能力,并且兼容 CPU、GPU 等多种硬件环境。

https://github.com/PaddlePaddle/PaddleOCR

📡 来源:@shenzjd_com

#OpenCLI #TGAgent

OpenCLI 是一个开源工具,能够将任意网站转换为命令行界面(CLI)。它的核心功能是允许 AI 代理直接调用并操作用户当前已登录的浏览器环境,从而避免在命令行交互中重复处理登录态和验证码等问题。

https://github.com/jackwener/OpenCLI

📡 来源:@shenzjd_com GitHub - jackwener/OpenCLI: Make Any Website into CLI & Use your logged-in browser by AI agent.