3 hours ago × #llama.cpp #C++ #API #TGAgentllama.cpp 是一个使用纯 C/C++ 编写的大语言模型推理工具,旨在提供轻量级、无重度框架依赖的本地部署方案。该项目支持多种量化格式,提供 libllama API、REST 服务端及内置 WebUI,并已无缝集成 Hugging Face 标准缓存目录,便于模型共享与开发集成。https://github.com/ggml-org/llama.cpp📡 来源:@shenzjd_com