chopratejas/headroom
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
Headroom 是一个专为 AI 代理设计的上下文压缩层,可在 LLM 接收前压缩工具输出、日志、文件及 RAG 块。它通过 6 种算法将 token 减少 60-95%,保持答案准确。支持 Python/TS 库、代理和 MCP 服务器,具备本地优先、可逆压缩及跨代理记忆功能。
NousResearch/hermes-agent
The agent that grows with you
这是一个具备内置学习循环的自我改进型 AI 代理,能从经验中创建并优化技能,建立跨会话的用户模型。它支持多平台接入(Telegram、CLI 等),允许自由切换底层模型,并具备自动化任务、子代理并行处理及多种部署方式,旨在成为伴随用户成长的智能助手。
affaan-m/ECC
The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond.
ECC 是一个跨多个 AI 代理工具(如 Claude Code、Cursor、Copilot)的性能优化系统。它提供了一套完整的解决方案,包括技能管理、记忆持久化、安全扫描和并行化等。该项目旨在通过持续学习和研究优先的开发方法,提升代理工具的效率,并支持 v2.0.0-rc.1 版本的新仪表板 GUI。
PaddlePaddle/PaddleOCR
Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
PaddleOCR 是一个强大的轻量级 OCR 工具包,支持 100+ 种语言。它可以将 PDF 和图像转换为结构化、LLM 就绪的数据(JSON/Markdown)。核心功能包括 SOTA 文档 VLM(PaddleOCR-VL-1.6)和结构感知转换(PP-StructureV3),在文档解析、表格识别和复杂元素处理方面表现卓越,适合构建智能 RAG 和 Agentic 应用。
github/spec-kit
💫 Toolkit to help you get started with Spec-Driven Development
这是一个 Python 工具包,旨在帮助开发者进行规范驱动开发。它将产品规范转化为可执行的代码,直接生成工作实现,而非仅作为指导。通过支持 AI 编码代理集成,它帮助开发者专注于产品场景和可预测结果,从而更快地构建高质量软件。
NVIDIA/cosmos
NVIDIA Cosmos is an open platform of world models, datasets, and tools that enables developers to build Physical AI for robots, autonomous vehicles, smart infrastructure, and more.
NVIDIA Cosmos 是一个开放的世界模型平台,旨在构建物理 AI。其核心是 Cosmos 3,采用统一的多模态架构,支持语言、图像、视频、音频和动作序列的处理与生成。平台提供 Reasoner(理解)和 Generator(生成)两种运行时,具备世界理解、模拟、预测及合成数据生成能力,适用于机器人、自动驾驶等领域。
lfnovo/open-notebook
An Open Source implementation of Notebook LM with more flexibility and features
这是一个开源的 Notebook LM 替代品,支持私有部署和多模型。它允许用户上传 PDF、视频、音频等多种内容,利用 OpenAI、Anthropic、Ollama 等多种 AI 模型进行智能搜索、对话和生成专业播客。项目强调数据隐私和完全控制,支持多语言界面,是 Google Notebook LM 的强大开源替代方案。
Open-LLM-VTuber/Open-LLM-VTuber
Talk to any LLM with hands-free voice interaction, voice interruption, and Live2D taking face running locally across platforms
Open-LLM-VTuber 是一个本地运行的语音交互 AI 伴侣,支持免提对话、语音打断和 Live2D 动态形象。支持 Windows、macOS 和 Linux,提供 Web 和桌面客户端模式(含透明背景)。目前 v2.0 正在开发,v1 版本持续维护。
jwasham/coding-interview-university
A complete computer science study plan to become a software engineer.
这是一个旨在帮助求职者通过大型科技公司技术面试的完整计算机科学自学计划。它涵盖了数据结构、算法、操作系统、网络等核心知识,资源丰富且支持多语言,适合有一定编程基础并希望成为软件工程师的学习者。
github/copilot-sdk
Multi-platform SDK for integrating GitHub Copilot Agent into apps and services
这是一个多平台 SDK,旨在将 GitHub Copilot 的代理工作流集成到各类应用中。它暴露了 Copilot CLI 的生产级代理运行时,支持 Python、TypeScript、Go、.NET、Java 和 Rust 等多种语言。开发者无需自行构建编排逻辑,即可通过 SDK 定义代理行为,由 Copilot 处理规划、工具调用和文件编辑等任务。
aquasecurity/trivy
Find vulnerabilities, misconfigurations, secrets, SBOM in containers, Kubernetes, code repositories, clouds and more
Trivy 是一个用 Go 语言编写的多功能安全扫描器,能够扫描容器、文件系统、Git 仓库、虚拟机和 Kubernetes 等目标,检测漏洞、配置错误、敏感信息和许可证问题。它支持多种操作系统和编程语言,提供全面的软件物料清单 (SBOM),并可与 CI/CD 流程及主流平台无缝集成,是 DevSecOps 环境中不可或缺的安全工具。
openclaw/openclaw-windows-node
Windows companion suite for OpenClaw - System Tray app, Shared library, Node, and PowerToys Command Palette extension
这是一个为 AI 个人助手 OpenClaw 提供的原生 Windows 伴侣套件。项目包含 WinUI 3 系统托盘应用、共享网关客户端库及 CLI 工具,旨在提供便捷的快速访问和管理功能。它支持 x64 和 ARM64 架构,依赖 .NET 10.0 SDK 和 WebView2 运行时,适合需要在 Windows 上部署和管理 AI 助手的用户。
reconurge/flowsint
A modern platform for visual, flexible, and extensible graph-based investigations. For cybersecurity analysts and investigators.
Flowsint 是一个基于图的开源 OSINT 探索工具,专为网络安全分析师设计。它提供可视化界面,允许用户通过自动化丰富器探索实体间的复杂关系。项目强调隐私,所有数据存储在本地,支持灵活扩展,适用于开源情报调查和取证分析。
mvanhorn/last30days-skill
AI agent skill that researches any topic across Reddit, X, YouTube, HN, Polymarket, and the web - then synthesizes a grounded summary
这是一个基于 Python 的 AI Agent 技能,能够并行搜索 Reddit、X、YouTube、HN、Polymarket 和网络上的任何话题。它通过点赞、观看和真实资金等真实互动来评分,并由 AI Agent 综合生成一个接地气的摘要。它打破了平台围墙花园,提供 Google 等传统搜索引擎无法提供的独特数据聚合。