加载中...

2026年06月04日 GitHub Trending 榜单

成功: 14 | 失败: 0耗时: 311s

chopratejas/headroom

12,430
🍴 807
📈 +3,142
Python

Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.

💡 AI 总结:

Headroom 是一个专为 AI 代理设计的上下文压缩层,可在 LLM 接收前压缩工具输出、日志、文件及 RAG 块。它通过 6 种算法将 token 减少 60-95%,保持答案准确。支持 Python/TS 库、代理和 MCP 服务器,具备本地优先、可逆压缩及跨代理记忆功能。

🔧 技术栈:Python, TypeScript, MCP (Model Context Protocol)
💼 适用场景:优化 LLM 应用和 AI 代理的上下文窗口使用率,降低成本并提高处理速度。

NousResearch/hermes-agent

180,948
🍴 31,037
📈 +1,913
Python

The agent that grows with you

💡 AI 总结:

这是一个具备内置学习循环的自我改进型 AI 代理,能从经验中创建并优化技能,建立跨会话的用户模型。它支持多平台接入(Telegram、CLI 等),允许自由切换底层模型,并具备自动化任务、子代理并行处理及多种部署方式,旨在成为伴随用户成长的智能助手。

🔧 技术栈:Python, TUI, Docker, OpenAI API
💼 适用场景:适合需要长期记忆、多平台自动化交互及自定义模型配置的高级用户或开发者。

affaan-m/ECC

207,206
🍴 31,811
📈 +1,750
JavaScript

The agent harness performance optimization system. Skills, instincts, memory, security, and research-first development for Claude Code, Codex, Opencode, Cursor and beyond.

💡 AI 总结:

ECC 是一个跨多个 AI 代理工具(如 Claude Code、Cursor、Copilot)的性能优化系统。它提供了一套完整的解决方案,包括技能管理、记忆持久化、安全扫描和并行化等。该项目旨在通过持续学习和研究优先的开发方法,提升代理工具的效率,并支持 v2.0.0-rc.1 版本的新仪表板 GUI。

🔧 技术栈:JavaScript, Python, AI Agent Harnesses
💼 适用场景:用于需要优化 AI 代理工具性能、管理复杂工作流以及跨不同开发环境部署生产级代理的开发者。

PaddlePaddle/PaddleOCR

79,844
🍴 10,598
📈 +141
Python

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.

💡 AI 总结:

PaddleOCR 是一个强大的轻量级 OCR 工具包,支持 100+ 种语言。它可以将 PDF 和图像转换为结构化、LLM 就绪的数据(JSON/Markdown)。核心功能包括 SOTA 文档 VLM(PaddleOCR-VL-1.6)和结构感知转换(PP-StructureV3),在文档解析、表格识别和复杂元素处理方面表现卓越,适合构建智能 RAG 和 Agentic 应用。

🔧 技术栈:Python, PaddlePaddle, Deep Learning
💼 适用场景:将 PDF 或图像文档转换为结构化数据,用于构建智能 RAG 和 Agentic 应用。

github/spec-kit

108,564
🍴 9,597
📈 +321
Python

💫 Toolkit to help you get started with Spec-Driven Development

💡 AI 总结:

这是一个 Python 工具包,旨在帮助开发者进行规范驱动开发。它将产品规范转化为可执行的代码,直接生成工作实现,而非仅作为指导。通过支持 AI 编码代理集成,它帮助开发者专注于产品场景和可预测结果,从而更快地构建高质量软件。

🔧 技术栈:Python, uv, AI Coding Agents
💼 适用场景:适合希望通过规范驱动开发(SDD)将产品需求快速转化为可执行代码的开发团队,特别是利用 AI 编码代理辅助编程的场景。

NVIDIA/cosmos

8,987
🍴 579
📈 +133
Jupyter Notebook

NVIDIA Cosmos is an open platform of world models, datasets, and tools that enables developers to build Physical AI for robots, autonomous vehicles, smart infrastructure, and more.

💡 AI 总结:

NVIDIA Cosmos 是一个开放的世界模型平台,旨在构建物理 AI。其核心是 Cosmos 3,采用统一的多模态架构,支持语言、图像、视频、音频和动作序列的处理与生成。平台提供 Reasoner(理解)和 Generator(生成)两种运行时,具备世界理解、模拟、预测及合成数据生成能力,适用于机器人、自动驾驶等领域。

🔧 技术栈:Jupyter Notebook, Diffusers, vLLM, Transformers, CUDA
💼 适用场景:机器人、自动驾驶汽车、智能基础设施等领域的物理 AI 开发

lfnovo/open-notebook

24,999
🍴 2,914
📈 +212
TypeScript

An Open Source implementation of Notebook LM with more flexibility and features

💡 AI 总结:

这是一个开源的 Notebook LM 替代品,支持私有部署和多模型。它允许用户上传 PDF、视频、音频等多种内容,利用 OpenAI、Anthropic、Ollama 等多种 AI 模型进行智能搜索、对话和生成专业播客。项目强调数据隐私和完全控制,支持多语言界面,是 Google Notebook LM 的强大开源替代方案。

🔧 技术栈:TypeScript
💼 适用场景:适合需要本地化、私有化知识管理,并希望利用多种 AI 模型进行研究和内容生成的用户。

Open-LLM-VTuber/Open-LLM-VTuber

9,574
🍴 1,149
📈 +581
Python

Talk to any LLM with hands-free voice interaction, voice interruption, and Live2D taking face running locally across platforms

💡 AI 总结:

Open-LLM-VTuber 是一个本地运行的语音交互 AI 伴侣,支持免提对话、语音打断和 Live2D 动态形象。支持 Windows、macOS 和 Linux,提供 Web 和桌面客户端模式(含透明背景)。目前 v2.0 正在开发,v1 版本持续维护。

🔧 技术栈:Python, Live2D, Web 技术
💼 适用场景:本地运行、拥有语音交互功能的虚拟伴侣或虚拟宠物

jwasham/coding-interview-university

349,706
🍴 83,225
📈 +632

A complete computer science study plan to become a software engineer.

💡 AI 总结:

这是一个旨在帮助求职者通过大型科技公司技术面试的完整计算机科学自学计划。它涵盖了数据结构、算法、操作系统、网络等核心知识,资源丰富且支持多语言,适合有一定编程基础并希望成为软件工程师的学习者。

🔧 技术栈:Computer Science, Data Structures, Algorithms, Operating Systems, Networking
💼 适用场景:适合准备大型科技公司技术面试的求职者。

github/copilot-sdk

8,961
🍴 1,211
📈 +38
Java

Multi-platform SDK for integrating GitHub Copilot Agent into apps and services

💡 AI 总结:

这是一个多平台 SDK,旨在将 GitHub Copilot 的代理工作流集成到各类应用中。它暴露了 Copilot CLI 的生产级代理运行时,支持 Python、TypeScript、Go、.NET、Java 和 Rust 等多种语言。开发者无需自行构建编排逻辑,即可通过 SDK 定义代理行为,由 Copilot 处理规划、工具调用和文件编辑等任务。

🔧 技术栈:Java, Python, TypeScript, Go, .NET
💼 适用场景:用于在应用程序中集成 GitHub Copilot 的代理工作流,实现自动化编程和智能任务处理。

aquasecurity/trivy

35,664
🍴 430
📈 +255
Go

Find vulnerabilities, misconfigurations, secrets, SBOM in containers, Kubernetes, code repositories, clouds and more

💡 AI 总结:

Trivy 是一个用 Go 语言编写的多功能安全扫描器,能够扫描容器、文件系统、Git 仓库、虚拟机和 Kubernetes 等目标,检测漏洞、配置错误、敏感信息和许可证问题。它支持多种操作系统和编程语言,提供全面的软件物料清单 (SBOM),并可与 CI/CD 流程及主流平台无缝集成,是 DevSecOps 环境中不可或缺的安全工具。

🔧 技术栈:Go, Docker
💼 适用场景:适用于容器、代码仓库及云环境的漏洞扫描、配置检查和合规性审计。

openclaw/openclaw-windows-node

1,318
🍴 167
📈 +411
C#

Windows companion suite for OpenClaw - System Tray app, Shared library, Node, and PowerToys Command Palette extension

💡 AI 总结:

这是一个为 AI 个人助手 OpenClaw 提供的原生 Windows 伴侣套件。项目包含 WinUI 3 系统托盘应用、共享网关客户端库及 CLI 工具,旨在提供便捷的快速访问和管理功能。它支持 x64 和 ARM64 架构,依赖 .NET 10.0 SDK 和 WebView2 运行时,适合需要在 Windows 上部署和管理 AI 助手的用户。

🔧 技术栈:C#, WinUI 3, .NET 10.0, WebView2, PowerShell
💼 适用场景:适用于需要在 Windows 系统上集成和管理 OpenClaw AI 助手的用户及开发者。

reconurge/flowsint

5,303
🍴 638
📈 +308
TypeScript

A modern platform for visual, flexible, and extensible graph-based investigations. For cybersecurity analysts and investigators.

💡 AI 总结:

Flowsint 是一个基于图的开源 OSINT 探索工具,专为网络安全分析师设计。它提供可视化界面,允许用户通过自动化丰富器探索实体间的复杂关系。项目强调隐私,所有数据存储在本地,支持灵活扩展,适用于开源情报调查和取证分析。

🔧 技术栈:TypeScript, Docker, Make
💼 适用场景:适用于网络安全分析师进行开源情报调查和实体关系可视化分析。

mvanhorn/last30days-skill

27,558
🍴 2,345
📈 +199
Python

AI agent skill that researches any topic across Reddit, X, YouTube, HN, Polymarket, and the web - then synthesizes a grounded summary

💡 AI 总结:

这是一个基于 Python 的 AI Agent 技能,能够并行搜索 Reddit、X、YouTube、HN、Polymarket 和网络上的任何话题。它通过点赞、观看和真实资金等真实互动来评分,并由 AI Agent 综合生成一个接地气的摘要。它打破了平台围墙花园,提供 Google 等传统搜索引擎无法提供的独特数据聚合。

🔧 技术栈:Python, AI Agent, Web Scraping
💼 适用场景:用于快速获取跨多个社交媒体和市场的最新趋势及真实用户反馈。