Blaizzy/mlx-audio
A text-to-speech (TTS), speech-to-text (STT) and speech-to-speech (STS) library built on Apple's MLX framework, providing efficient speech analysis on Apple Silicon.
基于Apple MLX框架的音频处理库,支持TTS/STT/STS功能,优化Apple Silicon性能,提供多语言、语音克隆、量化模型及Web交互功能。
VectifyAI/PageIndex
📑 PageIndex: Document Index for Vectorless, Reasoning-based RAG
PageIndex 是一种无需向量数据库或分块处理的推理型RAG系统,通过构建文档结构树索引并利用LLM进行上下文感知的树搜索检索,提升长文档检索的准确性与专业性。
remotion-dev/remotion
🎥 Make videos programmatically with React
Remotion是一个基于React的程序化视频生成工具,允许开发者通过编程方式创建动态视频内容。支持组件化视频设计、动画合成及自动化渲染,适用于需要批量生成个性化视频的场景。
qarmin/czkawka
Multi functional app to find duplicates, empty folders, similar images etc.
Czkawka是用Rust开发的多功能文件管理工具,支持查找重复文件、空文件夹、相似图片/视频、大文件等。具备多平台支持、隐私保护、缓存加速和CLI/GUI双模式,核心库可复用于其他应用。
OpenBMB/UltraRAG
UltraRAG v3: A Low-Code MCP Framework for Building Complex and Innovative RAG Pipelines
UltraRAG v3是基于MCP架构的低代码RAG开发框架,通过YAML配置实现复杂流水线编排,标准化Retriever/Generation等组件为MCP服务器,支持条件分支、循环等控制结构,降低RAG开发门槛。
microsoft/VibeVoice
Open-Source Frontier Voice AI
VibeVoice是微软开源的语音AI框架,包含ASR和TTS模型。支持60分钟长音频实时转录与合成,具备多语言识别、说话人分离、时间戳标记等功能,采用低帧率语音分词器提升效率。
openai/codex
Lightweight coding agent that runs in your terminal
OpenAI推出的轻量级本地编码代理,支持终端运行,提供代码生成与编辑功能。可通过ChatGPT账户或API密钥使用,兼容多平台二进制文件安装,强调本地化与高效开发体验。
supermemoryai/supermemory
Memory engine and app that is extremely fast, scalable. The Memory API for the AI era.
Supermemory是一款面向AI时代的高性能内存管理引擎,支持多源内容录入(URL/PDF/文本)、自然语言交互、AI工具集成及多平台扩展。提供网页应用、浏览器插件和Raycast扩展,适用于企业级数据整合与个性化记忆管理。
Psiphon-Inc/conduit
Conduit React Native app
Conduit是基于React Native开发的跨平台网络代理应用,集成psiphon-tunnel-core实现网络穿透功能,支持Android、iOS及Mac系统,采用TypeScript开发并使用Git LFS管理大型库文件。