remotion-dev/remotion
🎥 Make videos programmatically with React
Remotion 是一个基于 React 的程序化视频生成工具,允许开发者通过代码创建动态视频内容。支持 TypeScript,提供视频渲染、动画处理和导出功能,适用于需要自动化生成视频的场景。
VectifyAI/PageIndex
📑 PageIndex: Document Index for Vectorless, Reasoning-based RAG
PageIndex是一款无需向量数据库和分块处理的推理型RAG系统,通过构建文档结构树索引并利用LLM进行上下文感知的树搜索实现精准检索,模拟人类专家分析长文档的逻辑流程。
OpenBMB/UltraRAG
UltraRAG v3: A Low-Code MCP Framework for Building Complex and Innovative RAG Pipelines
UltraRAG v3是基于MCP架构的低代码RAG开发框架,通过标准化Retriever、Generation等组件为MCP服务器,结合YAML配置实现复杂RAG流水线的快速构建,降低开发门槛并提升部署效率。
browser-use/browser-use
🌐 Make websites accessible for AI agents. Automate tasks online with ease.
提供Python库实现AI代理自动化网页操作,支持云服务和隐身浏览器,简化在线任务流程。包含快速启动模板、LLM集成及沙盒部署方案。
block/goose
an open source, extensible AI agent that goes beyond code suggestions - install, execute, edit, and test with any LLM
block/goose 是一个用 Rust 编写的开源 AI 代理,可自动化开发任务,支持代码生成、调试、项目构建及 API 交互,兼容任意 LLM 并提供桌面与 CLI 工具。
Blaizzy/mlx-audio
A text-to-speech (TTS), speech-to-text (STT) and speech-to-speech (STS) library built on Apple's MLX framework, providing efficient speech analysis on Apple Silicon.
基于Apple MLX框架的音频处理库,支持文本转语音(TTS)、语音转文本(STT)和语音转语音(STS)。优化Apple Silicon芯片性能,提供多语言支持、语音克隆、速度控制及量化模型,兼容Python API与Web界面。
simstudioai/sim
Open-source platform to build and deploy AI agent workflows.
开源AI代理工作流构建平台,支持可视化流程设计、自然语言生成节点、向量数据库集成,提供云端和自托管部署方案。
microsoft/VibeVoice
Open-Source Frontier Voice AI
VibeVoice是微软开源的前沿语音AI框架,包含ASR和TTS模型。支持60分钟长音频单次处理,生成带说话人、时间戳和内容的结构化转录,覆盖100+语言。采用7.5Hz超低帧率连续语音分词器,提升计算效率。提供实时语音合成与多语言风格语音生成能力。
putyy/res-downloader
视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载!
基于Go和Wails的跨平台资源下载工具,支持视频号、抖音、快手、小红书等平台的视频/音频/直播流等资源抓包与下载,提供代理设置、m3u8处理及多平台兼容性,界面简洁易用。
AI4Finance-Foundation/FinRobot
FinRobot: An Open-Source AI Agent Platform for Financial Analysis using LLMs 🚀 🚀 🚀
FinRobot是一个基于大语言模型的金融分析开源平台,提供自动化报告生成、财务分析、估值评估及风险评估功能,支持市场预测和交易策略分析,适用于金融领域的智能化决策需求。