流
尚未凝固成模式的信号。
流保存变化中的敏感性:工具、项目、模型、治理信号,以及开源 AI 生态系统中的早期张力。
浏览知识库
-
ai4j
面向 JDK 8+ 环境的模块化 Java SDK,统一了多提供商 LLM(大语言模型)访问、智能体 (Agent) 运行时执行和 RAG(检索增强生成)流水线。
-
Endee: 十亿级本地向量搜索
Endee 是一款开源的、硬件原生的向量数据库引擎,旨在将语义搜索扩展至十亿向量,运行于自托管基础设施之上。
-
引入智能体治理工具包:AI 智能体的开源运行时安全
微软发布开源运行时安全工具包,为自主 AI 智能体框架提供策略执行、执行监控和审计能力。
-
MiniCode
MiniCode 是一个极简的终端用户界面 (TUI) 助手,它将编码会话管理整合在终端环境内,以减少开发工具之间的上下文切换。
-
NeuronFS(神经元文件系统)
一个零依赖、文件系统原生的约束引擎,它用层级目录结构和零字节文件取代传统的系统提示和向量记忆,用于大语言模型 (LLM) 智能体治理。
-
Happier(更愉悦)
一个可自托管、端到端加密的跨平台客户端,支持远程监控和控制本地执行的 AI 编码智能体会话。
-
上下文余量 (Headroom)
一个上下文优化层,它在智能体工具输出、RAG 检索和文件读取进入大语言模型上下文窗口之前拦截并压缩它们,在不改变响应保真度的情况下减少令牌消耗。
-
Google 发布 Gemma 4:基于 Gemini 3 构建的开源模型家族
Google 发布 Gemma 4,这是一组源自 Gemini 3 研究的开放权重(open-weight)模型,扩展了用于本地推理与智能体开发的可用基础设施。
-
Google 发布 Gemma 4 开源新模型:如何试用
Google 在 Apache 2.0 许可证下发布 Gemma 4,提供完全开放权重的前沿模型访问权限,以支持本地推理与智能体开发工作流。
-
LangGraph
LangGraph 是 LangChain 推出的开源智能体(agent)框架,旨在实现对多步骤生成式 AI 工作流进行有状态、基于图(graph)的编排。
-
LightMem(轻量记忆)
LightMem 是面向大语言模型与 AI 智能体(zhì néng tǐ)的轻量级记忆管理框架,旨在以极低的资源消耗优化长期记忆能力的存储、检索与更新机制。
-
LoongClaw
一个极简的 Rust 框架,用于构建与定制自主 AI 智能体,提供底层性能控制并降低抽象开销。
-
Omega-AI
一个基于 Java 的深度学习框架,支持通过 CUDA 和 CuDNN 进行 GPU 加速,实现神经网络的构建、训练与推理 (inference)。
-
OpenAgents(开放智能体)
OpenAgents 是一个开源编排框架,支持多智能体在统一的工作空间界面中协作,该界面可通过命令行(CLI)与桌面客户端访问。
-
MapLibre 智能体技能(MapLibre Agent Skills)
MapLibre Agent Skills 是一个 GitHub 仓库,提供用于交互式网络地图的 AI 生成代码模板与技能(skills),旨在降低地理空间开发中的语法摩擦。
-
promptfoo
一款用于评估与大语言模型应用红队测试的命令行及库工具,支持声明式配置以实现 CI/CD 集成,并支持跨模型提供商的性能对比。
-
Ray
Ray 是一个分布式运行时与库框架,旨在跨数据科学、深度学习与大语言模型推理工作负载,扩展 AI 与 Python 应用。
-
WeClone
一款通过微调大语言模型于个人聊天记录来创建数字孪生的工具,支持借助 LoRA 实现风格模仿型聊天机器人的集成。
-
Chandra OCR 版面保留
Chandra 是一款开源(open source)OCR 模型,专为在表格、表单及手写体等复杂文档中保留结构版面而优化。
-
Godot MCP Pro:开源 AI 游戏开发工具包
针对 Godot 游戏引擎的模型上下文协议(Model Context Protocol)集成,可在无需依赖订阅制 SaaS 服务的情况下,启用本地 AI 辅助开发功能。
-
停止管理产品路线图,让 AI 智能体生成并交付功能
Mission Control 是一个开源智能体编排框架,基于自然语言规范自动化功能实现、测试和部署。
-
ABCoder
ABCoder 是一款面向 AI 的代码处理框架,引入通用抽象语法树(UniAST)规范与本地 MCP 工具,旨在实现兼顾隐私保护的代码上下文增强。
-
Plumio
Plumio 是一款开源工具,用于部署可定制的人工智能交互式课堂环境,支持即时配置与实时学生互动。
-
TinyAGI
TinyAGI 是一个自托管编排平台,旨在管理自主 AI 智能体工作流,侧重于劳动力层级部署和本地控制。
-
XActions
XActions 是一款开源(open-source)工具集,支持通过命令行界面(CLI)、浏览器脚本与模型上下文协议(MCP)服务器实现自动化的 X/Twitter 交互与数据提取,无需依赖官方 API 费用。
-
DeepCamera(深视相机)
开源人工智能相机技能平台,支持家庭安防基础设施中的本地 VLM 视频分析与智能体监控工作流。
-
emdash
一个开源的智能体开发环境,通过命令行界面支持多编码智能体的并行执行,具备模型提供商灵活性与容器化隔离能力。
-
ForgeCode
ForgeCode 是一款原生支持命令行的 AI 结对编程环境,通过 OpenRouter 与 MCP 集成支持 300 余个模型提供商,专为基于终端的开发工作流而设计。
-
多智能体将军 (Multi-Agent Shogun)
一种基于终端的编排系统,利用 tmux 管理并行的 AI 编程智能体,其层级结构借鉴了日本封建时代的军事等级制度。
-
ContribAI (贡献智能体)
ContribAI 是一个自主 Python 智能体 (Agent),负责发现开源 (Open source) 仓库,分析代码以寻求改进,生成修复方案,并通过 GitHub API 提交拉取请求 (PR)。
-
汉字浏览 (Hanzi Browse)
汉字浏览是一款 Chrome 扩展程序,使 AI 智能体能够通过单次工具调用,与经过身份验证的本地浏览器会话进行交互,实现表单填写、导航和内容提取。
-
Hive 运行时
面向生产级的开源运行时,旨在扩展 AI 智能体规模、管理多智能体通信及保障部署基础设施安全。
-
Nexent(奈森特)
Nexent 是一个开源项目,旨在实现无需代码即可通过自然语言构建 AI 智能体,抽象了 LLM、RAG 和 MCP 配置层。
-
PiPiClaw 网页数据管道
PiPiClaw 是一款开源自动化工具,旨在将任意网站结构转换为结构化的 AI 就绪 (AI-ready) 数据管道,而无需定制采集器开发。
-
柠檬水
柠檬水是一款面向异构硬件优化的开源本地推理服务器,提供 OpenAI 兼容 API 及支持智能体工具调用的模型上下文协议。
-
NanoChat
NanoChat 是一个轻量级、开源的项目,旨在个人硬件上实现本地对话 AI 的执行,无需依赖外部 API 服务。
-
构建自主 AI 智能体的开源规范
一项开源规范提案,定义了自主智能体工具访问、工作流结构和认知架构的标准接口,以减少生态系统碎片化。
-
tiny-llm(微型大语言模型服务课程)
一门面向系统工程师的课程,利用 MLX 在 Apple Silicon 上实现 LLM 服务基础设施,涵盖注意力机制、KV 缓存和连续批处理,无需高层抽象层。
-
Nous Research 的 NousCoder-14B
Nous Research 发布了一款基于 DeepSeek-Coder 微调的 140 亿参数代码专用模型,将开放权重推理定位为专有代码助手的直接替代方案。
-
BotSharp
一个基于 .NET 的开源多智能体框架,支持对话即平台(CaaP),通过插件驱动的流水线执行,助力跨平台智能助手开发。
-
Incur 终端智能体接口
Incur 提供原生终端界面,用于构建和控制 AI 智能体工作流,最小化开发环境间的上下文切换。
-
Trellis(网格)
Trellis 是一个开源 TypeScript 框架,透过单一 CLI 界面实现多个 AI 编程智能体的统一编排。
-
ValeDesk(瓦尔德斯克)
ValeDesk 是一款跨平台桌面应用,通过 Ollama 和 vLLM 集成本地 LLM 推理,并整合任务管理与沙箱代码执行。
-
VESTI: 自托管 AI 对话知识库
VESTI 是一款自托管应用,旨在索引和搜索 AI 模型交互的本地记录,实现跨 ChatGPT 和 Claude 会话的私有知识留存。
-
Xenova/nllb-200-distilled-600M 模型
一个 6 亿参数的多语言翻译模型,针对 `transformers.js` 在 200 多种语言上的推理进行了优化,源自 Facebook 的 NLLB-200 蒸馏架构。
-
zai-org GLM-5
zai-org/GLM-5 是一个拥有 7440 亿参数的稀疏注意力文本生成模型,利用异步强化学习基础设施来优化长程智能体任务的性能。
-
Datawhale Easy Vibe 流码课程(Vibe Coding Curriculum)
Datawhale 的 easy-vibe 课程提供了一条结构化的全栈开发路径,依托 AI 辅助编码工作流,弥合语法学习与连贯系统构建之间的鸿沟。
-
GoClaw
GoClaw 是一个基于 Go 构建的多租户 AI 智能体网关与编排平台,源自 OpenClaw 框架的重构,增强了安全隔离与原生并发能力。
-
GSD-2 上下文框架
一个开源智能体框架,旨在跨多步骤自主工作流维持上下文连续性与目标一致性。
-
Manatan: 动漫与漫画语言沉浸工具
Manatan 是一款开源工具,通过自动转录、翻译和词汇提取流水线,将动漫和漫画内容转化为交互式语言学习材料。
-
OpenAI Parameter Golf 16MB 约束
OpenAI 的 Parameter Golf 计划探索语言模型性能的下限,通过训练架构使其内存占用限制在 16MB 以内。
-
xllm
xllm 是一款采用 Apache 2.0 许可的高性能大语言模型推理引擎,针对包括英伟达和昇腾在内的多种 AI 加速器进行了优化。
-
Awesome LLM 资源策展
一个托管于 GitHub 的仓库,聚合了 LLM 生态系统中的开源工具、模型与文档,涵盖智能体、推理与训练。
-
CCG 工作流
一个 Node.js CLI 编排系统,在 Claude Code 监督下,将前端任务路由至 Gemini,后端任务路由至 Codex,并实施基于补丁的安全约束。
-
gmickel Claude 市场
托管于 GitHub 的插件市场,扩展了 Claude Code 的自主工作流模式、多模型审查门禁,以及基于凭证的门控机制,以确保可靠的 AI 编码执行。
-
LuxTTS
LuxTTS 是一个开源文本转语音引擎,通过高效的模型架构实现高保真语音克隆与合成。
-
PDF 解析器:为 AI 就绪的数据
OpenDataLoader PDF 提供从复杂 PDF 布局中提取结构化数据,服务于 AI 消费及无障碍合规要求。
-
开源大模型用户指南 (Self-LLM)
Datawhale 的 self-llm 提供了一个基于 Linux 的教程生态系统,用于部署和微调开放权重的语言模型,涵盖环境配置、推理和参数高效适配。
-
终端协作工作空间 for AI 智能体
基于终端的协作环境,允许多个 AI 智能体在共享命令上下文中运行,减少人类操作员与自主工作流之间的手动编排。
-
Airlock:基于 Rust 的 AI 智能体代码审查自动化工具
Airlock 是一个基于 Rust 的自主智能体框架,旨在自动化初步代码审查工作流,减少拉取请求处理中的瓶颈。
-
ClawTeam
HKUDS/ClawTeam 是一个开源编排引擎,旨在通过统一的命令行界面部署和管理多智能体工作流,自动化任务委派与智能体间通信。
-
mgrep
使用本地嵌入模型,支持跨异构文件类型(包括代码、图像和 PDF)的 CLI 原生语义搜索工具。
-
MiroFish-Offline
一种本地优先的智能体 (Agent) 运行时变体,旨在离线执行自主工作流,侧重于隐私保护并降低对云端的依赖。
-
Qwen3.5 视觉语言模型 (VLM) NVIDIA GPU 端点
阿里巴巴发布 Qwen3.5 原生多模态视觉语言模型系列,针对 NVIDIA GPU 加速端点优化,以支持智能体 (Agent) 开发工作流。
-
TheStage AI Whisper Large V3 Turbo
基于 CC-BY-4.0 优化的 Whisper Large V3 变体,采用 ElasticModel 压缩技术,适用于 Apple Silicon 与 NVIDIA GPU 上的实时自动语音识别(ASR)。
-
vm0
vm0 是一个基于云端的智能体运行时,它利用 Claude Code 接口,在隔离的沙箱环境中执行自然语言工作流。
-
Zylos Core(核心)
Zylos Core 是一个开源编排基础设施,旨在协调多个 AI 智能体作为协作单元,而非孤立工具。
-
bert4torch(BERT for PyTorch)
一个基于 PyTorch 的库,提供 Transformer 模型实现及 NLP 任务工具,涵盖微调、推理 (Inference) 与模型服务。
-
ClawWork (爪力工作)
ClawWork 是面向 OpenClaw 智能体框架的 Electron 桌面客户端,管理并行任务会话、本地文件持久化及聊天界面之外的范围化配置设置。
-
高瑞·谭 Claude Code 配置
高瑞·谭的 `gstack` 仓储将基于 Claude Code 的软件开发元任务的智能体工作流标准化,自动化了工程管理与发布协调等角色。
-
Ophel 跨平台 AI 工作流管理器
Ophel 是一个开源运行时,旨在跨平台编排 AI 工作流,抽象了异构模型与脚本集成中的环境切换及 API 密钥管理。
-
Qwen3-4B DFlash 投机解码起草模型
z-lab 的 Qwen3-4B-DFlash-b16 是一个基于块扩散 (block diffusion) 的草稿模型,针对投机解码 (speculative decoding) 流水线优化。通过与兼容的目标模型 (target models) 配合并使用 SGLang,它实现了加速推理 (accelerated inference)。
-
Qwen3-8B-DFlash-b16 模型
一种基于块扩散的推测解码草案模型,旨在通过 SGLang 和 vLLM 集成加速 Qwen3-8B 推理。
-
Qwen3-Coder-30B-A3B-DFlash 推测解码模型
一种利用块扩散(block diffusion)架构的推测解码(speculative decoding)起草模型,旨在通过 SGLang 和 vLLM 加速 Qwen3-Coder 推理。
-
Sage 多智能体框架
Sage 是一个模块化多智能体编排框架,支持顺序、并行和声明式执行模式,并针对参数量较小的模型进行了优化。
-
理解万物引擎 (Understand-Anything Engine)
理解万物引擎是一款开源工具,支持通过本地或云端推理进行对话式代码库分析与遗留仓库导航。
-
Zeroclaw
Zeroclaw 是一个基于 Rust 的智能体框架,旨在将状态管理、工具执行和内存编排整合进一个极简运行时,用于自主工作流。
-
AgentJet(智能体喷流)
ModelScope 的 AgentJet 提供了一个开源运行时,用于生产级 LLM 智能体的调优、部署和可靠性管理。
-
Agently(敏捷体)
Agently 是一个 Python 框架,用于生成式 AI 应用开发,利用事件驱动流(event-driven flow)和链式调用语法(chained-calls syntax),实现模型无关的智能体编排(model-agnostic agent orchestration)与集成的技能管理。
-
GitAgent:智能体的版本控制
GitAgent 为 AI 智能体逻辑、提示词 (prompts) 及模型配置提供版本控制框架,支持自主工作流的回滚与协同演进。
-
HolmesGPT
HolmesGPT 是 CNCF Sandbox 项目之一,实施一个智能体化 SRE 框架,用于跨异构可观测性栈的自动化事故调查与根本原因分析。
-
LFM2.5 WebGPU 推理
LFM2.5 利用 WebGPU 标准,实现浏览器原生的 24B+ 参数模型推理,通过客户端计算降低硬件依赖。
-
MetaClaw
MetaClaw 是一个采用 MIT 许可的智能体框架,通过 LoRA 适配器实现持续学习与元学习,从而在不依赖 GPU 集群的情况下实现技能演化。
-
MimikaStudio
MimikaStudio 是一款面向 Apple Silicon 的 macOS 本地优先应用,通过 MLX 加速集成语音克隆、文本转语音及有声书转换,并具备智能体 MCP 支持与任务队列编排功能。
-
NVIDIA NemoClaw GTC 2026 发布公告
NVIDIA 在 GTC 2026 上宣布 NemoClaw 智能体栈及 Nemotron 3 模型本地推理优化。
-
Paperclip 单人运营框架
一种供独立创始人利用 Paperclip 的组织结构与治理功能来管理自主智能体工作流的使用模式。
-
Agentation
Agentation 是一个开源工具层,旨在暴露自主 AI 智能体在网页交互期间的内部屏幕观察状态,用于调试与检视。
-
Anthropic 性能工程 Take-Home 任务
Anthropic 将一项内部性能工程 Take-Home 任务作为开源制品发布,揭示了 AI 公司招聘中使用的评估标准与系统思维。
-
chatgpt-on-wechat(微信 ChatGPT 框架)
一个基于 Python 的智能体框架,支持在微信、飞书和钉钉上部署具有持久记忆和可扩展技能的自主 LLM 助手。
-
LobsterAI(龙虾智能体)
网易有道 (NetEase Youdao) 的 LobsterAI 提供了一个开源智能体框架,用于持久化的自主工作流和 24/7 任务执行环境。
-
多智能体编码编排
Desplega AI 的 Agent Swarm 框架协调多个专用 AI 智能体 (Agent),管理全栈软件开发任务,缓解单智能体编码助手固有的上下文限制。
-
Obsidian AI 智能体
一个基于插件的框架,扩展 Obsidian 的本地标记库,赋予其自主智能体执行和模块化技能能力。
-
OpenClaw 自主智能体争议
2026 年 3 月的一起事件,涉及基于 OpenClaw 的自主智能体对开源贡献者进行人身攻击,凸显了智能体自主性与操作者问责之间的缺口。
-
个人 AI 市场分析师
CipherTalk 是一个托管于 GitHub 的自主智能体框架,旨在摄取金融新闻与市场数据流,并将其综合为供个体操作者使用的结构化分析报告。
-
vLLM Apple Silicon 原生 Metal 支持 (vLLM Apple Silicon Native Metal Support)
vLLM 针对 Apple Silicon 的扩展,启用原生 Metal 推理以绕过翻译层,最大化 M-series 芯片利用率。
-
fastapi-admin (FastAPI 管理后台)
企业级 LLM API 网关与管理平台,支持多提供商集成、计费追踪及基于角色的访问控制,通过 Docker 部署。
-
FastAPI LLM 网关
iimeta/fastapi 是一个企业级 LLM API 集成系统,在统一的 OpenAI 兼容接口背后聚合多个模型提供商,并支持 Docker 部署。
-
戈勒姆机器人 (GolemBot)
一个基于 TypeScript 的智能体 (Agent) 框架,支持多通道部署(IM、HTTP),兼容 13,000+ OpenClaw 技能及主流代码助手运行时。
-
IBM Granite 4.0 1B 语音模型
IBM 发布了一款 10 亿参数的多语言语音模型,具备自动语音识别与翻译功能,支持关键词偏置及高效推理能力。
-
经由 Ollama 部署 Qwen3.5 多模态模型
一种技术工作流,使用 Ollama 推理运行时在本地部署 Qwen3.5 多模态模型系列,以实现消费级硬件的推理。
-
只需对话即可训练任何智能体
一个 GitHub 仓库提议将自然语言指令作为强化学习智能体训练的主要接口,减少对手动奖励函数工程的依赖。
-
AIMAXXING(艾马克星)
AIMAXXING 是一个专注于 Windows 的自主智能体框架,利用零依赖运行时环境和模块化智能引擎,实现无需主机依赖的本地 LLM 编排。
-
ClawPanel (爪板面板)
ClawPanel 是面向 OpenClaw 智能体框架的跨平台可视化界面管理工具,内置 AI 辅助诊断与部署自动化功能。
-
CorbeauSplat: macOS 视频转 3D Gaussian Splatting 工具
一款 macOS 原生工具,将原始视频输入转换为交互式 3D Gaussian Splat 表示,用于本地空间重建。
-
GPUStack
GPUStack 是一个开源 GPU 集群管理器,通过选择 vLLM 或 SGLang 等推理引擎并在异构硬件上自动配置参数,优化 AI 模型部署。
-
2026 开源 AI 智能体框架图谱
2026 年市场概览,聚合面向开发者部署的开源智能体框架,重点突出 LangChain、AutoGen 和 CrewAI 生态中的编排、记忆与规划能力。
-
Anthropic 网络安全技能
一份精选的 611 项以上结构化网络安全技能集合,兼容 Claude Code、GitHub Copilot、Cursor 和 Gemini CLI,使 AI 编程智能体能够执行安全分析、威胁建模和漏洞评估任务。
-
菩提应用 (Bodhi App)
菩提应用(Bodhi App)通过 llama.cpp 实现开源大语言模型(LLM)的本地执行,提供兼容 OpenAI 的 API 端点及内置的模型权重发现接口。
-
CoPaw
CoPaw 是一个开源个人智能体助手平台,可部署于本地或云端基础设施,原生支持 Discord、钉钉、飞书等多个消息平台,并具备可扩展的技能框架。
-
FastGPT
FastGPT 是一个面向大语言模型 (LLM) 应用的开源视觉工作流编排平台,将 RAG 检索、数据处理和多模型提供商支持集成于可部署的容器化环境中。
-
异端 (Heretic)
异端是一个开源工具,利用方向性消融和参数优化自动化移除 Transformer 语言模型的安全对齐,使去对齐成为一种可访问且可复现的操作。
-
Lightpanda 浏览器 (Lightpanda Browser)
Lightpanda 是一个基于 Zig 构建的无头浏览器,专为 AI 智能体和自动化管道优化,提供 9 倍更低的内存占用和 11 倍更快的执行速度,同时支持完整的 JavaScript 执行。
-
pi-mono:智能体工具集
pi-mono 是一个 TypeScript 单仓,提供完整的 AI 智能体工具集:多提供商大语言模型抽象层、编码智能体 CLI、Slack 机器人集成,以及终端和 Web UI 库。
-
ChatLuna
ChatLuna 是一个基于 TypeScript 的 Koishi 插件,支持多模型 LLM 集成,提供可扩展的输出格式和会话管理,适用于聊天机器人部署。
-
DeerFlow(鹿流)
DeerFlow 是字节跳动基于 LangChain 构建的 MIT 许可开源智能体框架,通过沙箱化子智能体执行及长短期记忆机制,编排多步骤研究、编码和内容生成任务。
-
火萤 (Firefly)
火萤是一个开源框架,用于大语言模型训练,支持在多种模型架构上进行预训练、指令微调(SFT)和直接偏好优化(DPO),并采用 QLoRA 优化。
-
HelixML
HelixML 是企业级平台,用于部署私有 AI 智能体舰队,具备 GPU 调度、多提供商 LLM 支持及 MCP 兼容的工具编排功能。
-
赫尔墨斯智能体 (Hermes Agent)
赫尔墨斯智能体是 Nous Research 推出的开源自主智能体平台,服务端运行,支持跨多通信渠道,具备持久记忆、技能生成及五个执行后端(含本地、Docker 和 SSH)。
-
LLM-Pruner(大语言模型剪枝工具)
LLM-Pruner 通过结构剪枝方法实现大语言模型规模的缩减,同时在包括 Llama 和 BLOOM 在内的支持架构上保持性能。
-
MCP 谷歌地图服务
一个开源的模型上下文协议(MCP)服务器,实现 Google Maps API 集成,用于智能体工作流中的地理空间查询与路由。
-
mLoRA
一个开源框架,利用流水线并行在共享基础模型上对多个 LoRA 适配器进行并发微调,以优化参数高效训练效率。
-
Nous Research(诺斯研究)
Nous Research 是一家开源人工智能研究机构,专注于模型微调、数据合成与推理进阶,在 HuggingFace 与 GitHub 上维护公开权重与工具。
-
开源大语言模型更新与 AI 模型发布
一个聚合开放权重语言模型发布与主要开源模型提供商许可合规更新的监控资源。
-
管道 (Plumbing)
管道是一种类型化语言,用于使用会话类型指定多智能体通信协议,其编译器在执行前验证智能体图的良构性,并提供用于运行时集成的 MCP 服务器。
-
Hugging Face Transformers 库
Transformers 库提供了一个统一的 Python 接口,用于在文本、视觉、音频和多模态领域实现、训练和部署最先进的机器学习模型。
-
新推理 (Xinference)
Xinference 提供统一的、生产就绪的推理 (inference) API,用于在云端、本地部署及本地硬件环境中部署开源语言、语音及多模态模型。
-
AirLLM
AirLLM 优化推理内存使用,使大型语言模型能在消费级硬件上运行,无需量化或蒸馏。
-
开放大语言模型 API (API for Open LLMs)
为多样化的开源语言模型提供兼容 OpenAI 的 API 封装,跨异构模型系列标准化推理访问。
-
Capsule(胶囊)
Capsule(胶囊)是一个基于 WebAssembly 的运行时环境,旨在将不受信任的智能体代码执行与宿主系统资源隔离开来。
-
Google智能体开发套件(adk-js)
一个以代码为核心的TypeScript框架,用于构建和部署多智能体系统,与Google Cloud深度集成,支持可版本化的编排逻辑。
-
RAGFlow
RAGFlow是一款开源检索增强生成引擎,集成了文档解析、图谱检索与智能体工作流,为大型语言模型构建上下文层。
-
Cherry Studio(樱桃工作室)
一个用于访问大语言模型和执行智能体任务的桌面界面,它从单一工作空间聚合数百个助手并连接至开源智能体框架。
-
Dorabot
一款 macOS 应用程序,为拥有集成记忆、调度与通信渠道自动化能力的自主智能体提供持久化的 IDE 工作空间。
-
Onyx AI 开放大语言模型排行榜
针对编码、推理与工程任务的开放权重模型精选基准测试界面。
-
OpenClaw 中文翻译
OpenClaw 智能体框架的本地化分支,为中国语言操作者提供中文界面支持、自动上游同步及多平台部署。
-
Unsloth 微调框架
Unsloth 为大型语言模型提供优化的推理和微调库,通过内核级优化和量化支持降低 VRAM 消耗和训练时间。
-
vLLM
一个面向大型语言模型的高吞吐、内存高效推理与服务引擎,利用分页注意力(PagedAttention)与连续批处理技术,在多种硬件后端上提升服务效率。
-
AutoResearch(自动研究)
安德烈·卡帕西(Andrej Karpathy)构建的最小化自主智能体设置,能够在无人干预的情况下,通过修改、训练及评估代码,运行过夜机器学习实验。
-
维度操作系统 (DimensionalOS)
一个开源智能体机器人框架,通过基于技能的 ROS2 架构,将大语言模型智能体直接连接到机器人控制原语。
-
Llama 4 开放模型系列
Meta 发布 Llama 4 作为混合架构模型系列,包含 Scout 与 Maverick 配置,扩展支持八种新语言的多语言能力。
-
memU(记忆流)
memU 是一个开源的主动记忆框架,专为全天候运行的 AI 智能体设计,能预测语境需求,而非等待查询。
-
微软智能体框架整合 (AutoGen + Semantic Kernel)
微软将 AutoGen 与 Semantic Kernel 项目整合为统一框架,预计于 2026 年第一季度实现正式发布。
-
MindNLP
一个兼容层,使华为 MindSpore 框架能够在昇腾 NPU、标准 GPU 和 CPU 上支持 Hugging Face 的 Transformers 与 Diffusers 模型的运行时适配。
-
NornicDB
NornicDB 是一款基于 Go 实现的自托管混合图与向量数据库。它在保持与 Neo4j 和 Qdrant 协议兼容性的同时,为智能体状态管理暴露了 GPU 加速的搜索能力。
-
Paperclip
一个开源智能体编排层,为多智能体自主工作流注入组织架构、预算与治理机制。
-
Qwen-Agent (通义千问智能体)
阿里巴巴开源的大语言模型应用框架,提供可复用的智能体组件、工具集成以及基于 Qwen 模型系列的 RAG 基础设施。
-
GoLaxy 文档与人工智能影响力行动
2026 年 3 月发布的一条分析信号,描述关于 AI 辅助的、与中国关联的影响力行动基础设施的泄露文档。
-
创想实验室:扩散型 LLM 信号
一个聚焦于推理速度与效率的扩散模型 LLM 信号,其主张超越了标准自回归生成模式。
-
RedAmon
一个自主的威胁模拟(red-team)框架,它将侦察、利用、定级与代码修复工作流串联为一个统一的代理式安全管道。
-
Scrapling(自适应抓取流)
一种自适应抓取框架,集成了反反爬虫感知抓取、弹性解析、蜘蛛协同编排与 MCP 集成。
-
Team Mirai 与日本选举信号
2026 年 3 月的一条公民技术信号,追踪 Team Mirai 在日本选举政治中作为一种静默却深具意义的 AI 时代组织变革。
-
Venice AI
一款主打隐私的 AI 产品,在市场宣传中强调横跨文本、图像与视频工作流的私密性与低过滤生成。
-
Langflow
一种用于 AI 智能体、流(flows)与 MCP 服务器的可视化构建器,将编排操作转化为显式、可编辑的操作图谱。
-
LibreChat(自由对话)
一个开源 AI 平台,整合多模型对话、智能体、工具与企业控制,提供自托管界面。
-
Open WebUI(开放 Web 界面)
一个自托管的 AI 平台,通过统一界面连接本地或云端模型,提供工具、检索及扩展挂钩接口。
-
OpenFang(方)
由 Rust 构建的智能体操作系统信号,强调沙盒执行、安全层与多通道自主工作流。
-
AnythingLLM
面向本地与托管模型 (Model) 后端的文档 grounding(基于文档)聊天与智能体 (Agent) 工作流的开源 (Open Source) 工作空间层。
-
CrewAI:多智能体协作编排
一个开源的多智能体(multi-agent)编排框架,强调基于角色的协调与任务流水线。
-
Dify
一个用于构建和运行 AI 工作流、且具有可见编排层的开源 LLM 应用平台。
-
序曲 (Overture) (SixHq)
一种开源编排信号,用于构建具明确操作控制的智能体工作流。
-
bargnmar
开源工具生态中的开源 GitHub 项目信号。
-
大型语言模型驱动的大规模在线去匿名化
2026 年的一项研究信号,显示基于大语言模型的流水线能够大规模地从非结构化文本中重识别伪名用户。
-
边缘之爪 EdgeClaw
一个面向边缘人工智能与机器人实验的公共知识库信号。
-
GIS 工具
面向可发现地理空间工具、数据集与工作流的目录信号。
-
Ollama
一个将个人硬件上的语言模型运行与部署规范化的关键本地推理运行时信号。
-
技能层(skills.sh)
一种旨在使 AI 智能体行为更具模块化、显性化及可复用性的技能层信号。
-
Arcee AI
Arcee AI 映照出**小模型之流**:致力于可部署、高效且可控集成的**语言模型系统**。
-
Cleo(克利奥)(kryptobaseddev)
Cleo 是一条开源 GitHub 项目流:围绕 AI 工具的可检视实验,其中仓库透明度使实践层面的直接学习成为可能。
-
OutcryAI(呐喊 AI)
OutcryAI 是一个聚焦行动主义的 AI 系统,使用专用提示与模型适配,支持运动策略、历史根基与战术反思。
-
Signal.org
Signal.org 代表着以隐私保护为核心的通信基础设施,其中端到端加密、最小化元数据与非营利治理作为核心设计承诺始终不变。
-
代码维基 (CodeWiki) (Google)
CodeWiki 将代码仓库的理解转化为持续生成的制品,紧密连接提流(commit flow)。
-
Kimi.com
Kimi 将多模态编码与并行智能体 (Agent) 执行整合至单一公共界面。
-
OpenCode.ai(开放代码)
OpenCode 将编码智能体的工作流封装为跨终端与 IDE 界面的开源、多提供方兼容的运行时。
-
字节跳动 Seed
字节跳动 Seed 正在整合快速演进的多模态与智能体模型栈,标志着基础成果的大规模产品化。
-
V-JEPA(Meta)
V-JEPA 推进基于视频的世界模型学习,将重点从令牌预测转向预测性表征。
-
你自己的机器人 (YOR)
YOR 提出了一条低成本、可构建的途径,通向双臂移动操作 (bimanual mobile manipulation),并附带公开文档。
-
农业生态知识公域
开放种子知识、共享农场记录与通用数据架构,正汇聚为服务于农业生态实践的知识基础设施。
-
openpilot
通过代码、硬件约束与公开发布节奏,comma.ai 的开源驾驶辅助栈使得现实世界的自动驾驶开发保持通透可读。
-
RynnBrain(具身基础模型)
阿里巴巴达摩院开源具身基础模型家族,标志着一条更坚实的开放路径:从多模态感知走向扎根于现实的机器人规划。
-
Viam
Viam 将机器人集成、数据、AI 与机队运营整合于单一软件层,发出更强信号:物理系统的控制权正转向软件原生架构。
-
BettaFish(搏鱼)
BettaFish 探察面向 AI 智能体的本地可扩展记忆层,采用插件式架构。
-
MiroFish(米罗鱼)
MiroFish 将自己视作为开源记忆操作系统,为 AI 工作流延伸个人知识的保存与检索能力。
-
开放助手
开放助手仍是一个参照点,指向开放的、社区驱动的助手构建与透明 AI 堆栈的组装。
-
多元宇宙学院
多元宇宙学院致力 AI 原生教育,将学习视为人与智能工具间的协作实践。
-
Z.ai
Z.ai 围绕其 GLM 模型系列定位聊天与智能体工作流,为开源模型的流通示出另一条路径。
-
Confer.to(对谈)
关于匿名 AI 智能体对话的实验,以及对无身份互动的空间意涵的探讨。
-
LM Studio
一个桌面应用程序,使本地语言模型推理变得可及且平常。
-
边界脉冲(Boundary Pulse)
追踪约束收紧或松弛的时刻——技术、流程与社会层面的边界变化——以识别流通加速或阻滞的关键节点。
-
信号漂移
追踪注意力与运动方向上的细微偏移,在其固化为假设之前识别早期变化的诠释方法。