
雷峰网(公家号:雷峰网)讯 5 月 14 日,OpenHuman 登上 GitHub榜单,并于这个月中旬履历了发作式增加。仅仅 6 天以内,它从 3,489 增加到 14,227 stars,日均增加 1,690 stars,持续霸榜第一约一周之久。截至研究日,更是已经经冲破 18,600 stars。 OpenHuman 是一款由开发者团体 TinyHumans AI 构建的开源桌面 AI Agent。它的自我定位是「Personal AI Super Intelligence」,即一个私有、简朴、极为强盛的小我私家智能体。 从品类上看,OpenHuman 既不是 IDE(不写代码),也不是谈天呆板人(有东西挪用及主动化能力),也不是条记软件(虽然它天生 Obsidian 兼容的常识库)。 它试图成为一个桌面级的小我私家 AI 操作体系进口,把影象、集成、语音、编码东西、当地常识库塞进统一个 Agent 框架里。 而于桌面级智能体助手迭出的今天,它的焦点主意也能够用一句话归纳综合:于用户输入第一个 prompt 以前,Agent 就已经经相识你。 从建造者本身于 Product Hunt 上的评论中可以看到,这个项目的初志实在很朴素。开创人想给本身的老爸配置一个 AI Agent,但发明市道上的智能体配置都太繁杂了,从装终端、配 API Key,到写 YAML,一般人底子玩不转。在是他想做一个,真正能一键开箱即用的产物。 这个起点是朴拙的。但 AI 产物或者者 vibe coding 这事,往往胡想很重大, 落地都一地鸡毛。咱们上手以后很快就发明,OpenHuman 的现实利用体验及愿景,还有有着不小的间隔。 最较着的问题是,「于第一个 prompt 以前就相识你」的主意,隐含着一个巨年夜的条件前提: 你必需自动、尽可能多地绑定第三方办事。 假如用户不毗连 Gmail、GitHub、YouTube 等账号,这个 Agent 就会对于你全无所闻,它会退化成一个平凡的谈天窗口,及免费的 ChatGPT 没有素质区分。 所谓的“分钟级相识”,彻底成立于用户绑定账号的“分钟级手速”之上。但谁会于接触一款新产物的第一刹时,就急头白脸地交出险些所有权限? 这是 OpenHuman 给咱们留下的第一印象,造次,而实际的骨感的地方还有有更多。 01 利用 OpenHuman 的历程中,一种很强烈的感触感染于在,这是一个贸易化野心远超产物完成度的项目。 这类洞察甚至先在真正上手利用,由于咱们发明主界面已经经高调插手了「奖励」模块。也就是说当产物还有于 Early Beta,功效还有有年夜量粗拙边角的时辰,保举奖励体系就已经经就位了。这类对于优先级的选择,自己就通报了许多旌旗灯号。 此外假如用户不定阅 OpenHuman 的付费规划,而是配置本身的 API Key,那末获得的只会是一个谈天框。没错,连 tools 都没法利用。 免费环境下所有东西挪用能力被锁死,Agent 的手及脚被充公了,焦点功效彻底不成用。此时的OpenHuman 只剩一张嘴,这象征着「一键开箱即用」的愿景,必需靠充值才能实现。 公允地说 OpenHuman 确凿提供了必然的免费额度,但实测下来年夜概只撑持三次简朴问答。甚至在用户一句话都不说的环境下,假如 Agent 绑定了几个第三方账号,那末体系主动抓取数据耗损的 token,也足以把免费额度吃光。用户还有没来患上和输入第一个 prompt,Agent 就死于了没额度上。 产物的胡想是「于输入第一个 prompt 以前 Agent 就充足相识你」,但实际是「于输入第一个 prompt 以前 Agent 就已经经把你的免费额度花完了」。 可以看出,OpenHuman 传播鼓吹的低成本、无磨擦利用,彻底成立于充值之上。 细想之下 OpenHuman 实在揭示出了相称魔幻的一壁。 一方面,市场上已经经有不少可以或许一键开箱即用的免费 Agent 产物,甚至在 ChatGPT 某种水平上也能够归在此列。另外一方面,OpenHuman 选择了「付费」作为用户转移进修成本的方式,但付费自己就是巨年夜的用户利用成本,它及「简朴」的方针自相抵牾。 固然,这也不克不及全怪 OpenHuman。AI 的推理成本确凿昂贵,对于在一个需要每一 20 分钟主动抓取数据、连续构建影象树的体系,token耗损更是平凡谈天的数倍。 这也许也反应了 AI 创业的一个残暴实际,假如没有充足富余的启动资金来补助冷启动期的用户体验,就会重现 OpenHuman 这类难堪的脚本,产物还有没让用户感触感染到价值,就已经经最先要钱了。 02 抛开体验层面的粗拙,这款产物于工程架构上确凿有值患上存眷的设计。 OpenHuman 的焦点架构是一条三阶段管道: ▪毗连:OAuth 接入 118+ 办事 ▪抓取:每一 20 分钟主动轮询 ▪影象:转换为 Markdown,构建 Memory Tree 这类设计用意很清楚,就是为了让 Agent 能于后台连续堆集对于用户的相识,无需用户自动投喂数据。当一众 Agent 产物都于传播鼓吹本身“越用越懂用户”,OpenHuman 把这个历程的初步,拉低到了只要能于用户的装备上跑起来便可。 为了实现这一点,OpenHuman 的技能栈选择了 Tauri,即 Rust 后端加 WebView 前端。必需认可开发团队确凿很是细节,比拟 Electron,Tauri 更轻量、更安全、更省内存,合适需要持久后台运行的 Agent 运用。从这个选型就表现出了团队对于产物形态的思索,当它需要像一个体系办事同样常驻后台,Electron 的资源开消于这个场景下就是不成接管的。 此外还有有 Memory Tree,这是 OpenHuman 最有技能含量的部门。存眷 Andrej Karpathy 的伴侣也许有印象,他于本年 4 月提出了一个名为「LLM Wiki」的观点,也就是用 LLM 将原始数据编译成布局化的 Markdown 常识库。 OpenHuman 把这个手动历程彻底主动化了,多源数据抓进来,颠末尺度化、分块(≤3k token)、评分,终极形成层级择要树,别离存入SQLite(供呆板检索)与obsidian Vault(利便人工查阅)。 这内里最要害的设计决议计划是可检视性,用户终究可以直接打开、浏览、编纂 Agent 的常识库。这及传统 RAG 的向量黑箱形成为了光鲜对于比,当你能看到 AI 到底「记住」了甚么,才能谈溯源及改正。 这种东西挪用 Agent,有一个通病是重复召回致使的上下文爆炸。OpenHuman 也思量到了这一点,它的架构中有一层名为 TokenJuice,这是一个用在 token 压缩的中间层。道理其实不繁杂,HTML 转 Markdown、长 URL 缩短、噪声清算、内容去重,同时保留 CJK 及 emoji 等多字节文本,但官方声称,就是这一套流程下来,可以降低高达 80% 的 token 耗损。 比起实现路径,这类工程思绪显然更贵重。于 Agent 体系中,真正昂贵的是后台抓取及东西挪用孕育发生的 token,于数据进入模子前做洗濯,必然比直接塞原始内容更经济。 OpenHuman 另外一处比力少见的设计,是提供了很是富厚的内置智能路由。推理密集使命走前沿年夜模子,通例使命走自制模子,图象走视觉模子,撑持 Ollama 当地推理,成本节制越发合理。 03 从 OpenClaw、Hermes 到 OpenHuman,短短半年间,已经经有三代 Agent 于GitHub 上各领风流。成心思的是,你能看到三者之间于工程思绪上存于着底子差异。 OpenClaw特性最光鲜,它于试图构建的是一个 Agent 节制平面,于此基础上才有了多 Agent 团队、跨通门路由及 Skill 市场,利用体验很像是于治理一个公司的 Agent 构造。 Hermes 的要害词则到了自进化。外部情况、脚手架……这些描写暗地里的共性于在,它们都看到了 Hermes 办事在单 Agent 连续改良的一壁,这也是 Hermes 最焦点的产物逻辑,即检测反复模式,然后主动天生可复用技术,就像是练习一个愈来愈智慧的助手。 沿着这条脉络,就不难理解 OpenHuman 的宣言。于利用以前就最先相识用户,也就是不需要等候用户教,而是自动「熟悉」用户。这是一种「上下文即产物」的 Agent 哲学,把用户的小我私家数据堆集酿成布局化影象,此时的 Agent ,像是一个从 Day 1 就熟悉了你的同事。 固然,为此带来的危害也是布局性的,OpenHuman 的价值主意及安全危害本就一体两面。 首当其冲的是 OAuth Token 聚合。 同时持有邮件、代码、日历、付出的 OAuth Token,当地 SQLite 数据库就会成为高价值进犯方针。2026 年已经有前车可鉴,Context.ai/Vercel 事务中,进犯者经由过程窃取 OAuth Token 横向挪动到 Vercel 内部体系,OpenClaw 的「Claw Chain」四缝隙链影响了 245,000 台办事器。OpenHuman 面对彻底不异的布局性危害,且今朝没有任何自力安全审计。 此外还有有 curl | bash 安装。对于在一个行将得到你邮件、代码、日历、付出信息拜候权限的东西,管道安装是已经知的供给链进犯向量。2025 年 ClickFix 进犯增加 517%,焦点伎俩就是引诱用户于终端履行长途号令。 而于所有危害之上,更值患上寻思的是 OpenHuman 自身发布的,未经验证的技能声明。前文提到的 80% token 压缩率、20 分钟同步靠得住性、Memory Tree 的范围举动都是项目自述,无第三方验证。而压缩层决议了哪些信息被保留、哪些被抛弃,对于在敏感场景,这是不能不稳重的问题。 这些危害是 feature 的副作用。要做到「分钟级相识你」,就必需同时获取年夜量敏感数据,要「一键设置」,就必需简化安全界限,要「连续更新影象」,就必需连结持久有用的 token。OpenHuman 的价值及危害,于架构层面就是绑定的。 04 只管 OpenHuman 自己于完成度及贸易化上有着诸般缝隙,但它提出的产物哲学仍旧值患上当真看待,甚至可以说,这恰是 OpenHuman 最具价值的部门。 「上下文即产物」的焦点主意是:当模子能力趋同后,产物的焦点价值不于在它能做甚么,于在它知道甚么。一样的模子,给它差别质量的上下文,产出的价值天差地别。 这项主意暗地里有一条清楚的逻辑链。当技能能力从稀缺走向富余,Agent 能力真正商品化,竞争核心就会从「我能做甚么」上移到「我能帮你做甚么」,此时对于用户的理解就酿成了新的稀缺资源。 这个链条于从收集带宽到内容保举,从相机像素到计较摄影,从CPU 主频到用户体验等多个行业,已经经被重复验证过。 OpenHuman 的呈现仍旧是对于这类汗青进程的反复,也就是于 Claude、GPT、Gemini 能力逐渐趋同的节点上,试图卡住「更相识用户」的身位。 但这里有一个要害的辨析,记住 ≠ 理解。 OpenHuman 今朝做到的是「跨源影象」,用户授权以后从多个平台拉取数据,压缩存储,被动检索。这解决了从 0 到 1 的问题,也就是让 Agent 有影象。可是从「记住」到「理解」还有有巨年夜的鸿沟,理解象征着瓜葛推理、用意猜测、价值对于齐,于诸多伶仃的信息点之间,成立逻辑及图景,描写将来及价值。 与此同时,「记住一切」也未必是准确谜底。 影象也有边际递减,真正有价值的不是记住更多,而是于要害时刻挪用要害影象。OpenHuman 「全量抓取 + 压缩存储」的线路,可能不如「少而精的要害影象 + 强推理」更靠近「理解」。 理解是影象、推理、方针模子的乘积。 三者缺一,都只是更高级的搜刮引擎。 这也许就是 AI 产物的下一个竞争维度,一个夹于模子及用户之间的、卖力堆集及治理用户上下文的「理解层」。OpenHuman 对于此的洞察极可能是准确的,但全量抓取、压缩存储、被动检索只是这个标的目的上最初期、最粗拙的一次测验考试。 是以假如你问我怎样对待 OpenHuman。 我会说这是一个标的目的准确、机会精准、但履行粗拙、贸易化过早的产物试验。它最年夜的价值不于在做出了甚么,而于在它界说了一个好问题:当模子能力面对边际递减,怎样越过从影象到理解的鸿沟,会是构建护城河的要害。 这中间的差距,既是它的局限,也是整个行业的时机空间,反之亦然。 雷峰网原创文章,未经授权禁止转载。详情见转载须知。













