
雷峰网(公家号:雷峰网)讯 baidu针对于企业级场景设计的桌面级 AI 智能体 DuMate 在本年 3 月 22 日全量上线。从咱们对于在 AI 办公产物的以往测评来看,可以或许真实进入办公场景的产物还有是未几见。 DuMate 可否打破中看不顶用的魔咒,成为一款真正能“抗活儿”的 AI 搭子?带着如许的疑难,咱们设计了一项笼罩项目研究、成果收拾以和包括四种交付物的多形态输出使命。看看baidu智能云 DuMate,毕竟能把使命推进到甚么水平。 01 中国一众 AI 玩家里,baidu的打法一直有本身的逻辑。文心一言打头部认知市场,秒哒打无代码运用搭建,而 DuMate 则试图弥补一个更详细的位置,小我私家和团队的一样平常办公场景中,真正替换那些需要“操作软件、串联文件、交付成果”的反复劳动。 素质上,这就是桌面级 Agent 的生态位。AI 助手的价值,不于在“答患上更好”,更于在“做患上更多”。当年夜模子的推理能力逐渐同质化,真正拉开差距的,是谁能更好地把 AI 嵌入真实事情流,并交付可留存、可复用的成果。 按照baidu智能云公然资料,DuMate 夸大的不只是问答,而是“瞥见屏幕、操作软件、处置惩罚文件、串联营业体系”。看起来简朴的功效定位,现实上笼罩了从桌面履行、事情区、技术扩大到当地安全、办公交付的整条事情链。于技能逻辑上,这需要 DuMate 具有三个条理的能力。 第一层是感知与理解。DuMate 需要理解用户于说甚么、想做甚么,这暗地里是将天然语言指令映照为详细操作序列的能力。 第二层是东西挪用与履行,理解以后,DuMate 需要调起准确的东西,读写文件、操作阅读器、履行代码、挪用 API。这要求它对于桌面情况有真正的感知及节制能力,而非只返回一个 API 挪用建议。 末了就是成果交赋予归档。履行完成后,成果需要以准确的形态输出,对于在办公助手来讲,这往往是 Word 文档、Excel 表格、PPT 演示或者者网站页面。并且交付物自己必需可留存、可复用。 本年 3 月 22 日全量上线后,DuMate 迅速补齐了技术广场、Word/PPT/Excel 优化、文件预览解析、逐日总结、动静渠道接入及正式计费等能力。于不到一个月的时间内,焦点办公能力已经经基本完备。DuMate 办公事情台的产物逻辑已经经更加清楚:即经由过程一个智能体,将用户恍惚的方针,直接转化为可留存、可复用的终极交付物,从而真正嵌入并解决真正的事情流问题。 02 此次测试,咱们没有选择常见的“写一篇文章”或者“收拾一份表格”之类不痛不痒的轻使命,而是给 DuMate 安插了一项更靠近真实事情的繁杂使命,缭绕某一个 GitHub 项目,完成一次“项目研究 + 多形态交付”使命。 好比让 AI 做一张 excel 或者者天生一张 PPT,这种使命太简朴、太洁净,实际中很少有人如许事情,底子测不出来AI 的程度。可是用一个真正的、混乱的、多源信息的使命来查核 AI,好比缭绕一个 GitHub 项目做使命,这恰是研发、产物、技能写作职员一样平常会遇到的事情。假如 AI 于这类使命上体现不错,那它于真实办公场景中年夜几率也能派上用处。 此次咱们选择的 GitHub 项目叫做 everything-claude-code,给不认识的伴侣先容一下。这个项目于 GitHub 上的 Star 数已经经跨越了 14 万。比起某种东西,它更像是一套专为 Claude Code 等 AI 编程东西设计的工程化配置体系,既能用来调教 AI,也能拿它进修怎么跟 AI 打共同。 Everything-claude-code 被设计出来的目的就是把 AI 从“谈天助手”进级成可遵照规范、沉淀经验的智能工程体系。 详细来讲它解决的是四年夜痛点: ▪长期化影象:经由过程主动化钩籽实现跨会话上下文生存,防止换项目就掉忆; ▪规范化流程:将开发拆解为计划、审查、测试等环节; ▪主动化查抄:内置安全扫描东西 AgentShield,含 1282 项测试及 102 条安全法则; ▪连续进修:AI 主动提取有用模式沉淀为团队常识。 整个项目组件像一个完备的“AI 开发流水线”,包括 30 多个各司其职的 Agent,150+ 个可复用 Skill 固化成的最好实践,70+ 条快捷号令一键触发繁杂流程,还有有 30 余条法则组成 AI 的举动底线。 简朴来讲,everything-claude-code 就是将一名资深工程师的一次性对于话酿成了可堆集、可优化的“工程实践”,而且能直接办事在你的私家 Agent 助理。 咱们为 DuMate 设计的测试使命,就是要求它对于开源于 GitHub 上的 everything-claude-code 举行收拾,并把这份“秘笈”以 Excel 内容目次、Word 仿单、PPT 纲领与逐页内容、网站四种情势举行输出。 测试标题问题: 代码块 请缭绕 GitHub 项目 everything-claude-code(https://github.com/affaan-m/everything-claude-code)完成一次“项目研究 + 多形态交付”使命。留意:该项目不是平凡运用,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的机能加强体系。请重点阐发其 co妹妹ands、skills、hooks、rules、guides、install scripts、配置与集成方式,不要误写成传统 SaaS 或者单体软件。请你先基在 GitHub 堆栈及公然收集资料完成研究,形成一份“同一事实草稿”,再基在这统一套事实草稿输出如下 4 项交付物:1. 一份可归档的正式 Word 仿单, 以计较机类专业册本的格局出现2. 一份合适先容/报告请示的 PPT 内容稿,面向计较机专业群体3. 一个可当地预览的展示型静态网站4. 一份 Excel 统计表,用在统计当前项目的组件/模块/目次/要害文件数目、名称、作用申明和备注1、研究规模至少笼罩:- 项目定位、方针用户、解决的问题、典型场景- co妹妹ands / skills / hooks / rules / guides / scripts / 配置文件 / tests / integrations 的布局与作用- 安装、配置、接入方式、典型用法- 架构或者事情机制- 当前版本状况、近来更新、维护活跃度- 危害、限定、不确定项- GitHub 以外的 guide、release、官网、文档、博客、社区、教程、会商等资料2、同一事实草稿请先输出一份布局化项目谍报,作为后续全数交付物的独一事实来历。要求:- 先输出“同一事实草稿”,标注【已经确认】【揣度】【待确认】,只管即便附来历链接- 若有资料冲突,列出冲突点与判定依据- 所有后续交付物必需严酷基在统一套事实草稿,相互不患上抵牾- 不患上编造项目中不存于的功效、组件、版本或者官方信息3、交付物要求1)Word:面向初次接触者,章节完备、专业正式,合适归档/培训/对于外申明;若不克不及直接天生 .docx,则提供完备正文、标题层级、封面建议、排版建议及文件名2)PPT:合适先容/报告请示,不照搬仿单;先纲领后逐页;每一页含标题、3-6个要点、图示建议、演讲备注;10-18页;若不克不及直接天生 .pptx,则提供完备逐页内容及文件名3)网站:若不克不及直接发布,则天生当地可运行的静态网站目次;至少包罗首页、项目先容、焦点能力、安装利用、架构申明、FAQ、参考资料;提供目次布局、全数文件内容、进口文件名及打开要领;优先利用无需繁杂构建的 HTML/CSS/JS4)Excel:先申明统计口径;统计当前项目的目次、co妹妹ands、skills、hooks、rules、scripts、docs/guides、配置文件、tests、integration targets 等数目、名称、路径、作用申明、所属种别、备注、来历依据;若不克不及直接天生 .xlsx,则提供可直接导入 Excel 的 CSV 或者表格内容和文件名4、输出挨次1. 研究要领与信息来历2. 同一事实草稿3. Excel 统计口径与统计表4. Word 仿单5. PPT 纲领与逐页内容6. 网站目次布局与文件内容7. 危害申明、未确认项、受限项8. 终极交付清单与建议文件名5、全局约束- 所有产出必需基在统一套事实草稿,相互不患上抵牾- 不患上编造 GitHub 堆栈中不存于的功效、组件、版本或者官方信息- 对于不确定内容必需明确标注- 不患上于没法天生真实 .docx/.pptx/.xlsx 文件时谎称“已经天生完成” 这项使命的难点于在,everything-claude-code 不是平凡运用步伐,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的机能加强体系,是以 DuMate 不克不及把它误写成传统 SaaS 或者单体软件。 此外因为超高的热度,everything-claude-code 于收集上有年夜量公然资料增补,DuMate 的研究不克不及局限在 GitHub 堆栈。良莠不齐的公然资料又对于交付质量提出了挑战,即所有内容必需基在统一套”同一事实草稿”,DuMate 需要甄别、摒弃那些自相抵牾的过错信息。 终极,它需要交付四样工具:一份 Word 仿单、一份 PPT 内容稿、一个可当地预览的静态网站,以和一份 Excel 统计表。 DuMate 的体现怎样呢?下面来看看: ▪搭草稿:先研究,后输出 第一步,DuMate 先读懂 everything-claude-code 项目,并从公然收集增补 guide、release、文档、博客及社区资料,终极形成“同一事实草稿”。这一步最值患上看的,不光是它会不会把堆栈 README 摘一遍,还有有它有无能利巴堆栈内信息及堆栈外信息归并起来,再构造成后续交付物配合依靠的底层质料。 从现实界面看,DuMate 没有逗留于“对于话框里给一段总结”,而是把使命拆成为了多个阶段节点。右边“进程”栏会显示当前正于天生的 Word、PPT、网站目次与终极清单等内容,左边则能看到当前对于话与事情区文件。这象征着它的履行历程不是黑箱,用户能知道它正于做甚么、哪些文件已经经天生、后续还有会走到哪一步。对于一款以“真干活”为卖点的办公 Agent 来讲,可不雅察、可控的利用体验是必不成少的。 更要害的是,DuMate 先搭草稿,再做输出。这个动作的价值于在:一旦草稿成型,后面的 Word、PPT、网站及 Excel 才有可能连结先后一致。对于有过真实项目履历的人来讲,最耗人的往往不是写质料,而是往返查对质料之间是否抵牾。DuMate 体现出来的,是一种更靠近项目事情的研究先行 + 一稿多用思绪。 ▪Excel 统计:统计口径先行 于事实草稿以后,DuMate 被要求天生 Excel 统计表。这里的难点不是“做个表”,而是要明确统计口径,梳理项目模块、目次、要害文件、数目、路径、作用申明及备注,而且与前面的研究结论连结一致。 现实使命中,它给出的不是一张姑且列表,而是一份更靠近可二次利用的统计质料,包罗统计口径申明、各字段界说,以和可以或许与后续文档交织查对的布局化数据。 ▪Word 仿单:进入真实文件天生流程 接着是 Word 仿单。这一步更像交付验证,平凡谈天助手往往只能给你一段“可以复制到 Word 里”的正文,而 DuMate 则进入了真实文件天生流程,末了直接拿出一个可以直接预览的 .docx 文档。 用户看到的再也不是“文本建议”,而是一个已经经天生出来、可以继承流转及生存的文件。这此中的差距,远比听上去的年夜。 到这一步,交付物已经经揭示出了不俗的落地价值。everything-claude-code 自己就是极具分享价值的实践经验,于此基础上形成的技能仿单,更是把这份“年夜牛指南”掰开揉碎了喂给用户。架构设计及焦点组件先容都是最基本的,这份 35 页的文档里,一半以上都是可以直接引导 Agent 实践的部署教程及最好实践案例。就连高频呈现的问题,都收拾成为了一份妨碍解除指南。 ▪PPT + 网站:内容形态切换 PPT 的出现效果也不错。事实上这个环节的难点从来不于在把文档压缩到几个画面上,而是要让内容从书面叙述切换到视觉表达。DuMate 于这一环节继承沿用统一套事实草稿,没有从头发现一套逻辑,项目申明就此转化为了更合适先容及报告请示的布局。 末了一环是展示型网站。这里磨练的就再也不是文档天生能力,而是信息架构迁徙:项目先容、焦点能力、安装利用、FAQ、参考资料等模块,需要被从头构造成网页表达。DuMate 终极天生了可当地预览的静态网站目次。这象征着统一套事实草稿,已经经不只是能被 写成文档 ,而是能被“做成网站”。 把这四项交付串起来看,DuMate 此次最有价值的体现,其实不是某一个单项上做患上比他人更美丽,而是它于研究—收拾—文件天生—展示化输出这条链路上靠得住地跑完了全程。对于在办公 Agent 来讲,于多个使命步调之间能顺滑地跟尾,偏偏是落地最要害的门坎。 03 从“单次天生”到“使命闭环”,桌面级 AI 办公东西正于履历一场不容拒绝的范式转移。 回看已往一年的 AI 办公赛道,年夜大都产物的逻辑依然是“发问-天生-复制”的三步轮回。用户于对于话框里输入需求,AI 返回一段文字或者一张图表,用户再手动把它搬到 Word、PPT 或者邮件里。但复制这个动作,偏偏是拦住办公 Agent 落地的末了一道门坎,它让 AI 只能饰演内容供给商的脚色,而不是真正接办、履行这套事情流。 这种产物没法嵌入一样平常办公场景,也不克不及被称为办公助手。DuMate 此次展示的标的目的,就是办公 Agent 从“内容提供商”到“办公搭子”的转向,这也是办公 Agent 赛道今后真实的技能分水岭。 一名持久存眷 AI 办公赛道的投资人向咱们吐露,2025 年到 2026 年上半年,主流 AI 办公产物实在都于做统一件事,那就是把对于话交互做患上更流利、把模子幻觉率压患上更低、把天生速率压到秒级。但这些指标的晋升,素质上还有是于优化“单次天生体验”。而真实的疆场,已经经于向“使命闭环能力”转移。让 AI 于真实事情流里跑彻底程,只是将来留于牌桌上的入场券。 这是贸易闭环逻辑之下的一定选择,定阅制的 AI 办公产物最怕的不是用户流掉,而是“用不起来”。纵然用户付了月费,但若只拿来写周报,ROI 算不外来,末了还有是会停失续费,如许的产物是没有PMF可言的。 换言之,而当 AI 可以或许真正替换部门反复性办公劳动时,用户的付费意愿及续费动力才会真正被唤起,这个市场才真的有可能呈现。 从被动的“天生-反馈”轮回,进化到自动的“感知-计划-履行-交付”,baidu于这条路上的选择颇有意思。DuMate没有去卷对于话体验或者者试图用模子参数解决一切,而是把赌注押于了“履行层”,也就是让 AI 瞥见屏幕、操作软件、串联文件,把成果直接交付成可留存、可复用的形态。 固然,这条路其实不好走。它要求 AI 体系对于桌面情况有更深的感知能力,对于使命有更长的影象及计划能力,对于交付形态有更矫捷的撑持能力。任何一个环节呈现短板,闭环城市断裂。这也许也是为何,年夜大都 AI 办公产物仍旧选择停于“天生”这一层。“闭环”级另外不变性,确凿已经经组成了技能门坎及护城河。于咱们看来,这类能力颇有多是桌面级 AI 办公东西告竣 PMF 的 分水岭。 DuMate 此次的压力测试,当然也有不足。PPT 的设计、网站的交互仍有优化空间,但它已经经没法用纯真的天生质量举行评价,而是于使命完成度这个更接近真实事情场景的维度上被审阅。从帮你做患上更快,到替你做患上更多,这也许就是 AI 办公赛道真正走向成熟的标记。 雷峰网文章 雷峰网原创文章,未经授权禁止转载。详情见转载须知。










