
雷峰网讯 2026年4月的一个凌晨,4点07分,一切瓦解了。 前一天晚上,我让家里的AI彻夜干活——收拾NAS(收集存储办事器,简朴说就是“家用年夜型挪动硬盘”)里20年攒下的几十TB数据,包括照片、文档、视频,AI要一个个分类,已经经跑了整整6个小时。 成果,路由器忽然重启了。 我的条记本主动重连WiFi时,犯了个致命过错:它没连家里的主路由,反而连上了运营商的光猫收集。就这一个小掉误,致使NAS、AI办事器全数掉联,六个小时的事情功亏一篑,整个家庭AI体系像多米诺骨牌同样,完全崩了。 早上7点,我打开电脑,屏幕上全是“毗连掉败”的提醒——这是我用AI重修家庭数字糊口的第九天,前八天的欣喜,差点被这一个小bug浇灭。 这一切,还有要从八天前,一台新电脑的到来讲起。 02 我是天卓,一个持续创业者,也是一个技能极客。 (编者补:邓天卓更是一个挪动互联网时代的超等创业者+投资人,与海内各家电商都瓜葛匪浅。) 从最早的PowerPC电脑,到厥后的Intel旗舰机,再到近几年的M一、M二、M三、M4 Max MacBook Pro,我的主力机换了一代又一代,但有一个习气从没变——不重装体系。 每一次换电脑,我都像“倒酒”同样,用苹果的迁徙助手(Migration Assistant),把旧电脑里的所有工具,一成不变拷贝到新电脑里。 20年下来,我那台M4 Max MacBook Pro,已经经酿成了一个8TB的“数字迷宫”:几十万张专业相机照片、无数投资文档、上百个软件的配置、从2004年最先的开发情况,还有有许多我本身都记不清是甚么的海量数据。 之前,我只能靠不停买顶配电脑,才能装下这个“迷宫”。但本年,我不想再如许“摆烂”了——由于我收到了一台“神器”:M5 Max MacBook Pro(16英寸顶配,业内叫“天子版”)。 这台电脑最牛之处,是它有128GB的同一内存(可以理解为“电脑的年夜脑运行空间”,越年夜越流利)。 放于一年前,只有数据中央的专业GPU(图形处置惩罚器,相称在电脑的“算力心脏”),才能动员650亿参数的年夜模子(参数越多,AI越智慧);但此刻,这台家用条记本就能轻松做到——好比Qwen3.5-122B的4bit量化版,只需要65GB内存,运行速率彻底够用。 更主要的是,模子跑于当地(就是只于我本身的电脑上运行),数据不会传到网上,既不消费钱买利用额度,也不消担忧隐私泄露。 在是我萌发了一个斗胆的设法:让AI帮我,把旧电脑里的“数字迷宫”,完全迁徙到新电脑上,趁便收拾洁净。 03重头戏: 打开 Claude Code,我下达了阿谁本身期待已经久的号令:“帮我把M4上的一切,迁徙到M5 Max上。” 这及传统的迁徙方式,彻底纷歧样。 苹果的迁徙助手(Migration Assistant)就是个“黑盒”——它只会把旧电脑里的所有工具,一成不变拷贝已往,无论有效没用,也无论兼容不兼容。 但Claude Code纷歧样,它像一个经验富厚的体系治理员,先花10分钟给两台电脑“看诊”: 1.扫描旧电脑上的所有软件、代码情况、配置文件; 2.读取我的shell配置(电脑操作号令的设置)、SSH密钥(长途登录电脑的“钥匙”)、启动项; 3.阐发每个运用,判定哪些有效、哪些没用; 4.查抄磁盘康健状况,防止迁徙历程中出问题。 看诊竣事后,Claude Code忽然问我:“你的体系里有14个Intel时代遗留的Rosetta翻译层运用(之前Intel芯片电脑的软件,于Apple芯片上需要“翻译”才能用),它们随着你换了好几台电脑,从来没清算过。此中8个有原生Apple芯片版本,我建议装原生版;别的6个已经经住手更新,你确定还有要吗?” 那一刻我就知道,它真的把我那20年的“数字迷宫”走通了——它不是于“照搬”,而是于“理解”我的需求,帮我做弃取。 以后,Claude Code给我天生了一份三层排查清单,把要迁徙的内容分了类,连我本身都忘了的工具,它都找出来了: 1.基础层:SSH密钥、桌面文件、经常使用软件列表,这些最轻易想到的工具; 2.中间层:Git配置(代码治理东西的设置)、自界说剧本、按时使命,这些手动拷贝很轻易漏掉的工具; 3.深层层:60GB+的虚拟机文件、相机色采配置文件(用专业相机的人都知道,这工具丢了就无法还有原照片色调)、散落于电脑里的项目文件夹。 一最先,数据传输速率只有33MB/s,按这个速率,迁徙完要花好几天。 Claude Code阐发瓶颈后,自动做了三项优化,刹时把速率提了上来: 1.去失压缩功效:于万千兆局域网上,压缩反而会占用CPU,拖慢速率; 2.换轻量级SSH加密算法:默许的加密算法太“重”,换个简朴的,速率直接翻倍; 3.年夜文件直接传输:不消增量算法(原来是用来节省传输流量的),于局域网上反而过剩,直接传更快。 终极,传输速率到达了210MB/s,一个周末,就完成为了所有数据的迁徙。 04 此次迁徙,完全转变了我对于AI能力的认知——它不只是一个“东西”,更像一个“万能助手”,能解决许多我没想到的问题。 迁徙历程中,Claude Code需要下载一个年夜型框架包,正要从官方网站下载时,它忽然停了下来:“这个包咱们以前于你的另外一台呆板上下载过,我直接从那台电脑拷过来,不消再从网上下载了。” 它竟然记住了我家里所有装备的状况,自动挪用其他装备的资源,省了我年夜量时间。 我有一台Windows台式机,配备了RTX 5090显卡,但内存被主板锁于了4800MHz,比标称的6000MHz低了25%,贸易超频软件都没用(戴尔于BIOS里做了锁定)。 Claude Code发明后,长途毗连到这台电脑,下载了主板的BIOS固件,用十六进制编纂器反编译,找到隐蔽的内存频率节制寄放器,还有制订了一套完备的破解方案——全程都于我下达号令的终端窗口里完成,我彻底没加入。 迁徙历程中,Claude Code忽然陈诉:“你的第二块NVMe硬盘(高速固态硬盘)呈现了可修复的ECC过错(简朴说就是数据传输时呈现了小过错)。” 更厉害的是,它还有给出相识决方案:“这类过错凡是是由于安装时散热片压患上太紧,造成为了物理应力。建议关机后,松动散热片右下角的固定螺丝,向上推一下再拧紧。” 这不是软件问题,也不是驱动问题,而是物理安装问题——AI竟然能经由过程扫描,发明这个问题,还有去硬件论坛找相识决方案,精准定位到详细哪颗螺丝。 迁徙完成后,我发明一个不测欣喜:许多付费软件,我不再用买了——由于AI能帮我实现所有功效,还有更好用。 举几个例子: 1.文件重定名:之前用付费软件,要末依靠云端,要末功效有限;AI帮我装了开源东西,挪用当地年夜模子,中英文混淆定名都能弄定,零成本; 2.语音辨认/合成:之前用云端办事,定时长计费;此刻当地跑Qwen3-ASR(语音辨认)及Qwen3-TTS(语音合成),免费、及时,正确率还有更高,还有能克隆声音; 3.常识库治理:之前企业级方案每个月要几百美元;此刻用当地东西加嵌入模子,拖进文件就能问答,不花一分钱; 4.代码审查:之前贸易东西年费几千美元;Claude Code不仅能审查代码,还有能理解我的整个项目,帮我修bug、写测试。 实在原理很简朴:这些付费软件,都是AI不敷智慧的时代产品;此刻有了当地年夜模子,一个通用的智能,赛过一百个专用的东西。 05 迁徙完成后,一个偶尔的发明,让我萌发了让AI接受整个家的设法——那就是节制家里的智能电扇。 RTX 5090显卡全速运行时,温度会飙升到85度,很影响机能。我家里有一台智能电扇,AI帮我做了一件事:让电扇听GPU温度的批示。 步调很简朴(AI全程操作): 1.挟制通讯:这台电扇原来要连厂商的云端办事器,AI于路由器里加了一行设置,把厂商的域名指向我家的NAS; 2.和谈转换:于NAS上用开源东西,把电扇的私有和谈(厂商本身的通讯方式),转换成尺度的MQTT和谈(智能装备通用的通讯方式); 3.设置法则:写一个简朴的温度监控剧本,GPU温度75度开电扇低速,85度开高速,55度如下主动封闭。 一个数字年夜脑,竟然能治理本身的散热——技能不难,但我从中看到了AI融入糊口的诗意。 此刻家里的智能装备愈来愈多:灯、空调、摄像头、门锁、扫地呆板人,每个都有本身的APP,注册一堆账号,还有不克不及互通——所谓的“智能家电”,实在就是一堆各自为政的遥控器。 但节制电扇的测验考试让我大白:年夜大都智能装备的“云端”,实在就是个动静中转站。只要把通讯挟制到当地,这些装备就能离开厂商云端,本身联动。 在是我搭建了一套体系:用NAS上的Home Assistant(智能家居中枢)当焦点,MQTT broker(动静总线,让装备之间能互相“措辞”)当桥梁,再用开源东西把各类装备的私有和谈,都转换成尺度和谈。 这里的AI,不是简朴节制装备,而是“理解我的用意”。 传统智能家居是“if-then”法则(好比温度跨越28度开空调),但AI能理解上下文:好比电扇,AI知道“GPU于跑年夜模子,估计两小时竣事,先开低速,跑完再关”;好比灯,AI知道“周末孩子于家打游戏,客堂灯光调暖一点,晚上10点后主动调暗,提示睡觉”。 并且AI能记住我的偏好,会跟着我的习气逐步进化——这才是真实的“智能”。 我家里有两辆特斯拉及一个家用充电桩,之前天天都要花几分钟揣摩:谁先充电?充几多?何时充最省钱?明天要跑远程,要不要布满电? 此刻,这些事全交给AI了: 1.智能列队:AI从我的日历里读取第二天的行程,按照两辆车的电量,主动计划谁先充——通勤的车充到80%就够,要跑远程的充到100%; 2.错峰充电:AI接入电力公司的分时电价API,白日电价贵的时辰不充,凌晨自制的时辰主动最先(加州峰谷电价能差2-3倍,一个月能省不少钱); 3.状况监控:AI经由过程Tesla API,及时读取车辆的电池康健度、胎压、软件版本,有异样就自动提示; 4.将来计划:冬天可让AI提早给车预热(用充电桩的电,不耗电池);之后装了太阳能板,AI还有能按照气候预告,优先用太阳能充电。 这些设法,技能上都能实现,只是需要花时间搭建及调试——但AI已经经帮我完成为了年夜部门事情。 06 我让AI长途查抄了家里给孩子打游戏的台式机,成果吓出一身盗汗——内里藏着4个歹意软件,Windows Defender(电脑自带的杀毒软件)一个都没发明。 此中有混合过的PowerShell木马(注入到体系进程里,很难发明),还有有反杀毒软件(专门制止安全软件运行),以和假装成“AI助手”的告白软件及阅读器挟制步伐(暗藏了5个月)。 AI不仅找到了它们,还有理解了它们的运行机制,把每一一层歹意步伐都清算洁净了。 更厉害的是,这台电脑七天蓝屏六次,AI阐发了体系日记,定位到是PCIe电源治理的兼容性问题,修改了注册表及电源方案后,蓝屏再也没呈现过。 解决了智能装备的问题后,我又让AI帮我收拾家里NAS里的160TB数据——这是20年堆集的“数字财富”,之前我底子没时间收拾。 我一天能拍几百张照片,之前收拾照片要花几个小时。此刻,AI能用多模态能力(既能看图片,又能理解文字),主动完成选片、分类、调色——它还有能进修我20年的审美偏好,知道我喜欢甚么样的构图及色调。 找照片也变患上很简朴:我只要说“帮我找2015年全家于日本吃及牛的照片”,AI就能经由过程理解照片内容、时间、所在,精准找到我要的照片——不再用于海量照片里翻来翻去了。 我天天要用到四款AI:电脑上用Claude、ChatGPT写代码,手机上用Gemini处置惩罚一样平常,开特斯拉时用Grok聊投资——这些对于话散落于差别平台,原来互不相通。 但我让AI搭建了一套“影象体系”:天天按时从这四款AI的对于话记载里,提取要害信息,汇入NAS上的影象中枢(由向量数据库及常识图谱构成),再同步回所有AI节点。 也就是说,不管我于哪台呆板上、跟哪一个AI聊过甚么、踩过甚么坑,其他AI都能记住。 好比,我于MacBook上提过一嘴某个Python包(代码东西)的版本问题,两天后于办事器上干活时,AI自动提示我:“这个包于你的MacBook上有兼容性问题,我用另外一个版本。” 07 虽然AI帮我做了许多事,但它其实不是完善的——迁徙及利用历程中,它也犯了许多过错,这些过错,偏偏袒露了当前AI的弱点。 迁徙数十万张RAW照片(专业相机的原始照片)时,AI陈诉“全数拷贝完成”,但现实上,有一部门照片于传输历程中暗暗丢掉了——由于文件太多,AI没有做端到真个校验,就决定信念满满地公布了过错的结论。 总结:AI很智慧,但有时“经验不足”,不敷严谨。 MacOS有两个运用文件夹:体系级的/Applications(体系自带或者从App Store下载的运用),及用户级的~/Applications(非App Store下载的运用)。 AI只迁徙了前者,彻底漏掉了后者;每一次让它从头查抄,都能再翻出点漏掉的工具——这申明,AI于“确认工作做完”这件事上,还有不敷偏执。 每一次进级OpenClaw平台(我用来治理AI体系的框架),城市出点小问题:端标语被重置、时区变回UTC、配置文件被笼罩…… 我及AI一路,记载了21种已经知的进级妨碍,然后写了一个主动修复剧本——进级后30秒内,就能主动修复所有问题。 实在,这些不是“bug”,而是运营成本——咱们不消覆灭所有问题,只要有能力主动处置惩罚它们就好。 08 把所有场景串起来,你会发明一个冲动人心的画面——这不是科幻影戏,是我此刻的一样平常: 早上7点,AI看了我的日历,知道我两小时后出门,提早给特斯拉预热,告诉我昨晚充的电够今天来回;咖啡机15分钟前主动启动,客堂的灯按日出时间亮起来。 白日事情时,我于M5 Max上用Claude Code写代码,当地AI随时待命;需要跑重型使命时,AI主动把使命转到GPU办事器,我底子不消管它于哪台呆板上运行。 下战书孩子下学打游戏,AI发明显卡被占用,主动把AI推理使命转到Spark,还有趁便查抄电脑安全——还有记患上以前那四个木马的教训。 薄暮电价岑岭,AI暂停特斯拉充电,把NAS备份推延到凌晨;深夜电价低谷,特斯拉主动充到80%,NAS最先跑备份,WiFi不再会连错收集。 周末,AI帮我收拾20年前的老照片,修复恍惚的画质,还有主动天生一本电子相册,送给家人。 今天的AI,还有有许多不完善,但每个环节的技能都已经经存于。咱们不需要等候“将来的Jarvis”,由于它就于咱们身旁——只要你愿意动手,用一台电脑、一套AI东西,就能把科幻酿成一样平常。 09 你可能会好奇,于最初履行迁徙使命时,我的AI助手是从哪找的。 我没有直接用现成的东西,而是本身搭建了一套家庭AI事情站——它不是一最先就设计好的,而是逐步试错、逐步完美,像“搭积木”同样凑起来的。 一最先,我用退役的M4 Max电脑跑Claude Code(一款能写代码的AI东西),还有部署了一些小模子做试验。但很快发明,M4 Max的算力不敷用,在是又加了一台搭载RTX 5090显卡(今朝最强的消费级显卡,32GB显存,显存越年夜,能同时运行的AI模子越多)的YLAI办事器。 我的方针很简朴:同时跑5个AI模子,分工互助: 1.谈天模子:帮我回覆问题、写代码; 2.语音辨认模子:把语音动静转成文字; 3.语音合成模子:把文字答复读出来; 4.文本嵌入模子:帮我收拾影象、成立索引(利便快速找工具); 5.Judge模子:判定哪些对于话、内容值患上记住。 但问题来了:一个26B参数的模子(比650亿参数小一些,但也很吃算力),就要占21GB显存,5个模子挤于32GB显存里,底子装不下。 我先试了用Ollama(一款经常使用的当地模子运行东西)治理所有模子,成果发明它会“踢人”——加载新模子时,会把旧模子从显存里挤出去,致使影象体系瘫痪。 厥后我又测验考试把小模子拆成自力办事,及Ollama分隔,但显存还有是不敷用。直到我忽然想通:不是所有模子都需要“占用焦点算力”。 文本嵌入模子及Judge模子,都是后台“偷偷干活”的,哪怕慢一点(从毫秒级酿成秒级),也不影响我利用。那爽性把它们放到CPU(电脑的“基础处置惩罚器”,日常平凡处置惩罚简朴使命)上跑,把GPU留给主力模子! 这一改,效果立竿见影:主力模子的运行速率从37t/s(tokens per second,每一秒处置惩罚的字符数,越快越好)飙升到205t/s,快了5.5倍,显存也完全够用了。 这是我踩了许多坑才总结的经验:假如你的电脑是Apple Silicon芯片(好比M一、M二、M三、M5系列),别装Ollama。 由于Ollama底层用的是llama.cpp,需要一层“翻译”才能挪用Apple的Metal GPU(苹果自研的显卡,专门适配自家芯片),会华侈许多机能。 保举用MLX——苹果专门为自家芯片做的AI框架,不消“翻译”,直接挪用Metal GPU,统一个模子,运行速率比Ollama快30%-50%,还有更省内存。 至在模子,直接去HuggingFace(一个AI模子同享平台)搜“mlx-co妹妹unity”,内里有所有主流模子的MLX版本,直接下载就能用。 颠末不停调试,我终究确定了最合适家用的配置,既够用又不华侈: 厥后我想跑全精度版本的 Qwen3.5-122B-A10B-FP8(参数更多、更智慧,处置惩罚使命更精准),单张RTX 5090显卡已经经装不下了。 我家里有两台NVIDIA DGX Spark(专业AI办事器,每一台有GB10 GPU及122GB同一内存),理论上把它们连起来,就能跑全精度年夜模子。 但实际全是坑:好比驱动署名不兼容、内存辨认过错、推理引擎版本bug……光调试这些问题,就花了我好几天。 终极,两台Spark连起来,跑Qwen3.5-122B-A10B-FP8(全精度版本),运行速率13-15t/s,不算快,但胜于质量高。我伴侣说,一年前,如许的配置于数据中央要花几十万。 由于数据愈来愈多,我还有加了一台NAS(8盘位RAID,简朴说就是“8个硬盘构成的超年夜存储”),一最先我把它当“万能选手”,让它跑各类AI容器(好比推理引擎、数据库)。 成果惨了:NAS的32GB内存被占满,嵌入式CPU跑推理慢患上离谱,启动一个办事要一分钟(GPU上只要3秒),并且硬盘一直转,嗡嗡响个不断,无法休眠。 厥后我觉悟了:NAS就该干它的本职事情——存储及备份、运行Qdrant向量数据库(帮我治理影象)、做IoT中枢(毗连智能装备),其他活全交给YLAI办事器及Spark,硬盘终究能正常休眠了。 这套体系一直用到今天,然后我换了 M5 Max,128GB 同一内存让年夜模子能跑于条记本上。颠末实测,1220 亿参数模子于 M5 Max 上加载 17 秒,推理速率 31t/s,思索链、图片理解、东西挪用万能力解锁。 转头看,整个体系不是被设计出来,而是一点点长出来的。 今天每一一台装备都找到了最合适本身的位置。 要害不是所有工具一次到位,而是先让焦点跑起来,Claude Code、一个当地模子加一个界面就够了,然后你的 AI 事情站就会按照现实需求,逐步长出本身的架构。就像我此刻的 fleet,也是从一台 M4 Max 最先,花了几个月一台一台加之去的。 一样的技能,于差别人的手里,用法也纷歧样,我的经验纷歧定合适所有人。但同样的是各人的出发点:先用起来,再说另外。 雷峰网(公家号:雷峰网)文章 雷峰网特约稿件,未经授权禁止转载。详情见转载须知。







进级挑战:双机并行,跑全精度年夜模子