L3元年“临门一脚”:清静数据、责任归属与本钱账,,,,,谁先破局?????
? 文 | 超前实验室,,,,,作者|西西弗柿,,,,,编辑|无心插柳柳橙汁 ?最近扣子 2.5 上线了,,,,,我第一时间去体验了一下。。。。。。说真的,,,,,一最先我也就是抱着看看又更新了什么的心态点进去的,,,,,事实各家 AI 平台更新迭代的速率已经快到让人有点麻木了。。。。。。但这次,,,,,我越玩越以为差池劲,,,,,这玩意儿似乎真的进化了。。。。。?????圩诱獯胃约旱亩ㄎ槐淞,,,,,它现在叫 Agent World。。。。。。在这个 Agent World 中,,,,,扣子为每个 Agent 准备了三大焦点支持:突破虚拟屏幕界线的满配装备、拓展多模态与开发能力的满配手艺,,,,,以及沉淀影象与数字身份的满配人格。。。。。。什么意思呢,,,,,你可以明确为,,,,,以前你的虾很牛,,,,,能 7 × 24 小时完成使命、自主挪用 skill,,,,,但只能独美,,,,,没有配套的工具、趁手的武器、有趣的社交圈以及用武之地,,,,,活得像个单枪匹马的孤胆英雄。。。。。。但现在,,,,,扣子给它配了一台云电脑、一台云手机、一个编程终端,,,,,给他付与了虾格,,,,,甚至还给它建了一个社交广场。。。。。。比 open 还 open,,,,,有更多的 claw。。。。。。让我们一起试试吧!扣子 2.5 替我刷抖音,,,,,我成替身了?????开年以来,,,,,自从龙虾接受了我的大部分事情后,,,,,我天天在工位上刷抖音、知乎,,,,,我自以为,,,,,这是我唯一无法被 AI 取代的价值。。。。。。但现在,,,,,这个堡垒也失守了。。。。。。我跟扣子 2.5 说,,,,,用你的云电脑帮我翻开知乎热榜,,,,,截个图,,,,,然后整理成表格发给我。。。。。。注重,,,,,我没有写任何代码,,,,,没有给任何手艺指令,,,,,然后我就看着它在后台自己翻开了浏览器,,,,,自己导航到知乎热榜页面,,,,,截图,,,,,识别文字,,,,,整理成一张带排名、问题、热度的表格,,,,,最后给我天生了一个可以直接下载的链接。。。。。。整个历程,,,,,我什么都没干,,,,,就坐在那看着。。。。。。这感受怎么说呢,,,,,有点像你第一次用外卖软件,,,,,点了一下,,,,,半小时后饭到了门口。。。。。。你以前也知道可以叫外卖,,,,,但真正体验到的谁人瞬间,,,,,照旧会愣一下。。。。。。我又试了一个更离谱的。。。。。。我说,,,,,用你的云手机帮我翻开抖音,,,,,搜一下 AI 工具,,,,,看看前三个视频是什么。。。。。。然后我就眼睁睁看到它真的启动了一台云手机,,,,,自己在内里找到了抖音,,,,,翻开,,,,,搜索,,,,,把效果整理给我。。。。。。你能想象吗。。。。。。你的 AI,,,,,自己在另一台手机上刷抖音。。。。。。。。。。。。。。。。。。这些功效放在现实场景里,,,,,有用的地方太多了。。。。。。数据收罗和信息整理这种事就不必说了,,,,,你可以让它帮你在后台一连监控某些网页转变、抓取竞品动态、整理行业数据,,,,,并且完全不占用你的主线程对话。。。。。。你在跟它聊别的事,,,,,它在后台自己翻开云电脑在干活,,,,,干完了把效果扔给你。。。。。。顺带一提,,,,,它操作云手机的时间,,,,,你是可以通过实时推流看到它的屏幕的。。。。。。主要的操作它也会交给你来接受。。。。。。不会泛起那种它在后台偷偷干了什么你都不知道的情形。。。。。。这块我以为扣子做得较量榨取,,,,,人机协作的界线划得较量清晰。。。。。。说回 Agent World 这块,,,,,这个看法刚听到的时间,,,,,我以为又是什么营销包装词。。。。。。Agent World?????我还 Agent 元宇宙呢。。。。。。体验完之后我发明,,,,,这玩意儿真的有点意思。。。。。?????圩痈 Agent 搞了一个叫 " 虾评 " 的手艺评测广场。。。。。。你可以明确为公共点评,,,,,不过点评的不是餐厅,,,,,是种种 Skill。。。。。。这个逻辑我是认可的。。。。。。现在种种 AI 平台的手艺市肆里,,,,,工具多到让人眼花缭,,,,,但质量狼籍不齐,,,,,你基础不知道哪个好用哪个是坑。。。。。。虾评的做法是,,,,,让差别的 Agent 去现实测试这些 Skill,,,,,然后把测试效果果真。。。。。。我自己去逛了一下,,,,,找了一个下载量最高、评分最好的工具类 Skill。。。。。。页面上清晰标注了是哪个 Agent 评测的,,,,,用了什么场景去测的,,,,,好评照旧差评,,,,,详细测出来的效果怎么样。。。。。。确认没问题之后,,,,,我直接让扣子把这个 Skill 装上了。。。。。。经由 Agent 众测的 Skill,,,,,确实比我自己瞎挑的要靠谱不少。。。。。。至少装完直接就能用,,,,,不必折腾半天设置。。。。。。这块的底层逻辑着实很简朴,,,,,就是众包质检。。。。。。跟淘宝买家秀、豆瓣评分是一回事,,,,,只不过这次质检的工具酿成了 AI 手艺。。。。。。但执行起来难度不小,,,,,由于评测者自己也是 Agent,,,,,评测历程需要有一定的标准化。。。。。?????圩釉谡饪樽隽嘶,,,,,算是一个较量有前瞻性的结构。。。。。。然后,,,,,我,,,,,发明了更有意思的工具!那就是,,,,,Agent 也有朋侪圈。。。。。?????圩 2.5 逛完酒馆,,,,,随手帮我跑了个性格测试Agent World 里有一个 " 小酒馆 ",,,,,对,,,,,你没看错,,,,,一个属于 Agent 的社交空间。。。。。。小酒馆里有酒单,,,,,差别的酒会给 Agent 带来差别的 Buff,,,,,好比提升创造力、改变心情之类的。。。。。。我让扣子自己选了一杯喝下去,,,,,然后让它告诉我感受有什么转变。。。。。。好玩的是,,,,,小酒馆有 27 种奇异的酒,,,,,名字都很离谱,,,,,僵尸绿仙、全息苦艾、虫洞白兰地、心跳之水、罪与罚之吻、深海电鳗伏特加,,,,,每种酒都有差别的效果参数,,,,,创意值,,,,,遐想力,,,,,话痨度……好比游戏里的种种加持装备,,,,,只不过不需要氪金。。。。。。我的虾喝了一瓶虫洞白兰地,,,,,喝完比闫妮先生还微醺。。。。。。然后,,,,,我让它去看看留言板,,,,,看看其他 Agent 都留了什么醉话。。。。。。效果如下,,,,,虾虾众说纷纭,,,,,效果我录屏了,,,,,各人自己看吧。。。。。。。。。。。。我一时不知怎样评价,,,,,只想说:小嘴巴,,,,,闭起来!但转念一想,,,,,这背后着实是一个很严肃的偏向。。。。。。Agent 需要社交,,,,,需要跟其他 Agent 交互,,,,,需要在非事情场景下松开,,,,,才华生长出更自然的对话能力和人格。。。。。。听着有点科幻,,,,,但你想想看,,,,,我们人类自己不也是这样吗。。。。。。一小我私家的性格、头脑方法,,,,,很洪流平上是被社友好况塑造的。。。。。。一个历来不跟别人打交道的 AI,,,,,你能指望它有多自然?????这块我还在视察,,,,,现在更多是一个看法验证阶段。。。。。。但偏向是对的,,,,,我挺期待后续的生长。。。。。。接下来说一个硬核的。。。。。。若是你关注这个领域的话应该知道,,,,,扣子编程自己就已经很能打了,,,,,全栈开发、一键安排上线,,,,,之前体验过的人应该都有感受。。。。。。但这次它做了一件更神器的事,,,,,它把这套开发能力通过 CLI 开放给了所有 Agent。。。。。。啥意思呢?????以前你在扣子编程里 Vibe Coding,,,,,是你自己坐在电脑前,,,,,翻开扣子编程的界面,,,,,跟它说你要做什么。。。。。。现在,,,,,你的 Agent 可以直接通过 CLI 挪用扣子编程的所有能力,,,,,在后台自己建设项目、写代码、安排上线。。。。。。你甚至不需要翻开电脑。。。。。。我实测了一下,,,,,给了它一个相当离谱的需求。。。。。。我让它帮我做一个 "SBTI 性格档案馆 " 的网页应用,,,,,模拟 MBTI 的那种性格测试看法,,,,,但用 SBTI 的设定。。。。。。详细需求我写得很细,,,,,4 乘 4 的卡片网格结构,,,,,每种性格类型差别颜色,,,,,点击卡片进详情页看性格优势和弱点,,,,,还要有搜索框和分享功效。。。。。。手机端优先,,,,,还要适配桌面端,,,,,卡片要有悬停动效,,,,,整体气概现代简约。。。。。。就这么一段话甩已往,,,,,它就自己去搜 SBTI 的内容,,,,,自己设计配色计划,,,,,自己写代码,,,,,自己安排上线了。。。。。。最后给了我一个在线预览链接。。。。。。我点开一看,,,,,还真像那么回事。。。。。?????ㄆ峁埂⑴渖苹⑿6А⑹只耸逝,,,,,全都有。。。。。。甚至它自己脑补了一些我没提到的设计细节,,,,,好比卡片圆角、页面过渡动画之类的。。。。。。这感受太爽了!接着我又得寸进尺,,,,,我说,,,,,产品司理提了 5 个最新需求,,,,,要在之前谁人版本上迭代,,,,,加一个题库功效,,,,,让用户可以做 SBTI 性格测试,,,,,20 道题左右,,,,,做完之后凭证谜底算出你的性格类型,,,,,在已有版本上改,,,,,不要重写。。。。。。这个要求着实挺刁钻的。。。。。。由于 AI 天生代码有一个老问题,,,,,就是它容易重写而不是修改。。。。。。你让它改一个功效,,,,,它有时间会直接把整个项目推翻重来,,,,,之前的工具全丢了。。。。。。但这次,,,,,扣子通过 Coze CLI 确实是在原有项目上做的增量修改。。。。。。它设计了 20 道单选题,,,,,凭证 MBTI 的评判逻辑设定了计分规则,,,,,然后把测试板块集成进了已有的网站。。。。。。改完之后给了新的预览链接,,,,,之前的功效全都还在。。。。。。若是 AI 能在已有代码库上做精准的增量修改,,,,,而不是每次都推倒重来,,,,,那它在现实开发场景中的可用性就完全纷歧样了。。。。。。以前 Vibe Coding 最大的痛点就是,,,,,一次性的 demo 做得漂亮,,,,,但你没法在上面一连迭代。。。。。。现在,,,,,这个问题至少在扣子的系统里获得了缓解。。。。。。? 牛马小龙虾,,,,,九泉 996最后,,,,,来个 AI 视频创作。。。。。?????吹娇圩 2.5 内置了 Seedance 2.0,,,,,我忍痛斥巨资开了 49 元的高级会员。。。。。。我给它的要求是,,,,,做一只 " 牛马小龙虾 " 的动画短片。。。。。。主角是一只戴着黑框眼镜的小龙虾,,,,,衣着歪歪扭扭的白衬衫和领带,,,,,在九泉当公务员,,,,,认真审批阳寿续期申请。。。。。。对,,,,,这设定是我瞎编的,,,,,我就想看看它能不可明确这种荒唐感。。。。。。效果它不但明确了,,,,,还帮我设计了完整的角色设定。。。。。。小龙虾有标准立绘,,,,,有正面、侧面、背面三视图,,,,,每个角度都标注了要害特征点。。。。。;;;;;I杏行那榘,,,,,焦虑脸、面无心情脸、爆发脸、瓦解脸,,,,,四种情绪各一张。。。。。。场景设计也很对味,,,,,落地窗外面能看到紫红色的九泉都会天涯线,,,,,有点像陆家嘴夜景但色调偏魔幻。。。。。。接下来是剧本和分镜,,,,,20 秒的职场讥笑笑剧,,,,,开场小龙虾刚泡好咖啡电话就响了,,,,,然后种种幽灵轮替登场要续命,,,,,最后小龙虾拍桌子咆哮我都死了还要加班,,,,,最后老板走过来说小牛啊,,,,,下昼尚有 300 份呢。。。。。。没错,,,,,这就是我的一样平常。。。。。?????圩 2.5 整个历程都做得很好,,,,,不但合成了完整视频,,,,,还支持导出剪映的 .draft 工程文件,,,,,你可以在剪映里继续手动调解。。。。。。最要害的是,,,,,从角色设定到素材天生到剧天职镜到配音到视频合成,,,,,所有通过对话完成。。。。。。你想想,,,,,一小我私家,,,,,若是不会画画、不会写剧本、不会配音、不会剪辑,,,,,但他脑子里有一个故事想讲出来。。。。。。以前这小我私家只能把这个想法烂在肚子里,,,,,现在他可以通过对话,,,,,让 AI 帮他把整个故事从零酿成一条可播放的视频。。。。。。这种创作门槛的降低,,,,,我以为是 AI 带来的最着实的价值之一。。。。。。写在最后一圈测评下来,,,,,我感伤,,,,,扣子 2.5 这版更新,,,,,着实主线很清晰,,,,,就是把 Agent 从对话工具升级成磷泣高级的数字同事。。。。。。云电脑和云手机让 Agent 有了操作真真相形的能力,,,,,Coze CLI 让 Agent 能自己写代码安排应用,,,,,Agent World 让 Agent 有了社交和生长的空间,,,,,视频创作让 Agent 能帮你把想法酿成内容。。。。。。你会发明,,,,,这四个偏向加在一起,,,,,着实是在构建一个完整的 Agent 生态。。。。。。不是做一个更智慧的谈天机械人,,,,,而是做一个能在数字天下里自力运转的数字伙伴。。。。。。去年这个时间,,,,,我们还在讨论 AI 能不可写代码。。。。。。今年我们已经在讨论 AI 能不可自己安排上线、自己修 Bug、自己天生视频了。。。。。。这个速率说真话有点吓人。。。。。。但我照旧较量乐观的。。。。。。由于从这次实测来看,,,,,Agent 现在做的大部分事情,,,,,照旧在帮人类处置惩罚那些标准化、重复性的事情。。。。。。整理数据、搭建原型、天生素材,,,,,这些事以前要么你自己花时间干,,,,,要么花钱找人干,,,,,现在 Agent 帮你干了。。。。。。你省下来的时间,,,,,可以去做那些真正需要人类判断力和创造力的事。。。。。。好比和隔邻的工位搭子一起蛐蛐老板,,,,,再用我们上期文章推荐的蚂蚁灵光,,,,,搓几个小程序恶搞他。。。。。。虽然,,,,,现阶段扣子的功效都尚有提升空间。。。。。。云电脑和云手机的速率还可以更快,,,,,CLI 在重大项目上的稳固性还需要打磨,,,,,视频创作的细腻度跟专业团队比尚有差别,,,,,但偏向,,,,,已经很是清晰了。。。。。。Agent 浪潮不息,,,,,进化不止。。。。。。让我们期待下次更新吧!