| 代码 | 名称 | 当前价 | 涨跌幅 | 最高价 | 最低价 | 成交量(万) |
|---|
在刚刚过去的一周,“养龙虾 ”彻底火了!
腾讯总部门前大排长龙等着免费安装“龙虾” ,闲鱼上代装“龙虾”服务几十到上百不等,各大云厂商纷纷推出一键部署教程和服务 。而这里的“龙虾 ”可不是指我们吃的小龙虾,而是指“OpenClaw” ,“claw”有爪和工具之意,正契合了它的工具属性,并且OpenClaw的吉祥物就是一只可爱的龙虾。
OpenClaw官网给出的官方定义为“The AI that actually does things”,可以直译为“真正干活的AI ”。它可以帮你清理收件箱 ,发送邮件,管理日程,办理航班值机等 ,而你只需发送指令到WhatsApp 、Telegram、飞书、钉钉等与它连接过的聊天软件 。
事实上,OpenClaw并不能直接使用,而是需要完成部署配置 ,并且在日常使用中逐渐给它添加技能,因此称为“养龙虾”。在部署OpenClaw时,第一个需要解决的问题就是选哪个大模型来当它的“大脑”。为了回答这一问题 ,PinchBench网站应运而生。
PinchBench专门针对OpenClaw对大模型进行基准测试,从而评估大语言模型在 OpenClaw 任务中的表现 。目前官网显示测试了全球主流的33个大模型。
数据显示,在成功率方面 ,谷歌的gemini-3-flash-preview位居榜首,为95.1%。国产大模型minimax-m2.1和kimi-k2.5闯进前三,测试成功率分别为93.6%和93.4%,力压一众claude大模型 。
完成测试费用方面 ,minimax-m2.1和kimi-k2.5也表现不俗,在兼顾了成功率的同时,费用低于gemini-3-flash-preview。前者费用分别是0.14和0.20美元 ,后者费用为0.72美元。
另外,在任务完成的速度上,minimax-m2.1和kimi-k2.5在7个成功率高于90%的大模型中也能达到平均水平 。
也难怪OpenClaw的创始人Peter Steinberger在接受一档播客访谈时曾直言 ,他认为Minimax 2.1是当前最好的开源模型(彼时他还没有测试过Minimax和Kimi的最新模型)。
(文章来源:东方财富研究中心)
哪个证券公司比较好:实盘的股票杠杆平台-核聚变国家队大消息!业绩有望持续高增长概念股出炉
股票十倍杠杆正规平台有哪些:哪个证券公司比较好-取消40集上限!“广电21条”搅动影视剧市场 行业影响几何?
股票买卖app哪个好用:哪个证券公司比较好-谷歌发布Pixel 10系列手机:AI全面加持 直面苹果挑战
带杠杆的股票:哪个证券公司比较好-十五五“新”期望:不止于科技创新 还在于系统构建
哪个证券公司比较好:股票场内配资-华泰证券:供需格局优化 光伏玻璃价格上涨
股票配资平台网站:哪个证券公司比较好-险资配置A股行业ETF规模已翻倍 电子行业ETF持仓总规模最大
还没有评论,快来说点什么吧~