澄迈预应力砼钢绞线 Cursor新模子,你若何还在套Kimi?马斯克你若何还吆喝上了??

点击次数:172 发布日期:2026-05-22 04:58:13
钢绞线

Cursor模子新澄迈预应力砼钢绞线,新版块已来到Composer 2.5。

略微翻Cursor公告,两件事挺有兴味:

是Cursor这回学浑厚了,新模子“套”了Kimi不再藏着掖着,连具体用了若干王人方向清纯碎白。

(Cursor:Kimi底,自特等测验+RL占了85的总算力)

二是马斯克原地献艺变脸,之前Cursor堕入“套壳风云”时他在傍边推波助澜,目前却十分力地赞理站台:

王人给我去用Cursor新模子。

网友:老马你让我感到生分(doge)。

别思多了,其实这是因为Cursor和马斯克达成了算力作——

Composer 2.5部分测验是在Colossus 2上完成的,以及Cursor正在和SpaceXAI作,从启动测验个界限显着大的模子。

好好好,新模子刚来,下代模子的“饼”又吃上了,看来Cursor的确铆足了劲思搞自研(具体原因下文详聊)。

不外远的咱是够不着了,先看目下这个确实的——Composer 2.5本人亮点也很足。

1/10资本、Opus 4.7推崇,况兼发布后周还给你双倍用量。

好伙,这几个词甩出来,等闲用模子的一又友谁不欢叫了。

但问题是,Cursor新模子真有这样顶吗??

1/10资本、Opus 4.7推崇

顶不顶目前咱不好说,归正测评收货挺亮眼。

据Cursor先容,“它擅长在万古辰运行的任务中持续使命,可靠地谨守复杂领导,互助体验也加顺畅”。

这些推崇反应到具体数字上即是,其能水平举座接近Claude Opus 4.7。

Terminal-Bench 2.0(结尾/敕令行任务):69.3 VS 69.4,险些持平;SWE-Bench Multilingual(多谈话工程问题):79.8 VS 80.5,差距微细;CursorBench v3.1(难度编程任务):63.2 VS 配64.8,差距微细。

能和Opus 4.7稠浊是曲,常用模子的东说念主王人知说念这里头的含金量了。

况兼除了在难度的任务上测验除外,他们还校正了模子在疏浚立场和参加别校准(什么期间该出多鼎力)等行为层面的推崇。

听起来有点概述,但Cursor示意:

这些维度很难通过现存基准充分反应,但咱们发现,它们对本色使用果十分蹙迫。

那么,Composer 2.5真实才气如何呢?

鉴于目前Cursor用度户只可体验Auto格式(诚然上架了然则选不了)澄迈预应力砼钢绞线,是以咱先看波网友的反馈。

先插嘴,Composer模子速率是真快啊,甭管是哪个版块,用起来歘歘歘的。

OK,回来正题。

目前圈扒下来,嗅觉Composer 2.5反馈还可以??

Snapchat前机器学习工程师热诚发帖称,自从Composer 2发布后,她就把大多半设立使命搬到了Cursor上头。

况兼还甩出了句颇有暴论滋味的话:

若是你在使用AI进行设立,却仍然默许使用资本的模子来完成每项任务,那么你80的使命王人是在浪花钱。

图像生成初创公司LetzAI的CEO也有访佛感受,他在体验新模子几小时后示意:

过去可能会对AI的案挑三拣四、反复修改,但此次因为Composer 2.5作念得太好太快,我方平直“躺平认了”。

没什么可抉剔的,就这样办吧。

思你也发现了,除了模子才气除外,他们提到了另个蹙迫要津词:价钱。

Composer 2.5的价钱为每百万输入token 0.50好意思元、每百万输出token 2.50好意思元。

此外,还有个智能水平相通但速率快的变体,价钱为每百万输入token 3.00好意思元、每百万输出token 15.00好意思元。

p.s. 与Composer 2样,fast是默许选项。

这个价钱若何说呢?也即是Opus 4.7的1/10吧。

1/10资本、Opus 4.7推崇,若是果真如测评和网友所言,那对是真香了。

Kimi底,还作念了这些测验校正

那么Composer 2.5此次是如何达成能“飞跃”(至少是名义上)的呢?

虽说是有Kimi底,但好赖贴的是“Cursor自研模子”的标签,这背后多若干少总得有自研吧。

Cursor:别说我还真有。

回到模子本人,Cursor这回在测验栈上作念了不少校正,主要围绕两个向:

模子智能和易用。

具体则有三点:

,给RL测验加了“定向反馈”

过去RL励是基于整条轨迹算的,rollout动辄几十万token澄迈预应力砼钢绞线,模子很难知说念我方究竟是哪步搞了——终励只可告诉你“出问题了”,但具体错哪儿,信号噪声绝顶大。

Cursor的解法是:那处不合就在那处平直喂反馈。

举个例子,模子在某轮调用了个不存在的器用,收到报错后连接干别的。几百次调用里就此次错,对终励基本没影响。

但Cursor会在出错那轮的险峻文里插句“Reminder: Available tools…”并附上可用器用列表,由此得到个新的“西席”概率散播。

如斯来,作假器用的概率被压下去,有替代项的概率被抬上来,然后让学生模子向这个散播靠近就行。

这套法在Composer 2.5里被用在了多种行为上,从编码立场到疏浚式王人有。

二,成数据界限翻了25倍

RL测验几轮下来,Composer还是能解决大部分测验题了,钢绞线若何连接提高?

谜底是动态生成难的任务。

其中个玩法叫“删除”——给智能体个带测试的代码库,让它删掉某个特定但保证代码库还能跑,然后任务即是把这个从头达成出来,测试即是励信号。

不外任务多,励舞弊也随着来了。

Cursor发现Composer 2.5会整些离谱操作,比如逆向Python类型查验缓存找出被删的函数签名,致使反编译Java字节码重建三API。

好在王人被监控器用抓到了,但也算提了个醒——大界限RL得谨防。

三,底层测验作念了化

Cursor用的是带散播式正交化的Muon,并把通讯作念成异步——个任务等通讯时,化器接着进其他任务,让聚集和想象相通起来。

终在1T模子上,化器每步只有0.2秒。

另外针对MoE模子,他们把非权重和权重的HSDP布局隔断了:非权重小,FSDP组就窄点,单节点内贬责;权紧要,就用宽的分片网格。

这样彼此立的并行维度也能相通,比如CP=2和EP=8可以在8个GPU上跑,而不必占16个。

总之,从测验信号到数据界限再到底层并行,Cursor此次是全栈王人动了遍。

One More Thing

Cursor为啥这样拼搞自研?其实从它和Anthropic的奥妙关连里就能一隅之见。

刚好近看了姚顺宇(不是腾讯阿谁)作客张小珺播客的那期节目,这位Anthropic前职工的不雅察,有时能确认问题:

Cursor早是踩着Claude的肩膀火起来的。设立者社区里不立文字的好用,背后很大部分功劳来自Claude模子本人。那段时辰Cursor和Anthropic是典型的“鱼水关连”,个出模子个坐褥物,各赚各的钱。

但Claude Code出来,画风就变了。

Anthropic我方下场作念编程产物,等于平直进了Cursor的土产货。原来的“上游供应商”俄顷形成了“正濒临手”,再连接把身命押在对的API上,显着不是个安全的接管。

是以Cursor走上自研这条路,与其说是思成为下个Anthropic,不如说是被着不得不走——

模子持在我方手里,命才在我方手里。

说到这里我很有趣个问题:在自研模子到手之前,Cursor目前的格式难说念真的不具有护城河吗?

至少对我这种非业设立者而言,听起来或者Cursor还可以——有多款前沿模子可选,价钱还低廉。

带着有趣,我看到X上有东说念主给出了种解读,挺有兴味:

Cursor的护城河从来王人不是基础模子,而是RL测验过程+设立者使命流数据。目前他们正在确认注解:只有经过满盈的微调,开源基础模子在特定任务上也能与前沿模子相比好意思。

仔细思思这话也不算太夸张。

Composer 2.5的测验里,85的算力王人花在了Kimi基模除外的后测验和RL上——Kimi K2.5仅仅个伊始,信得过让它在编程任务上能的,是Cursor我方那套围绕真实IDE场景作念出来的测验管线。

手机号码:13302071130

这个法也解释了为啥它能把价钱压到Opus的十分之。因为,开源基模省却了从预测验那笔贵的钱,剩下的全在编程这件事上作念淡雅化测验。

模子只为Cursor的IDE场景奇迹,没要为通用才气买单。

至于为啥此次牵手的是马斯克的SpaceXAI(毕竟老立时次推崇得并不友好),逻辑貌似也不复杂。

OpenAI有Codex、Anthropic有Claude Code、Google有Gemini Code Assist,这几我方王人在作念编程产物,跟Cursor王人是潜在敌手,算力上指望不上。

剩下能拿出天下算力集群、又不跟Cursor在编程赛说念正面突破的玩,掰着指头数也没几个了——

老马的Colossus 2刚好是现成的。

况兼若是把时辰线拉长看,你会发现马斯克和Cursor之间,还是远不仅仅单纯的“算力作”。

本年3月,xAI里面荡漾之际,马斯克先从Cursor挖走了两位中枢工程淡雅东说念主。

紧接着4月,大的作为来了。SpaceX晓示与Cursor达成作,由Colossus算为Cursor测验模子。

但信得过要津的不是算力,而是合同本人。

按照网上暴露的要求,SpaceX得回了改日以600亿好意思元收购Cursor的先权。即便终不收购,Cursor也需要支付100亿好意思元“作费”。

耐东说念主寻味的是,据TechCrunch暴露,这份合同官宣前几小时,Cursor原来正要敲定轮20亿好意思元、估值500亿的融资,参投包括a16z、英伟达、Thrive等线机构。

成果老马脚插进来,把这单给截胡了。

是以某种进程上而言,这其实是次十分典型的“马斯克式绑定”:

要么给我,要么给我100亿,非论怎么先提前把Cursor的运说念锁进了我方的疆土。

至于他前脚推波助澜、后脚力站台的变脸速率嘛——硅谷的故事,向来如斯。

相关词条:铝皮保温施工     隔热条设备     钢绞线    玻璃棉卷毡    保温护角专用胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定澄迈预应力砼钢绞线,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。

热点资讯