投注平台app官方网站-真钱投注 GLM-5真够顶:超24小时跑代码,700次器具调用、800次切高下文!
电子投注
你的位置:投注平台app官方网站 > 电子投注 > 真钱投注 GLM-5真够顶:超24小时跑代码,700次器具调用、800次切高下文!
真钱投注 GLM-5真够顶:超24小时跑代码,700次器具调用、800次切高下文!
发布日期:2026-02-17 11:24    点击次数:159

真钱投注 GLM-5真够顶:超24小时跑代码,700次器具调用、800次切高下文!

金磊 发自 凹非寺量子位 | 公众号 QbitAI

当看到GLM-5厚爱发布后的才能,才惊觉前几天深广模子Pony Alpha的热度照旧有点保守了。

因为这一次,GLM-5平直把开源AI也拽进了长任务时间。

瞧,GLM-5平直身兼数职,我方长入跑代码逾越24小时,700次器具调用、800次高下文切换之后……

它平直用JavaScript,从零手搓了一个Game Boy Advance(GBA)模拟器!

外不雅渲染画面是这么的:

屏幕里是这么的:

在莫得渲染情况下的动态适度如下:

视频地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

要知说念,这关于AI来说,是一个完全无法取巧的工程任务。

因为GBA模拟器波及到了500多条CPU提醒集、内存分页机制、音频子系统和图形渲染时序等任务。

哪怕一条提醒辞退出错,或者一次文献写入偏差,扫数这个词名堂就会在几个小时后崩盘。

而况GLM-5濒临的照旧无并行、无任何参考代码、关闭收集搜索的那种。

即便如斯,从视频给出的适度中咱们也不难发现,GLM-5如实是阐明荒谬结识:

器具调用结识:第700次和第一次在语法、时事、准确度上莫得互异;提醒辞退历久:高下文即使切换了800次,依旧投诚Meta-Prompt的门径、商定和经过;使命判断结识:GLM-5知说念我方什么工夫该测试、信息记载、切换战略等;高下文够可靠:每次高下文清空后,GLM-5能从条记和文献中准确还原使命景色。

这也难怪不少网友在看完之后直呼:

它(GLM-5)不错制作细密的CAD模子!

而况目下GLM-5的评测适度也已出炉,在泰斗榜单Artificial Analysis中,平直到了与Claude Opus 4.5并列的水平。

在业内公认的主流基准测试中,GLM-5的编程才能亦然已毕了与Claude Opus 4.5对皆:

{jz:field.toptypename/}

而况在测度模子计较才能的Vending Bench 2中,GLM-5赢得了开源第一的收获:

但毕竟Claude Opus是闭源,护城河一下子被GLM-5这个开源模子给端掉,亦然引得不少网友甘心:

感谢开源!

那么GLM-5这位开源界的第一位“全栈架构师”,还有什么样的实力?

接下来,一波深度实测开源版Opus级别的模子,走起~

依然有东说念主请求上架App Store了

咱们的测试将在Claude Code中调用GLM-5 API的样貌张开。

因此,牛牛游戏咱们第一个测试等于作念最测验模子的逻辑闭环才能的游戏——条目GLM-5从零生成一个3D版大财主:

接下来,咱们平直来看下适度:

{jz:field.toptypename/}

视频地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

不错看到,濒临如斯复杂的需求,GLM-5稳稳地把扫数功能都已毕了出来。

如果Prompt愈加致密无比,咱们就不错得到一个OpenClaw对战的《龙虾版3D大财主》:

视频地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

而且依然灵验户使用GLM-5作念了个学术版“抖音”,而况提交上架苹果App Store!

视频地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

10余款APP都要上架了(showcase.z.ai):

实测继续。

这一次,咱们要测试GLM-5对复杂物理执法描写的融会才能,请听Prompt:

创建一个玻璃十二面体,每个面是一个遮罩,裸露中央疏通旋转基底环结的不合谋略(看起来像拼贴/滤镜)。诓骗一些细小的泛光适度。在它外面再加一层大致两倍大小的第二层(透明)玻璃壳,并让每个面透过期更正里面玻璃的外不雅成不同类型,比如透过外层的某一面,投注pp扫数这个词内壳看起来像是染色玻璃、彩绘玻璃或线框等,仅供参考。使用 three.js,……

视频地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

GLM-5依旧是精确地捕捉到了Prompt中的要道词,生成的HTML文献翻开后,一个光影交错的十二面体悬浮在空中。

除此以外,包括像全栈类型任务,举例制作一个完好、有谋略感的电商网站,GLM-5亦然不错拿执。

以及有东说念主也用GLM-5手搓了个3D版可交互的《我的寰宇》!

开源,Win Again

GLM-5的出现,不管是从实测照旧网友们的反响来看,都在象征一件事情:

开源大模子完成了一次从助手到独处工程师的质变。

曩昔,咱们用AI是写一句Prompt,但需要不休地去作念调试的使命;但当今,用GLM-5不错是给它一个目的,然后去喝咖啡,偶尔纪念望望它有莫得跑偏。

更宏不雅地来看,这关于SaaS行业来说,也可能是一场风暴。

毕竟就在前几天,跟着Claude Opus等具备长任务才能的闭源模子展现威力,国际市集依然出现了心焦。

举例那时金融数据功绩商FactSet最惨盘中暴跌10%,S&P Global、穆迪、纳斯达克公司纷纷下降,各大指数全线跳水。

Fortune和CNBC报说念称,SaaS软件类股票遭到抛售,投资者惦念,如果AI能现场手搓一个CRM系统,谁还去买年费软件。

天然黄仁勋安抚说AI会增强现存器具,但GLM-5的实测推崇告诉咱们:重塑大概依然在发生。

更挫折的是,之前这种才能是闭源巨头的特权。当今,GLM-5把这把钥匙交到了扫数成就者手里。

大概此次开源模子24小时不终止我方跑代码仅仅一个源流,改日会更长、更快、更好、更强。

Two More Things:

GLM其实从4.5版块驱动就死磕AI编程这件事,当今这个国产AI的coding套餐在国表里亦然相配火爆;此次智谱一上来就限售,番邦网友们都是在“求”的景色。

以及,智谱公司的大楼,当今亦然成了个打卡点:

起原咱们提到的GBA模拟器,由于GLM-5一直在跑,才略员小哥哥放工打车是这么的:Agent乘客。

GitHub:https://github.com/zai-org/GLM-5

Hugging Face:https://huggingface.co/zai-org/GLM-5

ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5

GameBoy Advance体验:https://e01.ai/gba