国庆日,日本的一群很棒的模特!最强的国家编程模型诞生了,摩尔寒武纪迅速适应

Li Shuiqing的作者Moying Zhidongxi在9月30日国庆日的前夕报道说,AI的全球竞争达到了一个小的高潮,大型国家模型采用了一系列伟大的运动。今天下午,Zhipu AI正式推出了新一代的大型型号GLM-4.6。昨晚,DeepSeek还宣布了DeepSeek-V3.2-Exp实验版本模型的推出。两家主要的国家公司在全国假期没有放松,并加班以促进技术迭代。在海洋的另一侧,克劳德十四行诗4.5同时推出,而Google Gemini 3.0预计将面对十月,从而在激烈的舞台上导致模型的全球竞争。作为Zhipu GLM的最新版本,GLM-4.6系列在实际编程,长上下文处理,推理功能,信息搜索,写作功能和代理的合理方面都取得了全面的改进超过DeepSeek-V3.2-Exp。这也是新的“中国最强大的编码模型”。据说这使用户可以享受大约1/7 Claude Sonnet 4的代码特征。Phidongxi是第一个在GLM-4.6中执行真实测试的代码特征,其编程功能令人惊讶。与GLM-4.5相比,该代码的质量和实施效果显着提高,与十四行诗Claude 4.5和GPT-5相当。同时,对代理的文本,逻辑,内存,搜索和调用的理解有很大的经验。目前,GLM-4.6位于Zhipu Maas BigModel.cn平台上,并将在拥抱面部和模型合作社的同时成为开源。国家GIP制造商,例如寒武纪和Netonals以及国内筹码。经验地址:https://chat.z.ai技术报告局:https://z.ai/blog/glm-4.61。 GLM-4.6扫除了八个授权等级,编程特征达到了新的最大值,从而提高了30个%令牌消费条款。根据条约,让我们看看GLM-4.6评估的结果。通过八次享有声望的参考测试,包括AIME 25,GPQA,LCB V6,HLE和SWE板凳的验证,GLM-4.6在大多数专制列表中的DeepSeek-v3.2-Exp和Claude Sonnet 4等主要模型的改进都要好,这使得它成为了国家模型的第一个模型。这些结果在战斗。 GLM-4.5是GLM-4.6的上一代模型,最初是在7月28日启动的,首次在单个模型中首次实现了代理的推理,编纂和功能的本地融合。代码功能中出色的GLM-4.5性能使Zhipu Maas平台的销售超过10次。 GLM-4.6基于此实现了积分跳跃。这不仅为代码函数建立了新功能,还增加了长期和下游的数字。总收益超过DEP启动的DeepSeek-V3.2-Exp昨天寻找。这些改进也反映在实际的编程评估中,GLM-4.6也取得了积分损失。为了在实际编程任务中测试该模型,Zhishu在克劳德代码环境中执行了74个实际方案编程任务。结果表明,GLM-4.6实际上是在Claude 4的十四行诗上方测量的,并且优于其他国家模型。就平均令牌消耗而言,与最低的GLM-4.5相似模型相比,GLM-4.6节省了30%以上。为了确保透明度和可靠性,Zhipu发现了行业验证和繁殖的所有流行和代理的轨迹。链接:https://huggingface.co/datasets/zai-org/c-benchtrajectores 2。真正的测试编程令人惊讶,Claude和GPT-5 SMART是GLM-4.6编程,具有智能的Claude和GPT-5,专注于体验功能。与GLM-4.5相比,它不仅显着改善,而且发现更多的CO可以通过更高的完成率来实现MPLEX编程任务,并且代码生成质量和多个任务的预览效果达到了可与Claude SONNET 4.5和GPT-5相当的水平。首先,我尝试“转动六角形弹跳模拟”。经验表明,GLM-4.6可以准确模拟旋转容器,碰撞,节能现象的作用以及质量对脉冲渗透性的影响,并可以提供控制选项,例如旋转速度,重力和摩擦的控制。入口:它模拟了一个旋转的六角形螺栓,两个球具有相同的体积,并且球A的球是球面团的两倍。 GLM-4.6输出:将相同的快速单词发送到GLM-4.5时,输出效果为:弹球出现六角形限制,仿真效果不如GLM-4.6好,并且没有控制选项。与GLM-4.5相比,此示例使您可以直观地看到GLM-4.6中的世代改进。怎么样GLM-4.6与Claude 4.5的Claude 4.5的最后一版相比?如下图所示,这是X平台用户的“快速单词”的一个示例,并且可以做一些“令人惊讶”的事情。 GLM-4.6是否能够在GPT-5中证明相同的消息并且没有获得有效的代码?即使您输入一个非常简单和快速的单词,如下图所示,GLM-4.6也可以理解抽象单词“交互式”和天文概念“太阳系”的含义,并执行相对精确的模拟。控制台模拟行星在太阳系中的位置和行为,承认借助3D型号拖动它们,并承认可调变量,例如执行速度和出现在Claude SONNET 4.5上方的行星的大小。 。输入:创建太阳系的交互式模拟。 GLM-4.6输出:GLM-4.6它是SVG Animationary生成的示例中超过GPT-5的理解和编程的特征执行。如下图所示,X平台上的用户使用GPT-5为“ Capybara Bichycle”生成SVG动画,但是动画并未精确地生成Capybara。这使我怀疑GPT-5似乎仅生成培训数据中显示的内容。我要求GLM -4.6尝试相同的问题,并发现我迅速生成了精确和逼真的动画。 Capybara的动画版本与现实世界的形式更近,Capybara带着车把骑着自行车座椅。输入:SVG,Capybara自行车动画。 GLM-4.6输出:交互式游戏进一步测试了大型模型的编程功能。当您的GLM-4.6生成一个简单的3D设置游戏时,GLM-4.6很快生成了736个行代码程序。预览是一个具有三维感的空间。当单击鼠标拍照并移动对象时,打击和分数机制会产生奖励效果。入口:创建一个带有三个JS的简单3D射击游戏。 Glm-4.6输出:GLM-4.6实现了额叶设计,GitHub的集成,更长的上下文和电池全部开发中的其他更新。我再次尝试。需要GLM-4.6来生成“基于力的速度组的演变和相互作用”的模拟。这检查了GLM-4.6在额叶开发,物理模拟,状态管理,系统架构,抽象建模,简化复杂性和使用链使用中的多个特征。如下图所示,GLM-4.6通过开发模块化控制板,模拟控件,参数配置和人口A和B的动态指标完成了实现步骤,并通过模拟速度组快速排斥的速度类型的物理定律必须模拟“ Peqballsueññas”。输出:除了体验GLM-4.6代码功能外,我们还研究了通过文本理解,代理,搜索和多模式调用GLM-4.6的能力AI PPT的生产。通过多次对话,我直观地感觉到GLM-4.6的“手和眼”更有效。它提供了有关主题的精确搜索和信息改进。与“社交属性社交城市”有关的内容“星星追逐” NA保持与其他页面相同的格式和深度。 Ronda 3:照片有点单调,并添加了时尚视觉元素。添加与四个PPT有关的照片。出发:通常,GLM-4.6仅使用GLM-4.5的名称重复,但是实际的测试效果非常直观,在某些情况下,发现它具有比GPT-5和Claude Sonnet 4.5更好的效果。最大的国家模型的重复率令人惊讶,并且与昨天衡量新的DeepSeek模型时的感觉一致。 3。国家筹码将迅速适应,国家的光线将降低价格,它将提高质量,AI将使更多的人受益。 GLM-4.6将启动,但是国家芯片制造商做出了迅速的反应。 Cambrian和Moore的线程几乎立即完成了GLM-4.6的改编,并且在国家国内模型和筹码方面的协同效率超出了想象力。 GLM-4.6在寒武纪时期的主要国内芯片中实现了FP8+INT4的混合定量部署。这是国内tick是FP8+INT4模型芯片的第一个集成解决方案,该解决方案被放入生产中。保持精确度并没有改变,但大大降低了推理成本并创造了可行的道路,以便国家芯片操纵大型模型。同时,Moore的线程基于VLLM推理框架完成了GLM-4.6的改编。新一代GPU可以使用FP8的天然精度执行稳定的模型,这使他们能够在生态和快速适应性方面完全验证Musa和GPU体系结构的好处。 GLM-4.6和国家芯片的组合由Cambrian和Moore Thread创建的S通过Zhipu Maas平台为公众和公司提供服务。将来,原始的国家GLM模型和国内芯片将共同促进模型培训和推理的性能优化和效率。这种协同作用不仅反映在技术层面上,而且直接使最终用户受益。随着GLM-4.6的启动,Zhipu将同时更新其GLM编码计划,从而启动一个有趣的每月20元数据包,从而使用户可以享受1/7 In In 1/7的IQ 9/10 Claude IQ 9/10。同时,我们启动了GLM编码计划企业版,以为企业用户提供结合安全性,盈利能力和更高国际绩效的编码解决方案。以前订阅GLM编码计划的用户将自动更新为GLM-4.6,将添加识别和搜索功能,并接纳10多个工具,包括Claude Code,Roo Code,Kilo Code,Kilo Code和Cline。 Zhipu提供GLM编码最大为高频重型开发人员。这是Claude Max Plan(20倍)的使用三倍。 The tendency to improve quality and reduce prices “for large models in the country is more evident, and we can see that it is expected to accelerate and facilitate the propagation of larger models technologies. Multiple developers and companies can enjoy the main capacities of AI at a lower cost. Conclusion: Model quality and price reduction after the improvements behind the architecture updates and national chips accelerated the synergy of GLM-4.5 to GLM-4.6. The AI ​​ZHIPU在短短两个月内取得了巨大的飞跃,并表现出强大的技术重复能力,同时提高了模型的质量,这使大型模型成为了与众不同的工具,这不仅是绩效的简单改进。Ntry。大型国家模型和国内筹码之间的详细合作创造了一个更独立,可控的技术生态系统。螺纹改变了,摩尔完成了GLM-4.6的改编。此外,使用AI芯片(例如华为和寒武纪)的DeepSeek适应表明,国家AI芯片和前卫模型可以以协调的方式成为项目,从而建立一个坚实的基础来建立独立的基础设施。
特殊声明:先前的内容(包括照片和视频(如果有),如有)已由网络自我媒体平台的用户收费和发布。该平台仅提供信息存储服务。
注意:以前的内容(如果您的照片或视频)将由社交媒体平台NetEase Hao的用户收取和发布,并且仅提供信息存储服务。

类似文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注