北航、人大和九坤投资共同撰写的论文 《Scaling Laws for Code: Every Programming Language Matters》 整理而成。 在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。
IT之家 12 月 23 日消息,TIOBE 指数 2025 年 12 月排行榜现已在官网公布,这个月 Python 依旧稳如泰山,以 23.64% 的市场份额夺得冠军,而 C 语言则是从上月的第 4 名升至亚军,市场份额 10.11%,C++ ...
这个比喻恰恰反映了当今AI编程助手面临的一个严重问题。根据Veracode公司2025年的研究报告,AI编程助手在生成与安全相关的代码时,竟然有45%的情况下会产生存在安全漏洞的代码。这就像是那个看似专业的厨师,虽然能做出看起来不错的菜,但却可能在食 ...
中国人工智能初创公司MiniMax今日宣布发布M2.1模型,在现实世界复杂任务和智能体能力方面实现显著性能提升,支持更多编程语言和办公场景。