腾讯发布开源MoE大语言模型Hunyuan-large:总参数398B为业内最大

2024-11-05 20:45:57来源:快科技编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

  原标题:腾讯发布开源MoE大语言模型Hunyuan-large:总参数398B为业内最大

  11月5日消息,腾讯今日宣布推出业界参数规模最大、效果最好的开源MoE大语言模型Hunyuan-Large。

  Huanyuan-large模型的总参数量为389B、激活参数为52B、训练token数量为7T、最大上下文长度为256K、词表大小为12.8w。

  在技术创新方面,Hunyuan-large通过高质量的合成数据来增强模型训练,弥补了自然数据的不足。

腾讯发布开源MoE大语言模型Hunyuan-large:总参数398B为业内最大

  其中,该模型预训练支持处理高达256K的文本序列,大幅提升了长文本上下文的处理能力,能够更高效地完成长文本任务。

  据了解,Hunyuan-large在CMMLU、MMLU、CEva1、MATH等多学科综合评测集上表现优异,在中英文自然语言处理、代码生成、数学运算等9大能力维度中全面领先,超越了Llama3.1和Mixtral等一流开源模型。

  此外,腾讯还宣布将推出自研的长文评测集“企鹅卷轴(PenguinScrolls)”,以填补行业在真实长文评测集上的空白。

  企鹅卷轴基于公开的金融、法律、学术论文等长文本构建,文本长度从1K到128K不等,覆盖深度阅读理解和长文推理任务。

     投稿邮箱:lukejiwang@163.com   详情访问鹿财经网:http://www.lucaijing.com.cn

相关推荐
通义千问发布Qwen3-Coder,代码模型能力再升级,推 通义千问发布Qwen3-Coder,代码模型能力再升级,推

原标题:通义千问发布Qwen3-Coder,代码模型能力再升级,推出代理式编程命令行

科技说2025-07-23

消息称一汽丰田正筹备 AI 座舱研发:计划明年发 消息称一汽丰田正筹备 AI 座舱研发:计划明年发

原标题:消息称一汽丰田正筹备 AI 座舱研发:计划明年发布 7 月 15 日消息,据

科技说2025-07-16

余承东:开源鸿蒙代码破1.3亿行,软硬件产品超 余承东:开源鸿蒙代码破1.3亿行,软硬件产品超

原标题:余承东:开源鸿蒙代码破1.3亿行,软硬件产品超千款 华为开发者大会

科技说2025-06-20

360集团发布纳米AI智能体,开启高效搜索与分析新 360集团发布纳米AI智能体,开启高效搜索与分析新

原标题:360集团发布纳米AI智能体,开启高效搜索与分析新时代 360集团近期震撼

科技说2025-06-16

华为Pura 80系列6月11日震撼发布 华为Pura 80系列6月11日震撼发布

原标题:华为Pura 80系列6月11日震撼发布 华为近日宣布,其备受期待的Pura 80系列

科技说2025-06-03

腾讯AI战略成效初显,ToB业务成新增长点,订阅非 腾讯AI战略成效初显,ToB业务成新增长点,订阅非

原标题:腾讯AI战略成效初显,ToB业务成新增长点,订阅非主流商业模式? 腾讯

科技说2025-05-15

奇瑞携手南洋理工,全球开源计划海外协同创新 奇瑞携手南洋理工,全球开源计划海外协同创新

原标题:奇瑞携手南洋理工,全球开源计划海外协同创新中心正式启动! 奇瑞

科技说2025-05-13

清华90后创业者季宇发布“褐蚁”一体机,挑战 清华90后创业者季宇发布“褐蚁”一体机,挑战

原标题:清华90后创业者季宇发布褐蚁一体机,挑战AI算力市场 近日,北京行云

科技说2025-05-01

Meta发布独立AI助手Meta AI,社交融合新体验能否撼 Meta发布独立AI助手Meta AI,社交融合新体验能否撼

原标题:Meta发布独立AI助手Meta AI,社交融合新体验能否撼动ChatGPT地位? meta公

科技说2025-04-30

1秒充电不止1公里!小鹏发布5C超充AI电池:电驱 1秒充电不止1公里!小鹏发布5C超充AI电池:电驱

原标题:1秒充电不止1公里!小鹏发布5C超充AI电池:电驱效率行业第一 4月15日

科技说2025-04-15