选择你喜欢的标签
我们会为你匹配适合你的网址导航

跳过将删除所有初始化信息

您的位置：0XUCN > 资讯 > 智能

新闻分类

科技
- 通信
- 数码
- 科学
互联网
- 融资
- 新零售
- 企服
- 共享
- 教育
- 医疗
- 物联网
- 安全
- 智能
- 政策
- 动态
- 技术
- 软件
娱乐
- 电影
- 电视剧
- 综艺
- 动漫
- 音乐
- 明星
- 网娱
- 韩娱
- 热点
- 值得买
游戏
- 手游
- 端游
- 页游
- 主机
- 公告
- 攻略
体育
- 业界
- 足球
- 篮球
- 彩票
汽车
- 车讯
- 新车
- 评测
时尚
- 奢侈品
- 时装
- 美妆
- 美体
健康
- 疾病
- 两性
- 健美
- 医美
- 养生
- 新冠
旅游
母婴
- 孕产
- 哺育
- 早教
- 亲子
- 萌娃
房产
- 资讯
- 家居
- 家电
教育
- 高考
- 考研
- 公考
- 留学
- 高校
- 小初高
宠物
- 资讯
- 百科
- 训练
- 常识
- 宠物用品
其它
造数

BitCPM-CANN – 面壁智能联合清华开源的端侧大模型

智能 PRO 稿源：AI工具集 2026-05-25 20:40

BitCPM-CANN是什么

BitCPM-CANN是面壁智能联合清华大学与OpenBMB开源社区联合推出的，中国首个完全基于华为昇腾国产算力平台完成端到端训练的1.58-bit三值大模型。模型采用量化感知训练路线，包含0.5B至8B四个尺寸，推理阶段释放约6倍显存红利，模型能力保留率达90.1%–97.2%，标志着国产NPU首次拥有完整的低比特训练栈。

BitCPM-CANN的主要功能

1.58-bit三值大模型推理： 提供0.5B、1B、3B、8B四个参数规格，可在端侧设备上高效运行，8B模型可轻松部署于当前主流旗舰手机。
国产昇腾全链路训练闭环： 从训练到推理完整链路均在华为昇腾平台上原生完成，无需依赖国外GPU进行预训练。
极致显存释放： 相比传统BF16精度，推理阶段释放约6倍显存红利，同等内存可承载远超以往的模型能力。
全精度对照评测验证： 与同尺寸MiniCPM4全精度模型在常识、阅读理解、学科知识、数学与推理等11项任务上完成1:1性能对照。
开源模型与训练底座： 全系列模型权重及基于MindSpeed × Megatron-LM的低比特训练底座均对外开放，支持开发者复现与二次创新。

BitCPM-CANN的技术原理

量化感知训练（QAT）： 模型在训练初始阶段即主动学习使用三值权重（-1、0、+1）进行知识表达，非训练完成后再被动压缩，从根本上实现极低比特下的原生生长。
三值权重信息密度最大化： 通过1.58-bit位宽约束迫使每个bit发挥最大知识承载效率，使权重精度取决于每bit承载的知识量非位宽大小。
MindSpeed × Megatron-LM训练底座： 基于主干框架在昇腾平台上搭建完整的低比特训练基础设施，包含环境适配、32K长序列支持、并行策略与融合算子体系。
端到端国产算力原生适配： 从最底层量化算子、QAT算法到完整并行策略和训练框架，全部针对华为昇腾进行原生开发与优化，实现训练推理一体化。
系统性可扩展低比特范式： 通过0.5B至8B全尺寸系列的工程验证，证明该低比特训练路线具备跨规模的系统性、可扩展性与工程可复现性。

如何使用BitCPM-CANN

获取开源模型权重： 访问HuggingFace下载0.5B、1B、3B、8B全系列模型权重。
部署训练底座： 基于面壁智能开源的MindSpeed × Megatron-LM低比特训练底座，在华为昇腾平台上完成环境适配、依赖安装与框架部署。
端侧推理运行： 用模型6倍显存红利优势，在当前主流旗舰手机或PC端侧设备上直接运行8B及以下模型进行推理。
二次训练创新： 基于QAT训练基础设施与开源代码，在昇腾平台上进行二次微调、领域适配或更大规模的低比特训练创新。

BitCPM-CANN的核心优势

国产算力闭环突破： 首次在昇腾上实现端到端1.58-bit训练并全精度对照评测至8B级别，打破国产芯片只能跑推理的刻板印象。
性能保留率行业领先： 3B模型能力保留率达97.2%为全档最高，8B达95.7%，0.5B亦达90.1%，系统性可扩展且工程可复现。
训练效率显著优于同类： 此前GPU版BitCPM 1B仅用微软BitNet 2B 1/20的训练算力即实现全面超越，效率优势已验证。
端侧天花板大幅抬升： 6倍显存红利结合MoE架构，有望将50B乃至100B参数超大模型装入终端，使端侧AI能力达到全新高度。

BitCPM-CANN的项目地址

HuggingFace模型库：https://huggingface.co/collections/openbmb/bitcpm-cann

BitCPM-CANN的同类竞品对比

对比维度	BitCPM-CANN	微软 BitNet
开发方	面壁智能 / 清华大学 / OpenBMB	微软研究院
技术路线	量化感知训练（QAT）	三值量化训练
训练平台	华为昇腾（国产NPU）	英伟达 GPU
权重精度	1.58-bit（-1, 0, +1）	1.58-bit（-1, 0, +1）
能力保留率	90.1%–97.2%（3B最高97.2%）	未公开同类全精度对照
训练效率	1B仅用BitNet 2B 1/20算力	基准方案
端到端训练	昇腾原生完成	GPU原生完成
开源程度	全系列权重 + 训练底座开源	部分开源
端侧价值	补国产NPU低比特模型供给侧空白	推动三值量化研究

BitCPM-CANN的应用场景

智能手机端侧AI： 在有限内存下运行更大参数模型，未来有望在手机上运行60B大模型，直接提升终端智能水平与用户体验。
国产芯片生态补全： 为高通骁龙8 Gen 4等已支持2-bit推理的端侧芯片提供高质量模型侧供给，实现软硬件协同与生态闭环。
企业级端侧部署： 适用PC、汽车、IoT等设备上的低内存成本大模型推理，对冲全球HBM内存价格飙升带来的供应链压力。
低比特训练研究创新： 为昇腾平台开发者提供可复用、可扩展的QAT公共基础设施，支持基于国产算力的二次训练与微调创新。

超好看的资讯你懂得 >>> 点击进入

0XU.CN

[超站]友情链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/

*文章为作者独立观点，不代表 0XUCN 立场

本文由给乔买裙子发表，转载此文章须经作者同意，并请附上出处(0XUCN)及本页链接。

原文链接 https://www.0xu.cn/article/intelnet/intelligent/67361.html

AI工具集 BitCPM-CANN 面壁智能 OpenBMB 清华大学

图库

给乔买裙子

公众号

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接

processon

itrust

SSL

K2CMS

热门AI排行

排名热点热门指数

1 DeepSeek -
2 ChatGPT -
3 腾讯元宝 -
4 豆包 -
5 Gemini -
6 通义千问 -
7 Grok -
8 讯飞星火 -
9 文心一言 -
10 Kimi -

分享文章

微信
微信扫码分享

新浪微博
离开
复制链接
返回顶部