产品 +

iEnter|智慧企业 +

企业资源计划管理系统

智钉

iManu|智能制造 +

制造执行系统

物流执行系统

高级计划及排程

iSupply|智慧供应链 +

运输管理系统

仓储管理系统

供应商关系管理系统

EP|智慧生态营销 +

经销商管理系统

全面营销管理系统

客户关系管理系统

Connect|智能网联 +

智能网联云平台

新能源汽车监控平台

商用车企业监控平台

电检系统

行驶记录仪

车载T-BOX

汽车故障诊断仪

国六OBD产品

后装GPS产品

DataValue|数据价值赋能 +

智慧质量

线索运营

智慧广告

Platform|云原生PaaS平台 +

云原生PaaS平台

容器引擎(QKP)

AI智能服务平台

API网关平台

低代码平台-QLCP

元宇宙技术探索平台

数据中台

智能运维平台

服务 +

咨询 +

车路协同解决方案

IT咨询

云原生技术架构规划与咨询服务

评测 +

网络安全等级保护测评

实施 +

电子电气检测服务

网联产品组装制造

运维 +

桌面及外围设备运维服务

云服务(IDC)

销贷服务

乘用车车联网运营服务

商用车车联网运营服务

客户联络中心运营服务

数据价值运营服务

K8s运维

关于BBIN·宝盈 +

企业简介 +

企业简介

BBIN·宝盈行业地位 +

BBIN·宝盈企业荣誉

BBIN·宝盈行业地位

BBIN·宝盈资质认证

社会责任 +
企业文化 +
投资者关系 +
BBIN·宝盈麾下企业 +
加入BBIN·宝盈 +

BBIN·宝盈业务发展规划

BBIN·宝盈福利待遇

人才招聘

信息公开 +

企业基本信息 +

企业概况

经营范围

市场主体登记基本信息

组织机构

成员单位

资质荣誉

企业重大事项 +

股权信息

产权信息

研发成果

企业经营管理 +

财务与经营状况

品牌与产品

安全环保 +

安全信息

招标招募 +

招标信息

人力资源 +

招聘信息

社会责任 +
企业公告 +

上市公司

公告信息

投资者关系

加入BBIN·宝盈

客户留言

BBIN·宝盈-首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型
2026-03-16 14:40:30

  导语:2月10日,腾讯混元推出头具名向消费级硬件场景的“极小”模子HY-1.8B-2Bit。该模子基在1.8B参数的小尺寸模子,经由过程2Bit量化技能,等效参数目约为0.3

2月10日,腾讯混元推出头具名向消费级硬件场景的“极小”模子HY-1.8B-2Bit。该模子基在1.8B参数的小尺寸模子,经由过程2Bit量化技能,等效参数目约为0.3B,现实存储占用仅约600MB,比经常使用的一些手机运用还有小,实现了端侧部署的新冲破。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

该模子基在混元团队首创的财产级2Bit端侧量化方案,经由过程对于HY-1.8B-Instruct模子举行2比特量化感知练习(QAT)产出,模子巨细削减至原始精度模子的1/6,同时于真实端侧装备上天生速率晋升2-3倍,可年夜幅晋升利用体验。能力上,模子还有保留了原版的思维链,可以为差别繁杂度的使命提供响应深度的推理历程。这是业界首个实现2bit财产级量化的端侧模子实践。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

左图为HY-1.8B原始精度模子,右图为HY-1.8B-2Bit模子,量化后的模子速率较着更快

跟着年夜语言模子普和,怎样将模子于好比手机、耳机或者者智能家居装备运用,成为业界难题,特别不少运用对于模子的离线部署、私密性等都有更高的需求,这就需要更多可以或许于端侧运行的又小又强的模子。端侧部署的睁开,素质上是一条于“小而精,快而准”的艰巨摸索之路,咱们既需要模子充足智慧,能应答千变万化的真实需求,又必需将它约束于极为有限的硬件资源内部署并快速推理,这就似乎于给模子举行“减脂增肌,减重提质”。

比特(Bit)是计较机存储的最小单元,1比特能暗示2种状况(0或者1),2比特能暗示4种状况,依此类推,一般模子的精度有2比特、4比特、8比特、32比特等暗示要领,数值越年夜模子的精度更高,所占的内存就越年夜。

虽然2比特量化的精度丧失较年夜,但经由过程QAT及进步前辈的量化计谋,已经经能让2比特模子靠近全精度模子的机能。于模子能力方面,对于比4比特PTQ模子版本数学、代码、科学等指标上体现相称,实现了“小而强”的设计方针。

技能上,量化作为年夜模子部署上线不成或者缺的一环,肩负了降低部署成本与保精度的任务,年夜部门环境下对于在int四、int八、fp8的压缩精度要求,采用PTQ量化计谋便可实现险些无损,但跟着原始模子巨细的缩小、压缩bit数的进一步降低,PTQ带来的量化丧失是巨年夜的。是以,对于在原始模子巨细只有1.8B,量化bit数只有2bit的HY-1.8B-2Bit,混元团队采用了量化感知练习计谋,这显著晋升了量化后模子的机能。

腾讯混元还有经由过程数据优化、弹性拉伸量化以和练习计谋立异三个要领来最年夜限度的晋升HY-1.8B-2Bit的全科能力。

部署方面,腾讯混元提供了HY-1.8B-2Bit的gguf-int2格局的模子权重与bf16伪量化权重,对于比原始精度模子,HY-1.8B-2Bit 可以或许矫捷用在端侧装备上,该模子也已经于 Arm 等计较平台上完成适配,可部署在启用 Arm SME2 技能的挪动装备上,并实现高效运行。

于MacBook M4芯片上,HY-1.8B-2Bit 固定了线程数为2测试了差别窗口巨细下的首字时延及天生速率,模子选定fp1六、Q四、HY-1.8B-2Bit三种gguf格局作为对于比,首字时延于1024输入内可以或许连结3—8倍的加快,天生速率上经常使用窗口下对于比原始模子精度,HY-1.8B-2Bit可以或许实现至少2倍不变加快。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

于天玑9500上一样举行了测试,对于比HY-1.8B-Q4格局首字时延可以或许加快1.5—2倍,天生速率加快约1.5倍。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

当前,HY-1.8B-2Bit的能力仍受限在监视微调(SFT)的练习流程,以和基础模子自己的机能与抗压能力。针对于这一问题,混元团队将来将重点转向强化进修与模子蒸馏等技能路径,以期进一步缩小低比特量化模子与全精度模子之间的能力差距,从而为边沿装备上的年夜语言模子部署开拓更广漠的运用远景。

项目链接:https://github.com/Tencent/AngelSlim

模子地址:https://huggingface.co/AngelSlim/HY-1.8B-2Bit

https://huggingface.co/AngelSlim/HY-1.8B-2Bit-GGUF

技能陈诉:

https://huggingface.co/AngelSlim/HY-1.8B-2Bit/blob/main/AngelSlim_Technical_Report.pdf

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

-BBIN·宝盈


地址:长春净月高新技术产业开发区百合街1009号

版权所有:BBIN·宝盈信息技术股份有限公司

电话:0431-85861717/ 4001182299