产品 +

iEnter|智慧企业 +

企业资源计划管理系统

智钉

iManu|智能制造 +

制造执行系统

物流执行系统

高级计划及排程

iSupply|智慧供应链 +

运输管理系统

仓储管理系统

供应商关系管理系统

EP|智慧生态营销 +

经销商管理系统

全面营销管理系统

客户关系管理系统

Connect|智能网联 +

智能网联云平台

新能源汽车监控平台

商用车企业监控平台

电检系统

行驶记录仪

车载T-BOX

汽车故障诊断仪

国六OBD产品

后装GPS产品

DataValue|数据价值赋能 +

智慧质量

线索运营

智慧广告

Platform|云原生PaaS平台 +

云原生PaaS平台

容器引擎(QKP)

AI智能服务平台

API网关平台

低代码平台-QLCP

元宇宙技术探索平台

数据中台

智能运维平台

服务 +

咨询 +

车路协同解决方案

IT咨询

云原生技术架构规划与咨询服务

评测 +

网络安全等级保护测评

实施 +

电子电气检测服务

网联产品组装制造

运维 +

桌面及外围设备运维服务

云服务(IDC)

销贷服务

乘用车车联网运营服务

商用车车联网运营服务

客户联络中心运营服务

数据价值运营服务

K8s运维

关于jn江南 +

企业简介 +

企业简介

企业价值 +

企业荣誉

行业地位

资质认证

社会责任 +
企业文化 +
投资者关系 +
麾下企业 +
加入jn江南 +

业务发展规划

福利待遇

人才招聘

信息公开 +

企业基本信息 +

企业概况

经营范围

市场主体登记基本信息

组织机构

成员单位

资质荣誉

企业重大事项 +

股权信息

产权信息

研发成果

企业经营管理 +

财务与经营状况

品牌与产品

安全环保 +

安全信息

招标招募 +

招标信息

人力资源 +

招聘信息

社会责任 +
企业公告 +

上市公司

公告信息

投资者关系

加入jn江南

客户留言

jn江南娱乐-Mac跑本地AI大模型 还差这一块
2026-05-29 19:45:46

  

一样是Mac,有人感觉当地年夜模子“已经经够用了”,有人却一打开长文档、长代码堆栈就最先卡、最先慢、最先爆内存。许多时辰,问题不彻底于模子巨细,而于另外一件更易被纰漏的事上:模子的“姑且影象”太占处所了。

Mac跑本地AI大模型 还差这一块

这件事于技能上叫KV Cache。你可以把它理解成,年夜模子于推理时随身带着的一本条记本。对于话越长,文档越长,代码上下文越长,这本条记本就越厚。跟着及模子不停对于话,Mac那本就很名贵的同一内存,也会被不停占用。

有无一种措施,可以或许将这个条记本压缩一下,从而让用户可以或许更好地于Mac上利用当地模子?

开源项目“TurboQuant+”提供了一个要领。

一个来自负厂思绪的开源项目

TurboQuant+基在google研究院发表于 ICLR 2026 学术集会上的最新论文,用了一套数学要领,专门解决这个"条记本太厚"的问题。

用一句话归纳综合:这个项目把AI的“事情影象”压缩到本来的1/4到1/6,但内容险些稳定。

就像你手机拍的一张5MB照片,压成JPEG以后只有500KB,肉眼却险些看不出不同。

TurboQuant+对于AI的“影象”做的,就是近似的工作。

Mac跑本地AI大模型 还差这一块

数据显示,压缩以后本来需要2.78GB的长对于话影象,此刻只需要0.98GB,压缩比最高可达6.4倍,并且质量丧失极小,4-bit压缩方案的回覆质量险些与未压缩时不异。

Mac用户福音

该项目表态后,也被许多Mac用户存眷。由于TurboQuant+对于Mac用户的价值,比对于其他平台的用户要年夜患上多。

缘故原由很简朴,由于Apple Silicon是同一内存架构,运行年夜语言模子的时辰,电脑的内存可以直接被用作显存。

也正由于此,同一内存架构有一个实际影响,那就是模子权重、KV Cache,以和体系自己,都于争统一分内存。是以TurboQuant+对于在Mac的价值,就不只是“账面上省一点”,而是会直接表现于可用余量上。

使用搭载M5 Max的MacBook Pro实测利用搭载M5 Max的MacBook Pro实测

压缩空间之后,象征着一样一款Mac,可以承载更多的内容。压缩后,不管是想于当地读超长 PDF、集会记要、技能文档,还有是想让AI理解整个年夜项目的代码,或者是想做当地常识库检索,利用更年夜的模子等等,都能跟着空间的增多以和上下文长度的加强,得到更好的体验。

这个项目的意义于在,它的目的是只管即便榨干硬件的能力,让Mac少被内存瓶颈卡住,不需要让用户马上进级硬件。

这类“让用户省钱”的开源项目,天然也获得了更多用户的存眷。

一个全新的设计思绪

于上手前,我还有要帮各人避个坑。虽然说TurboQuant+已经经有可用实现,也及llama.cpp生态有关,但不克不及简朴理解成今朝已经经完备内置,复制参数就能直接跑。

Mac跑本地AI大模型 还差这一块

由于今朝这个项目还有是于开源社区测试,比拟在真正用起来,把他当作一个很值患上存眷的技能标的目的,实在是更好的选择。固然,假如真要上手,也能够先确认一下项目的README文件,如许也会少踩许多坑。

假如你已经经于Mac上当地跑模子,并且常常遇到上下文或者内存限定,或者者很于意隐私,但愿把文档、常识库、代码阐发只管即便留于当地,这个开源项目都是值患上存眷的。说到底,TurboQuant+的意义不是让Mac成为更强的AI助手,而是让Mac于当地年夜模子这条路上,少一点束手束脚。

许多时辰,真正决议体验的不是模子排行榜顶端那一点差距,而是你手上这台呆板能不克不及不变、顺畅、连续地完成你要做的事。

从这个角度看,TurboQuant+ 这类底层优化,反而极可能是最靠近“有效”的那一类进展。

假如你是 Mac 用户,而且当真于当地用年夜模子,那 TurboQuant+ 值患上存眷。它纷歧定最显眼,但它解决的是最实际的问题:如何让统一台 Mac,装下更多上下文,少吃一点内存,跑起来更像东西,而不是玩具。

版权所有,未经许可不患上转载

-jn江南娱乐


地址:长春净月高新技术产业开发区百合街1009号

版权所有:jn江南信息技术股份有限公司

电话:0431-85861717/ 4001182299