近日,阿里通义千问发布了两款300亿参数的MoE大模型——Qwen3-30B-A3B-Instruct-2507和Qwen3-Coder-30B-A3B-Instruct。英特尔推出的可变显存技术(Intel Variable VRAM Technology),让搭载英特尔酷睿Ultra 200H处理器和32GB内存的AI PC能够流畅运行这两款大模型。该技术的核心是基于预留内存的动态调度机制,通过软件层面的调优,打破了传统核显显存固定分配的限制,实现了VRAM的动态调节和高效利用。它适配了MoE架构模型在专家节点切换时的显存波动特点,用户只需在英特尔官网下载并安装最新版的显卡驱动程序(32.0.101.6972或以上版本),再通过Intel Graphics Software控制面板自定义设定显存比例,即可将系统内存的默认VRAM分配比例从57%提升到87%。这使得32GB内存的笔记本设备,可使用的VRAM从18GB提升到27GB。同时,该技术还针对酷睿Ultra 200H平台的硬件特性,对预留内存的读写路径进行了深度优化,提升了内存带宽利用率,减少了数据交换延迟,确保大模型在高占比预留内存调用时仍能保持流畅运行。目前,英特尔生态合作伙伴Flowy AI已率先完成英特尔可变显存技术的验证,在其Flowy AI PC软件中集成了这两款30B模型。实测显示,在搭载英特尔酷睿Ultra 9 285H处理器及32GB内存的PC上,这两款30B模型不仅支持Q4、Q5、Q6等更高精度的量化版本,还能实现毫秒级响应的离线交互。
|
|