Reader
posts
feeds
[+]
[rss]
[atom]
[opml]
微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
2025-04-29 06:12:06 +0000 UTC
|
量子位
|
Default
减少内存带宽&提升计算效率