Reader

微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当

| 量子位 | Default
能在苹果M2 CPU上快速运行