阿里刚刚发布的 Qwen3 ,真的很牛。可以在这里尝试Qwen 3
主要的特点:
亮点与特性
- 双重思考模式:支持"思考模式"(深度推理)和"非思考模式"(快速响应),用户可灵活控制模型推理深度
- 广泛语言支持:覆盖 119 种语言和方言
- 增强 Agent 能力:优化了代码与环境交互能力
开源模型列表
MoE 模型(混合专家模型):
- Qwen3-235B-A22B:2350 亿总参数,220 亿激活参数
- Qwen3-30B-A3B:300 亿总参数,30 亿激活参数
Dense 模型(全参数模型):
- Qwen3-32B( 64 层,128K 上下文)
- Qwen3-14B( 40 层,128K 上下文)
- Qwen3-8B( 36 层,128K 上下文)
- Qwen3-4B( 36 层,32K 上下文)
- Qwen3-1.7B( 28 层,32K 上下文)
- Qwen3-0.6B( 28 层,32K 上下文)
阿里牛了,之前 QwQ 32B 我就挺喜欢用的,不过能力强,只是弱,这次不弱了。