事实证明千问qwen3小模型才是企业的生产力，他究竟能做什么呢？

4月底，阿里发布了qwen3系列模型，在全球互联网激起热烈的讨论，又一次证明阿里在开源模型届的号召力。

这次qwen3发布了6个不同体量参数开源模型

0.6b、1.7b、4b、8b、14b、32b、30bA14b、235bA22b

其中小体积模型特别引人注目，0.6b参数qwen3只有DeepSeek R1模型的千分之一的体积。

如此小的体积，让很多人对其充满期待，同时也带着疑问。

反正体积特别小，部署和测试成本很低，Make hands dirty 上手试试。

本文内容：

我们先看看，用户总结的qwen小模型的突出优点。

对于这种功能全面的小模型，在恰当使用的场景下，也能发挥巨大的作用；

我推荐使用Ollama的方式在PC或Mac进行本地部署。

先安装Ollama，进入官网

https://ollama.com/

下载适合你电脑的版本，安装完成后，下载对应的Qwen3模型

运行以上命令后，有以下几种方式进行使用模型的问答

具体细节在这篇文章中不展开。

经过部署后我们具体看看都在小模型大用途的场景，以下主要针对0.6b和8b两个版本的qwen3模型进行实测；

qwen3系列的小模型在总结文档上完成的比较出色

很多人担心小LLM模型在总结文档上无法精准达到效果，或者，出现严重的幻觉。

对此，GitHub上有机构针对市场上出现的上百款开源和私有模型进行测试对比。

我总结了和qwen小模型相关的对比，如下图所示，你会发现，8b模型的精准度要优于DeepSeek-R1

对于简单的文本总结，相信两个参数的模型都没有问题，由于我们总结文档很有可能是需要总结网页的内容，经过对比，发现：

样本分类的任务，我openai工程师分享的gpt分类测试

https://cookbook.openai.com/examples/leveraging_model_distillation_to_fine-tune_a_model

文章中提到的任务：根据红酒的描述文字，推断品种，

测试的效果：两个模型的差异

考虑到成本情况，8b模型相当于有竞争力。

当然，对0.6b进行微调/蒸馏，或许可以显著提升准确率，这个可以留在下一篇文章中进行测试。

以下是测试代码，大家可以自己运行：

记得先从kaggle上下载数据 https://www.kaggle.com/datasets/zynicide/wine-reviews

哪吒2中的“急急如律令”如何翻译，引起了一番讨论，我们看看两个小模型如何翻译的

可以看出，两者翻译都不会出错，但是8b模型在知识量上强很多，所以翻译上考虑的内容会更多

小语种翻译

qwen3支持129种语言，我在工作中正好遇到了小语种音乐歌词的问题，用来测试下

Aylonayin

Yuragimdagi cho’g-cho’g,

Tunlari uyqum yo’q-yo’q,

Bedorman-ey, hey bejonman-ey.

Sening bir bo’ying yo’q-yo’q,

Qilasan doim do’q-do’q,

Sezmaysan-ey, hey bilmaysan-ey.

Yuragimda atalgan muhabbat,

Faqat senga, faqat senga.

Naqorat:

Aylonayin, ho aylonayin,

Belingga belbog’ bo’lib boylanoyin.

Aylonayin, ho aylonayin,

Yurgan yo’llaringdan-ey aylonayin.

Senga aytar so’zim bor-bor,

Mehringga yurak zor-zor,

Qiynaysan-ey, hech bilmaysan-ey.

Beparvo bo’lma yor-yor,千问 Qwen 教程

Sensiz bu dunyo tor-tor,

Ko’rmaysan-ey, hech sezmaysan-ey.

Yuragimda atalgan muhabbat,

Faqat senga, faqat senga.

Naqorat:

Aylonayin, ho aylonayin,

Belingga belbog’ bo’lib boylanoyin.

Aylonayin, ho aylonayin,

我也不知道这是什么语种的歌词，看看0.6b和8b的翻译表现：

明显看出，在稍微专业一点的小语种领域：

建议在企业项目中，如果对响应速度有要求的AI场景（或分类、文本提取等场景），先快速的用qwen3-0.6b模型快速测试。

后续我还会根据其他的实际场景，进行小模型的测试。

#Qwen3 #小模型 #mcp #AI翻译 #AI总结 #AI幻觉 #LLM本地部署

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/257581.html原文链接：https://javaforall.net

事实证明千问qwen3小模型才是企业的生产力，他究竟能做什么呢？

关于作者

全栈程序员-站长

相关推荐

阿里千问大模型负责人林俊旸被曝非自愿离职

大模型教程

Qwen7b微调保姆级教程

千问AI如何生成图片

通义千问核心骨干“跳槽”字节：大模型人才争夺战再次升级

如何评价阿里千问大模型负责人林俊旸自宣卸任？会对通义千问造成什么影响？