4月底,阿里发布了qwen3系列模型,在全球互联网激起热烈的讨论,又一次证明阿里在开源模型届的号召力。
这次qwen3发布了6个不同体量参数开源模型
0.6b、1.7b、4b、8b、14b、32b、30bA14b、235bA22b
其中小体积模型特别引人注目,0.6b参数qwen3只有DeepSeek R1模型的千分之一的体积。
如此小的体积,让很多人对其充满期待,同时也带着疑问。
反正体积特别小,部署和测试成本很低,Make hands dirty 上手试试。
本文内容:
我们先看看,用户总结的qwen小模型的突出优点。
对于这种功能全面的小模型,在恰当使用的场景下,也能发挥巨大的作用;
我推荐使用Ollama的方式在PC或Mac进行本地部署。
先安装Ollama,进入官网
https://ollama.com/
下载适合你电脑的版本,安装完成后,下载对应的Qwen3模型
运行以上命令后,有以下几种方式进行使用模型的问答
具体细节在这篇文章中不展开。
经过部署后我们具体看看都在小模型大用途的场景,以下主要针对0.6b和8b两个版本的qwen3模型进行实测;
qwen3系列的小模型在总结文档上完成的比较出色
很多人担心小LLM模型在总结文档上无法精准达到效果,或者,出现严重的幻觉。
对此,GitHub上有机构针对市场上出现的上百款开源和私有模型进行测试对比。
我总结了和qwen小模型相关的对比,如下图所示,你会发现,8b模型的精准度要优于DeepSeek-R1
对于简单的文本总结,相信两个参数的模型都没有问题,由于我们总结文档很有可能是需要总结网页的内容,经过对比,发现:
样本分类的任务,我openai工程师分享的gpt分类测试
https://cookbook.openai.com/examples/leveraging_model_distillation_to_fine-tune_a_model
文章中提到的任务:根据红酒的描述文字,推断品种,
测试的效果:两个模型的差异
考虑到成本情况,8b模型相当于有竞争力。
当然,对0.6b进行微调/蒸馏,或许可以显著提升准确率,这个可以留在下一篇文章中进行测试。
以下是测试代码,大家可以自己运行:
记得先从kaggle上下载数据 https://www.kaggle.com/datasets/zynicide/wine-reviews
哪吒2中的“急急如律令”如何翻译,引起了一番讨论,我们看看两个小模型如何翻译的
可以看出,两者翻译都不会出错,但是8b模型在知识量上强很多,所以翻译上考虑的内容会更多
小语种翻译
qwen3支持129种语言,我在工作中正好遇到了小语种音乐歌词的问题,用来测试下
Aylonayin
Yuragimdagi cho’g-cho’g,
Tunlari uyqum yo’q-yo’q,
Bedorman-ey, hey bejonman-ey.
Sening bir bo’ying yo’q-yo’q,
Qilasan doim do’q-do’q,
Sezmaysan-ey, hey bilmaysan-ey.
Yuragimda atalgan muhabbat,
Faqat senga, faqat senga.
Naqorat:
Aylonayin, ho aylonayin,
Belingga belbog’ bo’lib boylanoyin.
Aylonayin, ho aylonayin,
Yurgan yo’llaringdan-ey aylonayin.
Senga aytar so’zim bor-bor,
Mehringga yurak zor-zor,
Qiynaysan-ey, hech bilmaysan-ey.
Beparvo bo’lma yor-yor,千问 Qwen 教程
Sensiz bu dunyo tor-tor,
Ko’rmaysan-ey, hech sezmaysan-ey.
Yuragimda atalgan muhabbat,
Faqat senga, faqat senga.
Naqorat:
Aylonayin, ho aylonayin,
Belingga belbog’ bo’lib boylanoyin.
Aylonayin, ho aylonayin,
我也不知道这是什么语种的歌词,看看0.6b和8b的翻译表现:
明显看出,在稍微专业一点的小语种领域:
建议在企业项目中,如果对响应速度有要求的AI场景(或分类、文本提取等场景),先快速的用qwen3-0.6b模型快速测试。
后续我还会根据其他的实际场景,进行小模型的测试。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/257581.html原文链接:https://javaforall.net
