阿里云于8月3日宣布开源两款重要的大型模型——QWen-7B和QWen-7b-Chat。这两款模型的参数规模达到了令人瞩目的70亿,并且已经在Hugging Face和ModelScope平台上开放,并可免费商用。以下是相关链接:

GitHub项目主页:https://github.com/QwenLM/Qwen-7B

Hugging Face:https://huggingface.co/Qwen/Qwen-7B-Chat

ModelScope:https://modelscope.cn/studios/qwen/Qwen-7B-Chat-Demo/summary/

TopGpt:https://www.topgpt.one

事实上,阿里云在今年4月份推出了通用问答聊天机器人,算得上是较早的开发者。然而,在早期阶段,该项目采用了内部测试制度,因此对外开放的用户数量并不多。

时至今日,已过去了将近4个月的时间,国内的大型模型发展已经形成了一场激烈的竞争战。而此时,阿里云选择在开源领域继续前进,对于用户来说,无疑是喜闻乐见的消息。

阿里云之所以选择开源这两款模型,是因为开源模型能够赢得用户的支持。开源的优势在于能够吸引更多的开发者参与其中,共同改进模型的性能和功能。

同时,开源模型也能够避免封闭式的开发,引起他人的关注和审查。这对于保护用户的隐私和数据安全非常重要。如果模型不开源,可能会引发人们对于模型中是否存在安全漏洞或潜在风险的担忧。

当然,现在大型模型的热度可能有所下降,但阿里云选择开源模型仍然是为了保持竞争力。开源模型不仅可以吸引更多的用户,还可以通过众包的方式快速获得反馈和改进。

快速入门文档

在本地使用需要先安装环境,您也可以直接获取官方镜像安装在本地。

下载并安装ModelScope library

更多关于下载安装ModelScope library的问题参考环境安装

pip install modelscope

模型加载和推理

更多关于模型加载和推理的问题参考模型的推理Pipeline。

import os
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks model_id = 'qwen/Qwen-7B-Chat' pipe = pipeline(
task=Tasks.chat, model=model_id, device_map='auto')
history = None text = '浙江的省会在哪里?'
results = pipe(text, history=history)
response, history = results['response'], results['history']
print(f'Response: {response}')
text = '它有什么好玩的地方呢?'
results = pipe(text, history=history)
response, history = results['response'], results['history']
print(f'Response: {response}')
"""
Response: 浙江的省会是杭州。
Response: 杭州是一座历史悠久、文化底蕴深厚的城市,拥有许多著名景点,如西湖、西溪湿地、灵隐寺、千岛湖等,其中西湖是杭州最著名的景点,被誉为“天下第一湖”。此外,杭州还有许多古迹、文化街区、美食和艺术空间等,值得一去。
"""

使用

当然,你也可以直接在modelscope平台使用Qwen-7B-Chat模型,地址链接:https://modelscope.cn/studios/qwen/Qwen-7B-Chat-Demo/summary

拿来比较发现,确实还是逊色很多,毕竟还是刚开源阶段,但我相信总有一天国内的大模型可以媲美;

结语

最后,我想分享一下对于QWen-7B/QWen-7b-Chat的个人看法。近期,大型模型的热度逐渐消退,这也是有原因的。我认为,这主要有两个方面的原因。

首先,用户的新鲜感逐渐减弱。起初,很多用户因为好奇心而去尝试各种新产品,但随着可供选择的产品越来越多,并且经过长期的使用和体验,大型模型逐渐失去了其"神秘感"。然而,尽管新鲜感逐渐消退,仍然有一部分用户真正希望通过人工智能提升生产力,这部分用户占比并不大。

其次,市场投资者对于AI大型模型的热情也逐渐降温。一方面,这受到用户数量增长趋于平缓的影响,另一方面,目前的大型模型还没有找到良好的发展路径和盈利模式。

然而,对于互联网公司来说,面对人工智能和AI的不可阻挡的发展趋势,大型模型的研发是一条不能放弃的道路。你可以做得不好,但不能没有所作为。在这种情况下,像阿里云这样选择采用开源模型来维持在领域中竞争地位的公司,无疑是一个不错的选择。

这一点可以参考OpenAI,他们在逐步走向商业化之后,选择了不开源,甚至在GPT-4模型发布后,其模型结构、参数和训练细节等都不再对外公开,以至于很多人戏称OpenAI应该改名为CloseAI。然而,越是不开源,越是吸引他人的关注,最终可能导致自身形象受损。最近发生的GPT-4模型信息泄露事件就是很好的例子,有人在网上泄露了一份详细解析GPT-4技术细节的文档,尽管OpenAI并未做出任何回应,但很多人都认为这份文件应该是真实的。

综上所述,开源模型能够赢得用户的支持,并且能够避免引起他人的关注和潜在风险。阿里云选择开源QWen-7B和QWen-7b-Chat模型,既能保护用户的隐私和数据安全,又能提高模型的性能和功能。我期待着看到这两款模型在未来的发展中取得更大的成功。

【必看!】阿里云推出QWen-7B和QWen-7b-Chat,开放免费商用!的更多相关文章

  1. 光环国际联合阿里云推出“AI智客计划”

    2018阿里巴巴云栖大会深圳峰会3月28日.29日在大中华喜来登酒店举行,阿里云全面展示智能城市.智能汽车.智能生活.智能制造等产业创新. 3月28日下午,以"深化产教融合,科技赋能育人才& ...

  2. 全球首个百万IOPS云盘即将商业化 阿里云推出超高性能云盘ESSD

    近日,在经过近半年的上线公测后,阿里云全球首个跨入IOPS百万时代的云盘——ESSD即将迎来商业化,单盘IOPS高达100万,这是阿里云迄今为止性能最强的企业级块存储服务. 搭配ECS云服务器使用, ...

  3. [cnBeta]阿里云推出全栈IPv6解决方案 加速推进下一代互联网应用

    https://www.cnbeta.com/articles/tech/795695.htm 访问: 阿里云 - 最高1888元通用代金券立即可用 作为国内首个全面支持IPv6的云厂商,过去5个月, ...

  4. 阿里云推出SRT+杜比全景声直播方案,低成本打造高质量直播观感体验

    超过200个国家和地区共5144万人观看:浙江卫视.东方卫视55城总收视达2.39,稳居同时段市场第一:优酷直播间63%观看晚会的用户参与了互动:微博68.2亿的主话题阅读量:2019天猫双11狂欢夜 ...

  5. 选择困难症必看!云服务器如何选择操作系统,Windows和Linux哪个更好?

    在购买云服务器时,会有一个必选的配置,就是操作系统的选择,如何选择操作系统?操作系统选择错了怎么办?这是不少用户会遇到的问题,今天我们就来教大家如何选择操作系统,以及操作系统选择错了,该怎么切换. W ...

  6. 有关阿里云对SaaS行业的思考,看这一篇就够了

    过去二十年,随着改革开放的深化,以及中国的人口红利等因素,中国诞生了大批To C的高市值互联网巨头,2C的领域高速发展,而2B领域一直不温不火.近两年来,在C端流量饱和,B端数字化转型来临的背景下,中 ...

  7. 体验阿里云SSD云盘+ECS(I/O优化)的性能

    阿里云推出SSD云盘+I/O优化的ECS已有一段时间,这个功能优化可以为ECS服务器与SSD云盘提供更好的网络能力.据阿里云官网介绍,SSD云盘最高提供20000次随机读写IOPS.256MB/S吞吐 ...

  8. 阿里云Centos配置iptables防火墙

    虽说阿里云推出了云盾服务,但是自己再加一层防火墙总归是更安全些,下面是我在阿里云vps上配置防火墙的过程,目前只配置INPUT.OUTPUT和FORWORD都是ACCEPT的规则 一.检查iptabl ...

  9. 阿里云CentOS配置iptables防火墙[转]

    虽说阿里云推出了云盾服务,但是自己再加一层防火墙总归是更安全些,下面是我在阿里云vps上配置防火墙的过程,目前只配置INPUT.OUTPUT和FORWORD都是ACCEPT的规则 一.检查iptabl ...

  10. 阿里云正式上线移动直播问答解决方案,助力APP尽情“撒币”!

    2018年伊始,互联网圈就刮起了一阵"大佬狂撒币,网友喜答题"的热潮.以映客芝士超人等为代表的直播问答平台,通过答题分奖金的互动模式,迅速引爆网络热点.随后,多个直播和视频平台也上 ...

随机推荐

  1. Prism Sample 7 Module xaml

    这一节使用xaml标记甚为不解. 本节注册module 的方式同directory一节很类似.在那一节中,用工厂方法创建一模块目录: protected override IModuleCatalog ...

  2. AutoGPT:有手就会的安装教程

    AutoGPT 是什么 Auto-GPT 是一个实验性开源应用程序,展示了 GPT-4 语言模型的功能.该程序由 GPT-4 驱动,将 LLM 的"思想"链接在一起,以自主实现您设 ...

  3. Windows下cygwin编译redis源码

    准备环境 安装cygwin64 下载地址:https://www.cygwin.com/运行安装程序,一直下一步选择阿里镜像,目前试过163,会比阿里慢需要选择的包有make.pkg-config.p ...

  4. 数据库定时备份linux篇

    目录 1 序言 2 crond 相关知识点 2.1 crond 是什么? 2.2 crontab 进行定时任务设置 2.2.1 crontab 指令选项说明 2.2.2 crontab 指令使用格式 ...

  5. VB.NET 截取字符串

    在VB.NET中,您可以使用Substring方法或Split方法来截取字符串. Substring方法允许您从字符串中提取一个子字符串,该子字符串从指定的起始索引开始,并继续到字符串的末尾或指定的长 ...

  6. Element-DatePicker的宽度

    Element如何修改DatePicker的宽度 方法/步骤 1 打开一个vue文件,添加DatePicker日期选择器组件,设置默认日期为null.如图 2 在组件上添加style样式属性,设置wi ...

  7. STL-vector(ACM)

    1.长度可变的数组 2.这里不是很懂,v.size() 代码源里说这个v.size()是无符号类型的,使用时要说明类型, 但是我在使用时并没有出现warning,有大佬知道原因吗? 前置板子 3.ve ...

  8. 浏览器输入URL到网页完全呈现的过程

    前言 临近计算机网络期末考试, 最近在复习(预习), 写一遍博客讲解加深印象. 浏览器输入URL过程图 浏览器输入 URL 过程: 当用户在网页上输入网址 URL 后, 浏览器会对网址进行 DNS 域 ...

  9. CKS 考试题整理 (14)-启用API Server认证

    Context 由 kubeadm 创建的cluster 的kubernetes API 服务器,出于测试目的, 临时配置允许未经身份验证和未经授权的访问,授予匿名用户 cluster-admin 的 ...

  10. ClickHouse技术研究及语法简介

    本文对Clickhouse架构原理.语法.性能特点做一定研究,同时将其与mysql.elasticsearch.tidb做横向对比,并重点分析与mysql的语法差异,为有mysql迁移clickhou ...