ChatGPT 火了，一大批开源平替也来了

ChatGPT 凭一己之力让全球为 AI 沸腾，引发了科技巨头之间的聊天机器人军备竞赛。

众所周知，ChatGPT 的背后技术是 GPT（Generative Pre-trained Transformer）模型。GPT 是一种基于 Transformer 模型的自然语言处理模型，由 OpenAI 公司开发。它可以通过学习大量的自然语言数据来生成自然流畅的文本，例如文章、对话等。

2019 年 11 月，OpenAI 开源了 GPT-2 语言模型的完整版本（有 15 亿个参数）。GPT-2 是作为 OpenAI 2018 年 GPT 模型的 "直接扩展" 而创建的，其参数和训练数据集的大小都增加了 10 倍。

在 GPT-2 之后，OpenAI 又推出了 1750 亿个参数的 GPT-3，只是其源代码从未被公开。OpenAI 认为 GPT-3 可能被滥用，因此不应开源。包括后来的 GPT-3.5、GPT-4 都没有开源。目前，公开免费版 ChatGPT 仍然基于 GPT-3.5，不过按月订阅 “ChatGPT Plus” 的用户能够试用由 GPT-4 提供支持的更新版本的 ChatGPT。

尽管 ChatGPT 没有开源，但趁着这波热度，还是有不少类似的开源项目出现，GitHub 已经有人做个了替代 ChatGPT 的开源项目列表。

lucidrains/PaLM-rlhf-pytorch

这是一个类似于 ChatGPT 的模型，但使用的是 PaLM 架构。在 PaLM 架构之上实现了 RLHF（人类反馈强化学习）。

注：只有源代码，没有数据，没有模型权重，没有聊天系统。

togethercomputer/OpenChatKit

OpenChatKit 提供了一个强大的开源基础，可以为各种应用程序创建专用和通用聊天机器人。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

oobabooga/text-generation-webui

它是一个用于运行 GPT-J 6B、OPT、GALACTICA、LLaMA 和 Pygmalion 等大型语言模型的 gradio web UI。其目标是成为文本生成领域的 AUTOMATIC1111/stable-diffusion-webui。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

KoboldAI/KoboldAI-Client

这是一个基于浏览器的前端，用于使用多个本地和远程 AI 模型进行 AI 辅助写作。它提供一系列标准工具，包括内存、作者笔记、世界信息、保存和加载、可调整的 AI 设置、格式化选项，以及导入现有 AI Dungeon 冒险的能力。您还可以打开冒险模式并像 AI Dungeon Unleashed 一样玩游戏。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

LAION-AI/Open-Assistant

OpenAssistant 是一个基于聊天的助手，可以理解任务，可以与第三方系统交互，并为此动态检索信息。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

tatsu-lab/stanford_alpaca

这是 Stanford Alpaca 项目的 repo，该项目旨在构建和共享指令遵循的 LLaMA 模型。

注：半开源、非真正开源、基于封闭模型等...

BlinkDL/ChatRWKV

ChatRWKV 类似于 ChatGPT，但由 RWKV（100% RNN）语言模型提供支持，并且是开源的。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

THUDM/ChatGLM-6B

ChatGLM-6B 是一个基于通用语言模型（GLM）框架的开放式双语语言模型，拥有 62 亿个参数。借助量化技术，用户可以在消费级显卡上进行本地部署（INT4 量化级别仅需 6GB GPU 显存）。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

bigscience-workshop/xmtf

此存储库概述了用于创建 BLOOMZ & mT0 和 xP3 的所有组件，这些组件在通过多任务微调进行跨语言泛化一文中介绍。

注：有数据，有模型权重，通过 API 可以实现基础的聊天功能。

carperai/trlx

这是一个用于通过人类反馈（RLHF）进行语言模型分布式训练的代码库，用于微调 GPT 模型以生成聊天文本的工具，支持在线 RL 训练多达 20 亿个参数的模型，以及离线 RL 训练更大的模型。

注：注：只有源代码，没有数据，没有模型权重，没有聊天系统。

databrickslabs/dolly

该模型基于 pythia-12b 进行训练，使用了约 15,000 条指令 / 响应微调记录，这些记录是由 Databricks 员工在 InstructGPT 论文的能力领域中生成的 databricks-dolly-15k。

注：有数据，有模型权重，通过 API 可以实现基础的聊天功能。

LianjiaTech/BELLE

本项目的目标是推动中文大型会话模型开源社区的发展。该项目在原有的 Stanford Alpaca 基础上优化了中文性能。模型微调仅使用通过 ChatGPT 生成的数据（没有其他数据）。此 repo 包含 175 个用于生成数据的中文种子任务、用于生成数据的代码、用于微调模型的 0.5M 生成数据等等。

注：有数据，有模型权重，通过 API 可以实现基础的聊天功能。

ethanyanjiali/minChatGPT

这个示例演示了如何使用 RLHF 技术对齐语言模型，使其能够生成类似于 ChatGPT 的聊天文本。

注：有数据，有模型权重，通过 API 可以实现基础的聊天功能。

cerebras/Cerebras-GPT

7 个开源 GPT-3 样式模型，参数范围从 1.11 亿到 130 亿，使用 Chinchilla 公式训练。模型权重已在宽松许可下发布（特别是 Apache 2.0 许可）。

注：有数据，有模型权重，通过 API 可以实现基础的聊天功能。

TavernAI/TavernAI

一款主题风格是冒险和探险的聊天机器人，默认 AI 语言模型是 Pygmalion，还包括其他语言模型，比如 KoboldAI、ChatGPT、GPT-4 等。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

Cohee1207/SillyTavern

SillyTavern 是 TavernAI 1.2.8 的一个分支，目前正在积极开发中，并添加了许多主要功能。现在，它们可以被视为完全独立的程序。Tavern 是一个用户界面，它需要与一个 AI 系统后端配合使用，才能发挥作用。有多种支持的后端可供选择，包括 OpenAPI API（GPT）、KoboldAI（可以在本地运行或在 Google Colab 上运行）等。

注：有完整数据，有模型权重，包括 TUI 和 GUI 的精致聊天系统。

ChatGPT 这阵风刮得这么猛，GOTC 2023 怎会错过？

5 月 27 日至 28 日，GOTC 2023 将在上海召开， AIGC (AI Generated Content，AI 生成内容) 将成为本次大会的重头戏。尤其是在 “AI is Everywhere” 分论坛上，诸多 AI 专家将深入探讨 AIGC 背后的技术。

全球开源技术峰会（Global Open-source Technology Conference），简称 GOTC，是由开放原子开源基金会、 Linux 基金会亚太区、上海浦东软件园和开源中国联合发起的，面向全球开发者的一场盛大开源技术盛宴。 5 月 27 日至 28 日，GOTC 2023 将于上海举办为期 2 天的开源行业盛会。大会将以行业展览、主题发言、特别论坛、分论坛的形式展现，与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题，以及开源社区、AIGC、汽车软件、开源商业化、开源教育培训、云原生等热门话题，探讨开源未来，助力开源发展。

GOTC 2023 报名通道现已开启，诚邀全球各技术领域开源爱好者共襄盛举！

参会报名，请访问： https://www.bagevent.com/event/8387611

ChatGPT 火了，一大批开源平替也来了的更多相关文章

我用ChatGPT做直播技术选型，卷死了同事
摘要近两年即时通讯/直播产品炙手可热,市场上针对ToB的产品日益增多,企业该如何去选型呢?本文分享了笔者对于直播产品的思考,将从直播SDK实例功能特性.常见业务场景.注意事项及最佳实践等方面介绍如何 ...
Python+chatGPT编程5分钟快速上手，强烈推荐！！！
最近一段时间chatGPT火爆出圈!无论是在互联网行业,还是其他各行业都赚足了话题. 俗话说:"外行看笑话,内行看门道",今天从chatGPT个人体验感受以及如何用的角度来分享一下 ...
Android病毒分析基础（二）—ChatGPT提问技巧
今天我们来用最近比较火的"ChatGPT"学习一下Android病毒分析基础,看看和我们之前学的有什么不同,又能学习到什么新的东西,同时了解一下"ChatGPT" ...
思考20230208-关于chatGPT
最近的ChatGPT火了,我今天FQ.充了1 USD买了个虚拟手机号创建了openAI 的账号,试了一把,它的表现令我叹为观止.他已经不再是简单的基于海量数据在网络上搜索已有的答案,而是会根据用户的想 ...
从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史（转载）
转载 https://zhuanlan.zhihu.com/p/49271699 首发于深度学习前沿笔记写文章从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史张 ...
【开源】OSharp3.3框架解说系列：重新开源及3.3版本新特性
OSharp是什么? OSharp是个快速开发框架,但不是一个大而全的包罗万象的框架,严格的说,OSharp中什么都没有实现.与其他大而全的框架最大的不同点,就是OSharp只做抽象封装,不做实现.依 ...
盘点 PHP 和 ASP.NET 的10大对比！
[编者按]本文主要针对开源 PHP 和非开源的 ASP.NET 在性能.成本.可扩展性,技术支持和复杂性等方面进行比较. 在网上论坛,总是有成百上千的文章和帖子在讨论 PHP 和 ASP.NET,究竟 ...
pyDash：一个基于 web 的 Linux 性能监测工具
pyDash 是一个轻量且基于 web 的 Linux 性能监测工具,它是用 Python 和 Django 加上 Chart.js 来写的.经测试,在下面这些主流 Linux 发行版上可运行:Cen ...
剑指Kubernetes 揭秘腾讯云的PaaS技术选型策略
1.前言 Kubernetes 很火,一大批互联网公司早已领先一步,搭建起专有的 PaaS平台,传统企业们看到的 Kubernetes的趋势,亦不甘落后,在试水的道上一路狂奔-- 虽然,Kuberne ...
开源ERP-成功案例分析(3)
Odoo用户概要关于Odoo全球的用户,我们来看一些数据: Odoo目前全球有300万使用者 Odoo系统上每天新创建的数据库超过1000个 Odoo和Word.Excel.PowerPoint一样 ...

随机推荐

Codeforces Round #529 (Div. 3) 练习赛
Examples input 6 baabbb output bab input 10 ooopppssss output oops 思路: 模拟等差数列即可 #include<bits/std ...
AtCoder Beginner Contest 194 Editorial
A - I Scream 根据奶脂率和乳脂率判断是何种冰淇淋 int main() { ios_base::sync_with_stdio(false), cin.tie(0); int a, ...
Centos7 kubeadm安装k8s
安装环境准备关闭防火墙 systemctl stop firewalld systemctl disable firewalld 关闭selinux sed -i 's/enforcing/disa ...
13、SpringBoot-配置文件里密码加密
系列导航 springBoot项目打jar包 1.springboot工程新建(单模块) 2.springboot创建多模块工程 3.springboot连接数据库 4.SpringBoot连接数据库 ...
kafka集群三、增加密码验证
系列导航一.kafka搭建-单机版二.kafka搭建-集群搭建三.kafka集群增加密码验证四.kafka集群权限增加ACL 五.kafka集群__consumer_offsets副本数修改 ...
【驱动】以太网扫盲（三）PHY的控制器驱动框架分析
1. 概述 PHY芯片为OSI的最底层-物理层(Physical Layer),通过MII/GMII/RMII/SGMII/XGMII等多种媒体独立接口(介质无关接口)与数据链路层的MAC芯片相连,并 ...
freeswitch的gateway配置方案优化
概述 freeswitch是一款简单好用的VOIP开源软交换平台. 在之前的文章中,我们简单介绍过gateway的三种配置方案,但是实际应用之后发现,方案中的参数设置有缺陷,会导致一些问题. 本文档中 ...
Ceph学习笔记（1）- 架构概述
简介 Ceph的目标是采用商业硬件来构建大规模的.具有高可用.高扩展.高性能的分布式存储系统,ceph具有如下特点: 软件定义存储:Ceph不需要特定的硬件,在主流的Linux发行版等类Unix操作系 ...
java进阶(12)--8种数据包装类型、Integer、常用方法
一.基本数据类型与包装类型 8种基本数据类型,对应的包装类,父类 1.byte-->java.lang.Byte-->Number 2.short-->java.lang.Short ...
Liunx常用操作(九)-进阶命令
一.查看用户who 1.查看所有用户:who

ChatGPT 火了，一大批开源平替也来了

随机推荐

热门专题