2023年7月18日Meta开源了Llama2,在2万亿个Token上训练,可用于商业和研究,包括从7B到70B模型权重、预训练和微调的代码。相比Llama1,Llama2有较多提升,评估结果如下所示:

基于Llama2模型的开源模型如下所示:

1.WizardCoder Python V1.0

https://huggingface.co/WizardLM/WizardCoder-Python-13B-V1.0
https://huggingface.co/WizardLM/WizardCoder-Python-34B-V1.0

2.Phind Code Llama v1

https://huggingface.co/Phind/Phind-CodeLlama-34B-v1
https://huggingface.co/Phind/Phind-CodeLlama-34B-Python-v1

3.WizardLM 70B V1.0

https://huggingface.co/WizardLM/WizardLM-70B-V1.0

4.Dophin Llama 2 7B

https://huggingface.co/ehartford/dolphin-llama2-7b

5.Airoboros L2 2.0

https://huggingface.co/jondurbin/airoboros-l2-7b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-l2-13b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-33b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-l2-70b-gpt4-2.0

6.OpenOrca Preview2 13B

https://huggingface.co/Open-Orca/OpenOrcaxOpenChat-Preview2-13B

7.Vicuna v1.5 16k

https://huggingface.co/lmsys/vicuna-7b-v1.5-16k
https://huggingface.co/lmsys/vicuna-13b-v1.5-16k

8.Vicuna v1.5

https://huggingface.co/lmsys/vicuna-7b-v1.5
https://huggingface.co/lmsys/vicuna-13b-v1.5

9.Hermes LLongMA-2 8k

https://huggingface.co/conceptofmind/Hermes-LLongMA-2-7b-8k
https://huggingface.co/conceptofmind/Hermes-LLongMA-2-13b-8k

10.OpenChat V3.2

https://huggingface.co/openchat/openchat_v3.2

11.Llama 2 70B Instruct v2

https://huggingface.co/upstage/Llama-2-70b-instruct-v2

12.StableBeluga

https://huggingface.co/stabilityai/StableBeluga-7B
https://huggingface.co/stabilityai/StableBeluga-13B
https://huggingface.co/stabilityai/StableBeluga2

13.Holodeck

https://huggingface.co/KoboldAI/LLAMA2-13B-Holodeck-1
https://huggingface.co/KoboldAI/LLAMA2-13B-Holodeck-1-GGML

14.Llama 2 7B 32K

https://huggingface.co/togethercomputer/LLaMA-2-7B-32K

15.Kimiko

https://huggingface.co/nRuaif/Kimiko_7B
https://huggingface.co/nRuaif/Kimiko_13B

v16.LLongMA 2 16k**

https://huggingface.co/conceptofmind/LLongMA-2-7b-16k
https://huggingface.co/conceptofmind/LLongMA-2-13b-16k

17.Airoboros L2 GPT4 1.4.1

https://huggingface.co/jondurbin/airoboros-l2-7b-gpt4-1.4.1
https://huggingface.co/jondurbin/airoboros-l2-13b-gpt4-1.4.1
https://huggingface.co/jondurbin/airoboros-l2-70b-gpt4-1.4.1

**18.Llama 2 13B Orca 8kv

https://huggingface.co/OpenAssistant/llama2-13b-orca-8k-3319

19.WizardLM 13B V1.2

https://huggingface.co/WizardLM/WizardLM-13B-V1.2

20.LLongMA 2 8k

https://huggingface.co/conceptofmind/LLongMA-2-7b
https://huggingface.co/conceptofmind/LLongMA-2-13b

21.Nous Hermes Llama 2

https://huggingface.co/NousResearch/Nous-Hermes-llama-2-7b
https://huggingface.co/NousResearch/Nous-Hermes-llama-2-7b-GGML
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b-GGML
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b-GPTQ

22.Redmond Puffin 13B

https://huggingface.co/NousResearch/Redmond-Puffin-13B
https://huggingface.co/NousResearch/Redmond-Puffin-13B-GGML

23.Llama 2 7B Uncensored

https://huggingface.co/georgesung/llama2_7b_chat_uncensored

24.Luna AI 7B Chat Uncensored

https://huggingface.co/Tap-M/Luna-AI-Llama2-Uncensored

25.Guanaco Llama 2

https://huggingface.co/Mikael110/llama-2-7b-guanaco-fp16
https://huggingface.co/Mikael110/llama-2-13b-guanaco-fp16
https://huggingface.co/Mikael110/llama-2-70b-guanaco-qlora

26.Chinese Llama 2 7B

https://github.com/LinkSoul-AI/Chinese-Llama-2-7b

27.llama2-Chinese-chat

https://github.com/CrazyBoyM/llama2-Chinese-chat

参考文献:

[1]https://github.com/facebookresearch/llama

[2]https://github.com/facebookresearch/llama-recipes/

[3]https://ai.meta.com/resources/models-and-libraries/llama-downloads/

[4]https://github.com/facebookresearch/llama/blob/main/MODEL_CARD.md

[5]https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

[6]https://ai.meta.com/resources/models-and-libraries/llama/

[7]https://github.com/ovh/ai-training-examples/blob/main/notebooks/natural-language-processing/llm/miniconda/llama2-fine-tuning/llama_2_finetuning.ipynb

[8]https://blog.ovhcloud.com/fine-tuning-llama-2-models-using-a-single-gpu-qlora-and-ai-notebooks/

[9]https://www.reddit.com/r/LocalLLaMA/wiki/models/

[10]大模型评测:https://opencompass.org.cn/

基于Llama2模型的开源模型的更多相关文章

  1. 基于PaddlePaddle的语义匹配模型DAM,让聊天机器人实现完美回复 |

    来源商业新知网,原标题:让聊天机器人完美回复 | 基于PaddlePaddle的语义匹配模型DAM 语义匹配 语义匹配是NLP的一项重要应用.无论是问答系统.对话系统还是智能客服,都可以认为是问题和回 ...

  2. 全球首个开放应用模型 OAM 开源 | 云原生生态周报 Vol. 23

    作者 | 临石.元毅.冬岛.衷源.天元 业界要闻 全球首个开放应用模型 OAM 开源 2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon ...

  3. 全球首个开放应用模型 OAM 开源

    业界要闻 全球首个开放应用模型 OAM 开源 2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon 上海重磅宣布,阿里云与微软联合推出开放应 ...

  4. 从开源模型、框架到自研,声网 Web 端虚拟背景算法正式发布

    根据研究发现,在平均 38 分钟的视频会议里面,大概会有 13 分钟左右的时间用于处理和干扰相关的事情.同时研究也表明在参加在线会议的时候,人们更加倾向于语音会议,其中一个关键原因就是大家不希望个人隐 ...

  5. 基于git的源代码管理模型——git flow

    基于git的源代码管理模型--git flow A successful Git branching model

  6. 详解Linux2.6内核中基于platform机制的驱动模型 (经典)

    [摘要]本文以Linux 2.6.25 内核为例,分析了基于platform总线的驱动模型.首先介绍了Platform总线的基本概念,接着介绍了platform device和platform dri ...

  7. 【神经网络篇】--基于数据集cifa10的经典模型实例

    一.前述 本文分享一篇基于数据集cifa10的经典模型架构和代码. 二.代码 import tensorflow as tf import numpy as np import math import ...

  8. 基于MATLAB搭建的DDS模型

    基于MATLAB搭建的DDS模型 说明: 累加器输出ufix_16_6数据,通过cast切除小数部分,在累加的过程中,带小数进行运算最后对结果进行处理,这样提高了计算精度. 关于ROM的使用: 直接设 ...

  9. 基于R语言的ARIMA模型

    A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及 ...

  10. 第13章 TCP编程(4)_基于自定义协议的多线程模型

    7. 基于自定义协议的多线程模型 (1)服务端编程 ①主线程负责调用accept与客户端连接 ②当接受客户端连接后,创建子线程来服务客户端,以处理多客户端的并发访问. ③服务端接到的客户端信息后,回显 ...

随机推荐

  1. 中国科教工作者协会与CCF PTA联合认证学习须知

    中国科教工作者协会与CCF PTA联合认证学习须知 1.参与认证人员需在科技学堂(www.sciclass.cn)上进行课程学习,然后在PTA官网(pta.ccf.org.cn)报名并参加认证考试,考 ...

  2. MySQL快速导入千万条数据(2)

    目录 一.导入前1000万条数据 二.导入前2000万条数据 三.导入后面的1000万条数据 四.建索引 五.总结 接上文,继续测试3000万条记录快速导入数据库. 一.导入前1000万条数据 清库. ...

  3. 安装 mysql-community-server报错

    错误1. 报错: 所有的匹配结果均已经被参数的模块化过滤条件筛除: mysql-community-server 错误:没有任何匹配: mysql-community-server 解决办法: yum ...

  4. 【Azure Developer】在App Service上放置一个JS页面并引用msal.min.js成功获取AAD用户名示例

    问题描述 在App Service上放置一个JS页面并引用msal.min.js,目的是获取AAD用户名并展示. 问题解答 示例代码 <!DOCTYPE html> <html> ...

  5. 利用信号量SemaphoreSlim实现PaddleOCR的线程安全访问

    Wlkr.Core.ThreadUtils 项目背景 早在PaddleOCR 2.2版本时期,认识了周杰大佬的PaddleSharp项目,试用其中PaddleOCR时,发现它在改为web api调用时 ...

  6. 数据链路层传输协议(点到点):停等协议、GBN、SR协议

    数据链路层的传输协议:停等协议.GBN.SR 停止等待协议(单窗口的滑动窗口协议) 滑动窗口协议:GBN.SR GBN协议 GBN发送方需响应的三件事 1. 上层调用(网络层) 上层要发送数据时,发送 ...

  7. 使用LiME收集主机物理内存的内容时发生宕机

    作者 pengdonglin137@163.com 现象 在一台ARM64的Centos7虚拟机里加载 https://github.com/504ensicsLabs/LiME 编译出的内核模块时发 ...

  8. 美团面试:Redis 除了缓存还能做什么?可以做消息队列吗?

    这是一道面试中常见的 Redis 基础面试题,主要考察求职者对于 Redis 应用场景的了解. 即使不准备面试也建议看看,实际开发中也能够用到. 内容概览: Redis 除了做缓存,还能做什么? 分布 ...

  9. 从这里开始,跟我一起搞懂 MySQL!

    提前申明:<MySQL 基础实战>系列是学习极客时间林晓斌的<MySQL实战45讲>的整理和总结,希望大家仅做为学习使用! 架构示意图 Server 层:包括连接器.查询缓存. ...

  10. C++ 入门防爆零教程(上册)

    ## C++ 入门防爆零教程(上册) ######  C++ Introductory Explosion Proof Zero Tutorial(Volume $1$) 编写者:美公鸡(洛谷账号:b ...