基于Llama2模型的开源模型
2023年7月18日Meta开源了Llama2,在2万亿个Token上训练,可用于商业和研究,包括从7B到70B模型权重、预训练和微调的代码。相比Llama1,Llama2有较多提升,评估结果如下所示:
基于Llama2模型的开源模型如下所示:
1.WizardCoder Python V1.0
https://huggingface.co/WizardLM/WizardCoder-Python-13B-V1.0
https://huggingface.co/WizardLM/WizardCoder-Python-34B-V1.0
2.Phind Code Llama v1
https://huggingface.co/Phind/Phind-CodeLlama-34B-v1
https://huggingface.co/Phind/Phind-CodeLlama-34B-Python-v1
3.WizardLM 70B V1.0
https://huggingface.co/WizardLM/WizardLM-70B-V1.0
4.Dophin Llama 2 7B
https://huggingface.co/ehartford/dolphin-llama2-7b
5.Airoboros L2 2.0
https://huggingface.co/jondurbin/airoboros-l2-7b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-l2-13b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-33b-gpt4-2.0
https://huggingface.co/jondurbin/airoboros-l2-70b-gpt4-2.0
6.OpenOrca Preview2 13B
https://huggingface.co/Open-Orca/OpenOrcaxOpenChat-Preview2-13B
7.Vicuna v1.5 16k
https://huggingface.co/lmsys/vicuna-7b-v1.5-16k
https://huggingface.co/lmsys/vicuna-13b-v1.5-16k
8.Vicuna v1.5
https://huggingface.co/lmsys/vicuna-7b-v1.5
https://huggingface.co/lmsys/vicuna-13b-v1.5
9.Hermes LLongMA-2 8k
https://huggingface.co/conceptofmind/Hermes-LLongMA-2-7b-8k
https://huggingface.co/conceptofmind/Hermes-LLongMA-2-13b-8k
10.OpenChat V3.2
https://huggingface.co/openchat/openchat_v3.2
11.Llama 2 70B Instruct v2
https://huggingface.co/upstage/Llama-2-70b-instruct-v2
12.StableBeluga
https://huggingface.co/stabilityai/StableBeluga-7B
https://huggingface.co/stabilityai/StableBeluga-13B
https://huggingface.co/stabilityai/StableBeluga2
13.Holodeck
https://huggingface.co/KoboldAI/LLAMA2-13B-Holodeck-1
https://huggingface.co/KoboldAI/LLAMA2-13B-Holodeck-1-GGML
14.Llama 2 7B 32K
https://huggingface.co/togethercomputer/LLaMA-2-7B-32K
15.Kimiko
https://huggingface.co/nRuaif/Kimiko_7B
https://huggingface.co/nRuaif/Kimiko_13B
v16.LLongMA 2 16k**
https://huggingface.co/conceptofmind/LLongMA-2-7b-16k
https://huggingface.co/conceptofmind/LLongMA-2-13b-16k
17.Airoboros L2 GPT4 1.4.1
https://huggingface.co/jondurbin/airoboros-l2-7b-gpt4-1.4.1
https://huggingface.co/jondurbin/airoboros-l2-13b-gpt4-1.4.1
https://huggingface.co/jondurbin/airoboros-l2-70b-gpt4-1.4.1
**18.Llama 2 13B Orca 8kv
https://huggingface.co/OpenAssistant/llama2-13b-orca-8k-3319
19.WizardLM 13B V1.2
https://huggingface.co/WizardLM/WizardLM-13B-V1.2
20.LLongMA 2 8k
https://huggingface.co/conceptofmind/LLongMA-2-7b
https://huggingface.co/conceptofmind/LLongMA-2-13b
21.Nous Hermes Llama 2
https://huggingface.co/NousResearch/Nous-Hermes-llama-2-7b
https://huggingface.co/NousResearch/Nous-Hermes-llama-2-7b-GGML
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b-GGML
https://huggingface.co/NousResearch/Nous-Hermes-Llama2-13b-GPTQ
22.Redmond Puffin 13B
https://huggingface.co/NousResearch/Redmond-Puffin-13B
https://huggingface.co/NousResearch/Redmond-Puffin-13B-GGML
23.Llama 2 7B Uncensored
https://huggingface.co/georgesung/llama2_7b_chat_uncensored
24.Luna AI 7B Chat Uncensored
https://huggingface.co/Tap-M/Luna-AI-Llama2-Uncensored
25.Guanaco Llama 2
https://huggingface.co/Mikael110/llama-2-7b-guanaco-fp16
https://huggingface.co/Mikael110/llama-2-13b-guanaco-fp16
https://huggingface.co/Mikael110/llama-2-70b-guanaco-qlora
26.Chinese Llama 2 7B
https://github.com/LinkSoul-AI/Chinese-Llama-2-7b
27.llama2-Chinese-chat
https://github.com/CrazyBoyM/llama2-Chinese-chat
参考文献:
[1]https://github.com/facebookresearch/llama
[2]https://github.com/facebookresearch/llama-recipes/
[3]https://ai.meta.com/resources/models-and-libraries/llama-downloads/
[4]https://github.com/facebookresearch/llama/blob/main/MODEL_CARD.md
[5]https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/
[6]https://ai.meta.com/resources/models-and-libraries/llama/
[7]https://github.com/ovh/ai-training-examples/blob/main/notebooks/natural-language-processing/llm/miniconda/llama2-fine-tuning/llama_2_finetuning.ipynb
[8]https://blog.ovhcloud.com/fine-tuning-llama-2-models-using-a-single-gpu-qlora-and-ai-notebooks/
[9]https://www.reddit.com/r/LocalLLaMA/wiki/models/
[10]大模型评测:https://opencompass.org.cn/
基于Llama2模型的开源模型的更多相关文章
- 基于PaddlePaddle的语义匹配模型DAM,让聊天机器人实现完美回复 |
来源商业新知网,原标题:让聊天机器人完美回复 | 基于PaddlePaddle的语义匹配模型DAM 语义匹配 语义匹配是NLP的一项重要应用.无论是问答系统.对话系统还是智能客服,都可以认为是问题和回 ...
- 全球首个开放应用模型 OAM 开源 | 云原生生态周报 Vol. 23
作者 | 临石.元毅.冬岛.衷源.天元 业界要闻 全球首个开放应用模型 OAM 开源 2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon ...
- 全球首个开放应用模型 OAM 开源
业界要闻 全球首个开放应用模型 OAM 开源 2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon 上海重磅宣布,阿里云与微软联合推出开放应 ...
- 从开源模型、框架到自研,声网 Web 端虚拟背景算法正式发布
根据研究发现,在平均 38 分钟的视频会议里面,大概会有 13 分钟左右的时间用于处理和干扰相关的事情.同时研究也表明在参加在线会议的时候,人们更加倾向于语音会议,其中一个关键原因就是大家不希望个人隐 ...
- 基于git的源代码管理模型——git flow
基于git的源代码管理模型--git flow A successful Git branching model
- 详解Linux2.6内核中基于platform机制的驱动模型 (经典)
[摘要]本文以Linux 2.6.25 内核为例,分析了基于platform总线的驱动模型.首先介绍了Platform总线的基本概念,接着介绍了platform device和platform dri ...
- 【神经网络篇】--基于数据集cifa10的经典模型实例
一.前述 本文分享一篇基于数据集cifa10的经典模型架构和代码. 二.代码 import tensorflow as tf import numpy as np import math import ...
- 基于MATLAB搭建的DDS模型
基于MATLAB搭建的DDS模型 说明: 累加器输出ufix_16_6数据,通过cast切除小数部分,在累加的过程中,带小数进行运算最后对结果进行处理,这样提高了计算精度. 关于ROM的使用: 直接设 ...
- 基于R语言的ARIMA模型
A IMA模型是一种著名的时间序列预测方法,主要是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型.ARIMA模型根据原序列是否平稳以及 ...
- 第13章 TCP编程(4)_基于自定义协议的多线程模型
7. 基于自定义协议的多线程模型 (1)服务端编程 ①主线程负责调用accept与客户端连接 ②当接受客户端连接后,创建子线程来服务客户端,以处理多客户端的并发访问. ③服务端接到的客户端信息后,回显 ...
随机推荐
- linux日常运维(一)
- 进程管理ps.top - 任务计划crontab 进程管理 概念:进程是在自身的虚拟地址空间运行的一个单独的程序. 进程和程序区别:程序只是一个静态的命令集合,不占系统的运行资源:而进程是一个随时 ...
- CCF PTA&中国科教工作者协会联合认证
首页 项目简介 条例规定 通知公告 组织机构 服务中心 联系我们 登录|注册 当前位置:首页 > 新闻动态 开放报名:CCF PTA&中国科教工作者协会联合认证 发布时间: 2023-0 ...
- RK3588平台产测之ArmSoM产品低温环境测试
1. 简介 专栏总目录 ArmSoM团队在产品量产之前都会对产品做几次专业化的功能测试以及性能压力测试,以此来保证产品的质量以及稳定性 优秀的产品都要进行严苛的多次全方位的功能测试以及性能压力测试才能 ...
- 循序渐进介绍基于CommunityToolkit.Mvvm 和HandyControl的WPF应用端开发(7) -- 图标列表展示和选择处理
我们在WPF应用端的界面中,使用lepoco/wpfui 来做主要的入口框架,这个项目它的菜单内置了不少图标,我们需要在动态菜单的配置中,使用它作为图标的展示处理,本篇随笔介绍如何基于图标枚举集合进行 ...
- IntersectionObserver v2版本
业务需要内容展示后日志打点,于是使用到了IntersectionObserver,实践中发现一个问题:如果内容出现在了可视区内,但是被其他元素遮挡住了,这时候仍然会打日志. 于是寻找解决方案,发现In ...
- 【Vue3响应式入门#01】Reactivity
专栏分享:vue2源码专栏,vue3源码专栏,vue router源码专栏,玩具项目专栏,硬核推荐 欢迎各位ITer关注点赞收藏 背景 以下是柏成根据Vue3官方课程整理的响应式书面文档 - 第一节, ...
- LVS负载均衡概念+三种模式
1.LVS负载均衡概念剖解: 1)LVS技术全称:Linux virtual Server ,Linux虚拟机服务器集群,1998由章文嵩博士设计.并且开源的,是中国最早的开源软件项目之一. 2) ...
- 如何使用markdown
关于如何使用markdown写博客 markdown的语法 代码的插入 电脑Table建上面上面的键输入三个点``` 然后输入语言+回车 c语言中第一个程序 #include<stdio.h&g ...
- Linux g++减小可执行文件大小
去掉参数-g,产生不带有调试信息的可执行文件 加上参数-O2,产生尽可能小和尽可能快的代码 strip 可执行文件 去掉目标文件中的一些符号表.调试符号表信息,以减小程序的大小 参考文献: g++重要 ...
- 文心一言 VS 讯飞星火 VS chatgpt (129)-- 算法导论11.1 4题
四.用go语言,我们希望在一个非常大的数组上,通过利用直接寻址的方式来实现一个字典.开始时该数组中可能包含一些无用信息,但要对整个数组进行初始化是不太实际的,因为该数组的规模太大.请给出在大数组上实现 ...