【转帖】Meta 推出大型语言模型 LLaMA，比 GPT3.5 性能更高

https://finance.sina.com.cn/wm/2023-02-28/doc-imyihfvp8075151.shtml

ChatGPT 的爆火使得大家对 AI 进行了深度的讨论，大厂们也都在向公众展示他们所谓的 "生成性人工智能"已经准备好进入黄金时代。

近日，Meta 宣布推出大型语言模型 LLaMA（Large Language Model Meta AI），加入到由微软、谷歌等科技巨头主导的 AI“军备竞赛”中。同 ChatGPT、New Bing 不同，LLaMA 并不是一个任何人都可以与之对话的产品，也并未接入任何 Meta 应用。

公司 CEO 扎克伯格表示，LLaMA 旨在帮助研究人员推进研究工作，LLM（大型语言模型）在文本生成、问题回答、书面材料总结，以及自动证明数学定理、预测蛋白质结构等更复杂的方面也有很大的发展前景。能够降低生成式 AI 工具可能带来的“偏见、有毒评论、产生错误信息的可能性”等问题。

Meta 表示，LLaMA 可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者，正在接受研究人员的申请。

此外，LLaMA 将提供底层代码供用户使用，因此用户可以自行调整模型，并将其用于与研究相关的用例。

目前 Meta 在 GitHub 上提供了精简版 LLaMA。

比 GPT3.5 性能更高：参数规模小、训练数据多

Meta 目前提供有 70 亿、130 亿、330 亿和 650 亿四种参数规模的 LLaMA 模型。

在一些测试中，仅有 130 亿参数的 LLaMA 模型，性能表现超过了拥有 1750 亿参数的 GPT-3，而且能跑在单个 GPU 上；拥有 650 亿参数的 LLaMA 模型，能够媲美 700 亿参数的 Chinchilla 和拥有 5400 亿参数的 PaLM。

与此同时，所有规模的 LLaMA 模型，都至少经过了 1T（1万亿）个 token 的训练，这比其他相同规模的模型要多得多。例如，LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tokens 上训练，而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的训练。

与其他大型语言模型一样，LLaMA 的工作原理是将一系列 tokens 作为输入，并预测下一个单词以递归生成文本，Meta 使用了 20 种语言对其进行训练。

AI 能力结果评估

在常识推理方面 LLaMA 涵盖了八个标准常识性数据基准。这些数据集包括完形填空、多项选择题和问答等。

结果显示，拥有 650 亿参数的 LLaMA 在 BoolQ 以外的所有报告基准上均超过拥有 700 亿参数的 Chinchilla。

同时，除 BoolQ 和 WinoGrande 外，该模型测试中均超过拥有 5400 亿参数的 PaLM。拥有 130 亿参数的 LLaMA 模型在大多数基准测试上也优于拥有 1750 亿参数的 GPT-3。

闭卷答题和阅读理解方面，LLaMA-65B 几乎在所有基准上和 Chinchilla-70B 和 PaLM-540B 不相上下。

在数学推理方面，它在 GSM8k上的表现依然要优于 Minerva-62B。

在代码生成测试上，基于编程代码开源数据集 HumanEval 和小型数据集 MBPP，被评估的模型将会收到几个句子中的程序描述以及输入输出实例，然后生成一个符合描述并能够完成测试的Python程序。

LLaMA-62B 优于 cont-PaLM（62B）以及 PaLM-540B。

此外，在大规模多任务语言理解和训练期间的能力进化上，都有不错的表现

结语

Meta 的目标是在未来发布更大的模型，这些模型在更广泛的预训练数据集上进行训练，同时它观察到随着规模的扩大，性能也在稳步提高。

在这场争夺 AI 霸主地位的竞赛中，OpenAI 率先发布了 ChatGPT，谷歌很快以其 "实验性 "聊天机器人(16.710, 1.03, 6.57%) Bard 紧随其后，而中国科技巨头百度正计划以 Ernie Bot- ERNIE 3.0 进入战场。更不用说微软声称正建立在 "新的下一代 OpenAI 大型语言模型 "基础上的 Bing Chat（又名Sydney），它比 ChatGPT 更先进，而且还与 Bing 搜索整合。

大家也都在等待下一位官方声明，虽然 Meta 在这一领域进行了多次失败的尝试，但并没有被吓倒，它继续试验基于 LLM 的模型，成功推出 LLaMA。

随着其以前的模型在历史的尘埃中结束，每个人心中的问题是：Meta 这次真的能站出来吗？

AI 霸主之争还在持续升温，所有的目光都再次集中在 Meta 上，看看它是否有能力与大炮交锋。它是否能作为一个强有力的竞争者出现，还是像以前的模型那样，随着 LLaMA 的出现而逐渐消失？

未来，只有时间能证明。

参考链接：

https://analyticsindiamag.com/meta-launches-new-llm-llama-which-outperforms-gpt-3-at-a-fraction-of-the-size/

https://www.theverge.com/2023/2/24/23613512/meta-llama-ai-research-large-language-model

https://ai.facebook.com/blog/large-language-model-llama-meta-ai/

www.facebook.com

【转帖】Meta 推出大型语言模型 LLaMA，比 GPT3.5 性能更高的更多相关文章

GPT-NER：通过大型语言模型的命名实体识别
讲在前面,chatgpt出来的时候就想过将其利用在信息抽取方面,后续也发现了不少基于这种大语言模型的信息抽取的论文,比如之前收集过的: https://github.com/cocacola-lab/ ...
[转帖]央行推出数字货币DCEP：基于区块链技术、将取代现钞
央行推出数字货币DCEP:基于区块链技术.将取代现钞天天快报的内容. 密码财经 2019-10-29 18:15 关注前不久的10月23日,Facebook的首席执行官扎克伯格在美国国会听证会 ...
大型网站调试工具之一（php性能优化分析工具XDebug）
一.安装配置 1.下载PHP的XDebug扩展,网址:http://xdebug.org/ 2.在Linux下编译安装XDebug 引用 tar -xzf xdebug-2.0.0RC3.gzcd x ...
[转帖]高通推出八核笔电处理器骁龙8cx 能超英特尔吗？
高通推出八核笔电处理器骁龙8cx 能超英特尔吗? https://baijiahao.baidu.com/s?id=1619154699684981202&wfr=spider&for ...
[转帖]从Intel和ARM争霸，谈芯片前世今生
从Intel和ARM争霸,谈芯片前世今生 http://www.itpub.net/2019/07/24/2476/ 长文预警, 写的非常好.. 我尽量写得轻松一些,因为其实这个话题很有趣,仔细探究起 ...
Imec推出高性能芯片的低成本冷却解决方案
Imec推出高性能芯片的低成本冷却解决方案 Imec unveils low-cost cooling solution for high-performance chips 3D打印冷却器优于传统解 ...
.Net 大型分布式基础服务架构横向演变概述
一. 业务背景构建具备高可用,高扩展性,高性能,能承载高并发,大流量的分布式电子商务平台,支持用户,订单,采购,物流,配送,财务等多个项目的协作,便于后续运营报表,分析,便于运维及监控. 二. 基础 ...
.Net 大型分布式基础服务架构横向演变概述(转)
一. 业务背景构建具备高可用,高扩展性,高性能,能承载高并发,大流量的分布式电子商务平台,支持用户,订单,采购,物流,配送,财务等多个项目的协作,便于后续运营报表,分析,便于运维及监控. 二. 基础 ...
【转载】.Net 大型分布式基础服务架构横向演变概述
原文:https://www.cnblogs.com/chejiangyi/p/5220217.html 一. 业务背景构建具备高可用,高扩展性,高性能,能承载高并发,大流量的分布式电子商务平台,支 ...
[转帖]armel、armhf和arm64
armel.armhf和arm64 转帖 1 这些名词是什么的缩写 1.1 armel 是arm eabi little endian的缩写.eabi是软浮点二进制接口,这里的e是embeded,是对 ...

随机推荐

2021-01-25：redis中，哨兵如何选举？
福哥答案2021-01-25: 答案1: redis-sentinel故障转移的流程: 1.当多个sentinel发现并确认了master有问题. 2.接着会选举出一个sentinel作为领导. 3. ...
Java PDF文档转换 — PDF转Excel、SVG转PDF
概述 Spire.PDF for Java支持将PDF文档高质量地转换为XPS.图片.SVG.Word.HTML和PDF/A格式,以及支持将XPS.HTML文档转换为PDF格式.本文将通过代码演示来介 ...
教你如何基于MindSpore进行ChatGLM微调
本文分享自华为云社区<基于MindSpore的ChatGLM微调>,作者: JeffDing . 基于MindSpore的ChatGLM微调克隆Hugging Face模型克隆chat ...
史上最强DIY，手工制作一只会说话的机器狗
摘要:波士顿动力的机器狗,想要么?快来跟我一起动手制作吧. 波士顿动力的机器狗了解吗? 一个会后空翻.会开门.会爬楼梯的AI. 最近,我们实验室就来了一批mini版的机器狗,虽然不会各种高难度杂技动作 ...
BugBuilder: 高质量大规模缺陷库自动构建方法
摘要:本文提出并开发了高质量大规模缺陷库全自动构建方法BugBuilder,自动从版本控制系统中的人为编写的补丁中提取完整且精准的缺陷修复补丁. 本文分享自华为云社区<BugBuilder: 高 ...
LiteOS内核源码分析：静态内存Static Memory
摘要:本文带领大家一起剖析了LiteOS静态内存模块的源代码,包含静态内存的结构体.静态内存池初始化.静态内存申请.释放.清除内容等. 内存管理模块管理系统的内存资源,它是操作系统的核心模块之一,主要 ...
再获信通院权威认证，优等生华为云GaussDB数据库凭什么？
摘要:在八大项测试中,华为云 GaussDB的两款数据库都以优异的成绩通过.那么这两款数据库究竟是凭借什么获此殊荣呢? 近期,中国信通院公布了第十三批数据库产品基础能力.性能和稳定性评审结果.在本次评 ...
你好 Java！Solon v1.10.3 发布
相对于 Spring Boot 和 Spring Cloud 的项目: 启动快 5 - 10 倍. (更快) qps 高 2- 3 倍. (更高) 运行时内存节省 1/3 ~ 1/2. (更少) 打包 ...
Java线程池使用浅谈
1. 线程池相关基本概念任务(Task):任务是线程池中要执行的工作单元.任务可以是实现了 Runnable 接口或 Callable 接口的对象.Runnable 任务没有返回值,而 Callab ...
以 Golang 为例详解 AST 抽象语法树
前言各位同行有没有想过一件事,一个程序文件,比如 hello.go 是如何被编译器理解的,平常在编写程序时,IDE 又是如何提供代码提示的.在这奥妙无穷的背后, AST(Abstract Synta ...

【转帖】Meta 推出大型语言模型 LLaMA，比 GPT3.5 性能更高

【转帖】Meta 推出大型语言模型 LLaMA，比 GPT3.5 性能更高的更多相关文章

随机推荐

热门专题