运行模型对比 gemma:7b, llama2, mistral, qwen:7b

【gemma:2b】

total duration: 1m5.2381509s
load duration: 530.9µs
prompt eval duration: 110.304ms
prompt eval rate: 0.00 tokens/s
eval count: 604 token(s)
eval duration: 1m5.126287s
eval rate: 9.27 tokens/s

【gemma:7b】
total duration: 3m47.1115598s
load duration: 9.8098239s
prompt eval count: 110 token(s)
prompt eval duration: 12.228888s
prompt eval rate: 9.00 tokens/s
eval count: 573 token(s)
eval duration: 3m25.072638s
eval rate: 2.79 tokens/s

【llama2】
total duration: 4m34.6780371s
load duration: 4.9036352s
prompt eval count: 137 token(s)
prompt eval duration: 11.521429s
prompt eval rate: 11.89 tokens/s
eval count: 963 token(s)
eval duration: 4m18.252497s
eval rate: 3.73 tokens/s

【mistral】
total duration: 2m58.0946434s
load duration: 4.4304491s
prompt eval count: 129 token(s)
prompt eval duration: 11.605211s
prompt eval rate: 11.12 tokens/s
eval count: 626 token(s)
eval duration: 2m42.059441s
eval rate: 3.86 tokens/s

【qwen:7b】
total duration: 1m0.2411658s
load duration: 1.04ms
prompt eval duration: 276.492ms
prompt eval rate: 0.00 tokens/s
eval count: 220 token(s)
eval duration: 59.96335s
eval rate: 3.67 tokens/s

gemma:7b vs llama2

总结来说，llama2运行在加载速度和prompt评估速率上有明显提升，但是由于处理的令牌总数增加导致整体评估阶段耗时增加，使得整个过程的总耗时延长。不过，在大规模处理任务中，提高单位时间内处理令牌的数量（prompt eval rate 和 eval rate）通常被视为性能改善的一个重要指标。

vs mistral
综合来看，这次运行的整体效率和单位时间内处理令牌的能力都有所提升，尤其是在总时长和整个评估阶段的处理速度上有显著改善。然而，处理的令牌总数较上次减少，可能反映了任务规模的变化或其他程序内部逻辑的调整。

vs qwen7b
综合分析，这次运行在加载速度和处理速度上表现优秀，特别是在处理少量令牌时的效率显著提高。然而，由于缺少prompt部分的具体令牌处理情况，对于prompt部分的性能评估无法给出明确结论。总体来看，如果目标是在短时间内高效处理较少数量的令牌，这次运行的表现是更好的。

AI 新世代

Online ChatAi

Link：https://www.cnblogs.com/farwish/p/18051582

运行模型对比 gemma:7b, llama2, mistral, qwen:7b的更多相关文章

Linux与Windows的设备驱动模型对比
Linux与Windows的设备驱动模型对比名词缩写: API 应用程序接口(Application Program Interface ) ABI 应用系统二进制接口(Application Bi ...
OSI七层模型和tcp/ip四层模型对比
OSI 与TCP/IP 模型对比 OSI 协议层名称 TCP/IP 协议层名称封装的单元功能描述 TCP/IP协议应用层(Application) 应用层(Application) 数据应用程 ...
select、poll、epoll模型对比
select.poll.epoll模型对比先说Select: 1.Socket数量限制:该模式可操作的Socket数由FD_SETSIZE决定,内核默认32*32=1024. ...
Cortex-A7 MPCore 简介与处理器运行模型
Cortex-A7 MPcore 处理器支持 1~4 核,通常是和 Cortex-A15 组成 big.LITTLE 架构的,Cortex-A15 作为大核负责高性能运算,比如玩游戏啥的,Cortex ...
运行模型，COM错误，解决问题步骤
运行模型,COM错误,解决问题步骤 1.数据新建一个,路径短一点,不要有中文 2.所有数据重新导入 3.文档新建 4,问题莫名奇妙解决了
[书籍翻译] 《JavaScript并发编程》第二章 JavaScript运行模型
本文是我翻译<JavaScript Concurrency>书籍的第二章 JavaScript运行模型,该书主要以Promises.Generator.Web workers等技术来讲解J ...
C#开发BIMFACE系列30 服务端API之模型对比1：发起模型对比
系列目录 [已更新最新开发文章,点击查看详细] 在实际项目中,由于需求变更经常需要对模型文件进行修改.为了便于用户了解模型在修改前后发生的变化,BIMFACE提供了模型在线对比功能,可以利用在 ...
C#开发BIMFACE系列31 服务端API之模型对比2：获取模型对比状态
系列目录 [已更新最新开发文章,点击查看详细] 在上一篇<C#开发BIMFACE系列30 服务端API之模型对比1:发起模型对比>中发起了2个模型对比,由于模型对比是在BIMFAC ...
C#开发BIMFACE系列32 服务端API之模型对比3：批量获取模型对比状态
系列目录 [已更新最新开发文章,点击查看详细] 在<C#开发BIMFACE系列31 服务端API之模型对比2:获取模型对比状态>中介绍了根据对比ID,获取一笔记录的对比状态.由于模 ...
C#开发BIMFACE系列33 服务端API之模型对比4：获取模型对比结果
系列目录 [已更新最新开发文章,点击查看详细] 模型对比可以对两个文件/模型进行差异性分析,确定两个文件/模型之间构件的几何和属性差异,包括增加的构件.删除的构件和修改的构件. 模型对应可以用 ...

随机推荐

记录--H5 实现拍照选景框效果
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助背景在实际项目中,遇到了需要唤起手机摄像头拍照的需求,最开始是通过<input type="file" hid ...
Dll堆栈问题(Dll的静态变量与全局变量、vs的MT与MD)
问题引入:dll有一个导出函数,函数参数是string&,string在函数内部被=赋值.在exe动态加载此dll,调用此导出函数后,会崩溃. 原因:如果任何STL类的实现中使用了静态变量(我 ...
.NET Emit 入门教程：第三部分：构建模块（Module）
前言: 在这一部分中,我们将深入讨论动态程序集中模块的概念以及如何构建和管理模块. 1.模块的概念: 模块是动态程序集中的基本单位,它类似于一个独立的代码单元,可以包含类型.方法.字段等成员. 在动态 ...
摄像头网页预览，不需安装插件，支持Chrome
背景实在是不想折腾ActiveX控件 1.麻烦(开发麻烦.使用时设置也麻烦) 2.非IE浏览器不兼容解决方案写一个摄像头服务,提供http服务,返回摄像头当前画面的Base64字符串,前端页面调 ...
python pyzbar 批量识别二维码
1.安装pyzbar pip install pyzbar 2.代码 import os import cv2 as cv from pyzbar import pyzbar # 目录路径 path ...
【已解决】git push send-pack: unexpected disconnect while reading sideband packet
解决办法:修改缓存大小打开项目所在路径下的git目录找到config文件,用记事本打开编辑. 添加如下内容并保存即可 [http] postBuffer = 1048576000
【已解决】Python使用sql语句模糊查询报错：python中TypeError: not enough arguments for format string
2021-03-26-19:54:13 今天下午对世界疫情详情数据库进行模糊查询. 首先要明确一点:使用模糊查询就会用到WHERE语句中的LIKE语句,主要说一下在使用 % 的时候要注意的点: 在Py ...
10 JavaScrit定时器
10 JavaScrit定时器在JS中, 有两种设置定时器的方案: // 语法规则 t = setTimeout(函数, 时间) // 经过xxx时间后, 执行xxx函数 // 5秒后打印我爱你 t ...
#Kruskal重构树，主席树，倍增#洛谷 4197 Peaks
题目传送门分析首先第\(k\)大一般都是主席树问题是困难值的限制有点束手无措又是\(\text{Kruskal重构树}\) 将困难值为边权跑最小生成树,重新建树,实际上让困难值跳到尽量大的位置 ...
Elasticjob 3.x 最新版本源码解读(含备注源码)
源码地址(含备注):https://gitee.com/ityml/elastic-job-zgc 官方网站: https://shardingsphere.apache.org/elasticjob ...

运行模型对比 gemma:7b, llama2, mistral, qwen:7b

运行模型对比 gemma:7b, llama2, mistral, qwen:7b的更多相关文章

随机推荐

热门专题