近日,Meta(原 Facebook)开源了他们公司的新一代大模型 Llama 3,虽然目前只放出了 8B 和 70B 两个版本,但是在评估结果上已经优于 Claude 3 Sonnet、Mistral Medium 和 GPT-3.5 等大模型。Meta 官方还表示,这些只是开胃菜,更强的 400B 参数的模型已经在训练中了,预计几个月后将和大家见面(开源与否尚不明确)。

说回上周的热门开源项目,最近基于 LLM 构建知识库的开源项目很火,但我一个都没收录。因为如果是本地起大模型效果不好,请求大模型的 API 又不免费,所以我找到了一个 OpenAI API 反向代理开源项目,可用来实现免费白嫖 OpenAI API。内容也是知识库的关键,Reader 能够将网页内容转化成 LLM 友好的文本。对于没有编程基础的小伙伴,这有一个 30-Days-Of-Python 的开源教程,学它!当然,学习之余也可以娱乐一下,比如试试‘无名杀’,这是一款类似于三国杀的开源卡牌游戏。

  • 本文目录

    • 1. 开源新闻

      • 1.1 Meta 开源 Llama 3 大模型
    • 2. 开源热搜项目
      • 2.1 OpenAI API 免费反向代理:ChatGPT
      • 2.2 一门新兴的系统级编程语言:Zig
      • 2.3 将网页内容转化成 LLM 友好的文本:Reader
      • 2.4 三国杀类型的卡牌游戏:noname
      • 2.5 为期 30 天的 Python 编程挑战:30-Days-Of-Python
    • 3. HelloGitHub 热评
      • 3.1 自定义 Windows 任务栏透明度的小工具:TranslucentTB
      • 3.2 跨平台的手写笔记和绘图应用:Rnote
    • 4. 结尾

1. 开源新闻

1.1 Meta 开源 Llama 3 大模型

今年初,扎克伯格就曾公开解释过:​Meta 为什么开源 Llama 模型?

  1. 改进模型:开源可以借助社区的力量持续提升模型的质量,因为社区的反馈和审查有助于安全性和运行效率的提升,而这对每个人都有益。
  2. 产品发展:虽然开源并不排除将模型转化为商业产品的可能性,开源模型的领导者可以将社区创新整合进自家产品中,提高产品竞争力。
  3. 行业标准:开源软件有潜力成为行业标准,从而促进技术发展和统一性。
  4. 吸引人才:由于开发者和研究人员更倾向于参与开源项目,开源策略可以帮助公司吸引和招聘到行业内的优秀人才。

最新发布的 Llama 3 相较于 Llama 2 在参数规模、训练数据集、模型架构(GQA)、性能、多语言支持、推理和代码生成方面都有所提升,但现在对中文支持的不是很好,而且 meta.ai 上用的还是 Llama 2。

GitHub 地址:github.com/meta-llama/llama3

2. 开源热搜项目

2.1 OpenAI API 免费反向代理:ChatGPT

主语言:TypeScriptStar:3.7k周增长:1k

虽然现在无需登陆就可以免费使用 ChatGPT(gpt-3.5-turbo 模型),但如果是想用接口的话还要收费的。该项目就是基于免费的 ChatGPT 网站服务,将其转化成免费的 ChatGPT API,接口返回和官方一致,支持 Docker 部署。需要注意的是部署的服务器,要在 OpenAI 服务支持的国家和地区。

GitHub 地址→github.com/PawanOsman/ChatGPT

2.2 一门新兴的系统级编程语言:Zig

主语言:ZigStar:30k周增长:300

这是一种命令式、通用、静态类型、编译的系统编程语言,注重性能、安全和可读性。它支持编译时泛型与反射、交叉编译以及手动存储器管理,目标为改进 C 语言,可以轻松地和 C 语言的代码库配合工作。Zig 简洁且直接,没有隐式控制流、没有隐式内存分配、没有预处理器、没有宏,特别适合用于开发编译器、操作系统内核、桌面应用、性能敏感的应用、嵌入式系统等。

const std = @import("std");
const parseInt = std.fmt.parseInt; test "parse integers" {
const input = "123 67 89,99";
const ally = std.testing.allocator; var list = std.ArrayList(u32).init(ally);
// Ensure the list is freed at scope exit.
// Try commenting out this line!
defer list.deinit(); var it = std.mem.tokenizeAny(u8, input, " ,");
while (it.next()) |num| {
const n = try parseInt(u32, num, 10);
try list.append(n);
} const expected = [_]u32{ 123, 67, 89, 99 }; for (expected, list.items) |exp, actual| {
try std.testing.expectEqual(exp, actual);
}
}

GitHub 地址→github.com/ziglang/zig

2.3 将网页内容转化成 LLM 友好的文本:Reader

主语言:TypeScriptStar:3k周增长:2.5k

该项目可以将指定的 URL 内容转化为干净、LLM 友好的文本,从而提高 Agent 和 RAG 系统的输入质量,可作为构建知识库的一环。我试用了一下,内容提取效果不错,但是对于需要登陆才能访问的 URL 就不行了。

GitHub 地址→github.com/jina-ai/reader

2.4 三国杀类型的卡牌游戏:noname

主语言:JavaScriptStar:1.9k周增长:100

「无名杀」是一款以三国为背景的卡牌策略游戏,它完全免费、无广告,玩法和三国杀一样,但自由度高很多,有海量武将可供玩家选择,还支持自制武将和技能,提供了身份、国战、斗地主、塔防、单挑、联机等游戏模式。

GitHub 地址→github.com/libccy/noname

2.5 为期 30 天的 Python 编程挑战:30-Days-Of-Python

主语言:PythonStar:31k周增长:600

该项目是帮助人们在 30 天内学会 Python 编程语言,通过每天的练习和学习,逐渐掌握 Python 的基础和进阶知识,全部完成可能需要超过 100 天。该教程适合想要快速入门 Python 的初学者,或者对 Python 有一定了解,想通过实践深入理解 Python 的开发者。

GitHub 地址→github.com/Asabeneh/30-Days-Of-Python

3. HelloGitHub 热评

在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。

3.1 自定义 Windows 任务栏透明度的小工具:TranslucentTB

主语言:C++

该项目是采用 C++ 开发的用于调整 Windows 任务栏透明度的工具,它体积小、免费、简单易用,支持 5 种任务栏状态、6 种动态模式、Windows 10/11 操作系统。

项目详情→hellogithub.com/repository/48c9ce6373cd4e108d74bcb4f8ac7a41

3.2 跨平台的手写笔记和绘图应用:Rnote

主语言:Rust

这是一款用 Rust 和 GTK4 编写的绘图应用,可用于绘制草图、手写笔记和注释文档等。它支持导入/导出 PDF 和图片文件,以及无限画布、拖放、自动保存等功能。适用于 Windows、Linux 和 macOS 系统,需要搭配手写板使用。

项目详情→hellogithub.com/repository/1d768cfa742c4fcd9c0a0bd4374cb425

4. 结尾

在结束本周「GitHub 热点速递」的精彩内容后,希望这些开源项目能够对大家有所启发,帮助你们找到新的工具、学习资源或是娱乐项目。如果看完这些还不过瘾,可以通过阅读「往期回顾」的内容,找到更多热门开源项目。

往期回顾

以上为本周的「GitHub 热点速递」全部内容,如果你发现其他好玩、有趣的 GitHub 项目,就来 HelloGitHub 和大家一起分享吧。

Llama 3 开源了「GitHub 热点速览」的更多相关文章

  1. 朋友圈那串神秘字符背后的开源项目「GitHub 热点速览」

    ​如果你这周没刷到类似 "npub1sg6plzptd64u62a878hep2kev88swjh3tw00gjsfl8f237..." 的一串字符,那就说明本期 GitHub T ...

  2. 如何让程序更健壮「GitHub 热点速览」

    对于 ML 模型训练而言,好的数据集能让结果更健壮,cleanlab 是一个降低数据噪音,及时帮你修正数据集错误的工具.好的工具能让你的结果更完美.同样的,RedTeam-Tools 提高了渗透测试的 ...

  3. 真·生产力「GitHub 热点速览」

    这些工具真的能极大提高生产力,节约你的时间来自(摸)我(鱼)增(划)值(水).先别提 style2paints,你给它随意画个草图,就能给你一个能交付给甲方爸爸的成品插画.如果提升 30%-40% 传 ...

  4. 开源不到 48 小时获 35k star 的推荐算法「GitHub 热点速览」

    本周的热点除了 GPT 各类衍生品之外,还多了一个被马斯克预告过.在愚人节开源出来的推特推荐算法,开源不到 2 天就有了 35k+ 的 star,有意思的是,除了推荐算法本身之外,阅读源码的工程师们甚 ...

  5. 你的梦想家居「GitHub 热点速览」

    上周推荐的 ChatGPT 版小爱,不知道有哪些小伙伴回去尝试接入了呢?本周依旧由 2 个不错的 ChatGPT 延伸项目,一个是比 DeepL.Grammarly 更懂你的划词翻译 openai-t ...

  6. Python 霸榜的一周,又有什么新 AI 力作呢?「GitHub 热点速览」

    GPT 带火了一波语言模型,LLaMA 和 Alpaca 也在持续发力.依旧是各类 GPT 后缀霸榜 GitHub trending 的一周,为此特推部分专门收录了两个比较不错的 GPT 应用.而作为 ...

  7. AI 能多强「GitHub 热点速览」

    不知道 AI 在你那边是什么样的具象,在我这就是各种搞图:从给线稿图上色,到直接给你生成一张小色图,AI 最近是真出风头,本周热点速览也收录了 2 个 AI 项目,也和图像有关.还有一个和 AI 相关 ...

  8. 穷人版生产力工具,好用得飞起 「GitHub 热点速览」

    被 GPT 和 OpenAI 刷屏了一个多月,现在 GitHub Trending 已经没有什么和 gpt 无关的项目了,但是好在总有优秀的开源项目拯救我的项目疲惫.像是贴心好用的反向代理 pgrok ...

  9. 碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

    这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出所有可见物体,它标记出的物体边界线清晰可见.如此出色的模型,自然获得了不少人的赞赏,开源没几天,就拿下了 18k+ ...

  10. 一款能“干掉” ChatGPT 的应用「GitHub 热点速览」

    据说有了它,ChatGPT 就可以靠边站了.因为 Auto-GPT 能更加主动地完成你给他的指定任务,不用做更多的人为干涉,它的推理能力比 ChatGPT 更强,有人用它解放双手做了个 React 网 ...

随机推荐

  1. Android 获取设备的CPU型号和设备型号

    原文: Android 获取设备的CPU型号和设备型号-Stars-One的杂货小窝 之前整的项目的总结信息,可能不太全,凑合着用吧,代码在最下面一节 CPU型号数据 华为: ro.mediatek. ...

  2. Jetpack架构组件学习(0)——总结篇

    原文地址:Jetpack架构组件学习(0)--总结篇 | Stars-One的杂货小窝 对之后学习的Jetpack架构开发优点进行简单总结,及对应的文章分类链接 LifeCycle 主要解决将一些初始 ...

  3. 几个有用的svn命令

    1.检验authz文件是否合法;svnauthz-validate /root/.svn/webservice/conf/authz 2.杀死svn服务:killall svnserve 3.查看sv ...

  4. 关于C++ 多态实现技术的深度解析(vfptr,vftable)

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明   本文作为本人csdn blog的主站的备份.(Bl ...

  5. Jmeter教程-JMeter 环境安装及配置

    JMeter 环境安装及配置 在使用 JMeter 之前,需要配置相应的环境,包括安装JDK和JMeter. 首先,了解一下JDK,它就是Java的开发工具包. JMeter 是使用 Java 编写的 ...

  6. 基于R语言的GD库实现地理探测器并自动将连续变量转为类别变量

      本文介绍基于R语言中的GD包,依据栅格影像数据,实现自变量最优离散化方法选取与执行,并进行地理探测器(Geodetector)操作的方法.   首先,在R语言中进行地理探测器操作,可通过geode ...

  7. C# OpenCv Haar、LBP 人脸检测

    using OpenCvSharp; namespace OPenCVDemo { class Program { static void Main(string[] args) { // Load ...

  8. Generalized Focal Loss:Focal loss魔改以及预测框概率分布,保涨点 | NeurIPS 2020

    为了高效地学习准确的预测框及其分布,论文对Focal loss进行拓展,提出了能够优化连续值目标的Generalized Focal loss,包含Quality Focal loss和Distrib ...

  9. KingbaseES V8R6数据库运维案例之---索引坏块故障处理

    案例说明: 在执行表数据查询时,出现下图所示错误,索引故障导致表无法访问,后重建索引问题解决.本案例复现了此类故障解决过程. 适用版本: KingbaseES V8R3/R6 一.创建测试环境 # 表 ...

  10. 使用fiddler抓取HTTPS的数据包(抓取App端的数据包)

    众所周知,我们在做接口测试的时候有两种情况: 第一种是先拿到接口测试规范文档,再去做接口测试. 第二种是没有接口文档,只有通过自己抓包. 那么说到抓包,就不得不说抓包工具,对于浏览器web端,我们只需 ...