每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧!

重磅更新

Hugging Cast 播客 #1 发布

Hugging Cast 是由 Hugging Face 团队成员录制的、介绍最新人工智能新闻、应用以及开源动态的播客节目,第一期的 Hugging Cast 已经发布,我们聊了 Hugging Chat 以及 AI 的实践相关的话题。

来 B 站看看吧:

https://www.bilibili.com/video/BV1jM411G74u/

今晚 11 点 Hugging Cast 播客 #2 线上直播,欢迎来这里报名参加:

https://streamyard.com/watch/GJkVxAWR76k2

StarCoder: 开源的 SOTA 代码大模型

StarCoder 是针对代码的大语言模型 (代码 LLM),模型使用了 GitHub 上被许可的数据训练而得,包含 80 多种编程语言、Git commits、Issues 等。与 LLaMA 类似,我们基于 1 万亿个词元训练了一个约 15B 参数的模型。此外,我们还针对一个 35B 词元的 Python 数据集对 StarCoderBase 模型进行了微调,从而获得了一个我们称之为 StarCoder 的新模型。

详情请回顾文章: StarCoder: 最先进的代码大模型

每日论文精选页面上线

AK (@_akhaliq) 是一个在 Twitter 上拥有 19 万粉丝的、专注于发布各种 AI 研究论文的账号,在大约发布了 1.7 万条论文推荐信息之后,接下来 AK 将在 Hugging Face 上开启后续的更新,欢迎访问:

hf.co/papers

开源更新

使用 Token Merging (ToMe) 提高 Stable Diffusion 的推理速度

Token Merging 可以通过在 Transformer 网络的前向传递中逐步合并冗余的 token/patch 来加速推理,通过在A100 和 V100 GPU 设备上对使用 tomesd 和不使用的 StableDiffusionPipeline 进行了基准测试,发现使用 tomesd 可以显著提高推理速度,尤其是对于较大的图像分辨率。以及,使用 tomesd 不会明显降低图像生成的质量。

查看文档了解更多信息:

https://hf.co/docs/diffusers/main/en/optimization/tome

Datasets 库 2.12 版正式发布

Datasets 是一个数据集调用库,你可以轻松调用 Hub 上的以及多种公共数据集,并进行高效的数据预处理。Datasets 库的 2.12 正式版已经正式发布,包括 Spark DataFrame 的支持、流式数据的支持、数据集分片等新功能,也包含了一些 bug 修改和文档改进等。此外,我们欢迎并感谢五位新的贡献者对这个版本的贡献 (@QizhiPei、@bbbxyz、@csris、@eli-osherovich、@maddiedawson)

Accelerate 库迎来了 2 千万次下载!

本月初,Accelerate 迎来了第 2 千万次下载,这见证了社区对这个库的喜爱和信任,快来试试看吧!

https://hf.co/docs/accelerate/

产品更新

宣布与 Spawning.ai 进行合作

在构建商业模型时,使用授权的训练数据至关重要,Spawning.ai 提供了一个 API 来确保你的机器学习项目建立在同意的数据之上。部分符合条件的、在 Hugging Face 上开源托管的数据集也将由 Spawning.ai 提供的 API 来显示数据源的报告。

新的 Space 模版: 构建 Shiny 应用

Shiny 是一个高效且开发者友好的 GUI 框架,你可以根据需求选择使用 R 或 Python 模板。Posit 与 Hugging Face 合作,提供了 R 和 Python Shiny 包的 Space 应用模板,用户可以轻松地将 Shiny 应用程序部署到 Hugging Face 上,并方便地将 Hub 上的模型集成到自己的应用中。


以上就是本期的 Hugging News,祝大家拥有一个愉快的周末!

Hugging News #0526: Hugging Cast 发布第一期、邀请来认领自己的论文啦!的更多相关文章

  1. Hugging News #0331: Hugging Papers 来啦,快来认领你的论文!

    每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...

  2. Facebook 发布深度学习工具包 PyTorch Hub,让论文复现变得更容易

    近日,PyTorch 社区发布了一个深度学习工具包 PyTorchHub, 帮助机器学习工作者更快实现重要论文的复现工作.PyTorchHub 由一个预训练模型仓库组成,专门用于提高研究工作的复现性以 ...

  3. Hugging Face 社区中蓬勃发展的计算机视觉

    在 Hugging Face 上,我们为与社区一起推动人工智能领域的民主化而感到自豪.作为这个使命的一部分,我们从去年开始专注于计算机视觉.开始只是 Transformers 中 Vision Tra ...

  4. 道德与社会问题简报 #3: Hugging Face 上的道德开放性

    使命: 开放和优秀的机器学习 在我们的使命中,我们致力于推动机器学习 (ML) 的民主化,我们在研究如何支持 ML 社区工作并有助于检查危害和防止可能的危害发生.开放式的发展和科学可以分散力量,让许多 ...

  5. JS的发布订阅模式

    JS的发布订阅模式 这里要说明一下什么是发布-订阅模式 发布-订阅模式里面包含了三个模块,发布者,订阅者和处理中心.这里处理中心相当于报刊办事大厅.发布者相当与某个杂志负责人,他来中心这注册一个的杂志 ...

  6. Visual Studio 2017正式版发布全纪录

    又是一年发布季,微软借着Visual Studio品牌20周年之际,于美国太平洋时间2017年3月7日9点召开发布会议,宣布正式发布新一代开发利器Visual Studio 2017.同时发布的还有 ...

  7. 基于Mindspore2.0的GPT2预训练模型迁移教程

    摘要: 这篇文章主要目的是为了让大家能够清楚如何用MindSpore2.0来进行模型的迁移. 本文分享自华为云社区<MindNLP-基于Mindspore2.0的GPT2预训练模型迁移教程> ...

  8. Kakao Brain 的开源 ViT、ALIGN 和 COYO 文字-图片数据集

    最近 Kakao Brain 在 Hugging Face 发布了一个全新的开源图像文本数据集 COYO,包含 7 亿对图像和文本,并训练了两个新的视觉语言模型 ViT 和 ALIGN ViT 和 A ...

  9. Android 4.4 KitKat升级率已经接近18%(2014-07-09 07:29)

    腾讯数码讯(编 译:张秀梅)按照惯例, 每个月的第一个星期的星期一谷歌都会发布最新一期Android版本分布图.从去年十月末谷歌发布Android 4.4 KitKat以来,截止到目前为止Androi ...

  10. phpanalysis提取关键字

    最近在开发一个文章模块功能,设计那边提出要给文章生成对应标签,用于文章关联推送,这里和大家分享一下实现过程: 这里需要用到PHPAnalysis,下载链接如下 链接:https://pan.baidu ...

随机推荐

  1. 如何在 Apinto 实现 HTTP 与gRPC 的协议转换 (上)

    什么是 gRPC 像gRPC是由google开发的一个高性能.通用的开源 RPC 框架,主要面向移动应用开发且基于HTTP/2协议标准而设计,同时支持大多数流行的编程语言. gRPC基于 HTTP/2 ...

  2. 第四朵“云”!全托管的时序数据云平台 TDengine Cloud 正式支持阿里云

    3 月 13 日,全托管的时序数据处理云服务平台 TDengine Cloud 正式支持阿里云,这是继 Microsoft Azure.AWS.Google Cloud 后 TDengine Clou ...

  3. 解决margin合并问题

    一.什么是外边距合并 外边距合并(叠加)是一个相当简单的概念.但是,在实践中对网页进行布局时,它会造成许多混淆. 所谓的外边距合并就是,当两个垂直外边距相遇时,它们将形成一个外边距.合并的外边距的高度 ...

  4. Salesforce LWC学习(二十) CLI篇:新版本不支持Audience解决方案

    本篇参考:https://github.com/forcedotcom/cli/issues/470 https://developer.salesforce.com/docs/atlas.en-us ...

  5. 【ACM算法竞赛日常训练】DAY5题解与分析【储物点的距离】【糖糖别胡说,我真的不是签到题目】| 前缀和 | 思维

    DAY5共2题: 储物点的距离(前缀和) 糖糖别胡说,我真的不是签到题目(multiset,思维) 作者:Eriktse 简介:19岁,211计算机在读,现役ACM银牌选手力争以通俗易懂的方式讲解算法 ...

  6. Kubeadm安装k8s集群升级100年证书时报错:Unable to connect to the server: EOF:求解决方法.

    报错信息: 使用命令时: Kubelet服务报错: 报错情况,在更新完k8s100年证书的时候,到最后重新启动kubelet服务的时候,服务是可以重新启动的,但是kubectl的命令是无法使用的,会等 ...

  7. TypeScript 学习笔记 — 自定义类型:部分属性可选,反选 key,求对象交差并补集等(十三)

    目录 将部分属性变为可选属性 根据值的类型 反选 key 写法一:基础原理写法,使用不同的内置类型,Pick 和 Omit 写法二:基础原理写法,使用 Pick 内置类型 + 传参的方式 写法三:使用 ...

  8. 四月二十五号java基础知识

    1.注意:无论哪个构造方法,在创建文件输入输出流时都可能银给出的文件名不对.路径不对文件的属性不对等,不能打开文件而造成错误,此时系统会抛出FileNotFoundException异常执行read( ...

  9. day60:Linux压缩与打包&用户管理&用户提权sudo&grep,sed,awk,sort,uniq

    目录 1.文件管理-压缩与打包 2.用户管理 用户怎么查 如何创建用户 创建的用户信息都存储在哪? 用户存储密码的文件 如何为用户设定密码? 3.用户组 4.用户提权相关 5.Extra:额外补充 文 ...

  10. 【介绍】C++五种迭代器

    目录 1. 输入迭代器(Input Iterator): 2. 输出迭代器(Output Iterator): 3. 前向迭代器(Forward Iterator): 4. 双向迭代器(Bidirec ...