【AI新趋势期刊#1】GPT自动理解视频、AI法律顾问、大模型安全围栏
每天都要浏览大量AI相关新闻,是不是感到信息量爆炸,有效信息少?
这么多新产品和新工具,到底哪些是真正是有价值的,哪些只是浮躁的一时热点?
想参与AI产品和工具的开发,从哪里能够获得大量的灵感和思路?
我会把AI相关的新趋势、新想法、新思路,和成熟AI产品、工具、模型等整理在这里,帮助大家去除信息噪音,更高效的了解AI前沿发展。
主要围绕:
- AI业界趋势、想法、思路
- AI产品
- AI开发者工具
- AI模型
作为本期刊的第一期,我们主要围绕2023年4月发布的相关产品和技术工具。
终端产品
AI中国法律助手
https://github.com/lvwzhen/law-cn-ai
该项目把 中国法律文书 作为知识库,将知识库embedding后存入向量数据库,然后向用户提供了完整界面,用户可以用自然语言提问,后台使用openAI的API,结合知识库的现有知识进行自然语言的回答。
主要技术:
- 预处理知识库
- 在PostgreSQL中使用 pgvector 存储嵌入向量。
- 执行向量相似性搜索,查找与问题相关的内容。
- 将内容注入到OpenAI GPT-3文本自动补全中,并将响应流式传输到客户端。
HuggingChat
Hugging Face发布了一个ChatGPT开源替代品名为HuggingChat。Hugging Face大家都懂的,可以理解成AI界的Github,很多注明的开源模型都在上面首发。
底层模型目前有两种选择:
金融/投资 GPT助手
FinChat.io是由ChatGPT提供技术支持的工具。它利用人工智能生成关于公共公司和投资者的问题的答案。为了提供准确的答案,FinChat会提供推理、来源和数据等支持。实测效果有点酷炫。
微软AI设计器
https://designer.microsoft.com/
输入文字,通过AI生成一个合适的设计图,且支持动态图。例如下面的文字描述"为我的油管频道‘Science for Littles’设计一个动态的广告"生成了右方的一些设计图,生成速度非常快,还可调节图片尺寸。
选择了右方较为满意的设计后,可以继续在在线编辑器中修改你的设计,支持自由导出各种格式与下载。
AI Shell
https://github.com/builderio/ai-shell
将chatGPT整合到你的shell中,用ai命令进行操作
VLog
https://github.com/showlab/VLog
V是大写,他可以将一段长视频转换成包含视觉和音频信息的文档。通过将此文档发送到ChatGPT,我们可以针对这个视频的内容进行自然语言聊天!当然,需要消耗你自己的openAI API额度。
开发者工具
音频能力工具集:AudioGPT
https://huggingface.co/spaces/AIGC-Audio/AudioGPT
这个工具集里包含了大量音频相关的处理能力工具,大部分工具使用时需要填写你自己的GPT API key,消耗你的额度,我试了一下,文字转语音,一句5个词的句子,消耗了我4000个token!(暴风哭泣!)
演讲:
- 文字转语音
- 风格迁移
- 语音识别
- 语音增强
- 语音分离
- 语音翻译
- 单声道到双声道
- 文字转唱
唱歌:
- 文字转唱歌
音频处理:
- 文本到音频
- 音频修复
- 图像到音频
- 声音检测
- 目标声音检测
- 声音提取
大模型安全围栏:NeMo-Guardrails
https://github.com/NVIDIA/NeMo-Guardrails
NeMo Guardrails 是一个开源工具包,可以轻松地将可编程护栏添加到基于 LLM 的对话系统中。Guardrails(或简称“rails”)是控制大型语言模型输出的特定方式,例如不谈论政治、以特定方式响应特定用户请求、遵循预定义的对话路径、使用特定语言风格、提取结构化数据等。
主要优势:
- 构建值得信赖、安全可靠的 LLM 对话系统:使用 NeMo Guardrails 的核心价值是能够编写 rails 来指导对话。开发人员可以选择定义他们的 LLM 驱动的机器人在某些主题上的行为,并让他们的创造力不受其他人的影响!
- 通过操作连接模型、链、服务等: LLM 不需要解决所有挑战。NeMo Guardrails 提供了将您的代码库或服务无缝安全地连接到聊天机器人的能力!
chatGLM结合本地知识库:langchain-chatGLM
https://github.com/imClumsyPanda/langchain-ChatGLM
一种利用 ChatGLM-6B + langchain 实现的基于本地知识的 ChatGLM 应用。支持将txt、markdown等格式的文本文件上传后,进行提问。会给出自然语言的回答,并且在最后会标注出引用本地文本的出处。
本项目实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。
支持的LLM模型:
- THUDM/chatglm-6b
- THUDM/chatglm-6b-int8
- THUDM/chatglm-6b-int4
- THUDM/chatglm-6b-int4-qe
- ClueAI/ChatYuan-large-v2
支持的Embedding 模型:
- nghuyong/ernie-3.0-nano-zh
- nghuyong/ernie-3.0-base-zh
- shibing624/text2vec-base-chinese
- GanymedeNil/text2vec-large-chinese
在任意消费级终端部署大模型:MLC LLM
MLC LLM是一种通用解决方案,可以使任何语言模型在各种硬件后端和本地应用程序上本地化部署,同时为所有人提供一个高效的框架,以进一步优化模型性能,以适应其自身用例。
我们的使命是使每个人都能够在其设备上本地开发、优化和部署AI模型。
这个方向的探索如果出现突破,将大大减少模型部署和使用的门槛,让全世界的低算力设备也能加入AI算力阵营。
仿openAI风格API调用chatGLM:chatglm-openai-api
https://github.com/ninehills/chatglm-openai-api
让开发者能够用调用openAI API的方式调用其他开源模型,节省大量开发工作。
参考
Github Trending
Meta360创新学院-AGI前夜
【AI新趋势期刊#1】GPT自动理解视频、AI法律顾问、大模型安全围栏的更多相关文章
- 致研究者:2018 AI 研究趋势
2017 年是机器学习领域最有成效.最具创意的一年.现在已经有很多博文以及官方报道总结了学界和业界的重大突破.本文略有不同,Alex Honchar在Medium发文,从研究者的角度分享机器学习明年发 ...
- LiveVideoStack Meet|深圳 多媒体开发新趋势
2018年初始,音视频技术生态并不平静,Codec争夺愈加激烈,新一代标准的挑战一浪高过一浪:WebRTC的定版也为打通浏览器.移动端乃至IoT带来了机会:此外AI.区块链技术的兴起,催化着与多媒体领 ...
- 系统架构:Web应用架构的新趋势---前端和后端分离的一点想法
最近研究servlet,看书时候书里讲到了c/s架构到b/s架构的演变,讲servlet的书都很老了,现在的b/s架构已经不是几年前的b/s架构,其实b/s架构就是web应用开发,对于这样的架构我们现 ...
- [转]Web3.0时代,企业知识管理新趋势
[转自http://www.amt.com.cn/html/ManageFront/AMTPoint0/2014/0716/1370.html] Web3.0时代,企业知识管理新趋势 2014-07- ...
- Web应用架构的新趋势
系统架构:Web应用架构的新趋势---前端和后端分离的一点想法 最近研究servlet,看书时候书里讲到了c/s架构到b/s架构的演变,讲servlet的书都很老了,现在的b/s架构已经不是几年前 ...
- HMS Core Discovery第16期回顾|与虎墩一起,玩转AI新“声”态
HMS Core 在AI领域最新的技术能力有哪些?本期Discovery直播以<与虎墩一起,玩转AI新"声"态>为主题,邀请了HMS Core 机器学习服务产品经理.机 ...
- 百度生成式AI产品文心一言邀你体验AI创作新奇迹:百度CEO李彦宏详细透露三大产业将会带来机遇(文末附文心一言个人用户体验测试邀请码获取方法,亲测有效)
目录 中国版ChatGPT上线发布 强大中文理解能力 智能文学创作.商业文案创作 图片.视频智能生成 中国生成式AI三大产业机会 新型云计算公司 行业模型精调公司 应用服务提供商 总结 获取文心一言邀 ...
- 《2016ThoughtWorks技术雷达峰会----雷达新趋势》
雷达新趋势 徐昊,ThoughtWorks中国区CTO 1.Open Source open source 已经从一个简简单单的软件代码组织方式变成一种文化,一种运动.当谈到Open Sour ...
- 新时代的Vim C++自动补全插件 clang_complete
Vimer的福音 新时代的Vim C++自动补全插件 clang_complete 使用vim的各位肯定尝试过各种各样的自动补全插件,比如说大名鼎鼎的 OmniCppComplete .这一类的插 ...
- Android Oreo 8.0 新特性实战 Autosizing TextView --自动缩放TextView
Android Oreo 8.0 新特性实战 Autosizing TextView --自动缩放TextView 8.0出来很久了,这个新特性已经用了很久了,但是一直没有亲自去试试.这几天新的需求来 ...
随机推荐
- SpringBoot2:@Configuration 注解
@Configuration 这个注解的作用,告诉 springboot 这是一个配置类.配置类以及类里的方法都可以作为Bean.里面的方法用@Bean标记. @Configuration 替换了繁琐 ...
- day8:列表相关函数&深浅拷贝&字典相关函数&集合相关操作/函数
字符串/列表/字典/集合 目录 字符串相关操作: 拼接 重复 跨行拼接 索引 切片字符串相关函数:常规11+is系列3+填充去除6+最重要3字符串拓展:字符串的格式化format 列表的相关操作:拼接 ...
- Semantic Kernel 入门系列:🍋Connector连接器
当我们使用Native Function的时候,除了处理一些基本的逻辑操作之外,更多的还是需要进行外部数据源和服务的对接,要么是获取相关的数据,要么是保存输出结果.这一过程在Semantic Kern ...
- 【LeetCode动态规划#10】完全背包问题实战,其三(单词拆分,涉及集合处理字符串)
单词拆分 力扣题目链接(opens new window) 给定一个非空字符串 s 和一个包含非空单词的列表 wordDict,判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词. 说明: 拆 ...
- JavaScript基础语法-变量
JavaScript JavaScript - 变量 1. 概念 变量是用于存放数据的容器 通过变量名可以获取数据 并且数据是可修改的 2. 使用 声明变量 只声明不赋值 直接调用 程序会输出unde ...
- 笔记:C++学习之旅---引用
笔记:C++学习之旅---引用 什么是引用? 引用就是别名,引用并非对象,相反的,他只是为一个已经存在的对象所起的另外一个名字. /*引用就是别名*/ #include <iostream> ...
- MySQL概述与安装
MySQL数据库 概要: 一.MySQL数据库的概述 二.MySQL数据库的搭建 三.MySQL数据库软件的使用 四.MySQL数据类型 五.MySQL数据库数据的操作 一.初始MySQL数据库 1. ...
- [C++提高编程] 1、模板
文章目录 1 模板 1.1 模板的概念 1.2 函数模板 1.2.1 函数模板语法 1.2.2 函数模板注意事项 1.2.3 函数模板案例 1.2.4 普通函数与函数模板的区别 1.2.5 普通函数与 ...
- Win Node.js安装教程
前言: 一.下载 下载地址:https://registry.npmmirror.com/binary.html?path=node/ 二.安装(以下为傻瓜式安装操作) 三.验证安装 to be c ...
- JavaScript中的四种枚举方式
字符串和数字具有无数个值,而其他类型如布尔值则是有限的集合. 一周的日子(星期一,星期二,...,星期日),一年的季节(冬季,春季,夏季,秋季)和基本方向(北,东,南,西)都是具有有限值集合的例子. ...