探索Semantic Plugins:开启大模型的技能之门
前言
在之前的章节中我们或多或少的已经接触到了 Semantic Kernel
的 Plugins
,本章我们讲详细介绍如何使用插件。
Semantic Kernel
的一大特点是拥有强大的插件,通过结合自定义/预定义的插件解决智能业务的问题。让传统的代码和智能插件一起工作灵活地接入到应用场景简化传统应用向智能化转型的过程。
什么是Plugins
?
我们知道LLMs
(大模型)的训练数据和我们使用之间有时间差,还有一个问题 LLMs
对自己企业化内的知识认知有缺陷。OpenAI
通过插件将ChatGPT
和第三方的应用程序之间进行连接,这些插件使 ChatGPT
能够与开发人员定义的 API
进行交互,从而增强 ChatGPT
的功能并允许有更广泛的操作,如:
检索实时信息
,例如,体育赛事比分、股票价格、最新新闻等。检索知识库信息
, 例如,公司文档、个人笔记等。协助用户进行相关操作
,例如,预订航班、公司内预定会议、订餐等。
Semantic Kernel
遵循OpenAI
的插件的插件规范,可以很方便地接入和导出插件(如基于Bing, Microsoft 365
,OpenAI
的插件),这样可以让开发人员很简单地调用不同的插件服务。除了兼容OpenAI
的插件外,Semantic Kernel
内也有属于自己插件定义的方式。不仅可以在规定模版格式上定义 Plugins
, 更可以在函数内定义 Plugins
.
从高层次上理解插件是一组可以公开给 AI
应用程序和服务的功能。
插件要提供在语义上描述其行为方式的详细信息,从函数的输入、输出到副作用,一切都需要以 AI
可以理解的方式进行描述.
定义插件
在 Semantic Kernel 中定义 Plugins 插件有两种方式,第一种是通过模版定义插件也叫Semantic Plugins
(语义插件),第二种是通过函数创建插件也叫 Native Plugins
(本地插件)
Sermantic Plugins
通过模版定义插件
我们知道可以通过Prompts
(提示词工程)可以和LLMs
进行对话,我们在处理一系列特定业务过程中,可能不止一个Prompts
,可能是一组Prompts
的集合。我们可以把这些针对业务能力的Prompts
集合放到Semantic Kernel
的插件集合内。
模版格式
在 Semantic Kernel
模版定义格式有固定的格式,Prompts
(提示词)都放在 skprompt.txt
文件内,而相关参数设置都放在 config.json
文件内,文件结构参考如下图
const string ConfigFile = "config.json";
const string PromptFile = "skprompt.txt";
这些都是在
SK
写死的配置,所以插件内的命名一定要遵循这个规则!
|-plugins
|-Prompts
|-Translator
|-skprompt.txt
|-config.json
|-WriterPlugins
|-Joke
|-skprompt.txt
|-config.json
|-ShortPoem
|-skprompt.txt
|-config.json
skprompt.txt
我们先来看看 skprompt.txt
的定义,这里一般是放置和业务相关的 Prompt
,可以支持多个参数,每个参数都放置在 {{$参数名}}
内,如以下格式:
Translate {{$input}} into {{$language}}
在之前的章节我们介绍过这是SK
里 TemplateFormat
的默认格式"semantic-kernel"
config.json
这是配置相关的内容,随了设置和 LLMs
相关的参数外,你也可以设定输入的参数以及相关描述
{
"schema": 1,
"description": "Translate sentenses into a language of your choice",
"execution_settings": {
"default": {
"max_tokens": 2000,
"temperature": 0.7,
"top_p": 0.0,
"presence_penalty": 0.0,
"frequency_penalty": 0.0,
"stop_sequences": ["[done]"]
}
},
"input_variables": [
{
"name": "input",
"description": "sentense to translate",
"default": ""
},
{
"name": "language",
"description": "Language to translate to",
"default": ""
}
]
}
这其实就是对PromptTemplateConfig
提示词模版配置类的 json
数据,最后在 SK
内会被反序列化到对象内。
// Load prompt configuration. Note: the configuration is optional.
var configPath = Path.Combine(functionDirectory, ConfigFile);
var promptConfig = File.Exists(configPath) ?
PromptTemplateConfig.FromJson(File.ReadAllText(configPath)) :
new PromptTemplateConfig();
之前我们对PromptTemplateConfig
类进行过详细的讲解,不熟悉的可以看看深入学习 Semantic Kernel:创建和配置 prompts functions。
从解决方案的角度看一下配置的目录图
注册 Semantic Plugins
要从 Semantic Kernel
中要实现Semantic Plugins
模板化插件的注册,需要KernelExtensions
类中的CreatePluginFromPromptDirectory
扩展方法。
再开始之前在我们代码的解决方案Plugins
文件夹下对每一个skprompt.txt
和config.json
进行生成设置
核心代码
var kernel = Kernel.CreateBuilder()
.AddAzureOpenAIChatCompletion(config.ModelId, endpoint: config.Endpoint, apiKey: config.ApiKey)
.Build();
//注册插件
string folder = Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "Plugins");
kernel.ImportPluginFromPromptDirectory(folder);
string[] pluginNames = ["Prompts", "WriterPlugins"];
foreach (var pluginName in pluginNames)
{
kernel.ImportPluginFromPromptDirectory(Path.Combine(folder, pluginName));
}
//测试从插件获得funciton
var jokeKernelFunction = kernel.Plugins.GetFunction("Prompts", "Translator");
Console.WriteLine("System: 请输入要翻译的内容");
var userResuest = Console.ReadLine();
Console.WriteLine("System: 请输入要翻译的语言语种");
var language = Console.ReadLine();
var results = await jokeKernelFunction.InvokeAsync(kernel, new KernelArguments()
{
{"input", userResuest},
{"language", language}
});
Console.WriteLine($"Assistant: {results.ToString()}");
插件名称约定
ImportPluginFromPromptDirectory
这个方法在注册插件过程中如果没有指定插件名字会默认用文件夹名称
pluginName ??= new DirectoryInfo(pluginDirectory).Name;
输出
System: 请输入要翻译的内容
User: 那么近那么美周末去河北
System: 请输入要翻译的语言语种
User: 英文
Assistant: So close, so beautiful, go to Hebei for the weekend.
最后
本章我们详细介绍了如何使用 Semantic Kernel
的插件功能,包括插件的概念、定义插件的两种方式(Semantic Plugins 和 Native Plugins)、以及如何注册和调用 Semantic Plugins。通过插件,我们可以扩展 ChatGPT
的功能,使其能够与第三方应用程序进行连接,实现更广泛的操作和服务。
通过注册插件并调用相应函数,我们可以实现诸如翻译、笑话生成等功能。在下一篇中,我们将关注 Native Plugins
原生函数插件的介绍。
参考文献
示例代码
探索Semantic Plugins:开启大模型的技能之门的更多相关文章
- ILLA Cloud: 调用 Hugging Face Inference Endpoints,开启大模型世界之门
一个月前,我们 宣布了与 ILLA Cloud 与达成的合作,ILLA Cloud 正式支持集成 Hugging Face Hub 上的 AI 模型库和其他相关功能. 今天,我们为大家带来 ILLA ...
- Picasso:开启大前端的未来
“道生一,一生二,二生三,三生万物.” —— <道德经> Picasso是大众点评移动研发团队自研的高性能跨平台动态化框架,经过两年多的孕育和发展,目前在美团多个事业群已经实现了大规模的应 ...
- 华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅
摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...
- DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述 近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮. 这场风潮对数字世 ...
- 无插件的大模型浏览器Autodesk Viewer开发培训-武汉-2014年8月28日 9:00 – 12:00
武汉附近的同学们有福了,这是全球第一次关于Autodesk viewer的教室培训. :) 你可能已经在各种场合听过或看过Autodesk最新推出的大模型浏览器,这是无需插件的浏览器模型,支持几十种数 ...
- 跟上节奏 大数据时代十大必备IT技能
跟上节奏 大数据时代十大必备IT技能 新的想法诞生新的技术,从而造出许多新词,云计算.大数据.BYOD.社交媒体……在互联网时代,各种新词层出不穷,让人应接不暇.这些新的技术,这些新兴应用和对应的IT ...
- PowerDesigner 学习:十大模型及五大分类
个人认为PowerDesigner 最大的特点和优势就是1)提供了一整套的解决方案,面向了不同的人员提供不同的模型工具,比如有针对企业架构师的模型,有针对需求分析师的模型,有针对系统分析师和软件架构师 ...
- PowerDesigner 15学习笔记:十大模型及五大分类
个人认为PowerDesigner 最大的特点和优势就是1)提供了一整套的解决方案,面向了不同的人员提供不同的模型工具,比如有针对企业架构师的模型,有针对需求分析师的模型,有针对系统分析师和软件架构师 ...
- 文心大模型api使用
文心大模型api使用 首先,我们要获取硅谷社区的连个key 复制两个api备用 获取Access Token 获取access_token示例代码 之后就会输出 作文创作 作文创作:作文创作接口基于文 ...
- AI大模型学习了解
# 百度文心 上线时间:2019年3月 官方介绍:https://wenxin.baidu.com/ 发布地点: 参考资料: 2600亿!全球最大中文单体模型鹏城-百度·文心发布 # 华为盘古 上线时 ...
随机推荐
- 在RockyLinux 9.3环境中采用RPM模式部署Oracle 19C
在RockyLinux 9.3环境中采用RPM模式部署Oracle 19C 用途 在开发数据库系统时,可以验证功能是否与Oracle的表现一致,验证正确性和兼容性 限制 虚拟机安装,CPU 2*4 内 ...
- 力扣498(java)-对角线遍历(中等)
题目: 给你一个大小为 m x n 的矩阵 mat ,请以对角线遍历的顺序,用一个数组返回这个矩阵中的所有元素. 输入:mat = [[1,2,3],[4,5,6],[7,8,9]]输出:[1,2,4 ...
- 力扣476(java)-数字的补数(简单)
题目: 对整数的二进制表示取反(0 变 1 ,1 变 0)后,再转换为十进制表示,可以得到这个整数的补数. 例如,整数 5 的二进制表示是 "101" ,取反后得到 "0 ...
- 阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练
简介: 阿里云AHAS Chaos:应用及业务高可用提升工具平台之故障演练 应用高可用服务AHAS及故障演练AHAS Chaos 应用高可用服务(Application High Availabili ...
- Java编程技巧之单元测试用例编写流程
简介: 立足于"如何来编写单元测试用例",让大家"有章可循",快速编写出单元测试用例. 作者 | 常意来源 | 阿里技术公众号 温馨提示:本文较长,同学们可收藏 ...
- Hologres揭秘:如何支持超高QPS在线服务(点查)场景
简介: 本期我们将揭秘Hologres如何支持超高QPS在线服务(点查)场景. Hologres(中文名交互式分析)是阿里云自研的一站式实时数仓,这个云原生系统融合了实时服务和分析大数据的场景,全面兼 ...
- SmartNews:基于 Flink 加速 Hive 日表生产的实践
简介: 将 Flink 无缝地集成到以 Airflow 和 Hive 为主的批处理系统的技术挑战和应对方案. 本文介绍了 SmartNews 利用 Flink 加速 Hive 日表的生产,将 Flin ...
- LlamaIndex 起步教程(本地模型)
提示:确保您已先按照自定义安装步骤操作. 这是一个著名的"五行代码"起步示例,使用本地 LLM(大语言模型)和嵌入模型.我们将使用 BAAI/bge-small-en-v1.5 作 ...
- 数据可视化之matplotlib模块
一.简介 Matplotlib是一个强大的Python绘图和数据可视化的工具包.数据可视化也是我们数据分析的最重要的工作之一,可以帮助我们完成很多操作,例如:找出异常值.必要的一些数据转换等.完成数据 ...
- Codeforces 题解集
Codeforces Round 940 (Div. 2) and CodeCraft-23 Codeforces Round 940 (Div. 2) and CodeCraft-23 (A-E)