深入浅出分析最近火热的Mem0个性化AI记忆层

最近Mem0横空出世，官方称之为PA的记忆层，The memory layer for Personalized AI，有好事者还称这个是RAG的替代者，Mem0究竟为何物，背后的原理是什么，我们今天来一探究竟。

Mem0 介绍

官方介绍为：

Mem0 provides a smart, self-improving memory layer for Large Language Models, enabling personalized AI experiences across applications.

关键点，是为LLM提供的智能的，可自我改进的记忆层，从而可以实现在各种应用中提供更加个性化的和连贯一致的用户体验。

主要特点

多层次记忆：支持用户级、会话级和AI代理级的记忆保留。
自适应个性化：根据用户交互不断改进，提供精准个性化记忆。
开发者友好API：简单易用，易于集成。
跨平台一致性：保持不同设备上的行为一致性。
托管服务：简化部署和维护。

快速开始

安装：通过pip安装mem0ai。

pip install mem0ai

基本用法：

import os

from mem0 import Memory

# 依赖LLM提取记忆，所以需要open ai

os.environ["OPENAI_API_KEY"] = "xxx"

# 吃石化 Mem0

m = Memory()

# 通过add方法，存储非结构化的记忆，metadata提供schema定义

result = m.add("I am working on improving my tennis skills. Suggest some online courses.", user_id="alice", metadata={"category": "hobbies"})

print(result)

# Created memory: Improving her tennis skills. Looking for online suggestions.

# Retrieve memories

all_memories = m.get_all()

print(all_memories)

# 搜索记忆  Search memories

related_memories = m.search(query="What are Alice's hobbies?", user_id="alice")

print(related_memories)

# 更新记忆 Update a memory

result = m.update(memory_id="m1", data="Likes to play tennis on weekends")

print(result)

# Get memory history

history = m.history(memory_id="m1")

print(history)

上述的示例代码展示了如何添加记忆、检索记忆、搜索、更新和获取记忆历史。

注意代码里的metadata, 这里相当于定义了一个schema，让LLM从非结构化数据里提取相关的记忆信息。

原理分析

透过上面的示例代码，我们先来猜测下mem0的原理：

通过LLM+制定的metadata，抽取记忆信息，这里雷士知识图谱抽取，重点是定制一个合适的prompt来抽取有效信息
相关记忆信息通过向量化存储，因此可以支持记忆信息检索
记忆支持更新，例如demo里的hobbies更新

我们下载代码一探究竟。

记忆管理

def add(

        self,

        data,

        user_id=None,

        agent_id=None,

        run_id=None,

        metadata=None,

        filters=None,

        prompt=None,

    ):

        """

        Create a new memory.

        Args:

            data (str): Data to store in the memory.

            user_id (str, optional): ID of the user creating the memory. Defaults to None.

            agent_id (str, optional): ID of the agent creating the memory. Defaults to None.

            run_id (str, optional): ID of the run creating the memory. Defaults to None.

            metadata (dict, optional): Metadata to store with the memory. Defaults to None.

            filters (dict, optional): Filters to apply to the search. Defaults to None.

        Returns:

            str: ID of the created memory.

        """

        if metadata is None:

            metadata = {}

        embeddings = self.embedding_model.embed(data)

        filters = filters or {}

        if user_id:

            filters["user_id"] = metadata["user_id"] = user_id

        if agent_id:

            filters["agent_id"] = metadata["agent_id"] = agent_id

        if run_id:

            filters["run_id"] = metadata["run_id"] = run_id

        if not prompt:

            prompt = MEMORY_DEDUCTION_PROMPT.format(user_input=data, metadata=metadata)

        extracted_memories = self.llm.generate_response(

            messages=[

                {

                    "role": "system",

                    "content": "You are an expert at deducing facts, preferences and memories from unstructured text.",

                },

                {"role": "user", "content": prompt},

            ]

        )

        existing_memories = self.vector_store.search(

            name=self.collection_name,

            query=embeddings,

            limit=5,

            filters=filters,

        )

        existing_memories = [

            MemoryItem(

                id=mem.id,

                score=mem.score,

                metadata=mem.payload,

                text=mem.payload["data"],

            )

            for mem in existing_memories

        ]

        serialized_existing_memories = [

            item.model_dump(include={"id", "text", "score"})

            for item in existing_memories

        ]

        logging.info(f"Total existing memories: {len(existing_memories)}")

        messages = get_update_memory_messages(

            serialized_existing_memories, extracted_memories

        )

        # Add tools for noop, add, update, delete memory.

        tools = [ADD_MEMORY_TOOL, UPDATE_MEMORY_TOOL, DELETE_MEMORY_TOOL]

        response = self.llm.generate_response(messages=messages, tools=tools)

        tool_calls = response["tool_calls"]

        response = []

        if tool_calls:

            # Create a new memory

            available_functions = {

                "add_memory": self._create_memory_tool,

                "update_memory": self._update_memory_tool,

                "delete_memory": self._delete_memory_tool,

            }

            for tool_call in tool_calls:

                function_name = tool_call["name"]

                function_to_call = available_functions[function_name]

                function_args = tool_call["arguments"]

                logging.info(

                    f"[openai_func] func: {function_name}, args: {function_args}"

                )

                # Pass metadata to the function if it requires it

                if function_name in ["add_memory", "update_memory"]:

                    function_args["metadata"] = metadata

                function_result = function_to_call(**function_args)

                # Fetch the memory_id from the response

                response.append(

                    {

                        "id": function_result,

                        "event": function_name.replace("_memory", ""),

                        "data": function_args.get("data"),

                    }

                )

                capture_event(

                    "mem0.add.function_call",

                    self,

                    {"memory_id": function_result, "function_name": function_name},

                )

        capture_event("mem0.add", self)

        return response

这里的逻辑比较简单

参数的判断、处理
通过 MEMORY_DEDUCTION_PROMPT 结合用户的data，抽取记忆，得到extracted_memories
然后通过data查询相关的existing_memories
然后将extracted_memories、existing_memories 拼接到一起，交予大模型，让大模型调用合适的tool来更新记忆，tools ： [ADD_MEMORY_TOOL, UPDATE_MEMORY_TOOL, DELETE_MEMORY_TOOL]
根据function call的结果，调用tool_calls更新记忆

本质上全部委托给大模型，通过prompt做了一定的约束。

Mem0 点评

Mem0 是RAG的杀手?

NO, Mem0 是RAG的助手，可以帮助提供更个性化的内容。

Mem0 有什么用处？

Mem0可以显著提升个性化AI的能力。通过记住用户的偏好等用户画像信息，AI产品就可以提供更加个性化服务，有较好的想象空间。传统的用户画像依赖于产研去设计schema，只能挖掘存储设计好的一些特征，而Mem0通过大模型，可以提供schame base和大模型自己挖掘的记忆，提供了一条更通用的方案
PA产品、泛娱乐、教育等各个领域，都可以发挥出作用

Mem0 有什么不足？

mem0当前未看到提供一些通用的schema，提供graph base的管理支持
用户的memory应该区分短中长期记忆，mem0当前是未区分的，需要有解决方案
自定义的记忆管理规则
支持结合RAG 和用户对话历史，初始化记忆
完全依赖LLM，成本较大

我们也可以看下mem0的roadmap，有规划提供一些自定义规则支持：

Integration with various LLM providers
Support for LLM frameworks
Integration with AI Agents frameworks
Customizable memory creation/update rules
Hosted platform support

深入浅出分析最近火热的Mem0个性化AI记忆层的更多相关文章

深入浅出分析C#接口的作用
1.C#接口的作用 :C#接口是一个让很多初学C#者容易迷糊的东西,用起来好像很简单,定义接口,里面包含方法,但没有方法具体实现的代码,然后在继承该接口的类里面要实现接口的所有方法的代码,但没有真正认 ...
Android指纹识别深入浅出分析到实战（6.0以下系统适配方案）
指纹识别这个名词听起来并不陌生,但是实际开发过程中用得并不多.Google从Android6.0(api23)开始才提供标准指纹识别支持,并对外提供指纹识别相关的接口.本文除了能适配6.0及以上系统, ...
深入浅出分析MySQL MyISAM与INNODB索引原理、优缺点、主程面试常问问题详解
本文浅显的分析了MySQL索引的原理及针对主程面试的一些问题,对各种资料进行了分析总结,分享给大家,希望祝大家早上走上属于自己的"成金之路". 学习知识最好的方式是带着问题去研究所 ...
深入浅出分析MySQL索引设计背后的数据结构
在我们公司的DB规范中,明确规定: 1.建表语句必须明确指定主键 2.无特殊情况,主键必须单调递增对于这项规定,很多研发小伙伴不理解.本文就来深入简出地分析MySQL索引设计背后的数据结构和算法,从 ...
深入浅出分析MySQL MyISAM与INNODB索引原理、优缺点分析
本文浅显的分析了MySQL索引的原理及针对主程面试的一些问题,对各种资料进行了分析总结,分享给大家,希望祝大家早上走上属于自己的"成金之路". 学习知识最好的方式是带着问题去研究所 ...
深入浅出分析MySQL常用存储引擎
MyISAM是MySQL的默认数据库引擎(5.5版之前),由早期的ISAM(Indexed Sequential Access Method:有索引的顺序访问方法)所改良.虽然性能极佳,但却有一个缺点 ...
Android指纹识别深入浅出分析到实战
指纹识别这个名词听起来并不陌生,但是实际开发过程中用得并不多.Google从Android6.0(api23)开始才提供标准指纹识别支持,并对外提供指纹识别相关的接口.本文除了能适配6.0及以上系统, ...
【集合系列】- 深入浅出分析Collection中的List接口
一.List简介 List 的数据结构就是一个序列,存储内容时直接在内存中开辟一块连续的空间,然后将空间地址与索引对应. 以下是List集合简易架构图由图中的继承关系,可以知道,ArrayList. ...
【集合系列】- 深入浅出分析HashMap
一.摘要在集合系列的第一章,咱们了解到,Map的实现类有HashMap.LinkedHashMap.TreeMap.IdentityHashMap.WeakHashMap.Hashtable.Pro ...
【集合系列】- 深入浅出分析 ArrayDeque
一.摘要在 jdk1.5 中,新增了 Queue 接口,代表一种队列集合的实现,咱们继续来聊聊 java 集合体系中的 Queue 接口. Queue 接口是由大名鼎鼎的 Doug Lea 创建,中 ...

随机推荐

CentOS7的一些常规操作
1.启动或者重启sshd服务: systemctl stop sshd.service systemctl start sshd.service systemctl restart sshd.serv ...
iOS直播助手第一个版本总结
经过1个月的努力,终于完成了直播助手iOS11版本的适配,第一个版本也已经提审,趁着这个空档进行一下总结: 打算后续按照目录进行完善 1.iOS直播采集介绍,直播助手iOS11采集使用的方法 2.iO ...
Windows平台git clone文件路径太长报错
问题描述在Windows下拉取一些比较大的开源项目经常会提示文件路径太长(filename too long),然后死活都不成功解决办法 1.配置git git config --system c ...
idea 使用 mvn clean package 报错 Could not create local repository at
使用 mac 版本的 idea 打包使用打包命令 mvn clean package 总是报错: [ERROR] Could not create local repository at /Repos ...
react 属性绑定动态值
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
鸿蒙HarmonyOS实战-ArkTS语言基础类库（通知）
前言移动应用中的通知是指应用程序发送给用户的一种提示或提醒消息.这些通知可以在用户设备的通知中心或状态栏中显示,以提醒用户有关应用程序的活动.事件或重要信息. 移动应用中的通知可以分为两种类型:本地 ...
IDEA的安装、激活（到25年2月）&汉化
1,在官网下载IDEA软件,官网 2,下载之后,双击安装包,然后一直点击next即可. (中间可以按照自己的要求设置安装目录) 3,快捷方式和java打钩 4,点击install即可进行安装,时间有一 ...
INFINI Labs 产品更新 | Easysearch 1.8.0 发布数据写入限流功能
INFINI Labs 产品又更新啦~,包括 Easysearch v1.8.0.Gateway.Console.Agent.Loadgen v1.25.0.本次各产品更新了很多亮点功能,如 Easy ...
Vue学习：11.了解生命周期
Vue.js框架为组件设计了一套完整的生命周期,涵盖了从创建到销毁的全过程.这些生命周期钩子函数(lifecycle hooks)允许开发者在特定的阶段执行自定义逻辑,以便更好地管理组件的状态和与其交 ...
Python数据类型（数字，字符串，[列表]，(元组)，{字典:字典值},{列表,列表2}）
Python数据类型(数字,字符串,[列表],(元组),{字典:字典值},{列表,列表2}) # 1. # Python3 数字(Number) # Python 数字数据类型用于存储数值. # 数据 ...