腾讯推出的 AppAgent,是一个多模态智能体,通过识别当前手机的界面和用户指令直接操作手机界面,能像真实用户一样操作手机!

机器学习周刊:关注Python、机器学习、深度学习、大模型等硬核技术

1、如何学习深度学习?

最近X上有推友重提这篇文章,是网友看过 Jeremy 教授的 fast.ai 深度学习课程后,把每节课提到的学习建议和忠告都总结了下来:https://forums.fast.ai/t/things-jeremy-says-to-do/36682/1

我让ChatGPT、Claude、Gemini翻译并总结了这篇文章,Gemini完成的更加出色,给出了26条关于学习方法和一些细节的建议(强烈建议,如果时间允许,可以看原文):

  1. 倾听:仔细注意老师在整堂课中的建议和提示。
  2. 不要被理论淹没:专注于运行代码并对其进行实验,而不是一开始就陷入理论细节中。
  3. 选择一个项目并把它做得精彩:选择一个你感兴趣的项目,并投入额外的精力,确保对其进行优化和改进。
  4. 探索不同的数据集:不要局限于课程中提供的数据集;自己寻找数据集并对其进行实验。
  5. 不要使你的代码过于复杂:保持你的代码简单和有条理,避免不必要的复杂性。
  6. 学习 Jupyter 快捷键:熟悉 Jupyter 快捷键以提高你的效率。
  7. 运行代码并对其进行实验:不要只阅读代码;运行它并尝试不同的输入和参数来观察会发生什么。
  8. 不要花几个小时试图立即理解所有理论:可以先不理解所有内容;专注于实践方面,并随着时间的推移逐渐加深你的理解。
  9. 阅读比赛获胜者的论文:通过阅读比赛获胜者的论文来学习他人的成功经验,注意他们的方法和见解。
  10. 使用你拥有的所有文本:在处理 NLP 时,确保使用所有可用的文本,包括未标记的验证集,以增强模型的性能。
  11. 学会发音希腊字母:熟悉深度学习论文中常用的希腊字母的发音。
  12. 非常习惯 PyTorch 张量:培养对 PyTorch 张量和运算的扎实理解。
  13. 应用广播规则:在处理更高秩张量时学习并应用广播规则。
  14. 不要假设库是正确的:对库持怀疑态度;验证其正确性并了解其工作原理。
  15. 不要担心你是否跟上了所有内容:感到不知所措是正常的;专注于你能理解的内容,并逐渐建立你的知识。
  16. 学会调试深度学习代码:调试 DL 代码具有挑战性;确保你的代码简单,并检查中间结果以尽量减少错误。
  17. 用玩具问题进行实验:创建并解决玩具问题以深入了解深度学习的概念和技术。
  18. 学习 Swift for TensorFlow:抓住机会学习 Swift for TensorFlow,它为 DL 开发提供了优势。
  19. 为 Swift for TensorFlow 生态系统做出贡献:通过为代码、文档或讨论做出贡献来参与 Swift for TensorFlow 社区。
  20. 使用 compose 进行函数组合:使用 compose 函数熟悉函数组合的概念。
  21. 谨慎的数据增强:在增强数据时,仔细考虑转换及其对数据完整性和标签准确性的影响。
  22. 尝试不同的架构:尝试不同的神经网络架构以深入了解它们的性能特征。
  23. 不要冻结批归一化层:避免在微调期间冻结批归一化层,以确保适当的权重更新。
  24. 尽可能以原始方式预处理数据:作为一般规则,尽量减少对神经网络数据的预处理,以保留其原始信息和结构。
  25. 学习 Swift for TensorFlow:抓住机会学习 Swift for TensorFlow,它为 DL 开发提供了优势。
  26. 自定义 Swift for TensorFlow:Swift for TensorFlow 是完全可自定义的,允许你修改和扩展它以满足你的特定需求。

2、2024 年学习生成式 AI 路线图

项目地址:https://github.com/krishnaik06/Roadmap-To-Learn-Generative-AI-In-2024

这个项目总结了生成式AI学习路线,从Python、机器学习、NLP、深度学习、GPT-4、Langchain、向量数据库、LLM项目部署,非常顺畅。

3、机器学习调查

地址:https://github.com/metrofun/machine-learning-surveys

有关主动学习、生物信息学、分类、度量学习、蒙特卡罗、多视图学习等方面的调查、教程和书籍的精选列表。

4、应用机器学习

地址:https://github.com/eugeneyan/applied-ml

这个项目分享了各公司在生产中数据科学和机器学习方面的论文和技术博客,已经更新了3年。

主要内容包括:

  • 如何构架问题 (例如,将个性化视为推荐系统 vs. 搜索 vs. 序列)
  • 哪些机器学习技术有效 (有时候,哪些不行 )
  • 为什么它有效,背后的科学原理包括研究、文献和引用
  • 实现了什么现实世界的结果(可以更好地评估投资回报率 )

5、如何构建高效的RAG系统

程序员Jiayuan (Forrest)在X上分享了开发者搜索工具 devv.ai 是如何构建RAG系统的过程,内容十分硬核。

这里是Treads汇总:https://typefully.com/Tisoga/PBB58Vu

6、MLC Chat

MLC Chat:在iPhone上离线运行7B最强LLM Mistral

中文不太行,速度很快,手机会发热

APP下载:https://apps.apple.com/gb/app/mlc-chat/id6448482937

Github:https://github.com/mlc-ai/mlc-llm

支持各种系统,能在各种设备上开发、优化和部署AI模型。包括iOS和安卓

7、Ollama

地址:https://ollama.ai/download

Ollama为那些在macOS、Linux(暂不支持Windows)上使用LLM的开发者提供了一种简便的解决方案,可以更轻松地将这些模型集成到自己的应用程序中。

Ollama目前支持了10余种大模型,安装后均可一个命令本地启动并运行

Model Parameters Size Download
Neural Chat 7B 4.1GB ollama run neural-chat
Starling 7B 4.1GB ollama run starling-lm
Mistral 7B 4.1GB ollama run mistral
Llama 2 7B 3.8GB ollama run llama2
Code Llama 7B 3.8GB ollama run codellama
Llama 2 Uncensored 7B 3.8GB ollama run llama2-uncensored
Llama 2 13B 13B 7.3GB ollama run llama2:13b
Llama 2 70B 70B 39GB ollama run llama2:70b
Orca Mini 3B 1.9GB ollama run orca-mini
Vicuna 7B 3.8GB ollama run vicuna
LLaVA 7B 4.5GB ollama run llava

8、DreaMoving

DreaMoving是一个基于扩散模型的人类舞蹈视频生成框架。能够根据指导序列和简单的内容描述(仅文本提示、仅图像提示或文本和图像提示)生成高质量、高保真度的视频。

体验地址:https://modelscope.cn/studios/vigen/video_generation/summary

9、苹果最新论文

论文: https://huggingface.co/papers/2312.11514

苹果发的这个论文《使用有限的内存实现更快的 LLM 推理》。通过将将模型参数保存在闪存里,根据需要移动到DRAM。 使得能够运行的模型大小是可用DRAM的两倍,与传统的CPU和GPU加载方法相比,推理速度分别提高了4-5倍和20-25倍

10、腾讯最新论文:《AppAgent: 多模态智能体,像真实用户一样操作手机》

项目首页:https://appagent-official.github.io

论文链接:https://arxiv.org/abs/2312.13771

项目地址:https://github.com/mnotgod96/AppAgent

论文通过引入一种基于大型语言模型(LLMs)的多模态智能代理(Agent)框架,赋予了智能体操作智能手机应用的能力。与传统的智能助手如 Siri 不同,AppAgent 不依赖于系统后端访问,而是通过模拟人类的点击和滑动等操作,直接与手机应用的图形用户界面(GUI)互动。这种独特的方法不仅提高了安全性和隐私性,还确保了智能体能够适应应用界面的变化和更新。

机器学习周刊03:如何学习深度学习?2024 年学习生成式 AI 路线图、如何构建高效的RAG系统、苹果 腾讯最新论文、阿里DreaMoving的更多相关文章

  1. AI学习---深度学习&TensorFlow安装

    深度学习   深度学习学习目标: 1. TensorFlow框架的使用 2. 数据读取(解决大数据下的IO操作) + 神经网络基础 3. 卷积神经网络的学习 + 验证码识别的案例   机器学习与深度学 ...

  2. 使用腾讯云 GPU 学习深度学习系列之二:Tensorflow 简明原理【转】

    转自:https://www.qcloud.com/community/article/598765?fromSource=gwzcw.117333.117333.117333 这是<使用腾讯云 ...

  3. 深度学习-深度强化学习(DRL)-Policy Gradient与PPO笔记

    Policy Gradient 初始学习李宏毅讲的强化学习,听台湾的口音真是费了九牛二虎之力,后来看到有热心博客整理的很细致,于是转载来看,当作笔记留待复习用,原文链接在文末.看完笔记再去听一听李宏毅 ...

  4. [译]深度神经网络的多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks)

    译自:http://sebastianruder.com/multi-task/ 1. 前言 在机器学习中,我们通常关心优化某一特定指标,不管这个指标是一个标准值,还是企业KPI.为了达到这个目标,我 ...

  5. 深度残差网络——ResNet学习笔记

    深度残差网络—ResNet总结 写于:2019.03.15—大连理工大学 论文名称:Deep Residual Learning for Image Recognition 作者:微软亚洲研究院的何凯 ...

  6. 【Python机器学习实战】决策树与集成学习(七)——集成学习(5)XGBoost实例及调参

    上一节对XGBoost算法的原理和过程进行了描述,XGBoost在算法优化方面主要在原损失函数中加入了正则项,同时将损失函数的二阶泰勒展开近似展开代替残差(事实上在GBDT中叶子结点的最优值求解也是使 ...

  7. (转) 基于Theano的深度学习(Deep Learning)框架Keras学习随笔-01-FAQ

    特别棒的一篇文章,仍不住转一下,留着以后需要时阅读 基于Theano的深度学习(Deep Learning)框架Keras学习随笔-01-FAQ

  8. Spark MLlib Deep Learning Deep Belief Network (深度学习-深度信念网络)2.3

    Spark MLlib Deep Learning Deep Belief Network (深度学习-深度信念网络)2.3 http://blog.csdn.net/sunbow0 第二章Deep ...

  9. 我在 B 站学习深度学习(生动形象,跃然纸上)

    我在 B 站学习深度学习(生动形象,跃然纸上) 视频地址:https://www.bilibili.com/video/av16577449/ tensorflow123 http://tensorf ...

  10. (转载)深度剖析 | 可微分学习的自适配归一化 (Switchable Normalization)

    深度剖析 | 可微分学习的自适配归一化 (Switchable Normalization) 作者:罗平.任家敏.彭章琳 编写:吴凌云.张瑞茂.邵文琪.王新江 转自:知乎.原论文参考arXiv:180 ...

随机推荐

  1. 使用 gopkg.in/yaml.v3 解析 YAML 数据

    YAML(YAML Ain't Markup Language)是一种人类可读的数据序列化格式,常用于配置文件和数据交换.在 Go 语言中,你可以使用 gopkg.in/yaml.v3 包来解析和生成 ...

  2. Android应用中对于微信分享的实例及问题

    源码地址 如何分享 分享无相应 分享结果如何接收响应 微信 分享回调 (提示几点关键问题:   debug_key 一定要获得对应的签名码 然后和weixin官网的appid对应     ) 几点注意 ...

  3. [最优化DP]决策单调性

    决策单调性的概念&证明工具: 决策单调性,是在最优化dp中的可能出现的一种性质,利用它我们可以降低转移的复杂度. 首先dp中会有转移,每个状态都由若干个状态转移而来,最优化dp比较特殊,只能由 ...

  4. MySQL防止被黑,通过跳板机ssh隧道访问

    更新了另外一篇,比这篇的方法更好:[https://www.cnblogs.com/scottyzh/p/17745527.html](服务器没有开放3306端口 远程访问MySQL数据库方法) 一. ...

  5. 【行云流水线实践】基于“OneBuild”方法对镜像进行快速装箱

    在云原生领域,无论使用哪种编排调度平台,Kubernetes,DockerSwarm,OpenShift等,业务都需要基于镜像进行交付,我们在内部实践"Source-to-image&quo ...

  6. websocket和ajax的区别(和http的区别)

    websocket和ajax的区别(和http的区别) https://segmentfault.com/a/1190000021741131 1. 本质不同 ajax,即异步JavaScript和X ...

  7. [Python急救站课程]汇率转换程序

    汇率转换程序 i = input("请输入金额用"¥"或"$"结束:") if i[-1] in ['¥']: C = (eval(i[0: ...

  8. 一篇文章让你理解:什么是Spring???

    背景 市场上,随便一个Java工程师的招牌要求上,都可以看到SSM.Spring.SpringMVC...类似字样.这玩意到底是个啥? 这是中邮消费招聘的岗位要求,可以看到第3点: 3.熟悉Strut ...

  9. 实现MyBatisPlus自定义sql注入器

    目标:新增mysql下的 插入更新的语法 INSERT INTO %s %s VALUES %s ON DUPLICATE KEY UPDATE %s 新增方法类,新增的方法名称为insertOrUp ...

  10. js朗读实现

    js 利用window实现朗读功能 ` 发音