众所周知,B站是学习网站

最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。

值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的例子类比)。

Up主的名字:新石器公园

推荐一看。

接下来聊聊感想

我是怎么发现这枚宝藏Up主的呢?

源于最近使用metaso.cn搜了一下2024年热点研究方向:

然后挑了几个计算机领域比较相近的研究方向,挨个儿去B站搜索相关领域的视频,顺其自然就找到啦,然后科普视频就看得停不下来,感触比较深的是:

从去年开始,大模型爆发,很明显的一个现象是,随着国内相关政策的不断完善,开源生态也越来越成熟,产业界的跟进落地速度与也越来越快,相关的产品层出不穷。不过,大多数开发人员更关注上层使用,而对底层的细节关注比较少,比如下面几个问题看看你是否能够回答:

1. 大模型的参数是指什么?它和传统的神经网络有什么不同?

2. transformer的自注意力机制是指什么?

3. 扩散模型底层原理是怎样的?大模型为什么能生成视频?

向下扩展到底层技术:

1. 之前频频上新闻的室温超导技术,究竟有啥用?

2. 量子计算机是科学还是玄学?它如何提高计算效率?又会与大模型擦出怎样的火花?

3. 忆阻器与常见的模电器件有何不同?

这些问题,在Up主的科普视频都有解答,对于概念理解而言,是非常好的入门渠道。如果你说,这和我有啥关系?这难道不是科学家要关心的嘛?那向上扩展到应用层,看看以下问题你能否回答:

1. 大模型在工业中是如何发挥作用的?比如之前华为用在了采矿,现在又用在了炼钢,究竟是怎么做的?

2. 大模型在计算机业界,最常用的架构是怎样的?除了RAG,还有其他形式吗?大模型效果评价体系有哪些?

3. 内容向量化是指什么?维度又是什么含义?选取多少维度比较合适?

4. 文本的语义切分怎么做,才能保证效果最优?传统的chunk+overlap是否还有优化空间?用大模型直接做语义切分怎么样?

5. prompt调优有哪些手段?如何评估它们的效果?

是不是发现很多知识明明用了,但是不清楚背后的原理?或者知道原理但不知道如何表达出来?

其实,这都属于知识体系构建不完整的一种体现,很多知识都是一个个孤岛,没有连点成线,更别提连线成面了。

所以,我们要做的是:

1. 在工作之余,花点时间了解平时用到的技术底层原理,慢慢提升认知。这是向下扎根的过程;

2.多关注行业发展趋势,多接触业务领域人员,了解他们对于技术演化趋势的看法,这也很重要,往往决定了技术是否能够搭载产品被推广出去。这是向上生长的过程。

既然谈到了知识体系的构建,那就

再聊聊信息收集和处理的方法

最近逛知乎偶然看到的一个话题:

于是有幸拜读了回答的一篇长文,该文从各种角度分析了信息的获取、处理以及分析方式,具体可以去知乎查看,本文不再展开。

还有一本北大博士论文神作,名叫《中县干部》,网上有资源,可以学习下。

总体而言,可以理解为文章讲述了一套概念:找到渠道、了解各类实体、获取各类实体之间的交互关系,并持续关注实体交互关系的动态变化。这与计算机科学中常常提到的知识图谱或者图数据库的构建和更新操作非常相似。

你看,这个世界的很多东西都是相通的,所以多多思考,任督二脉就慢慢打通了。

时间有限,今天就先聊到这里吧,希望能给大家带来一些启发。

推荐一枚宝藏Up主,顺便聊聊感想的更多相关文章

  1. IE10 CSS Hack(顺便聊聊IE11的CSS Hack)

    一.特性检测:@cc_on 我们可以用IE私有的条件编译(conditional compilation)结合条件注释来提供针对ie10的Hack:该脚本里面的IE排除条件注释,以确保IE6-9不承认 ...

  2. mysql+mycat搭建稳定高可用集群,负载均衡,主备复制,读写分离

    数据库性能优化普遍采用集群方式,oracle集群软硬件投入昂贵,今天花了一天时间搭建基于mysql的集群环境. 主要思路 简单说,实现mysql主备复制-->利用mycat实现负载均衡. 比较了 ...

  3. 【DNS】简单聊聊DNS如何工作

    随便聊聊 我们知道,网络上传输的数据包是一层一层的包起来的,典型的是mac地址层,ip层,tcp/udp层,应用层数据 这么几个层,那用户在浏览器中打开www.baidu.com数据包如何传到baid ...

  4. 聊聊CSS postproccessors

      阿里妈妈 @一丝 准备发布其CSSGrace,即CSS后处理插件,于是顺便聊聊CSS postprocessors. 从Rework说起 Rework是TJ大神开发的CSS预处理框架.但为什么会出 ...

  5. 企业级-Mysql双主互备高可用负载均衡架构(基于GTID主从复制模式)(原创)

    前言:          原理与思想        这里选用GTID主从复制模式Mysql主从复制模式,是为了更加确保主从复制的正确性.健康性与易配性.这里做的是两服务器A,B各有Mysql实例331 ...

  6. 一般来说,主方法main()结束的时候线程结束

    suspend()是将一个运行时状态进入阻塞状态(注意不释放锁标记).恢复状态的时候用resume().Stop()指释放全部. 这几个方法上都有Deprecated标志,说明这个方法不推荐使用. 一 ...

  7. Hibernate主键生成策略详解

    转载自:http://blog.csdn.net/wanghuan203/article/details/7562395 hibernate提供的主键生成策略,使我们可以在实体类的映射xml文件中设定 ...

  8. 从实例看hibernate的主键生成策略

    学习了hibernate会发现.hibernate中有实体类.实体类的映射文件.可是我们怎么样才干知道实体类的主键是如何的生成方式呢?hibernate提供的主键生成策略帮我们完美地解答了这个疑问.以 ...

  9. 推荐一款疫情期间适合在家办公的远程工具,仅需IP和密码轻松实现远程管理

    这段时间,受疫情影响,很多企业都开启了居家办公模式.但疫情突发,大多数人的办公资料没有拷贝打包,对于居家办公的人,尤其是运维人员来说,很难完成顺利完成工作. 像向日葵.teamviewer之类的远程软 ...

  10. 深入分析mysql为什么不推荐使用uuid或者雪花id作为主键

    前言:在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建 ...

随机推荐

  1. 扩展Unity编辑器顶部Toolbar,增加自定义按钮

    游戏需要增加几种启动模式,要在编辑器顶部Toolbar处增加几个按钮:进行下扩展. 这部分Unity没有直接提供接口,需通过反射实现.看了下有一个开源库: https://github.com/mar ...

  2. 让创意在幻觉中肆虐: 认识Illusion Diffusion AI

    人工智能新境界 在不断发展的人工智能领域,一款非凡的新工具应运而生,它能将普通照片转化为绚丽的艺术品.敬请关注Illusion Diffusion,这是一个将现实与想象力完美融合的AI驱动平台,可创造 ...

  3. JDK源码阅读-------自学笔记(十)(java.lang.Integer包装类初探)

    自动装箱和拆箱 JDK1.5后,Java引入了自动装箱(autoboxing)/拆箱(unboxing) 自动装箱 基本数据类型在需要时自动转化为对象 自动装箱 对象在需要时自动转化为基本数据类型 注 ...

  4. CodePen 的国内替代「笔.COOL」,一个功能完备、使用便捷的在线HTML/CSS/JS编辑器和作品分享平台

    笔.COOL,是一个最近在国内崭露头角的在线HTML/CSS/JS编辑器和作品分享平台. 笔.COOL 提供了一个在线的 HTML.CSS 和 JavaScript 代码编辑器.无需任何安装,你只需打 ...

  5. Kafka架构以及一键化部署

    什么是Kafka? Apache Kafka是一个开放源代码的分布式事件流平台,成千上万的公司使用它来实现高性能数据管道,流分析,数据集成和关键任务等相关的应用程序. Kafka的应用场景 构造实时流 ...

  6. 23ai免费版本环境快速就绪

    笔者感受就是搞一套Oracle 23ai的学习测试环境,从未如此的简单高效. 因为近期Oracle 23ai这个话题很火,很多人也在找实验环境想亲自体验测试一番. 其实搞这样的环境没有任何的门槛,甚至 ...

  7. 阿里巴巴 MySQL 数据库之索引规约 (二)

    索引规约 强制部分 [强制] 业务上具有唯一特性的字段,即使是多个字段的组合,也必须建成唯一索引. 说明:不要以为唯一索引影响了 insert 速度,这个速度损耗可以忽略,但提高查找速度是明显的:另外 ...

  8. golang nsq 同一个topic有多个channel,同时项目又互相引用时出现的问题

    p.p1 { margin: 0; font: 12px ".PingFang SC" } span.s1 { font: 12px "Helvetica Neue&qu ...

  9. WPF 实现触摸滑动功能

    自定义ScrollViewer的Touch事件--触摸上下移动ScrollViewer滚动到指定位置   1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 ...

  10. 7.14考试总结(NOIP模拟15)[夜莺与玫瑰·影子·玫瑰花精]

    梦总是有会醒来的时候,不会醒的梦总有一天会变成悲伤. 前言 这次考试的思维含量有一点大(此时距离考试还有 7min 而我的总结还没写完..) 但是对于以前的考试来讲还是有所进步的,毕竟在考试的时候还是 ...