Coding the Matrix: Linear Algebra through Computer Science Applications 本周的作业较少,只有一个编程任务hw2.作业比较简单,如果大学学习过矩阵代数的话,基本上没有什么问题,不过要注意的一点是基2的Span的求法. 基2空间上,在所有基向量中取任意个数个,叠加组合就得到了Span.但是如何取任意个呢?下面给出几种方法. 一种方法是对于任意可能的个数,利用Python中的排列组合module生成对应于此个数的所有排列,即得到S…
这一周的作业,刚压线写完.Problem3 没有写,不想证明了.从Problem 9 开始一直到最后难度都挺大的,我是在论坛上看过了别人的讨论才写出来的,挣扎了很久. Problem 9在给定的基上分解向量,里面调用了hw4的一些函数,通过solve函数获得矩阵方程的解 Problem 10判断矩阵是不是可逆的,注意判断矩阵是不是square的 Problem 11和Problem 12 都是求逆,也是解方程,只是函数的参数需要参考一下源码 发现一个有趣的事情,Coding the Matrix…
论文来自Mikolov等人的<Efficient Estimation of Word Representations in Vector Space> 论文地址: 66666 论文介绍了2个方法,原理不解释... skim code and comment : # -*- coding: utf-8 -*- # @time : 2019/11/9 12:53 import numpy as np import torch import torch.nn as nn import torch.…
Coding the Matrix: Linear Algebra through Computer Science Applications 这是一门用python实现矩阵运算的课,第一次作业就感觉对python的提高很大,用到了各种数据类型. 代码如下: ## Task 1 minutes_in_week = 60*24*7 ## Task 2 remainder_without_mod = 2304811-2304811//47*47 ## Task 3 divisible_by_3 =…
1. 问题描述 给你若干篇文档,找出这些文档中最相似的两篇文档? 相似性,可以用距离来衡量.而在数学上,可使用余弦来计算两个向量的距离. \[cos(\vec a, \vec b)=\frac {\vec a*\vec b}{||\vec a||*||\vec b||}\] 因此,用向量来表示文档,然后就可以用余弦来计算两篇文章之间的相似度了. 2. 词袋模型 一篇文档里面有很多很多句子,每个句子又是由一个个的词组成.词袋模型,通俗地讲,就是:把一篇文档看成词袋,里面装着一个个的词. 从而,将一…
https://en.wikipedia.org/wiki/Congruence_relation In abstract algebra, a congruence relation (or simply congruence) is an equivalence relation on an algebraic structure (such as a group, ring, or vector space) that is compatible with the structure in…
最近想学习下Lucene ,以前运行的Demo就感觉很神奇,什么原理呢,尤其是查找相似度最高的.最优的结果.索性就直接跳到这个问题看,很多资料都提到了VSM(Vector Space Model)即向量空间模型,根据这个模型可以对搜索的结果进行最优化的筛选,目前还不知道如何证明,只能凭借想象应该是这个样子的. 1.看一下TF/IDF 我们先来看下一个叫TF/IDF的概念,一般它用来作为一个搜索关键字在文档或整个查询词组的权重的计算方式.前几天看了吴军老师的数学之美系列文章,这个TF/IDF可以追…
原文:http://blog.csdn.net/zhangbinfly/article/details/7734118 最近想学习下Lucene ,以前运行的Demo就感觉很神奇,什么原理呢,尤其是查找相似度最高的.最优的结果.索性就直接跳到这个问题看,很多资料都提到了VSM(Vector Space Model)即向量空间模型,根据这个模型可以对搜索的结果进行最优化的筛选,目前还不知道如何证明,只能凭借想象应该是这个样子的. 1.看一下TF/IDF 我们先来看下一个叫TF/IDF的概念,一般它…
Vector Space Model The vector space model provides a way of comparing a multiterm query against a document. The output is a single score that represents how well the document matches the query. In order to do this, the model represents both the docum…
搜索结果排序是搜索引擎最核心的构成部分,很大程度上决定了搜索引擎的质量好坏.虽然搜索引擎在实际结果排序时考虑了上百个相关因子,但最重要的因素还是用户查询与网页内容的相关性.(ps:百度最臭名朝著的“竞价排名”策略,就是在搜索结果排序时,把广告客户给钱最多的排在前列,而不是从内容质量考虑,从而严重影响了用户体验).这里要讲的就是:给定用户搜索词,如何从内容相关性的角度对网页进行排序.判断网页内容是否与用户查询相关,这依赖于搜索引擎所采用的检索模型,常见的检索模型有:布尔模型.向量空间模型.概率模型…
Mikolov T , Chen K , Corrado G , et al. Efficient Estimation of Word Representations in Vector Space[J]. Computer ence, 2013. 源码:https://github.com/danielfrg/word2vec 文章目的 本文的目的是提出学习高质量的词向量(word2vec)的方法,这些方法主要利用在十亿或者百万词汇的数据集上.因此作者提出了两个新颖的模型(CBOW,Skip…
dmesg 中异常打印: kernel: irq 632: Affinity broken due to vector space exhaustion. kernel: irq 633: Affinity broken due to vector space exhaustion. 这个打印并不是申请不到中断号,而是已经申请到了中断号,但是配置中断路由的时候, 想要生效的中断绑核与预期不一致,代码为: commit 743dac494d61d991967ebcfab92e4f80dc7583b…
xml中文档(query)的结构: <topic> <number>CIRB010TopicZH006</number> <title>科索沃難民潮</title> <question> 查詢科索沃戰爭中的難民潮情況,以及國際間對其采取的援助. </question> <narrative> 相關文件內容包含科省難民湧入的地點.人數.受安置的狀況,難民潮引發的問題,参與救援之國家與國際組織,其援助策略與行動內容…
摘要 本文提出了两种从大规模数据集中计算连续向量表示(Continuous Vector Representation)的计算模型架构.这些表示的有效性是通过词相似度任务(Word Similarity Task)来度量的.实验结果表明,这种方法要优于已有的基于其他类型的神经网络模型的效果.更重要的是,这种方法可以以更低的计算代价获得更高的词相似性预测的准确度.举个例子来说,从16亿词的语料库中学习表示大概需要不到一天的时间.从效果角度来讲,在词的语法与语义相似度方面,达到了领先水平. 背景介绍…
1. 非常好的 Python 教程 <深入 Python 3.0> 以及 IBM 开发社区的博客探索 Python. 2. 子集: s 是 S 的子集 >>>S = {2, 3, 4, 5, 6, 7} >>>s = {x for x in S if x%2==0} # 偶数子集 >>>s set([2, 4, 6]) 3. 映射:Ceasar 加密 >>> import string >>> table…
这个Lab的内容光是说明就有7页之巨,我反复看了很久才看懂一点点,Lab主要完成的是从不同坐标系表示之间变换的方法. 原始的图片,从Camera basis的表示转换成WhiteBoard basis的表示 里面的Problem 3是难点,Problem 4我没有完成,因为还缺少之前的代码,暂时不写. 注意Problem 3中的vector h不能通过print(h)来获得,因为print会对浮点数进行四舍五入,导致答案错误. #from image_mat_util import * from…
1. 矩阵与映射 矩阵和映射包含两方面的关系: 简单:已知矩阵 M, 从向量 x 映射到 M * x. (注:矩阵与行向量的点乘) 稍微复杂:已知映射 x ->M * x, 求矩阵 M. 第一种情况直接运算就可以得到映射,就不详细写了,着重写第二种情况. 首先,假设 x 为 n 维行向量, M*x 为 m 维列向量,可以知道 M 是 m × n 大小的矩阵.在点乘里面,M 的列向量是基向量, x 向量的每个分量是线性组合的系数,M 矩阵可以写成: 怎么求出 v1, v2, ..., vn 向量呢…
1. 线性组合 概念很简单: 当然,这里向量前面的系数都是标量. 2. Span 向量v1,v2,.... ,vn的所有线性组合构成的集合,称为v1,v2,... ,vn的张成(span).向量v1,v2,...vn的张成记为Span{v1,v2,... ,vn}. 回顾上一次课里面的电脑登陆认证的过程,假设黑客知道使用 GF(2) 加密,截获到一组电脑的问题 alpha 以及用户的回答 beta: 那么即使黑客不知道密码, alpha 所组成的 span 里面的所有问题都可以通过线性组合来得到…
1. list 画点 >>> from plotting import plot >>> L = [[2, 2], [3, 2], [1.75, 1], [2, 1], [2.25, 1], [2.5, 1], [2.75, 1], [3, 1], [3.25, 1]] >>> plot(L) 2. 缩放 alpha × vec = [alpha × elem for elem in vec] >>> def scalar_vecto…
VSM思想 把文档表示成R|v|上的向量,从而可以计算文档与文档之间的相似度(根据欧氏距离或者余弦夹角) 那么,如何将文档将文档表示为向量呢? 首先,需要选取基向量/dimensions,基向量须是线性独立的或者正交的向量. 在IR系统中,有两种方式决定基向量: 1.核心概念的思想(core concept):把词语的类型分类,按照其在不同分类上的“倾斜程度”决定向量的值.but,很难决定基向量. 2.把出现过的term(词语)都当作是一个基向量,假定所有的基向量都是相互正交相互独立的.以下我们…
论文链接:https://arxiv.org/pdf/1301.3781.pdf 参考: A Neural Probabilistic Language Model (2003)论文要点  https://www.cnblogs.com/yaoyaohust/p/11310774.html - 线性规律linear regularities: "king - man = queen - woman" - 语法和语义规律syntactic and semantic regularitie…
Given a m x n matrix, if an element is 0, set its entire row and column to 0. Do it in place. Follow up: Did you use extra space? A straight forward solution using O(mn) space is probably a bad idea. A simple improvement uses O(m + n) space, but stil…
小结: 1.block diagonal matrix  直和 块对角矩阵 A block diagonal matrix is a block matrix that is a square matrix, and having main diagonal blocks square matrices, such that the off-diagonal blocks are zero matrices. A block diagonal matrix A has the form wher…
导语:其他集数可在[线性代数]标籤文章找到.线性子空间是一个大课题,这里先提供一个简单的入门,承接先前关于矩阵代数的讨论,期待与你的交流. Overview: Subspace definition In a vector space of Rn, sets of vectors spanning a volume EQUAL TO OR SMALLER THAN that of Rn form subspaces of that vector space of Rn. A subset H o…
Overview: Matrix algebra Matrix algebra covers rules allowing matrices to be manipulated algebraically via addition, subtraction, multiplication and division. However, despite the manipulations illustrated in the following may seem to be like that of…
Vector Space: R1, R2, R3,R4 , .... Each space Rn consists of a whole collection of vectors. R5 contains all column vectors with five components. This is called "5-dimensional space". The great thing about linear algebra is that it deals easily w…
Chap 1: Linear Equations and Matrix Linear equations Gaussian elimination Pivot; Triangularize; Back substitution; Coefficient matrix, augmented matrix, row vector & column vector; the meaning of Ai*, A*j; 3 situations of solution existence (under th…
表达式分析+矩阵+计算器+寄存器=矩阵计算器 怎么想起来搞这个呢.. //刚看龙书兴致勃勃要搞表达式分析 这个寄存器比较简陋,26字母+4缓存,//字母不分大小写 当然,不只能算矩阵,还能算数= = 简陋的命令行如图 尚处于初步阶段,奇怪的功能们尚待加入=ω=   代码 展示一下接口吧= = //matrix.h #ifndef __MATRIX_H__ #define __MATRIX_H__ #include <vector> using std::vector; template <…