Matrix multiplication

Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others)
Total Submission(s): 5236 Accepted Submission(s): 2009

Problem Description

Given two matrices A and B of size n×n, find the product of them.

bobo hates big integers. So you are only asked to find the result modulo 3.

Input

The input consists of several tests. For each tests:

The first line contains n (1≤n≤800). Each of the following n lines contain n integers -- the description of the matrix A. The j-th integer in the i-th line equals A_ij. The next n lines describe the matrix B in similar format (0≤A_ij,B_ij≤10⁹).

Output

For each tests:

Print n lines. Each of them contain n integers -- the matrix A×B in similar format.

Sample Input

0 1

2 3

4 5

6 7

Sample Output

0 1

2 1

Author

Xiaoxu Guo (ftiasch)

Source

2014 Multi-University Training Contest 5

题目就是裸的矩阵乘法。

代码:

 #include<iostream>

 #include<cstdio>

 #include<algorithm>

 #include<cstring>

 #include<cstdlib>

 #include<string.h>

 #include<set>

 #include<vector>

 #include<queue>

 #include<stack>

 #include<map>

 #include<cmath>

 using namespace std;

 int a[][],b[][],c[][];

 int main(){

     int n;

     while(~scanf("%d",&n)){

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&a[i][j]);

                 a[i][j]%=;

                 c[i][j]=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&b[i][j]);

                 b[i][j]%=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 if(!a[i][j])continue;//判断优化

                 for(int k=;k<n;k++)

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

             }

         for(int i=;i<n;i++){

             for(int j=;j<n;j++)

                 if(j==n-)printf("%d\n",c[i][j]%);

                 else printf("%d ",c[i][j]%);

         }

     }

         return ;

 }

看其他题解

这个题有两种解法，一种是先对矩阵进行%3，

然后在3次方循环里判断如果元素如果是0，则continue不进行乘积的累加的结果。能起到优化的作用。

还有一种就是对矩阵进行某一个进行转置后，再进行两个矩阵的乘积累加。也能起到优化。

代码:

 #include<iostream>

 #include<cstring>

 #include<cmath>

 #include<cstdio>

 #include<algorithm>

 using namespace std;

 int a[][],b[][],c[][];

 int main(){

     int n;

     while(~scanf("%d",&n)){

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&a[i][j]);

                 a[i][j]%=;

                 c[i][j]=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 scanf("%d",&b[i][j]);

                 b[i][j]%=;

             }

         for(int i=;i<n;i++)

             for(int j=;j<n;j++)

             swap(b[i][j],b[j][i]);//转置优化

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 //if(!a[i][j])continue;

                 for(int k=;k<n;k++)

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

             }

         for(int i=;i<n;i++){

             for(int j=;j<n;j++)

                 if(j==n-)printf("%d\n",c[i][j]%);

                 else printf("%d ",c[i][j]%);

         }

     }

         return ;

 }

用转置的话，也可以继续用3次方循环里判断元素是否为0，continue来优化。

直接判断的优化，时间跑1279MS，用转置不用判断是1653MS，用转置也用判断是1482MS，emnnnn。。。

 for(int i=;i<n;i++)

              for(int j=;j<n;j++){

                  for(int k=;k<n;k++)

                      c[i][k]=c[i][k]+a[i][j]*b[j][k];

              }

如果是按这种循环写，不管有没有在3次方循环里判断元素是否为0，或者不管有没有转置，都不会超时！！！

然后就是还发现了一个问题，如果三层循环里面写的是c[i][j]的循环会超时的。

 for(int i=;i<n;i++)

              for(int j=;j<n;j++){

                  for(int k=;k<n;k++)

                      c[i][j]=c[i][j]+a[i][k]*b[k][j];

              }

这个题简直有毒啊。

不管是直接判断优化还是转置优化，还是转置+判断优化，都是超时。

在经过这么多次智障操作之后(之后又交了一发，一共23次)，并且在记录了循环的次数之后！！！

我发现。。。

             int num=;

         for(int i=;i<n;i++)

             for(int j=;j<n;j++){

                 //if(!a[i][j])continue;

                 for(int k=;k<n;k++){

                     c[i][k]=c[i][k]+a[i][j]*b[j][k];

                     num++;

                 }

             }

在都不经过优化的情况下，num的次数都是一样的，两个循环的次数都是一样的。

为什么一个可以过，一个就超时呢？？？(所有的都测过了_(:з」∠)_ )
未解之谜啊啊啊啊啊啊啊啊啊啊啊啊啊啊_(:з」∠)_

玩不了玩不了。。。

由于C与C++的二维数组是以行为主序存储的。

因此矩阵a的行数据元素是连续存储的,而矩阵b的列数据元素是不连续存储的(N*1的矩阵除外),

为了在矩阵相乘时对矩阵b也连续读取数据,根据局部性原理对矩阵b进行转置。

然而并没有什么用，在不转置的情况下，c[i][k]的是两个按行的，c[i][j]是一个按行的。c[i][k]比c[i][j]快我可以理解。但是！！！

转置之后，c[i][k]是两个按列的，c[i][j]是一个按行的，按道理应该是c[i][j]的快啊，但是为什么还是c[i][k]]快啊。

啊啊啊啊啊啊啊，玩不了玩不了。

传送门:虽然名字叫矩阵乘法优化，然而并没有什么用

HDU 4920.Matrix multiplication-矩阵乘法的更多相关文章

HDU 4920 Matrix multiplication(矩阵相乘)
各种TEL,233啊.没想到是处理掉0的情况就能够过啊.一直以为会有极端数据.没想到居然是这种啊..在网上看到了一个AC的奇妙的代码,经典的矩阵乘法,仅仅只是把最内层的枚举,移到外面就过了啊...有点 ...
HDU 4920 Matrix multiplication 矩阵相乘。稀疏矩阵
Matrix multiplication Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/ ...
HDU 4920 Matrix multiplication（bitset)
HDU 4920 Matrix multiplication 题目链接题意:给定两个矩阵,求这两个矩阵相乘mod 3 思路:没什么好的想法,就把0的位置不考虑.结果就过了.然后看了官方题解,上面是用 ...
hdu 4920 Matrix multiplication（矩阵乘法）2014多培训学校5现场
Matrix multiplication Time ...
hdu 4920 Matrix multiplication bitset优化常数
Matrix multiplication Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/ ...
HDU 4920 Matrix multiplication（bitset优化）
题目链接 Matrix multiplication 求矩阵A和B相乘的结果. 因为答案只要对3取模,所以我们可以通过一些方法来加速计算. 我们对两个矩阵各开两个bitset,分别存储模3余1和模3余 ...
2014多校第五场1010 || HDU 4920 Matrix multiplication（矩阵乘法优化）
题目链接题意 : 给你两个n*n的矩阵,然后两个相乘得出结果是多少. 思路 :一开始因为知道会超时所以没敢用最普通的方法做,所以一直在想要怎么处理,没想到鹏哥告诉我们后台数据是随机跑的,所以极端数据 ...
HDU 4920 Matrix multiplication （硬件优化）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4920 解题报告:求两个800*800的矩阵的乘法. 参考这篇论文:http://wenku.baidu ...
hdu - 4920 - Matrix multiplication（缓存优化+开挂）
题意:求两个n x n的矩阵相乘后模3的结果,n <= 800. 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4920 -->>呀呀 ...

随机推荐

剑指Offer - 九度1522 - 包含min函数的栈
剑指Offer - 九度1522 - 包含min函数的栈2013-12-01 23:44 题目描述: 定义栈的数据结构,请在该类型中实现一个能够得到栈最小元素的min函数. 输入: 输入可能包含多个测 ...
BInder浅析
Binder是什么 Binder是运行在Android内核态用于进程间通信(IPC)的驱动,采用C/S架构,由三项基本组件组成:Binder服务端,Binder驱动,应用程序客户端. 为什么要用Bin ...
浅谈==和equals的区别
java中的==和equals的区别? 看上面的代码,输出的结果是: true false true true 1.为什么会有上面的区别呢?==和equals比较的到底是什么呢? 搞清楚两者的区别其实 ...
centos6 install cobbler
cobbler 安装一:定义yum源 wget -c -O CentOS-Base.repo http://mirrors.163.com/.help/CentOS6-Base-163.repo ...
web知识清单
声名随笔中的实例链接到另一个博客是我本人的另一个博客号模块一:HTML 1.html是什么: hyperText markup language超文本标记语言超文本:比文本更丰富的内容所有的浏览 ...
深入探讨ui框架
深入探讨前端UI框架 1 前言先说说这篇文章的由来最近看riot的源码,发现它很像angular的dirty check,每个component ( tag )都保存一个expressions数组 ...
django的F和Q对象
F表达式和Q表达式: # 示例模型如下 class Book(models.Model): """图书模型""" name = models ...
vmware中桥接丶仅主机丶net模式的区别
VMWare提供三种工作模式桥接(bridge).NAT(网络地址转换)和host-only(主机模式). 桥接模式在桥接模式下,VMWare虚拟出来的操作系统就像是局域网中的一台独立的主机(主机和 ...
Hexo-设置阅读全文
最近使用Hexo搭建了自己的博客,并且使用了简洁但是强大的NexT主题.这里介绍一下NexT主题下设置在首页显示一篇文章的简介,在简介后面提供一个链接阅读全文来进入文章的详情页.效果请看我的小窝在 ...
js 清除文本中的html标签
text.replace(/<[^>]+>/g,"");

HDU 4920.Matrix multiplication-矩阵乘法

Matrix multiplication

HDU 4920.Matrix multiplication-矩阵乘法的更多相关文章

随机推荐

热门专题