并行矩阵相乘最快多少秒，矩阵乘法快速幂

本文目录一览

1，矩阵乘法快速幂
2，C并行技术哪个最快Qpar PPL AMP OpenMP
3，计算矩阵相乘Matlab和C相比应当是哪个更快
4，矩阵乘法怎么算如 2 7 0 4 0 2 0乘 0 1 4 求过程 0 0
5，矩阵乘法的最小时间复杂度是多少
6，matrix10001000matrix10001000此矩阵相乘为什么会出大约7秒左
7，求一个使用并行算法递归实现矩阵乘法的程序

1，矩阵乘法快速幂

A^2k = (A^2)^k，A^(2k+1) = (A^2)^k*A也就是对于n规模的的，可以化到n/2

矩阵乘法快速幂

2，C并行技术哪个最快Qpar PPL AMP OpenMP

应该是OpenMP, 到不是它的速度多快, 而是一个开源的东西, 会被更多的人研究, 因此它的应用环境可能更容易建立起来.

C并行技术哪个最快Qpar PPL AMP OpenMP

3，计算矩阵相乘Matlab和C相比应当是哪个更快

我觉得是matlab，毕竟matlab就是以矩阵处理见长，矩阵实验室的名字也不是白叫的。

你说呢...

计算矩阵相乘Matlab和C相比应当是哪个更快

4，矩阵乘法怎么算如 2 7 0 4 0 2 0乘 0 1 4 求过程 0 0

矩阵乘法就是行乘以列得元素两个3行3列相乘还是三行三列记A、B、Cc11=2*0+0*0+7*0=0以此类推

两矩阵相乘，左矩阵第一行乘以右矩阵第一列（分别相乘，第一个数乘第一个数），乘完之后相加，即为结果的第一行第一列的数，依次往下算，推荐网址：http://baike.baidu.com/view/2455255.htm。对照例子学得快

5，矩阵乘法的最小时间复杂度是多少

x3=x2-4x+4x3-x2+4x-4=0x2(x-1)+4(x-1)=0(x2+4))(x-1)=0x=1所以交点（1,1）x3和(x-2)2与x轴交点是(0,0),(2,0)所以面积=∫(0到1)x3dx+∫(1到2)(x-2)2dx=x^4/4(0到1)+(x-2)3/3(1到2)=(1/4-0)+(0+1/3)=7/12

假设矩阵a为n*m,矩阵b为m*n ,则axb,如下计算过程：1.矩阵a中第一行的元素与矩阵b的第一列元素对应相乘,得结果第一行的第一个元素要进行m次乘法运算,故总的需要m*n*m次乘法运算.2.计算时间复杂度.即大o,运行上限.故o(n^3)

6，matrix10001000matrix10001000此矩阵相乘为什么会出大约7秒左

第一题一个简单的修改是把for(long long i = 2 ; i <= (long long)sqrt((double)target) ; i++)改成long long upper_bound = (long long)sqrt((double)target);for(long long i = 3 ; i <= upper_bound ; i+=2)这样偶数可以不用搜进一步优化可以把素因子分成6k-1型和6k+1型，还能省不少要改多线程的话可以把[0,upper_bound]分成若干段，每个线程搜其中的一段里的因子至于矩阵乘法，N阶矩阵相乘需要2N^3次运算，所以会相对比较慢，不过对N=1000而言7秒还是太慢了点，所以要分析代码才知道哪里没实现好我就指点你这些了，如果你不会那也没办法，看上去你的基本功比较成问题，这个无法速成

7，求一个使用并行算法递归实现矩阵乘法的程序

这个程序不是我编的，权当给你个参考，我也当作学习了，谢谢。//A(4,4)*B(4,1)=C(4,1)//如果单机执行,进程数为4//如果机群执行,并行机个数为4 #include <stdio.h> #include <mpi.h> #define SIZE 4 int main(int argc, char **argv) int j; int rank, size, root; float X[SIZE]; float X1[SIZE]; float Y1[SIZE]; float Y[SIZE][SIZE]; float Z[SIZE]; float z; root = 0; MPI_Init(&argc, &argv); MPI_Comm_size(MPI_COMM_WORLD, &size); MPI_Comm_rank(MPI_COMM_WORLD, &rank); printf("%d %d %d\n",SIZE,size,rank); if (rank==root) Y[0][0] = 1; Y[1][0] = 2; Y[2][0] = 3; Y[3][0] = 4; Y[0][1] = 5; Y[1][1] = 6; Y[2][1] = 7; Y[3][1] = 8; Y[0][2] = 9; Y[1][2] = 10; Y[2][2] = 11; Y[3][2] = 12; Y[0][3] = 13; Y[1][3] = 14; Y[2][3] = 15; Y[3][3] = 16; Z[0] = 1; Z[1] = 2; Z[2] = 3; Z[3] = 4; } MPI_Barrier(MPI_COMM_WORLD); //聚合通信_障碍同步,调用该函数时进程处于等待状态 //直到通信器中所有的进程都调用该函数是才继续执行. MPI_Scatter(Y,SIZE,MPI_FLOAT,Y1,SIZE,MPI_FLOAT,root,MPI_COMM_WORLD); //聚合通信_数据散发,它将一个进程中的数据按块散发给通信器中的所有进程 //依次散发,本题中散发情况为: //Y[0][0]->0,Y[0][1]->1,Y[0][2]->2,Y[0][3]->3 //Y[1][0]->0,Y[1][1]->1,Y[1][2]->2,Y[1][3]->3 //Y[2][0]->0,Y[2][1]->1,Y[2][2]->2,Y[2][3]->3 //Y[3][0]->0,Y[3][1]->1,Y[3][2]->2,Y[3][3]->3 MPI_Scatter(Z,1,MPI_FLOAT,&z,1,MPI_FLOAT, root,MPI_COMM_WORLD); //分别将Z[0],Z[1],Z[2],Z[3],散发给进程0,1,2,3 for(j=0;j <SIZE;j++) X1[j] = z*Y1[j]; } MPI_Reduce(X1,X,SIZE,MPI_FLOAT,MPI_SUM,root,MPI_COMM_WORLD); //聚合通信_归约,求和 if (rank==0) printf("%g %g %g %g %g\n",Y1[0],Y1[1],Y1[2],Y1[3],z); //进程0分配的各数据,Y1[SIZE],z printf( "%g\n",X[0]);printf( "%g\n",X[1]);printf( "%g\n",X[2]);printf( "%g\n",X[3]); } MPI_Finalize(); return 0; }

你好！I am looker_on!仅代表个人观点，不喜勿喷，谢谢。

文章TAG：并行矩阵相乘最快多少秒并行矩阵矩阵相乘