memcpy/memmove?快速乘?

memcpy?memmove?

//#pragma GCC optimize(2)

#include<bits/stdc++.h>

using namespace std;

const int n=;

int a[n+],b[n+],c[n+],d[n+],e[n+],f[n+];

int main()

{

    int i;

    srand();

    for(i=;i<=n;i++)    a[i]=rand();

    clock_t st1=clock();

    memcpy(b+,a+,sizeof(int)*n);

    clock_t ed1=clock();

    clock_t st2=clock();

    memmove(c+,a+,sizeof(int)*n);

    clock_t ed2=clock();

    clock_t st3=clock();

    for(i=;i<=n;i++)    d[i]=a[i];

    clock_t ed3=clock();

    clock_t st4=clock();

    for(i=;i<=n-;i+=)

    {

        e[i]=a[i];

        e[i+]=a[i+];

        e[i+]=a[i+];

        e[i+]=a[i+];

    }

    (i<=n)&&(e[i]=a[i]);

    (i+<=n)&&(e[i+]=a[i+]);

    (i+<=n)&&(e[i+]=a[i+]);

    clock_t ed4=clock();

    clock_t st5=clock();

    for(i=;i<=n-;i+=)

    {

        f[i]=a[i];

        f[i+]=a[i+];

        f[i+]=a[i+];

        f[i+]=a[i+];

        f[i+]=a[i+];

        f[i+]=a[i+];

        f[i+]=a[i+];

        f[i+]=a[i+];

    }

    (i<=n)&&(f[i]=a[i]);

    (i+<=n)&&(f[i+]=a[i+]);

    (i+<=n)&&(f[i+]=a[i+]);

    (i+<=n)&&(f[i+]=a[i+]);

    (i+<=n)&&(f[i+]=a[i+]);

    (i+<=n)&&(f[i+]=a[i+]);

    (i+<=n)&&(f[i+]=a[i+]);

    clock_t ed5=clock();

    cout<<"time1:"<<ed1-st1<<' '<<memcmp(a+,b+,sizeof(int)*n)<<'\n';

    cout<<"time2:"<<ed2-st2<<' '<<memcmp(a+,c+,sizeof(int)*n)<<'\n';

    cout<<"time3:"<<ed3-st3<<' '<<memcmp(a+,d+,sizeof(int)*n)<<'\n';

    cout<<"time4:"<<ed4-st4<<' '<<memcmp(a+,e+,sizeof(int)*n)<<'\n';

    cout<<"time5:"<<ed5-st5<<' '<<memcmp(a+,f+,sizeof(int)*n)<<'\n';

    return ;

}

不开优化：
time1:139254 0
time2:198093 0
time3:601853 0
time4:588247 0
time5:598584 0

O2：
time1:138256 0
time2:139235 0
time3:426570 0
time4:322532 0
time5:301933 0

Ofast：
time1:137893 0
time2:140585 0
time3:422154 0
time4:309306 0
time5:298620 0

很显然在大数据(n=50000000)下memcpy最快

另外，在小数据（比如n=26）下，测试得到明显直接赋值(time3)最快

在较小数据（比如n=1000）下，测试得到memmove最快？

快速乘

测试对比程序：

#include<bits/stdc++.h>

using namespace std;

typedef long long ll;

ll rd()

{

    return rand()|(ll(rand())<<);

}

ll md;

ll mul1(ll x,ll y)

{

    x%=md;y%=md;

    ll t=x*y-ll((long double)x/md*y+0.5)*md;

    return t<?t+md:t;

}

ll mul2(ll x,ll y)

{

    x%=md;y%=md;

    ll t=x*y-ll((long double)x*y/md+0.5)*md;

    return t<?t+md:t;

}

ll mul3(ll x,ll y)

{

    x%=md;y%=md;

    ll t=x*y-ll((long double)x/md*y+1e-)*md;

    return t<?t+md:t;

}

ll mul0(ll x,ll y)

{

    return __int128(x)*y%md;

}

ll a,b;

int main()

{

    int T=;

    srand();

    while()

    {

        T++;

        ll a=rd(),b=rd();

        md=rd();//%ll(1e18);

        //cout<<a<<' '<<b<<' '<<md<<'\n';

        ll t1=mul1(a,b),t2=mul0(a,b);//可将mul1改为mul2/mul3

        //cout<<t1<<' '<<t2<<'\n';

        if(t1!=t2)

        {

            printf("%d\n",T);

            puts("test");

            int t;cin>>t;

        }

        //int t;cin>>t;

    }

    return ;

}

经过一些测试，可以发现，mul3效果最差（在模数>=1e17时，100000组以内就拍出锅）；应该是1e-8不够

mul2效果没有mul1好（模数不设额外上限时，100000组以内出锅；上限1e18时，20秒不出锅）

mul1效果最好（模数不设额外上限时，20秒不出锅）

原因就不知道了。。。

memcpy/memmove?快速乘?的更多相关文章

自己实现的库函数2（memset,memcmp,memcpy,memmove）
memset,memcmp,memcpy,memmove是对内存进行管理的库函数,为了更好的理解和使用这几个函数,自己用C语言实现一下~ //内存设置函数void* my_memset(void* d ...
memset memcmp memcpy memmove 自己实现
memset memcmp memcpy memmove 自己实现 memset #include <stdio.h> #include <memory.h> #include ...
memcpy memmove区别和实现
memcpy与memmove的目的都是将N个字节的源内存地址的内容拷贝到目标内存地址中. 但当源内存和目标内存存在重叠时,memcpy会出现错误,而memmove能正确地实施拷贝,但这也增加了一点点开 ...
自己实现内存操作函数memset(),memcmp(),memcpy(),memmove()
1.memset()内存设置函数(初始化) void *my_memset(void* dest, int c, size_t count) { assert(dest != NULL); char ...
走进C标准库(7)——"string.h"中函数的实现memcmp,memcpy,memmove,memset
我的memcmp: int memcmp(void *buf1, void *buf2, unsigned int count){ int reval; while(count && ...
C的memset,memcpy,strcpy 的区别及memset memcpy memmove源码
extern void *memcpy(void *dest,void *src,unsigned int count);#include <string.h> 功能:由src所指内存 ...
一些关于memcpy memmove函数的区别，和模拟实现
memcpy: 它是c和c++使用的内存拷贝函数,memcpy函数的功能是从源src所指的内存地址的起始位置开始拷贝n个字节到目标dest所指的内存地址的起始位置中. 函数原型:void* memcp ...
strcpy和memcpy,memmove函数的区别
strcpy和memcpy的区别 strcpy和memcpy都是标准C库函数,它们有下面的特点. strcpy提供了字符串的复制.即strcpy只用于字符串复制,并且它不仅复制字符串内容之外,还会复制 ...
strcpy,memcpy,memmove和内存重叠分析
一:strcpy函数用法和实现: /* GNU-C中的实现(节选): */ char* strcpy(char *d, const char *s) { char *r=d; while((*d++= ...

随机推荐

Vue.js的动态组件模板
组件并不总是具有相同的结构.有时需要管理许多不同的状态.异步执行此操作会很有帮助. 实例: 组件模板某些网页中用于多个位置,例如通知,注释和附件.让我们来一起看一下评论,看一下我表达的意思是什么.评论 ...
人生苦短之Python发邮件
#coding=utf-8 import smtplib from email.mime.base import MIMEBase from email.mime.image import MIMEI ...
codeforces C. Team 解题报告
题目链接:http://codeforces.com/problemset/problem/401/C 题目意思:给出0和1的数目(分别为n和m个),问是否能构造一条同时满足连续两个0不能再一起和连续 ...
PGTM通用性能测试模型
PTGM通用性能测试模型一. 测试前期准备阶段目标: 1. 保证系统稳定性: 2. 建立合适的测试团队. 活动: 1. 系统基础功能验证类似于BVT测试,确保被测系统已具备进行性 ...
[原创]java操作word（一）
一. 需求背景在做项目的过程中,经常会遇到要把数据库数据导出到Word文件中的需求,因为很多情况下,我们需要将数据导出到WORD中进行打印.此需求可以通过用程序填充数据到word模板中来实现.所谓模 ...
js 分享代码--完整示例代码
<div class="bdsharebuttonbox" data-tag="share_1"> <a class="bds_ms ...
adb 调试命令
一.抓log 1. cat /proc/kmsg:抓kernel log(串口log) 2. 进入工程模式:adb shell am start -n com.mediatek.engineermo ...
CSS3：CSS 参考手册
ylbtech-CSS:CSS 参考手册 1.返回顶部 1. W3School 的 CSS 参考手册定期通过所有主流浏览器进行测试. CSS 属性 CSS 属性组: 动画背景边框和轮廓盒(框) ...
Jquery获取web窗体关闭事件，排除刷新页面
在js脚本里全局定义一个 var r=true;若是刷新的话则把r=false; $(window).unload(function () { if (r) { //这里面证明用户不是点的F5刷新执 ...
Deques and Randomized Queues
1. 题目重述完成三个程序,分别是双向队列,随机队列,和随机队列读取文本并输出k个数. 2. 分析 2.1 双向队列题目的性能要求是,操作时间O(1),内存占用最大48n+192byte. 当使用 ...

memcpy/memmove?快速乘?

memcpy?memmove?

快速乘

memcpy/memmove?快速乘?的更多相关文章

随机推荐

热门专题