TBB 主页及部分说明及TBB的Atomic

Posted on 2011-09-15 06:30 RTY 阅读(517) 评论(0) 编辑收藏引用所属分类: TBB

事情十这样的，有同事想要统计某些广告的点击，在多线程下运行，可能会同时操作同一个数据项，最早使用一个全局锁，效果不好，现在改成了细粒度锁，每一个数据项一个锁，但还是希望性能更好些。

我的想法是，使用Intel TBB的Atomic，这就避免了使用锁，同时性能也会提升，不过，到底能提升多少还要用数据说话。

1. 不使用锁的情况

#include <iostream>

＃include <vector>

#include <pthread.h>

using namespace std;

int v = 0;
 
void * tf(void * args)
{
    for(int i = 0;i < 100000;i++)
    {
        v += 1;
    }
 
    return NULL;
}
 
int main()
{
    pthread_t tid;
    vector<pthread_t> vp;
    for (int i = 0;i < 100;i++)
    {
        pthread_create(&tid, NULL, tf, NULL);
        vp.push_back(tid);
    }
 
    for (int i = 0;i < 100;i++)
    {
        pthread_join(vp[i], NULL);
    }
 
    cout<<v<<endl;
 
    return 0;
}

意料之内，很快，但结果不对

2706056
 
real    0m0.038s
user    0m0.127s
sys 0m0.005s

2. 换用mutex保护

#include <iostream>
\#include <pthread.h>
#include <vector>
using namespace std;
 
pthread_mutex_t mt = PTHREAD_MUTEX_INITIALIZER;
int v;
 
void * tf(void * args)
{
    for(int i = 0;i < 100000;i++)
    {
        pthread_mutex_lock(&mt);
        v += 1;
        pthread_mutex_unlock(&mt);
    }
    return NULL;
}
 
int main()
{
    pthread_t tid;
    vector<pthread_t> vp;
    for (int i = 0;i < 100;i++)
    {
        pthread_create(&tid, NULL, tf, NULL);
        vp.push_back(tid);
    }
 
    for (int i = 0;i < 100;i++)
    {
        pthread_join(vp[i], NULL);
    }
 
    cout<<v<<endl;
 
    return 0;
}

结果正确了，但太慢了

10000000
 
real    0m25.782s
user    0m3.929s
sys 0m25.601s

3. 用Atomic替换下吧

#include <iostream>
#include <tbb/atomic.h>
#include <pthread.h>
#include <vector>
using namespace std;
 
typedef tbb::atomic<int> ATOMINT;
ATOMINT v;
 
void * tf(void * args)
{
    for(int i = 0;i < 100000;i++)
    {
        v += 1;
    }
    return NULL;
}
 
int main()
{
    pthread_t tid;
    vector<pthread_t> vp;
    for (int i = 0;i < 100;i++)
    {
        pthread_create(&tid, NULL, tf, NULL);
        vp.push_back(tid);
    }
 
    for (int i = 0;i < 100;i++)
    {
        pthread_join(vp[i], NULL);
    }
 
    cout<<v<<endl;
 
    return 0;
}

结果准而快

10000000
 
real    0m0.222s
user    0m0.817s
sys 0m0.007s

结论：TBB的Atomic性能卓越，对于POD数据，能用Atomic，还是用Atomic吧

p.s

我是在Mac OS X上测试的，x86_64

只有注册用户登录后才能发表评论。


相关文章: TBB 主页及部分说明及TBB的Atomic Parallel Programming Essentials via the Intel TBB TBB 主页及部分说明及TBB的Atomic 2011 英特尔® 线程挑战赛－工具与下载

网站导航: 博客园博客园最新博文博问管理

RTY 实践出真知

TBB 主页及部分说明及TBB的Atomic

日历

常用链接

留言簿(12)

随笔分类(538)

随笔档案(319)

文章分类(11)

文章档案(11)

官方教程

知识共享链接

搜索

最新评论

阅读排行榜

评论排行榜

RTY 实践出真知

TBB 主页及部分说明 及TBB的Atomic

日历

常用链接

留言簿(12)

随笔分类(538)

随笔档案(319)

文章分类(11)

文章档案(11)

官方教程

知识共享链接

搜索

最新评论

阅读排行榜

评论排行榜

TBB 主页及部分说明及TBB的Atomic