数据科学中的并行计算:以R,C++和CUDA为例[ParallelComputingforDataScience:withExamplesinR,C++andCUDA]
内容简介
《数据科学中的并行计算:以R,C++和CUDA为例》是一本并行计算领域中,注意力完全集中在并行数据结构、算法、软件工具及数据科学中具体应用的书。
《数据科学中的并行计算:以R,C++和CUDA为例》中的例子不仅有经典的“n个样本,p个变量”的矩阵形式,还有时间序列、网络图模型,以及各种其他的在数据科学中常见的结构。
《数据科学中的并行计算:以R,C++和CUDA为例》同时也讨论7适用于多种硬件、多种编程语言的的软件包。
《数据科学中的并行计算:以R,C++和CUDA为例》特点
·关注数据科学中的应用,包括统计学、数据挖掘和机器学习。
·讨论了数据科学中的常见数据结构,如网络图模型。
·通篇强调7普遍的原理,如避免降低并行程序速度的因素。
·覆盖了主流的计算平台:多核、集群以及图像处理单元(GPU)。
·解释了Thrust包如何降低多核机器和GPU编程的难度,并使得同一份代码能够在不同的平台上工作。
·在作者网站上提供了样例代码。
作者简介
汪磊,中科院微系统所通信专业博士。曾活跃在Julia等多个开源项目。现就职于滴滴出行,负责订单派单策略方向。
寇强,美国印第安纳大学信息学博士在读,Rcpp核心成员。