第 8 章 并行化操作
向量化运算、并行运算和分布式运算
- future 在 R 语言中提供统一的并行和分布式处理框架
- future.apply 可以替代 base R 提供的 apply 族函数
- future.batchtools 使用 batchtools 实现并行和分布式处理
- batchtools Map 函数的并行实现,用于高性能计算系统和分布式处理,可以单机多核并行也可以多机并行,还提供了一种抽象的机制去定义大规模计算机实验。
- multidplyr 是 dplyr 的后端,多核环境下实现数据分块,提高并行处理性能
- disk.frame 是基于磁盘的超出内存容量的快速并行数据操作框架
- parallelMap R package to interface some popular parallelization back-ends with a unified interface
- big.data.table 基于 data.table 的分布式并行计算