第 8 章 并行化操作

向量化运算、并行运算和分布式运算

  • future 在 R 语言中提供统一的并行和分布式处理框架
  • future.apply 可以替代 base R 提供的 apply 族函数
  • future.batchtools 使用 batchtools 实现并行和分布式处理
  • batchtools Map 函数的并行实现,用于高性能计算系统和分布式处理,可以单机多核并行也可以多机并行,还提供了一种抽象的机制去定义大规模计算机实验。
  • multidplyr 是 dplyr 的后端,多核环境下实现数据分块,提高并行处理性能
  • disk.frame 是基于磁盘的超出内存容量的快速并行数据操作框架
  • parallelMap R package to interface some popular parallelization back-ends with a unified interface
  • big.data.table 基于 data.table 的分布式并行计算