第 4 章 字符串操作
Handling Strings with R 和 R for Data Science 提供字符串入门介绍 ,Sara Stoudt 整理了 stringr 包与 Base R 正则表达式函数的对应表 https://stringr.tidyverse.org/articles/from-base.html
stringr 基于 stringi 包字符串处理包, re2r 包基于 Google 开发的 C++ 库 re2,Google 编程之夏项目提供了一份 正则表达式性能综述, stringdist Approximate String Matching and String Distance Functions 近似字符串匹配和字符串距离计算函数 [11]
- janitor
- Manipulating strings with the stringr package
- filesstrings 基于 stringr 操作字符串
- strex 一些没有包含在 stringr 或者 stringi 中的字符串操作函数
- tidytext Text mining using dplyr, ggplot2, and other tidy tools
stringdist stringfish stringb stringi stringr
字符和字符串类型的数据值得单独拿出来讲,不仅因为内容多,而且比较难,应用范围最广,特别是面对文本类型的数据时,几乎是避不开的!R 的前身是 S,S 的前身是一些 Fortran 和 C 子程序,最早在贝尔实验室是用于文本分析领域,因此在 R 基础包中提供了丰富的字符串处理函数,你可以在R控制台中执行如下一行命令查看
help.search(keyword = "character", package = "base")
本章主要介绍 R 内置的字符串操作函数
参考文献
[11]
M. P. J. van der Loo, “The stringdist package for approximate string matching,” The R Journal, vol. 6, pp. 111–122, 2014,Available: https://CRAN.R-project.org/package=stringdist