量化数据
-
北京大学R语言教程(李东风)第25章: 函数式编程和数据框列表列
函数式编程介绍 R支持类(class)和方法(method),实际提供了适用于多种自变量的通用函数(generic function,或称泛型函数),不同自变量类型调用该类特有的方法, 但函数名可以保持不变。这可以支持一定的面向对象编程方式。 R也支持函数式编程,但不是专门的函数式编程语言。R语言的设计主要用函数求值来进行运算;R的用户主要使用函数调用来访问…
-
北京大学R语言教程(李东风)第24章:数据汇总
dplyr包的summarise()函数可以对数据框计算统计量。 以肺癌病人化疗数据cancer.csv为例,有34个肺癌病人的数据: d.cancer <- read_csv( “data/cancer.csv”, locale=locale(encoding=”GBK”)) ## Rows: 34 Columns: 6 ## ── Column s…
-
北京大学R语言教程(李东风)第23章: 数据整理
tidyverse系统 tidyverse是一系列用于数据输入输出、数据整理和数据汇总的R扩展包集合,使用这些包遵循相近的编程风格,比直接使用基本R编程要更直观、容易理解。其中readr包用于读入数据,tidyr包用于进行长、宽表转换,dplyr包用于数据整理与汇总,purr包进行map-reduce类操作,等等。 假设数据以tibble格式保存。数据集如果…
-
北京大学R语言教程(李东风)第18章: R程序效率
R是解释型语言,在执行单个运算时,效率与编译代码相近;在执行迭代循环时, 效率较低,与编译代码的速度可能相差几十倍。在循环中对变量进行修改尤其低效,因为R在修改某些数据类型的子集时会复制整个数据对象。R以向量、矩阵为基础运算单元,在进行向量、矩阵运算时效率很高,应尽量采用向量化编程。 另外,R语言的设计为了方便进行数据分析和统计建模,有意地使语言特别灵活,比…