北京大学R语言教程(李东风)第11章:列表类型

R中列表(list)类型来保存不同类型的数据。
一个主要目的是提供R分析结果输出包装:
输出一个变量,
这个变量包括回归系数、预测值、残差、检验结果等等一系列不能放到规则形状数据结构中的内容。
实际上,数据框也是列表的一种,
但是数据框要求各列等长,
而列表不要求。

列表可以有多个元素,
但是与向量不同的是,
列表的不同元素的类型可以不同,
比如,
一个元素是数值型向量,
一个元素是字符串,
一个元素是标量,
一个元素是另一个列表。

定义列表用函数list(), 如

rec <- list(name="李明", age=30,
  scores=c(85, 76, 90))
rec
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $scores
## [1] 85 76 90

typeof()函数判断一个列表,
返回结果为list
可以用is.list()函数判断某个对象是否列表类型

为了生成元素为空的长度为n的列表,程序如:

11.2 列表元素访问

列表的一个元素也可以称为列表的一个“变量”,
单个列表元素必须用两重方括号格式访问,如

rec[[3]]
## [1] 85 76 90
rec[[3]][2]
## [1] 76
rec[["age"]]
## [1] 30

列表的单个元素也可以用$格式访问,如

如果使用单重方括号对列表取子集,
结果还是列表而不是列表元素,如

rec[3]
## $scores
## [1] 85 76 90
is.list(rec[3])
## [1] TRUE

列表一般都应该有元素名,
元素名可以看成是变量名,
列表中的每个元素看成一个变量。
names()函数查看和修改元素名。

names(rec)
## [1] "name"   "age"    "scores"
names(rec)[names(rec)=="scores"] <- "三科分数"
names(rec)
## [1] "name"     "age"      "三科分数"
rec[["三科分数"]]
## [1] 85 76 90

可以修改列表元素内容。

rec[["三科分数"]][2] <- 0
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90

直接给列表不存在的元素名定义元素值就添加了新元素,
而且不同于使用向量,对于列表而言这是很正常的做法,比如

rec[["身高"]] <- 178
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

把某个列表元素赋值为NULL就删掉这个元素。

rec[["age"]] <- NULL
print(rec)
## $name
## [1] "李明"
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

list()函数中允许定义元素为NULL,这样的元素是存在的,如:

li <- list(a=120, b="F", c=NULL); li
## $a
## [1] 120
## 
## $b
## [1] "F"
## 
## $c
## NULL

但是,要把已经存在的元素修改为NULL值而不是删除此元素,
或者给列表增加一个取值为NULL的元素,
这时需要用单重的方括号取子集,
这样的子集会保持其列表类型,
给这样的子列表赋值为list(NULL),如:

li["b"] <- list(NULL)
li["d"] <- list(NULL)
li
## $a
## [1] 120
## 
## $b
## NULL
## 
## $c
## NULL
## 
## $d
## NULL

11.3 列表类型转换

as.list()把一个其它类型的对象转换成列表;
unlist()函数把列表转换成基本向量。如

li1 <- as.list(1:3)
li1
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
li2 <- list(x=1, y=c(2,3))
unlist(li2)
##  x y1 y2 
##  1  2  3

11.4 连接列表

两个列表可以用c连接成一个列表,
如:

li1 <- list(1:2)
li2 <- list(11:12)
li <- c(li1, li2)
li
## [[1]]
## [1] 1 2
## 
## [[2]]
## [1] 11 12

如下的做法没有达到目的:

li <- list()
li <- c(li, 1:3)
li <- c(li, 11:13)
li
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
## 
## [[4]]
## [1] 11
## 
## [[5]]
## [1] 12
## 
## [[6]]
## [1] 13

需要改为:

li <- list()
li <- c(li, list(1:3))
li <- c(li, list(11:13))
li
## [[1]]
## [1] 1 2 3
## 
## [[2]]
## [1] 11 12 13

11.5 返回列表的函数示例–strsplit()

strsplit()输入一个字符型向量并指定一个分隔符,
返回一个项数与字符型向量元素个数相同的列表,
列表每项对应于字符型向量中一个元素的拆分结果。

x <- c("10, 8, 7", "5, 2, 2", "3, 7, 8", "8, 8, 9")
res <- strsplit(x, ","); res
## [[1]]
## [1] "10" " 8" " 7"
## 
## [[2]]
## [1] "5"  " 2" " 2"
## 
## [[3]]
## [1] "3"  " 7" " 8"
## 
## [[4]]
## [1] "8"  " 8" " 9"

为了把拆分结果进一步转换成一个数值型矩阵,
可以使用sapply()函数如下:

t(sapply(res, as.numeric))
##      [,1] [,2] [,3]
## [1,]   10    8    7
## [2,]    5    2    2
## [3,]    3    7    8
## [4,]    8    8    9

sapply()函数是apply类函数之一,
稍后再详细进行讲解。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/77953.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2023年10月30日 01:56
下一篇 2023年10月31日 00:16

相关推荐

  • 北京大学R语言教程(李东风)第24章:数据汇总

    dplyr包的summarise()函数可以对数据框计算统计量。 以肺癌病人化疗数据cancer.csv为例,有34个肺癌病人的数据: d.cancer <- read_csv( “data/cancer.csv”, locale=locale(encoding=”GBK”)) ## Rows: 34 Columns: 6 ## ── Column s…

    2023年11月12日
    62000
  • 为什么世界卫生组织关于癌症和阿斯巴甜(是的,健怡可乐中的成分)的声明值得一听

    食品安全领域有一些令人震惊的消息:阿斯巴甜,一种用于多种食品和饮料的常见人造甜味剂,即将被全球领先的卫生机构宣布为致癌物。 7 月中旬,世界卫生组织 (WHO) 下属机构国际癌症研究机构 (IARC) 计划发布该产品安全数据的最新审查结果。据路透社报道,该机构将宣布阿斯巴甜“可能对人类致癌”。世卫组织的一个独立委员会(世卫组织和粮食及农业组织食品添加剂联合专…

    2023年7月10日
    21300
  • 计算风险管理:股票投资组合的策略、工具和文化

    计算风险管理:股票投资组合的策略、工具和文化 投资者需要更好地掌握风险管理工具,以衡量投资组合在快速变化的世界中战略弹性。 金融市场的每个角落都潜伏着危险。从宏观经济风险到系统性波动,再到个别公司面临的商业威胁,无数因素都可能使股票或投资组合偏离轨道。 正确进行风险管理是一项永恒的任务,即使是最有经验的投资组合经理也会受到考验,需要技能、经验和谦逊的结合。虽…

    2024年7月11日
    3100
  • 北京大学R语言教程(李东风)第13章: 数据框

    数据框 数据框定义 统计分析中最常见的原始数据形式是类似于数据库表或Excel数据表的形式。这样形式的数据在R中叫做数据框(data.frame)。数据框类似于一个矩阵,有n个横行、p个纵列,但各列允许有不同类型:数值型向量、因子、字符型向量、日期时间向量。同一列的数据类型相同。在R中数据框是一个特殊的列表,其每个列表元素都是一个长度相同的向量。事实上,数据…

    2023年11月1日
    39100
  • 低概率的损失:为什么这并不等于投资中的低风险

    在高尔夫中,一杆进洞是一项了不起的成就。概率?从 150 码的距离来看,大约是 1 比 850,000——几乎是一个统计上的异常。然而,2023 年 LPGA 巡回赛记录了 20 次这样的情况。这怎么可能呢?简单来说:低概率并不一定意味着低频率。请稍作停留思考这个观点。 现在,让我们换一个话题。想象两个抛硬币的游戏。第一个游戏中,硬币是公平的,赢或输的机会均…

    2025年1月8日
    4300

发表回复

登录后才能评论
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部