北京大学R语言教程(李东风)第11章:列表类型

R中列表(list)类型来保存不同类型的数据。
一个主要目的是提供R分析结果输出包装:
输出一个变量,
这个变量包括回归系数、预测值、残差、检验结果等等一系列不能放到规则形状数据结构中的内容。
实际上,数据框也是列表的一种,
但是数据框要求各列等长,
而列表不要求。

列表可以有多个元素,
但是与向量不同的是,
列表的不同元素的类型可以不同,
比如,
一个元素是数值型向量,
一个元素是字符串,
一个元素是标量,
一个元素是另一个列表。

定义列表用函数list(), 如

rec <- list(name="李明", age=30,
  scores=c(85, 76, 90))
rec
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $scores
## [1] 85 76 90

typeof()函数判断一个列表,
返回结果为list
可以用is.list()函数判断某个对象是否列表类型

为了生成元素为空的长度为n的列表,程序如:

11.2 列表元素访问

列表的一个元素也可以称为列表的一个“变量”,
单个列表元素必须用两重方括号格式访问,如

rec[[3]]
## [1] 85 76 90
rec[[3]][2]
## [1] 76
rec[["age"]]
## [1] 30

列表的单个元素也可以用$格式访问,如

如果使用单重方括号对列表取子集,
结果还是列表而不是列表元素,如

rec[3]
## $scores
## [1] 85 76 90
is.list(rec[3])
## [1] TRUE

列表一般都应该有元素名,
元素名可以看成是变量名,
列表中的每个元素看成一个变量。
names()函数查看和修改元素名。

names(rec)
## [1] "name"   "age"    "scores"
names(rec)[names(rec)=="scores"] <- "三科分数"
names(rec)
## [1] "name"     "age"      "三科分数"
rec[["三科分数"]]
## [1] 85 76 90

可以修改列表元素内容。

rec[["三科分数"]][2] <- 0
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90

直接给列表不存在的元素名定义元素值就添加了新元素,
而且不同于使用向量,对于列表而言这是很正常的做法,比如

rec[["身高"]] <- 178
print(rec)
## $name
## [1] "李明"
## 
## $age
## [1] 30
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

把某个列表元素赋值为NULL就删掉这个元素。

rec[["age"]] <- NULL
print(rec)
## $name
## [1] "李明"
## 
## $三科分数
## [1] 85  0 90
## 
## $身高
## [1] 178

list()函数中允许定义元素为NULL,这样的元素是存在的,如:

li <- list(a=120, b="F", c=NULL); li
## $a
## [1] 120
## 
## $b
## [1] "F"
## 
## $c
## NULL

但是,要把已经存在的元素修改为NULL值而不是删除此元素,
或者给列表增加一个取值为NULL的元素,
这时需要用单重的方括号取子集,
这样的子集会保持其列表类型,
给这样的子列表赋值为list(NULL),如:

li["b"] <- list(NULL)
li["d"] <- list(NULL)
li
## $a
## [1] 120
## 
## $b
## NULL
## 
## $c
## NULL
## 
## $d
## NULL

11.3 列表类型转换

as.list()把一个其它类型的对象转换成列表;
unlist()函数把列表转换成基本向量。如

li1 <- as.list(1:3)
li1
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
li2 <- list(x=1, y=c(2,3))
unlist(li2)
##  x y1 y2 
##  1  2  3

11.4 连接列表

两个列表可以用c连接成一个列表,
如:

li1 <- list(1:2)
li2 <- list(11:12)
li <- c(li1, li2)
li
## [[1]]
## [1] 1 2
## 
## [[2]]
## [1] 11 12

如下的做法没有达到目的:

li <- list()
li <- c(li, 1:3)
li <- c(li, 11:13)
li
## [[1]]
## [1] 1
## 
## [[2]]
## [1] 2
## 
## [[3]]
## [1] 3
## 
## [[4]]
## [1] 11
## 
## [[5]]
## [1] 12
## 
## [[6]]
## [1] 13

需要改为:

li <- list()
li <- c(li, list(1:3))
li <- c(li, list(11:13))
li
## [[1]]
## [1] 1 2 3
## 
## [[2]]
## [1] 11 12 13

11.5 返回列表的函数示例–strsplit()

strsplit()输入一个字符型向量并指定一个分隔符,
返回一个项数与字符型向量元素个数相同的列表,
列表每项对应于字符型向量中一个元素的拆分结果。

x <- c("10, 8, 7", "5, 2, 2", "3, 7, 8", "8, 8, 9")
res <- strsplit(x, ","); res
## [[1]]
## [1] "10" " 8" " 7"
## 
## [[2]]
## [1] "5"  " 2" " 2"
## 
## [[3]]
## [1] "3"  " 7" " 8"
## 
## [[4]]
## [1] "8"  " 8" " 9"

为了把拆分结果进一步转换成一个数值型矩阵,
可以使用sapply()函数如下:

t(sapply(res, as.numeric))
##      [,1] [,2] [,3]
## [1,]   10    8    7
## [2,]    5    2    2
## [3,]    3    7    8
## [4,]    8    8    9

sapply()函数是apply类函数之一,
稍后再详细进行讲解。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/77953.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2023年10月30日 01:56
下一篇 2023年10月31日 00:16

相关推荐

  • 北京大学R语言教程(李东风)第21章: Markdown格式

    介绍 Markdown是一种很简单的文本文件格式,通常保存为.md扩展名。Mardown中文内容应该使用UTF-8编码。Markdown文件里面有一些简单的格式标注方法,比如两个星号之间的文字会转化为斜体,缩进四个空格或一个制表符的内容会看成代码,用井号开头的行表示标题,井号越多标题级别越低。 Markdown适用于比较简单的文章、源程序说明等,不太适用于复…

    2023年11月10日
    26000
  • Citadel 及其同行正在涌入相同的行业

    像 Griffin’s Citadel 这样的多管理基金已经在对冲基金行业占据主导地位,凭借稳定的优异表现管理着超过 1 万亿美元的资产,其中包括健康的杠杆水平。但爆炸性增长导致行业巨头纷纷涉足许多相同行业。 这引起了监管机构、投资者和交易商对这些所谓的豆荚商店的不安。尽管 Citadel 的亿万富翁创始人公开反对任何认为他的公司和竞争对手构成系统性风险并需…

    2024年1月10日
    19600
  • 特朗普的保护主义如何可能促进自由贸易

    特朗普的保护主义如何可能促进自由贸易 由 Tyler Cowen 于 Bloomberg News, 1 月 23 日 25 日 自由贸易正遭遇困境。这在美国总统府里有明确的保护主义者时或许并不令人惊讶,但问题比初看起来要更深刻。 从货物贸易和服务贸易的区别开始。当美国制造商将拖拉机销往海外,这就是货物贸易。当美国软件公司开发一种 AI 医疗诊断工具并通过互…

    2025年2月11日
    8900
  • “Smart Beta”怎么会犯严重错误呢?

    关键点 扣除估值水平变化后的因子回报率远低于近期表现所显示的水平。 增值可以是结构性的,因此可以可靠地重复,也可以是情境性的——估值上升的产物——可能既不可持续也不可重复。 许多投资者都是业绩追逐者,他们在推高价格的过程中创造了估值水平,从而夸大了过去的业绩,降低了未来的潜在业绩,并放大了均值回归到历史估值常态的风险。 我们预见到,由于因子倾斜策略的迅速普及…

    2023年12月23日
    17500
  • 难以捉摸的阿尔法,腐蚀性成本

    1688 年,约瑟夫·德拉维加写道:“交易所的利润是妖精的宝藏。它们可能一度是红宝石,然后是煤炭,然后是钻石,然后是燧石,然后是晨露,然后是泪水。”他写的是当时阿姆斯特丹证券交易所的股票交易。他本可以写的是现代的阿尔法——投资者渴望获得的额外回报。由于缺乏公认的市场(资产定价)模型,学术界无法严格定义它。从经验上讲,由于统计噪声,即使我们使用自己选择的回报生…

    2024年10月17日
    13300

发表回复

登录后才能评论
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部