金融数据
-
在金融数据科学中使用具有经济意义的因素的好处
因素选择是我们构建财务模型时最重要的考虑因素之一。那么,随着机器学习 (ML) 和数据科学越来越融入金融,我们应该为 ML 驱动的投资模型选择哪些因素以及如何选择它们? 这些都是开放且关键的问题。毕竟,机器学习模型不仅可以帮助因子处理,还可以帮助因子发现和创建。 传统统计和机器学习模型中的因素:(非常)基础知识 机器学习中的因素选择称为“特征选择”。因素和特…
-
北京大学Julia语言入门讲义第5章: 字符串
Julia有单独的字符型Char,如’a’, ‘B’,以Unicode编码表示。 对字符型变量ch,用Int(ch)获得其编码,如: ‘中’ ## ‘中’: Unicode U+4E2D (category Lo: Letter, other) Int(‘中’) ## 20013 20013是十六进制数4E2D的十进制值。 适用于字符的函数: isdigit…
-
北京大学金融时间序列分析讲义第24章: 向量自回归模型
24.1 VAR(1)模型 多个资产收益率的联合模型中最常用的是向量自回归(Vector Autoregression, VAR)模型。称k元时间序列rt服从一个一阶向量自回归模型,即VAR(1),若有 rt=ϕ0+Φrt−1+at(24.1) 其中ϕ0是k维常数向量,Φ是k阶常数方阵,{at}是序列不相关的弱平稳列,Eat=0,Var(at)=Σ…
-
北京大学金融时间序列分析讲义第23章:多元时间序列基本概念
经济的全球一体化和信息传播的发展使得各国的金融市场相互关联,一个市场的价格变动可以很快地扩散到另一个市场。持有多个资产的投资者也希望了解多个资产的收益率之间的关系。这些问题属于多元时间序列分析的范畴。 多元时间序列包含多个一元时间序列作为分量,各个一元时间序列的采样时间点相同,所以数据可以用矩阵形式表示,每行为一个时间点,每列为一个一元时间序列。在R中可以保…
-
北京大学金融时间序列分析讲义第20章: 随机波动率模型
本章内容来自自(Tsay 2013)§4.13和§4.14内容。 前面的波动率方程中σ2t=Var(at|Ft−1)都是被σt−1,…和at−1,…完全决定。另一种方法是假定σ2t的模型本身有新息,这样的模型称为随机波动率(Stochastic Volatility, SV)模型。模型写成 at=σtεt,(1−α1B−⋯−αmBm)lnσ2t=α0+vt.…
-
北京大学金融时间序列分析讲义第18章: GARCH模型
本章来自(Tsay 2013)§4.6-4.8内容。 ARCH模型用来描述波动率能得到很好的效果,但实际建模时可能需要较高的阶数,比如§17.5.3的欧元汇率波动率建模用了11阶的ARCH模型。考虑类似从AR推广到ARMA的模型变化。 模型方程 (Bollerslev 1986)提出了ARCH模型的一种重要推广模型,称为GARCH模型。对于一个对数收益率序列…
-
北京大学金融时间序列分析讲义第17章: ARCH模型
这是原书(Tsay 2013)§4.5内容。 ARCH模型公式 (R. F. Engle 1982) 提出了ARCH模型(自回归条件异方差模型),这是对将波动率定义为条件标准差,第一次提出的波动率的理论模型。基本思想是: 资产收益率的扰动序列at=rt−E(rt|Ft−1)是前后不相关的, 但是前后不独立。 at的不独立性, 描述为Var(rt|Ft−1)=…
-
北京大学金融时间序列分析讲义第16章: 资产波动率模型特征
金融数据中最关心的除了资产价格、收益率,就是资产波动率。资产波动率度量某项资产的风险,有多种定义。本章: 理解波动率特点; 学习ARCH、GARCH等波动率模型; 学习如何对波动率建模,如何应用波动率模型。 波动率是期权定价和资产分配的关键因素。波动率对计算风险管理中的VaR(风险值)有重要作用。一些波动率指数已经成为金融工具,如CBOE(Chicargo …
-
北京大学金融时间序列分析讲义第15章: 线性时间序列案例学习「美国月失业率」
失业率是每个国家、地区经济运行的重要指标。2011年,美国的季节调整后的月度失业率在9%左右。 本章对美国月失业率数据进行建模和预测,使用不带解释变量和带解释变量的两种方法,解释变量是周首次申请失业救济金人数信息。 数据来自Department of Labor, US Beareau of Labor Statistics。数据经过了季节调整。失业率为百分…
-
北京大学金融时间序列分析讲义第14章: 线性时间序列案例学习「全球温度异常值」
用时间序列方法对全球温度异常建模,目的不是证明全球变暖,而是: 演示线性时间序列模型的建模和预测方法; 比较不同的模型; 了解时间序列模型长期预测的局限性; 理解仅根据数据区分非随机趋势与单位根非平稳的困难。 全球温度异常值的数据来源有: GISS, Goddard Institute for Space Studies 隶属于 NASA(National …
-
北京大学金融时间序列分析讲义第13章:线性时间序列案例学习—汽油价格
这一章用三个实例来详细讲解如何用R语言和线性时间序列模型分析实际数据,并展现线性时间序列模型的适用性与局限性。 数据为: 1997-01-06到2010-09-27的美国普通汽油价格周数据; 1880年1月到2010年8月全球温度异常值的月度数据; 美国失业率月度数据,包括首次申领失业救济金人数的序列以及不包括的序列。 这些数据是持续更新的,也反映了全球或美…
-
北京大学金融时间序列分析讲义第11章: 长记忆模型
长记忆模型介绍 ACF是时间序列建模的重要参考。对于ARMA序列,当滞后k→∞时其样本ACF是负指数速度趋于零的。对于单位根非平稳列,其理论ACF无定义(因为自协方差是针对弱平稳列定义的),其样本ACF在样本量T→∞时每个ρ̂ k都趋于1(k>0)。 有一些平稳时间序列的ACF虽然也随滞后k→∞趋于零,但是收敛到零的速度比较慢,只有负幂次k−…
-
北京大学金融时间序列分析讲义第10章: 带时间序列误差的回归模型
10.1 方法示例 在统计学的数据分析中,线性回归分析是最常用的分析工具之一。线性回归以一元线性回归为例,模型如下 Yt=β0+β1Xt+et, t=1,2,…,T(10.1) 其中自变量{Xt}为常数列,β0,β1为未知的系数,{et}为零均值独立同分布随机误差序列,方差为σ2e,因变量{Yt}为随机变量列。参数β0,β1,σ2e可以用最小二乘法估计,估计…
-
北京大学金融时间序列分析讲义第9章: 季节模型
经济和金融中的月度、季度数据一般有明显的周期,日数据也会有按照周、月、年周期的变化。这样的性质称为季节性,含有周期变化的时间序列称为季节时间序列。 如:可口可乐公司1983第1季度到2009第3季度公布的季度盈利数据。每个季度的盈利数据在季度结束后约一个月以后公布。共107个观测。考虑季度盈利的对数值。 da <- read_table( “q-ko-…
-
北京大学金融时间序列分析讲义第8章: 指数平滑
简单指数平滑 指数平滑最早是来自一种简单的预测方法:用历史数据的线性组合预测下一时间点的值,线性组合系数随距离变远而按负指数(几何级数)衰减: x̂ h(1)≈wxh+w2xh−1+⋯=∑j=1∞wjxh+1−j 其中0<w<1,w越小,距离远的历史观测对预测的贡献越小。 因为是加权平均,所以所有加权的和应该等于零,注意到 ∑j=1∞wj=w1−…
-
北京大学金融时间序列分析讲义第6章: ARMA模型
ARMA模型的概念 AR模型有偏自相关函数截尾性质;MA模型有相关函数截尾性质。有些因果线性时间序列有与AR和MA类似的表现,但是不能在低阶实现偏自相关函数截尾或者相关函数截尾。 ARMA模型结合了AR和MA模型,在对数据拟合优度相近的情况下往往可以得到更简单的模型,而且不要求偏自相关函数截尾也不要求相关函数截尾。 ARMA(1,1)模型为 Xt=ϕ0+ϕ1…
-
北京大学金融时间序列分析讲义第5章: 移动平均模型
移动平均模型的概念 移动平均模型是具有q步外不相关性质的平稳列的模型;对于高阶的AR模型,有些可以用低阶的MA模型更好地描述。一般的AR模型也可以用高阶MA模型近似。 理论上,AR模型也可以是无穷阶的: Xt=ϕ0+∑j=1∞ϕjXt−j+εt 其中{ϕj}应绝对可和。一个特例为 Xt=ϕ0−∑j=1∞(−θ1)jXt−j+εt 其中0<|θ|<…
-
北大金融时间序列分析讲义第4章: 自回归模型
自回归模型的概念 如果ρ1≠0,则Xt与Xt−1相关,可以用Xt−1预测Xt。最简单的预测为线性组合,如下模型: Xt=ϕ0+ϕ1Xt−1+εt(4.1) 称为一阶自回归模型(Autoregression model),记作AR(1)模型。其中{εt}是零均值独立同分布白噪声序列,方差为σ2,并设εt与Xt−1,Xt−2,…独立。系数|ϕ1|<1。更一…
-
金融时间序列分析讲义第2章: 金融数据及其特征
课程采用蔡瑞胸(Ruey S. Tsay)的《金融数据分析导论:基于R语言》(Tsay 2013)(An Introduction to Analysis of Financial Data with R)作为主要教材之一。这是第一章金融数据及其特征的授课笔记。 参考: (Tsay 2013) (Tsay 2010) (Tsay 2014) (吴喜之 and…
-
金融时间序列分析讲义第1 章:金融数据分析中的R软件介绍
本课程的软件需求 课程采用Ruey S. Tsay的《金融数据分析导论:基于R语言》(An Introduction to Analysis of Financial Data with R)作为主要教材之一。课程讲述金融时间序列分析的各种模型,以及如何用R软件进行建模计算。 作为基础,学生需要重点掌握R软件如下功能: 基本数据类型,日期和日期时间类型,数据…