1. 网站地图
  2. 设为首页
  3. 关于我们


面向聚类及预测的时间序列信息粒化方法研究

发布时间:2021-08-12 13:03
致谢 I
摘要 III
Abstract V
1引言 1
1.1研究背景 1
1.2研究意义 2
1.3论文框架与研究内容 3
1.4研究创新点 5
2理论基础与文献综述 7
2」时间序列分析 7
2.1.1时间序列及其结构特征 7
2.1.2时间序列的降维表示方法 10
2.1.3时间序列的相似性度量方法 13
2.1.4时间序列的数据挖掘任务 20
2.2粒计算 23
2.2.1粒计算的基本组成 25
2.2.2粒计算的基本问题 27
2.2.3粒计算的理论模型 28
2.3时间序列信息粒化 34
2.3.1时间序列信息粒化的时间轴信息粒化方法 35
2.3.2时间序列信息粒化的论域信息粒化方法 39
2.3.3已有研究的不足 41
2.4本章小结 41
3基于波动点的时间序列时间轴信息粒化方法 43
3.1本章研究思路 43
3.2基于波动点的时间序列信息粒化 44
3.2.1信息粒划分方法 44
3.2.2信息粒描述方法 48
3.3基于线性信息粒化的时间序列相似性度量 49
3.3.1线性信息粒匹配 49
3.3.2线性信息粒的相似性度量 52
3.4实验及结果分析 55
3.4.1UCR标准数据集实验 55
3.4.2科创板股票数据集实验 61
3.5本章小结 65
4基于云模型的时间序列时间轴信息粒化方法 67
4.1本章研究思路 67
4.2基于云模型的时间序列信息粒化 68
4.2.1云模型理论 68
4.2.2基于云模型的自适应信息粒化算法 71
4.3基于云模型信息粒化的时间序列相似性度量 77
4.3.1云模型匹配 77
4.3.2基于期望曲线的云模型相似性度量 80
4.4实验及结果分析 87
4.4.1UCR标准数据集实验 87
4.4.2沪深A股股票数据集实验 90
4.5本章小结 97
5基于论域信息粒化的模糊时间序列预测方法 98
5.1本章研究思路 98
5.2基于模糊C均值聚类和信息粒化的时间序列论域划分 99
5.2.1基于模糊C均值聚类的时间序列论域初始划分 100
5.2.2基于模糊信息粒化的时间序列论域划分优化算法 103
5.3基于论域信息粒化的时间序列预测 108
5.3.1模糊时间序列 108
5.3.2基于模糊逻辑关系的时间序列预测方法 109
5.4实验及结果分析 120
5.4.1台湾加权股价指数(TAIEX)数据集实验 120
5.4.2上海证券综合指数(SHCI)数据集实验 126
5.5本章小结 130
6结论与展望 132
6.1研究结论 132
6.2研究展望 134
参考文献 136
作者简历及在学研究成果 146
独创性说明 149
关于论文使用授权的说明 149
学位论文数据集
1引言
1.1研究背景
近年来随着互联网技术的飞速发展,数据存储设备性能的提升,各个行 业产生并存储着大量的数据。在这些数据中,有很大一部分数据是带有时间 标签的,即按照时间顺序记录的一系列观测值,称为时间序列。例如在气象 领域,某地区的气温和风速时间序列;在交通领域,某地铁站的人流量时间 序列;在经济领域,我国的国内生产总值时间序列;在金融领域,某股票的 交易量和交易价格时间序列等。如何对这些时间序列数据进行有效的分析处 理,挖掘出潜在的、有价值的知识和信息以支持企业更为高效的生产、运营、 管理和决策活动,是当今大数据时代的重要任务之一。传统的时间序列分析 方法主要是基于统计学模型对时间序列进行预测,常见的统计学模型有:自 回归模型(Auto Regression, AR)、移动平均模型(Moving Average, MA)、自 回归移动平均混合模型(Auto Regression Moving Average, ARMA)和差分自 回归移动平均模型(Auto Regressive Integrated Moving Average, ARIMA)等 [氏
在当今的大数据时代,时间序列数据具有高维性、不确定性和复杂性等 特征,传统的时间序列分析方法已不能满足实际应用的需要,因此相关学者 将数据挖掘技术应用于时间序列分析中,满足了实际应用中的多元化需求。 经过学者们的不断努力,时间序列数据挖掘(Time-Series Data Mining, TSDM) 【2]已经成为了数据挖掘领域中一个非常重要的研究分支。时间序列的数据挖 掘任务主要分为以下几个方面:聚类B4]、分类[5,6]、关联规则发现[7,8]、异常 检测[9」0]和时间序列预测⑴」2]等。
在经济管理领域中,时间序列数据挖掘有着广泛的应用价值。例如目前 中国的股票市场共有3000多只股票,每只股票在交易日的每个时刻都会产生 大量的数据(交易量、交易价格等),利用时间序列的聚类算法可以对同一时 间段内的不同股票价格时间序列进行聚类分析,发现具有相同股价变化特征 的股票,从而为投资者选股提供决策支持;上海证券综合指数是反映上海证 券交易所股票总体走势的统计指标,该指数的变化情况很大程度上反映了我 国股票市场的变动情况,通过对上证指数进行预测,可以了解未来股票市场 的走向,从而为投资者调整投资策略提供决策支持。然而将时间序列数据挖 掘技术应用于股票时间序列分析时主要面临着以下的问题:长期的股票交易 记录导致所形成的时间序列数据具有显著的高维特征,若对其直接运用现有 的数据挖掘算法,会造成过高的计算复杂度。在过去的十几年里,许多时间 序列的降维表示方法被提出并成功应用到数据挖掘的各个领域中。但这些降 维方法具有一个普遍的缺点:不能有效地保留吋间序列的结构特征。
粒计算是一种模拟人类求解问题思维和解决大数据复杂任务的新方法, 是近年来人工智能领域一个新兴的研究方向[⑶。该理论的主要思想是将复杂 问题抽象、划分转化为若干较为简单的问题(即粒化),从而有助于更好的分 析和解决问题。本文在时间序列分析中引入粒计算的粒化思想,通过对时间 序列进行信息粒化,将原始高维时间序列粒化为低维粒时间序列,构造的信 息粒能够刻画和反映原始时间序列数据的结构特征,从而实现高效降维,为 后续的数据挖掘工作奠定基础。
现有的时间序列信息粒化研究主要分为在时间轴和在论域这两个方面的 研究,即解决时间窗口的有效划分表示问题和论域的有效划分表示问题。时 间序列时间轴信息粒化研究通常采用固定的时间间隔对时间序列进行划分即 硬划分,进而对划分后得到的信息粒进行表示,忽略了时间序列在时间轴上 的变化特征,不符合信息粒的本质含义,因此需要根据时间序列在时间轴上 的变化特征来设计时间序列的信息粒化方法,使得到的信息粒内部结构之间 相似,信息粒之间有区别。时间序列论域信息粒化研究通常无法兼顾论域划 分区间的可解释性和预测准确率这两个方面的要求,因此需要设计出一种既 能够具有较强的可解释性同时具有较高预测准确率的时间序列论域信息粒化 方法。
基于上述分析,本文研究面向聚类及预测的时间序列信息粒化问题,针 对已有研究方法中的不足,从时间轴和论域两个方面提出三种不同的时间序 列信息粒化方法,并应用于股票时间序列数据进行聚类和预测分析,为股票 投资者提供决策建议。
1.2研究意义
本文将粒计算中的信息粒化思想引入时间序列分析中,研究面向聚类及 预测的时间序列信息粒化方法。所提出的方法不同于传统的时间序列分析方 法,可以在保证时间序列的关键结构信息不丢失的情况下对时间序列数据进 行高效降维,便于进行后续的时间序列数据挖掘工作,提高数据挖掘的效率 和准确性,在理论方法层面上为时间序列的数据挖掘研究提供新的研究思路 和方向。
本文提出的时间序列信息粒化方法可以应用于各领域中的时间序列数据 挖掘工作,尤其是经济管理领域。例如运用本文提出的基于时间轴的时间序 列信息粒化方法对股票数据进行聚类分析,其聚类结果可以作为投资者选股 时的选股依据;运用本文提出的基于论域的时间序列信息粒化方法对股票数 据进行预测分析,判断韦来股票市场的涨跌趋势,可以帮助投资者合理地调 整投资策略,在现实应肉层面上为投资者提供决策支持。
【本文地址:https://www.xueshulunwenwang.com//jingjilei/guojijinrong/1854.html

上一篇:林农贷款担保困境影响因素及破解机制研究 ——基于黑龙江省调查数据

下一篇:商业银行国际衍生金融理财产品投资风险研究 ——以中行原油宝为例