基于时间序列挖掘的股票短期走势预测软件系统毕业论文
2020-02-19 18:01:13
摘 要
随着我国经济的腾飞,股票市场发展迅猛,居民的生活水平和收入水平都有了较大的提高,这也使得越来越多的人希望实现财富的保值与增值。不少人选择了房地产等投资方向,而股票市场的投资毫无疑问是其中最火热的一个。股票的特性决定了它的低门槛,上至六十岁老年人下至青年人都能较为容易的参与进来,然而与其低门槛相对的则是股票投资易学难精,甚至专业的金融投资人士也不能保证每次都获得收益。股票投资是一把双刃剑,一方面可能带来高回报,另一方面又存在高风险。如何选择投资股票的种类以及如何确定何时进行投资获取的收益最大是投资者们最关心的问题。股票价格预测是长久以来困扰全球诸多学者专家的问题,这项研究中蕴含着巨大的潜在经济价值。越来越多的研究表明预测股票走势足以带来可观的收益,而预测走势最重要的问题就是股票市场产生的大量数据。多种多样的算法被开发出来用以从大量的原始数据中挖掘出隐含的有价值的信息,为投资者提供助力。在这些算法中,数据挖掘在金融界得到了广泛的应用。
本文主要对基于关联规则的股票短期走势预测算法研究进行了设计和论证,具体工作如下:
首先基于课题的研究背景进行简单的分析,介绍了数据挖掘技术与股票分析的相关理论,然后对数据挖掘算法进行介绍。本文由需求分析、总体设计、详细设计和系统测试四个阶段构成开发过程,系统实现了简单的股票信息查询、趋势预测这两个基本功能,本次股票短期预测利用关联规则中的Apriori算法对单支股票进行走势预测,并评估预测结果的准确度。当Apriori算法的最小支持度为0.1,最小置信度为0.5,事件重叠窗口为7时,预测结果的准确率最高,可以为股票投资者选择何时进行投资提供一定的参考。本次设计基本满足了广大投资者的需求,具有一定的实际应用价值。
关键词:时间序列;数据挖掘;系统设计;股票走势预测
Abstract
With the rapid development of China's economy, the stock market has developed rapidly,residents' living standards and income levels have been greatly improved, which makes more and more people hope to achieve the preservation and appreciation of wealth. Many people choose real estate and other investment direction, and the stock market investment is undoubtedly one of the hottest. The characteristics of the stock determine its low threshold, from the age of 60 to the old people down to the young people can easily participate in, however, the opposite of the low threshold is the stock investment is easy to learn difficult to fine, even professional financial investment personnel can not guarantee that every time gain income. Stock investment is a double-edged sword, which can bring high returns on the one hand and high risks on the other hand. How to choose the type of stocks to invest in and how to determine when to make the most gains from investment is the most concerned issue for investors. Stock price forecasting is a problem that has long plagued the global many scholars and experts, the study contains the huge potential economic value. A growing number of studies show that forecasting stock movements is enough to generate significant returns, and the most important problem with forecasting trends is the amount of data produced by the stock market. A variety of algorithms have been developed to extract hidden valuable information from vast amounts of raw data, providing investors with a boost. Among these algorithms, data mining has been widely used in the financial industry.
This paper mainly designs and demonstrates the short-term trend forecasting system based on time series mining. The specific work is as follows:
Firstly, based on the research background of the subject, a simple analysis is carried out. The related theories of data mining technology and stock analysis are introduced, and then the data mining algorithm is introduced. In this paper, the development process is composed of four stages: demand analysis, overall design, detailed design and system testing. System has realized the simple stock information query, trend prediction the two basic functions, the stock of short-term prediction using association rules Apriori algorithm of single stock trend forecast, and evaluate the accuracy of predicted results. When the minimum support degree of Apriori algorithm is 0.1, the minimum confidence degree is 0.5, and the time interval is 7, the prediction results have the highest accuracy, which can provide certain reference for stock investors to choose when to invest. This design basically meets the needs of investors and has certain practical application value.
Key words: time series; data mining; system design; stock trend forecasting
目录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 研究现状 1
1.3研究内容与结构 3
第2章 数据挖掘技术与股票分析概述 4
2.1 数据挖掘技术概述 4
2.1.1数据挖掘的定义 4
2.1.2数据挖掘的流程 4
2.2 股票分析概述 5
2.2.1基本分析法 5
2.2.2技术分析法 5
2.3 数据挖掘算法简介 5
2.3.1 Apriori算法 5
2.3.2FP-树频集算法 7
第3章 系统概要设计 8
3.1系统需求分析 8
3.1.1需求分析与描述 8
3.1.2可行性分析 8
3.2 系统总体设计 9
3.3核心功能设计 9
3.3.1数据读取 9
3.3.2数据处理 10
3.3.3时间序列模式挖掘 11
3.3.4走势预测 12
第4章 系统实现 13
4.1 股票走势预测实现 13
第5章 系统预测实验与结果分析 16
5.1不同事件重叠窗口 16
5.1.1窗口长度的选取 16
5.2不同支持度和置信度 20
5.2.1支持度选取 20
5.2.2置信度选取 22
5.3预测其他股票 22
5.3.1实际应用 22
5.4总结分析 25
结语 26
参考文献 27
第1章 绪论
1.1 研究背景及意义
自股票市场诞生以来,许多专家学者积极投身到对股票市场的分析研究中,一些有效的股票分析方法应运而生,其中包括移动平均法、波浪理论、K线分析法、柱状图分析法、道氏理论等。许多研究者应用传统的统计学方法对股票市场分析与预测,但由于一些传统的统计计量模型对数据具有严格要求,例如要求数据具有平稳性、正态性、低噪声等特征,并且在分析过程中常常有一些限定条件,然而实际生活中股票市场的数据具有动态性、数据量大以及数据间关系复杂等特点,因此,应用一些传统的统计方法对股票市场分析与预测很难达到预期效果。如今,信息技术飞速发展,利用数据挖掘技术处理海量复杂的股票数据正好解决了这一难题。数据挖掘是从数据中发现知识,它的出现提高了人们分析处理大量数据的能力,也带来诸多经济效益。因此,数据挖掘方法已经广泛应用于金融分析领域。
股票市场分析是证券投资过程中的一个重要环节,是指人们通过科学、有效的方法对股票的价值进行评估,并判断其变化趋势的行为。有效地分析股市行情有利于指引投资者做出较为准确的判断,提高收益回报。股票投资的目标是在稳定收益的前提下尽可能降低投资风险,在稳定风险的前提下尽量提高收益,这就需要使用有效的分析方法和手段对股票市场的影响因素全面综合考虑,进而做出客观准确的判断。数据挖掘技术综合机器学习、人工智能、统计学、数据库等多门学科,能从大量数据中发现有价值的信息,为投资者带来巨大的收益。
另一方面,从时间序列的角度总结其中的规律,中外的金融证券研究者们发明了各种各样的技术指标。所谓技术指标,就是通过对K线图中的开盘价、最高价、最低价、收盘价及成交量的数据信息进行一定规则的数理运算,而以—个或几个简单的数值来反映序列中某一方面的信息。随着计算机的普及和互联网的兴起,普通投资者们已经不用学习技术指标的计算方法,任何一款证券交易软件都会实时地将送些经典的技术指标的计算结果图示的方式放在最为显眼的位置。而普通投资者,只需要掌握这些指标背后所包含的意义及买卖点的判断方法,就可以在实盘中使用这些方法了。基于这两方面的研究可以挖掘出合理而有价值的模式,更好的反应事物的形态规律,便于我们清楚直接的认识。本次研究和设计充分利用时间序列理论和数据挖掘技术对股票数据的处理,从而实现对股票市场的分析与预测,具有较强的现实性和可行性。
1.2 研究现状
自股票出现以来,股票预测便受到学术界的广泛关注与积极研究,国内外许多学者对其进行了研究,提出了许多预测分析方法。
(1)时间序列分析法
时间序列分析法[1,2]是通过建立股价与综合指数的时间序列辨识模型,如传统的随机游走模型(Rw),自回归移动平均模型(ARMA),其次非平稳模型(ARIMA)等来预测未来股价变化。它包括两种类型:单变量与多变量。
用时间序列的模式存储数据具有压缩数据、保持时间序列基本形态的功能,并且具有一定的除噪能力。目前常用的时间序列模式表示方法:频域表示法、分段线性表示法、符号表示法以及主成分分析表示法等。
从已知事件测定未知事件,对尚未发生或目前还不明确的事物进行预先的估计和推测,是在现时对事物将要发生的结果进行探讨和研究。进行预测的总原则是:认识事物的发展变化规律,利用规律的必然性进行科学预测。时间序列预测主要包括三种基本方法:内生时间序列预测技术;外生时间序列预测技术;主观时间序列预测技术。
(2)人工智能方法
近年来的研究热点,自20世纪90年代初至今,人工智能得到了很大的发展,特别是神经网络的研究取得了划时代的发展,并且应用于各个领域。在金融领域,以欧美为中心,很多学者开展了神经网络的研究与应用。T.Kimoto, K.Asakawa[3,4]等人于1990年开发了Tokyo stock exchange Price index (TOPIX)预测系统,应用了modular NN系统研究了各种市场因素之间的联系;Hares[5]等利用神经网络集成预测吉隆坡证券指数,为股票指数预测提供了新的思路。国内也进行了许多有益的研究:吴成东[6]在德国学者Bernd Freisleben研究的基础上,综合考虑了历史价格因素、经济因素及政策技术因素,取得较好的预测效果;王小平,魏海坤[7]等人应用遗传算法研究了股市预测方法;然而,由于股票市场多噪声,不稳定的特性,这些预测依然没有达到很理想的效果。
(3)其他预测方法
专家评估法(专家调查法):专家评估法是以专家为索取未来信息的对象,组织各领域的专家运用专业方面的知识和经验,通过直观的归纳,对预测对象过去和现在的状况、发展变化过程进行综合分析与研究,找出预测对象变化、发展规律、从而对预测对象未来的发展实际状况做出判断。
市场调查法:运用科学的方法,有目的地、系统地搜集、记录、整理有关市场营销信息和资料,分析市场情况,了解市场的现状及其发展趋势,为市场预测和营销决策提供客观的、正确的资料。
本文利用数据挖掘中的关联规则Apriori算法挖掘出股票历史走势中的潜在规律,用来对未来走势进行预测。
1.3研究内容与结构
第1章,确定本次设计的研究背景及意义,并对股票预测的国内外研究现状作出分析,由此确定系统的研究内容与结构。
第2章,主要对数据挖掘与股票分析方法进行理论概述和说明,并对经典数据挖掘算法进行了具体论述。
第3章主要对股票走势预测系统进行总体概要设计,包括系统的需求分析,可行性分析。
第 4 章主要对股票走势预测系统进行了详细设计。对股票走势预测系统的开发环境和设计方案进行详细说明。
第 5 章主要是系统的分析和实验验证。在实验的基础上分析了实验结果,验证了系统的性能,最后得到了一个可信度较高的系统。
第2章 数据挖掘技术与股票分析概述
2.1 数据挖掘技术概述
2.1.1数据挖掘的定义
数据挖掘技术是一种基于高科技的先进的统计技术,学界对于数据挖掘技术还没有一个明确的定义。但是可以从宽泛的角度来对其进行定义,即我们可以对一些大量的,不完整的模糊数据进行一些潜在价值的挖掘,这一过程就被称为数据挖掘的过程。简单来说就是使用数学上的理论方法来对数据进行知识的提取与探索。数据挖掘是另一种知识研究的方法和手段,数据挖掘是一个交叉性很强的学科,其不仅运用到高等数学中的概率统计等方面知识,同时还运用到计算机中的数据库以及数据存储方面知识,同时数据挖掘的过程还涉及到了机器学习的内容。在大量的数据中进行模型化的分析和研究,需要不同学科知识的交叉配合。从数据中提取的知识,可以有效为解决一些问题提供帮助。数据挖掘技术一是包括数据的预处理,对与主题有关的数据进行整理,二是进行数据的集成和转换,三是使用智能的方法对数据进行一定的挖掘,寻找其中蕴含的规律。
2.1.2数据挖掘的流程
一般的数据挖掘步骤是确定数据挖掘的目标、收集数据、提取目标数据、数据预处理、构建挖掘模型、模型评估、知识表示等过程,具体介绍如下:
(1)确立项目目标:挖掘项目必须包含完成项目的价值所在。
(2)数据收集:以既定的系统方式收集和测量有针对性的变量的信息,来源可以是网络爬取、业务调查。
(3)数据预处理:对收集的数据进行“格式化”的处理,便于后续的模型训练与统计。
(4)数据挖掘:通过一些算法模型或者分析方法,将原始收集的数据转化为有用信息的过程。
(5)模型评价:对数据挖掘后的结果进行综合评价,判断数据挖掘模型的挖掘结果,算法的执行时间和稳定性等。
(6)知识表示:通过一种易于理解的形式展现给用户,将学习规则形式转为人为理解的知识。
2.2 股票分析概述
2.2.1基本分析法
基本分析也叫基本面分析,基本面指的就是股票内在的真实价值,股票内在的真实的价值等价于其未来所能产生的预期收益的现值。基本面分析是通过分析影响股票价格变化的各项因素,判断是否进行投资。众所周知,股票价格受到各种因素的影响,大到国家政策导向,小到股民心理因素都会影响股票价格。但是也正是因为其影响因素众多,所以基于基本面分析法对股票进行详尽的分析的难度非常大。
基本分析法适用的领域:①长周期股票价格的预测;②比较成熟的股票市场;③精确度要求不高的股票领域。
基本分析法的优点:①能整体把握股价的趋势;②分析方法简单易于操作。基本分析法的缺点是:①短周期的股票预测效果较差;②预测结果的精度较低。
2.2.2技术分析法
技术分析主要是利用股票市场中的历史和现在的数据,使用不同的方法和手段,寻找股票市场中隐含的规律,并利用发现的规律对未来股票数据进行预测。
技术分析法的优点:①操作简单方便,通过信息处理得到的图表,利用自己的经验和知识即可判断;②其着重于理性分析,利用技术分析法得到图表显示的信息不会以人的主观意愿而改变;③由于股价的变动受到市场中各因素的影响,技术分析法可以将影响因素量化,使其更加直观真实。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: