登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

13种概率分布的可视化工具毕业论文

 2021-11-20 22:39:21  

论文总字数:21721字

摘 要

本文借助python程序编写软件pycharm进行13种概率分布模型的可视化工具的开发,其中GUI借助于PyQt5进行设计,过程中涉及使用numpy库、Qt Designer等相关技术,亦可使用该工具进行同概率分布下不同参数的可视化对比,所得结果对于概率分布数据可视化及机器学习具有重要的指导意义。

论文主要研究了通过python实现13种概率分布的可视化工具。

研究结果:利用pycharm和PyQt5实现了基于python的13种概率分布的可视化工具的开发。

关键词:数据可视化;python;pycharm;PyQt5;概率分布;

Abstract

In this paper, we use pycharm to develop the visualization tools of 13 probability distribution models. The GUI is designed by pyqt5, which involves using numpy library and QT Designer and other related technologies can also use this tool to compare the visualization of different parameters under the same probability distribution. The results are of great significance for the visualization of probability distribution data and machine learning.

This paper mainly studies 13 visualization tools of probability distribution through python.

Research results: 13 visualization tools of probability distribution based on Python are developed by pycharm and pyqt5.

Key Words:Data visualization;python;pycharm;PyQt5;probability distribution

目录

第1章绪论 6

1.1背景 6

1.2目的及意义 6

1.3国内外研究现状 6

第2章各概率分布的函数及实现 7

2.1开发工具 7

2.2概率分布 7

2.2.1均匀分布 7

2.2.2伯努利分布 8

2.2.3二项分布 9

2.2.4分类分布 11

2.2.5多项式分布 12

2.2.6β分布 13

2.2.7Dirichlet分布 15

2.2.8γ分布 16

2.2.9指数分布 18

2.2.10高斯分布 19

2.2.11正态分布 20

2.2.12卡方分布 21

2.2.13 t分布 22

第3章图形界面设计 25

3.1图形界面设计预览 25

第4章论文总结及不足 30

参考文献 31

致谢 32

第1章 绪论

随着技术的不断发展,数据可视化是如今大数据时代所必须研究的课题,且概率分布在机器学习领域亦应用广泛,以此为基准进行概率分布的可视化工具设计。

1.1 背景

数据可视化,是一门研究数据在视觉层次上展示的科学。通过多种方式,将数据以图形化的方式,来清晰地传达出数据所蕴含的信息,以及数据之间的紧密联系,这便是数据可视化的目的。但是,这并不就相当于数据可视化实现功能一定会使人让人枯燥无味,或是为了华而不实而顾此失彼。为了更加有效地传达数据中蕴含的信息,可视化过程更加地要求艺术与功能共同进步,相互映衬。利用可视化数据来形象化地传递重要的信息与特征,从而进一步实现对相当缺少样本而又复杂的数据的深层次观察思考。与可视化数据息息相关的研究有很多,例如信息图形、信息可视化、科学可视化亦或是统计图形。目前,可视化数据在研究、教学和开发领域,是一个相当活跃而又重要的方面。成熟的科学可视化领域与较年轻的信息可视化领域的统一,在”可视化数据”开始时方才实现。

1.2 目的及意义

面对庞大而冗杂的大数据,将其进行可视化能够更加简洁明了地显示数据,便于进行数据分析和数据挖掘。也就是全面提高消息和知识的准确性、高效性、精简性。这就是数据可视化的共同目的.数据可视化能将不可见的数据信息情况转变成为可见的图形符号,能将纷繁复杂、一下看上去毫无关联却又有着千丝万缕联系的数据信息,建立起纽带,看到隐藏在这其中的规律性和特征,得到 更有商业价值的见解。同时通过适合的图表直接了当且清楚而直观地表现出来,达到数据信息自我解释、让数据信息说话的目的。对于加深和加强受众对数据信息的正确理解和印象而言,数据可视化毫无疑问是最有效的方式。

1.3 国内外研究现状

在海外,实际上数据可视化现已很成熟了,例如说新闻这方面,他们凭借数据可视化的方法,采用图像化来传递信息,由此来提高自身的影响力,像有些有名气的新闻媒体比如卫报、芝加哥论坛报、BBC、ABC等。而在国内,数据可视化开始的时间较晚些,例如说360平台的“360星图”,借助于12亿终端设备,使人们真实的看到大数据;再如阿里巴巴的淘宝指数,通过公司旗下的电子支付产生的商业数据开展深入分析和可视化,为买家、卖家和其他第三方提供信息,进行分享。

第2章 各概率分布的函数及实现

2.1开发工具

PyCharm是本次实验主要用到的开发软件,它是一种Python IDE,带有许多的便捷工具,这些工具可以提高用户在使用Python语言开发的效率,比如运行调试程序、不同的语法以不同的颜色高亮显示、Project管理、代码历史修改、根据输入智能提示命令全程、自动填充代码、单元测试等。

另外在开发过程中用到了Numpy库,Numpy是一个开源的Python科学计算库,它包括常用的对象和函数:包括但不限于一个强大的N维数组对象ndrray;成熟的函数库;实用的线性代数、随机数生成函数.

由于NumPy能够直接对数组和矩阵进行操作,所以对于同样的数值计算任务,可以省略很多循环语句.这就进一步体现了直接编写Python代码远不如使用numpy便捷,Python中等价的基本数据结构的存储效率和输入输出性能远不如numpy中数组的处理能力,NumPy的大部分代码都是用C语言写成的,这也使得纯python代码没有Numpy高效。

在本次开发过程中我们主要用到numpy库对多维数组的处理以及numpy matplotlib来生成可视化后的图像。

2.2概率分布

我们在生活中遇到的所有概率事件可以分为两大类:一类是确定性事件,这种事件的发生情况有且仅有一种可能的结果,例如人是否需要进食;另一类则是不确定性事件,这类事件可能同时有多个发生的情形,例如,下周一的温度是否会高于30℃,或者明天商场的某商品是否会降价销售,或者投掷一个骰子,向上的一面是几,亦或是扔一枚硬币,落地后后数额朝上还是花面朝上。数学上用随机变量来描述这种不确定的事件。对不确定性事件相对而言,我们在数学上使用随机变量的概率分布来描述多种不同的结果以及每种结果所发生的可能性。概率与统计,是数学学科的重要应用分支。概率统计模型,如各种随机变量的概率分布,对于解决实际问题有着广泛而深刻的应用。

本次开发主要研究均匀分布、伯努利分布、二项分布、分类分布、多项式分布、β分布、Dirichlet分布、γ分布、指数分布、高斯分布、正态分布、卡方分布、t分布。下面逐一介绍。

2.2.1 均匀分布

无论是在现实中,还是在概率统计问题中,都到处存在着符合均匀分布规律的事件,因此均匀分布是一种最常见也最简单的分布形式。另一方面,对于解决现实世界的问题或学术理论问题,均匀分布也有重要的应用。以分布的特征来分类,均匀分布可分为离散型均匀分布和连续型均匀分布,两种均匀分布分别有以下的定义:

离散型均匀分布:若随机变量X有n个不同的取值,且这n个取值互相分散不连续,例如1,2,...n,就称其为离散型均匀,具有以下的概率密度函数:

连续型均匀分布:如果随机变量X在可以在区间a到b之间连续取值,便成为连续型均匀分布,其分布函数为:

对于[a,b]的任意子区间,例如[x1,x2],随机变量的取值落在x1,x2之间的概率

由此可见,连续型均匀分布的结果落在某个区间的可能性仅与这个区间的长度有关,而与该区间所处的位置无关。

实现:参数为边界值[a,b]

函数主体:def uniform(x, a, b):

y = [1 / (b - a)

if a lt;= val and val lt;= b

else 0 for val in x]

return x, y, np.mean(y), np.std(y)

参数设置:m=int(input("请输入左边界:"))

n=int(input("请输入右边界:"))

请支付后下载全文,论文总字数:21721字

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图