首页 科技开发工具 娱乐游玩工具 热门工具   APP 登录/注册 联系/合作
   
 
什么是 Python 中的分布图?
理解原始数据应该始终是任何产品创建过程的第一步。此步骤占据了盈利和有效产品工作流程的重要部分。 

使用各种技术探索和理解数据。创建数据可视化是其中之一,因为它们有助于数据探索和解释。 

我们可以通过开发相关且有吸引力的可视化来了解数据的底层结构和关系。 

分布图的使用对于探索性数据分析至关重要。它们帮助我们识别异常值和偏度,或提供集中趋势度量(均值、中位数和众数)的摘要。 

什么是 Python 中的分布图?  
通过将数据的经验分布与某个分布的预期理论值进行对比,分布图提供了对样本数据分布的直观评估。要确定样本数据是否来自特定分布,除了更正式的假设检验之外,还 可以使用分布图。 

Statistics and Machine Learning Toolbox 中提供了绘图分布选项,如下所示: 

正态概率图 
正态图工具的用途包括确定样本数据是否来自正态分布。您可以使用 probplot 调查删失数据的分布或为非正态分布构建概率图。对于概率分布对象,使用绘图创建概率图。 

分位数-分位数图 
QQ 图确定两组样本数据是否属于同一分布族。该地块可以承受规模和位置的变化。 

累积分布图 
cdfplot 或 ecdf 用于直观地比较样本数据的经验累积分布函数 (cdf) 与给定分布的理论累积分布函数,使用。对于概率分布对象,使用绘图绘制累积分布函数。 

分布式绘图的类型 
Seaborn 分布图用于分析单变量和双变量分布。本文将探讨四个分布图,包括以下内容: 

联合地块 
Jointplot 由三个图组成。显示标准变量如何随预测变量变化的多元统计图显示在一张图中。无偏变量的分散显示在第二张图中,它位于多变量图表的上边缘对角线上。最终图表显示了预测变量的分散情况,位于多变量图表的右边缘,具有垂直调整的方向。使用 jointplot() 函数显示每列的相互分布。必须向联合图提供三个参数。 

术语“参数”用于方差分析。与评估各种变化之间的联系以及该关系强度的多元回归相反,它评估并突出显示数据中的相关异常。Seaborn 模块的 jointplot() 方法创建了一个散点图,在图的上边缘和右侧具有不同的直方图。  

要构建联合图,我们将使用 jointplot() 方法。此步骤的图表显示了一个散点图,在地图的边缘有两个直方图。该图显示了“总账单”和“小费”字段之间似乎呈正相关。随着一个参数值的增加,另一个参数的值也会增加。 

距离图 
散布图,也称为 Distplot,描述了原始数据集中的方差。Seaborn 框架的 distplot() 函数显示了实时数据参数的整体分散情况。Seaborn 库和 Matplotlib 库都用于说明各种调整之间的 distplot。Distplot 中使用直方图和曲线来描述数据。 

Seaborn 库包含各种用于可视化数据波动和绘制信息图形的技术。Seaborn 包的 distplot() 方法生成 Distplot。Distplot 显示了关于分散关系的参数的统计分散,这是单一模型参数。单个列的数据直方图分布通过 distplot() 函数显示。提供给 distplot() 函数的参数是列名。 

distplot() 方法接收数据集参数并返回具有离散关系的图。Seaborn 库的 distplot() 方法与 KDE 图结合使用,以评估因变量分散在多个数据集中的可能性。首字母缩略词 KDE 是指内核密度估计。 

Distplot 可以以多种方式显示。我们使用 pylab 框架的 subplot() 函数来同时说明四个备选方案。我们可以通过更改 distplot() 函数的输入来获得不同的可视化效果。其中一些参数将与用户交互,改变色调、布局和其他元素。 

每种 Pyplot 技术都以某种方式改变视觉效果。Seaborn 是一个基于 matplotlib 的可视化分析工具包。一个流行的用于数值计算的 Python 库称为 NumPy。Pylab 库结合了 NumPy 和 Matplotlib 包的方法来提供集成开发环境。 

我们使用 Seaborn 库的 set() 方法。此外,我们还使用了 seed() 和 randn() 方法。这两个操作都是 NumPy 库的一部分。在这种情况下,我们创建了四个不同的 Distplots。我们在四个子图中分别调用 distplot() 方法。我们只需设置第一个子图的尺寸并使用 Seaborn 库的 distplot() 函数来绘制它。我们为 distplot() 函数提供第二个子图的“rug”和“hist”参数。 

定义维度后,我们使用 displot() 方法绘制第三个子图。在这里,我们给“vertical”变量赋值“False”。与上一个类似,我们利用 Seaborn 库的 kdeplot() 方法来构建 KDE 图形。“阴影”参数的值设置为“真”。此外,“b”被设置为颜色的值。最后,plt.show() 方法显示这些子图。 

配对图 
绘制数据集中的成对关系是成对图的作用 (seaborn.pairplot)。数据科学家和分析师经常使用流行的 Python 可视化库 Matplotlib 和 Seaborn。还有更多,但这些是公认的规范。在级别方面,Seaborn 建立在 Matplotlib 的基础上,“提供了一个高级界面来生成有吸引力和信息丰富的统计视觉效果。” Matplotlib 是更基本的包。 

得益于 Seaborn 更高级别的预构建绘图功能,我们拥有了很好的功能。其中之一是配对图。您可以使用 Matplotlib 绘制各种绘图类型,包括折线图、散点图、条形图、直方图等。pair plot 不是一种特定的绘图形式,而是一种绘图模型。 

我们想使用对图查看数据集中的每个特征对如何与类分布相关联。正如您在上面看到的,配对图的对角线不同于其他成对图的对角线。这是因为对角线图呈现相同的特征对。因此,我们不必绘制对角线特征的相关性。相反,我们可能只使用一种绘图类型来表示该对的类别分布。 

各种特征对图可以是散点图或热图,以确保类分布在相关性方面有意义。最流行的绘图类型,如直方图和 KDE(核密度估计),可以有效地描述类的密度分布,也可以选择作为对角线的绘图类型。 

对图有助于我们理解和快速分析数据集的相关矩阵 (Pearson),因为它清楚地说明了每个特征对的相关性。 

Seaborn 分布图 
分布图通常描述数据分布变化。Seaborn Distplot 代表连续数据变量的分布。 

地毯地块 
单个定量变量的 rug 数据被绘制为沿轴的标记,这种类型的绘图称为绘图。它用于显示数据的分散性。 

地毯图通常与二维散点图结合使用,地毯图的 x 轴和 y 轴分别代表 x 值和 y 值。它的垂直标记类似于散点图矩形“地毯”边缘的流苏。 

刻度线通常用于绘制沿 x 轴和 y 轴的边缘分布。 

通过巧妙地突出个别观察的位置,此功能旨在增强其他图。地毯锅的一些参数是 

x,y:变量 x 和 y 分别定义相对于 x 轴和 y 轴的位置。 

高度:这描述了每个地毯元素占据的轴区域。
 
轴:它描述了应该用于映射地毯元素的轴。 

axis:绘图的预先存在的轴。 

数据:输入必须用于绘制地毯的数据结构。
 
色调:用于确定绘图元素颜色的语义变量。
 
调色板:这是用于选择绘图颜色的工具。 

展开边距:它的值为布尔值。为了防止与其他项目重叠,如果为 True,它会将轴边距增加地毯的高度。 

图例:值为布尔值。如果它返回 False,则不会添加语义变量的图例。 
结论,了解变量的分布对于涉及数据分析或机器学习(即特征)的活动至关重要。分布可能会影响我们处理任务的方式。 我们已经在本文中了解了如何使用详细的 Seaborn 资源,但还可以了解许多其他细微差别。此外,还有其他 Python 可视化包,其功能超过了 Seaborn。查看UNext以了解有关 Python 的更多信息并了解分布式绘图的重要性。此外,探索电子学习平台上有关数据科学和机器学习的各种前沿认证。 
最新文章:
所有文章资讯、展示的文字、图片、数字、视频、音频、其它素材等内容均来自网络媒体,仅供学习参考。内容的知识产权归属原始著作权人所有。如有侵犯您的版权,请联系我们并提供相应证明,本平台将仔细验证并删除相关内容。
工具综合排行榜
TOP 1
双计算器 双计算器
同时用两个计算器,用于价格对比、数字分别计算等
TOP 2
推算几天后的日期 推算几天后的日期
推算从某天开始,增加或减少几天后的日期
TOP 3
随机密码生成 随机密码生成
随机生成安全复杂的密码,自由设置密码长度及复杂度
TOP 4
推算孩子的血型 推算孩子的血型
根据父母的血型推测子女的血型
TOP 5
日期转中文大写 日期转中文大写
把数字日期转成中文大写,是财务或商务合同常用的工具
热门内容:       双计算器       推算孩子的血型       随机密码生成       日期转中文大写       推算几天后的日期       达轻每日一景       高校分数线       高校查询       周公解梦大全
首页 科技开发工具大全
娱乐游玩工具大全
登录/注册
联系我们
  用户咨询/建议
kf@ss3316.com


商务合作/推广
hz@ss3316.com

达轻工具 APP

访问手机版网站
使用本平台必读并同意:任何内容仅供谨慎参考,不构成建议,不保证正确,平台不承担任何责任,同意用户协议隐私政策   
BaiduTrust安全认证签章
© 达轻科技 版权所有 增值电信业务经营许可证 ICP备 沪B2-20050023-3