当前位置： > 网站运营 > 网络赚钱 > 文章内容

spss描述性分析,SPSS描述性分析探索所得中位数不一样

http://www.itjxue.com 2023-01-05 04:02 来源:未知 点击次数:

如何在SPSS软件中对数据进行描述性统计分析

我们使用SPSS分析数据文件的时候，经常需要进行描述性统计分析，那么如何操作呢？下面我给大家分享一下。

工具/材料

SPSS

首先点击顶部的文件菜单，选择下拉菜单中的数据选项，如下图所示

在弹出的打开数据界面，我们选择要操作的数据文件，如下图所示

数据加载进来以后我们可以选择要进行分析的字段，这里我选择身高进行描述性统计分析，如下图所

然后我们点击顶部的分析菜单，在下拉菜单中选择描述选项，如下图所示

接着在弹出的描述性界面中将身高添加到变量面板，然后按选项按钮，如下图所示

接下来在弹出的选项界面中勾选要统计的内容，如下图所示

然后回到描述性界面中在这里可以在点击样式设置统计结果的样式，如果不想设置的话直接点击确定按钮，如下图所示

最后SPSS软件就会自动给我们将描述统计分析表格绘制好了，如下图所示

如何用SPSS进行描述性统计分析

所谓描述性统计分析，就是在表示数量的中心位置的同时，还能表示数量的变异程度（即离散程度）。描述性统计分析一般有二种方法可以进行：1、频数分布分析，2、列联表分析。

------------------------转自热心网友

spss描述性分析,SPSS描述性分析探索所得中位数不一样

spss描述性分析

你好

一、描述性统计分析

概念：是以概括性数据描述数据特征的各项活动。

通俗的讲就是用儿子代表全家

集中趋势：关于数据“中心位置”的某种表述，也就是常说的“平均起来”

常见的有均数、中位数等

离散趋势：反应数据的波动范围大小

常见的有标准差、方差、四分位数

分布特征：数据的分布应该满足某种特征，比如正态分布

衍生出一系列概念描述数据与正态分布之间的关系，比如偏度系数以及封度系数

二、集中趋势描述指标

算数平均数：使用一个数高度浓缩数据，也就是说平均数是描述一组数到一个数的距离。

使用范围：定距变量，单峰（如上图）或者基本对称的情况下才适用使用平均数。也就是说

均数适用于正态分布（包含极值的称为偏态分布）。在正态分布中均值代表集中趋势。

中位数:是一种位置平均数，将整体各单位按照大小排序，取中间位置的数

捷尾均数：去掉极值之后的均数

三、离散趋势描述指标

极差：最大值与最小值之差。反应数据的离散幅度，或者变异范围。

局限：取决于极端情况：1、不能反应数据分布情况

2、受极端值影响较大，不符合数据稳健性要求

适用于大体上了解数据的波动情况。

方差和标准差：

本质上反应数据与均值的差异情况。这种差异称为离散也称变异。

方差与标准差只适用于正态分布（无极端值）

分位数：

分位数本质上反应的是缩小极端值对变异幅度的影响。

适用范围：样本足够多。只是人为的切割，并非通过计算得出，不如均值和标准差精准。但是

中间位置原理极值，样本稳定。

变异系数:

是标准差与平均数的比值。

本质上是消除数据大小差异（平均数）后的波动情况（标准差）

四、连续变量的参数估计

正态分布：

是关于均值对称的分布，均值处为最大值。同时标准差（个体差异）影响曲线的形态（矮阔尖峭）

偏度：描述分布不对称的方向和程度。

尾巴所在的方向为分布方向

峰度：描述曲线的陡峭程度

标准正态分布：标准差为1，关于0对称

如果偏度系数标准差/峰度系数标准差2说明不服从正态分布。

五、spss的实现

tvg指偏度系数标准差，利润范围指峰度系数标准差。

SPSS-描述性分析

?step1：单击【文件】-【打开】-【数据】，弹出【打开数据】对话框。在左上角的【查找范围】找到文件所在位置，下方【文件类型】右侧下拉菜单中根据文件类型选择对应的类型。本文导入的是CSV文件，如下图1-1，单击【打开】，进入【文本导入向导】对话框。

step2：在弹出的【文本导入向导-第1/6步】对话框中（图1-2），观察一下各变量间的安排方式，单击【下一步】。step3：在弹出的【文本导入向导-第2/6步】对话框中，根据本例变量的安排方式选择【分隔】，文件开头是否包含变量名称选择【否】，如图1-3，单击【下一步】。step4：在弹出的【文本导入向导-第3/6步】对话框中，进行个案设置，保持默认设置即可，单击【下一步】，如图1-4。step5：在弹出的【文本导入向导-第4/6步】对话框中，SPSS根据导入数据特点，自动勾选【制表符】分隔符，如图1-5，单击【下一步】。

step6：在弹出的【文本导入向导-第5/6步】对话框中，选中【数据预览】下的变量列，然后依次分别设置【变量名称】和数据格式。单击【下一步】；在弹出的【文本导入向导-第6/6步】对话框中，可根据需要，选择是否保存刚才设置过的格式或者获得导入过程的语法，单击【完成】，就成功导入SPSS了。

step1：单击【转换】-【计算变量】，弹出【计算变量】对话框。在左上角的【目标变量】中输入计划生成的变量‘AGE’，在右侧【函数组】下拉菜单中找到所需的函数，本例中选择‘抽取日期’，在【函数和特殊变量】下选择‘Xdate.Year’，右上方【数字表达式】框中输入‘2020-XDATE.YEAR(BIRTHDAY)’，如图2-1，单击【确定】。返回‘数据视图’，可以看到生成了行的一列变量‘AGE’，如图2-2。

step1：单击【数据】-【标识重复个案】，弹出【标识重复个案对话框】，将变量'USERID'移到右侧框中，单击【确定】。此后可以看到‘数据视图’中多了变量——‘最后一个基本个案’，其中1代表非重复数据，0代表重复数据，选中此列，鼠标右击，在弹出的菜单中选择【升序排列】，可以看到最小值也为1，说明不存在重复项。由于该列变量在分析时无用，可以删除。

step1：单击【分析】 -【描述统计】-【描述】，打开【描述性】对话框，将‘AGE’变量移到右侧【变量】框中，勾选下方的【将标准化得分另存为变量（Z）】，如图3-3，单击【确定】。返回‘数据视图’，看到多出变量‘ZAG’，本例中ZAG的绝对值大于2的视为异常值（将±2δ 以外的数据视为异常值），如图3-4。

step2：单击【分析】 -【描述统计】-【探索】，打开【探索】对话框，将‘ZAGE’变量移到右侧【因变量列表】框中，勾选下方的【统计量】，如图3-5，单击【确定】。输出图3-6，根据图3-6中统计量可知：样本总计101535个，有效值共计32075个，存在缺失值；极大值和极小值的绝对值大于2，存在异常值。

step3：单击【数据】 -【选择个案】，打开【选择个案】对话框，勾选右侧【选择】下的【如果条件满足（C）】项，如图3-7，【输出】下方根据需要勾选，本例勾选【过了掉未选定的个案】，单击【如果（I)...】，进入【选择个案：if】对话框。在公式框中输入‘ABS(ZAGE) = 2AGE ~= 0’，将缺失值和异常值过滤掉。如图3-8.此后可以看到‘数据视图’中多了变量——‘filter_$，其中1代表被选择，0代表未被选择。如图3-9.

step1：分组前，先查看一下筛选后的数据情况，单击【分析】-【描述统计】-【频率】，进入【频率】对话框，将‘AGE’移到中间变量框中，点击右侧【统计量】，选择【众数】、【最小值】、【最大值】，点击【继续】如图3-10；点击【图表】，勾选【直方图】，见图3-11,点击【继续】,单击【确定】。从输出结果可以看到，有效值有30201个，年龄最小18岁，最大59岁，同年龄人数最多的是33岁；年龄分布基本服从正态分布。

step2：单击【转换】 -【重新编码为不同变量】，打开【重新编码为其他变量】对话框，将‘AGE’变量移到中间框中，在右侧【输出变量】-【名称】下输入‘AGE_GROUPS’，点击【更改】，如图3-13。点击【旧值和新值】，进入【?重新编码为其他变量：旧值和新值】，将年龄划分为不同的范围，每个年龄段赋予一个新值，如50岁以上的人，在左下角【范围，从值到最高】下输入50，【新值】下输入4，点击【添加】，如图3-14，单击【继续】，返回原对话框，单击【确定】。进入‘数据视图’界面，生成一列变量‘AGE_GROUPS’，如图3-15.

step3：单击【数据】 -【定义变量属性】，打开【定义变量属性】对话框将‘AGE_GROUPS’变量移到【要扫描的变量】中，如图3-16，单击【继续】，在【标签】列中输入自定义标签，如图3-17。返回‘数据视图’，单击右上角标签转换按钮，变量值标签发生了改变，如图3-18.

step1：单击【分析】 -【表】-【设定表】，进入【设定表格】对话框，依次将性别和年龄分组变量移到行，结果如图4-1，点击【类别位置】下的下拉菜单，选择【列中的行标签】（图4-2）；再依次选中表中的‘AGE_GROUPS'和'SEX'，单击鼠标右键，在弹出的子菜单中，见图4-3，取消【显示变量标签】前的勾选。点击【定义】下的【摘要与统计】，进入【摘要与统计】对话框，在该对话框中，将左侧【统计量】下的’列N%’和’行N%’移到右侧【显示】中。见图4-4，单击【应用选择】，返回【设定表格】对话框。

step2：选中表中的‘AGE_GROUPS'，点击【定义】下的【分类和总计】，进入【分类和总计】对话框，选中30~39岁标签，单击【添加小计】，在弹出的【定义小计】对话框中输入‘中青年’，将18~39岁的用户定义为中青年，同样方法，设置40~59岁的为中老年，见图4-4，单击【应用】，返回【设定表格】对话框，单击【确定】。

step1：选中输出的表格，鼠标右键，在弹出的子菜单中选择【导出】，见图4-5，进入【导出输入】对话框，在左侧文档类型下拉子菜单中选择想要输出的文件类型，中间【浏览】选择文件保存位置，如图4-6，单击【确定】

行N%数据体现了在不同年龄段下的男女人数比例：随着年龄段增大，女性占比逐渐降低。中青年群体中，男女占比基本持平，分别为49.5%和50.5%，而中老年群体，男性占比远高于女性，分别为62.2%和37.8%。列N%数据体现了在不同性别下，各年龄段的用户人数比例。男性用户中，人数占比由高到低的年龄段依次是30~39岁（43.2%），40~49岁（28.4%），18~29岁（15.3%）和50岁以上（13.1%）。而女性用户中，人数占比由高到低年龄段依次是30~39岁（48.5%），18~29岁（21.8%），40~49岁（20.9%）和50岁以上（8.8%）。由此可见，女性用户相比男性用户总体更加趋向年轻，18~39岁的女性用户占了女性总用户的70%以上，而30~49岁的男性用户占了男性总用户的70%以上。

如何用spss进行多维度描述性分析

描述性统计分析是针对数据本身而言，用统计学指标描述其特征的分析方法，这种描述看似简单，实际上却是很多高级分析的基础工作，很多高级分析方法对于数据都有一定的假设和适用条件，这些都可以通过描述性统计分析加以判断，我们也会发现，很多分析方法的结果中，或多或少都会穿插一些描述性分析的结果。

描述性统计主要关注数据的三大内容:

1.集中趋势

2.离散趋势

3.数据分布情况

描述集中趋势的指标有均值、众数、中位数，其中均值包括截尾均值、几何均值、调和均值等。

描述离散趋势的指标有频数、相对数、方差、标准差、标准误、全距、四分位间距、四分位数、百分位数、变异系数等。

注意:连续型变量和离散型变量的指标有所不同。

由于很多统计分析都有一个正态分布的假设，因此我们经常也会关注数据的分布特征，常用峰度系数和偏度系数来描述数据偏离正态分布的程度，也可以使用Bootstrap方法计算出结果与经典统计学方法计算出的结果进行对比，如果差异明显，则说明原数据呈偏态分布或存在极值

SPSS用于描述性统计分析的过程大部分都在分析-描述统计菜单中，另有一个在比较均值-均值菜单，虽然这几个过程用途不同，但是基本上都可以输出常用的指标结果。

一、分析-描述统计-频率

此过程可以输出连续型变量集中趋势和离散趋势的主要指标，还可以输出判断分布的直方图、峰度值

(责任编辑：IT教学网)

复制链接发给好友收藏本文关闭此页

上一篇：包含ManifestDestiny的词条

下一篇：match_parent,match_parent翻译成中文

spss描述性分析,SPSS描述性分析探索所得中位数不一样

如何在SPSS软件中对数据进行描述性统计分析

如何用SPSS进行描述性统计分析

spss描述性分析

SPSS-描述性分析

如何用spss进行多维度描述性分析

(责任编辑：IT教学网)

相关网络赚钱文章

阅读排行

专题教程

推荐网络赚钱文章

最新更新网络赚钱