上一页|下一页

“相关分析”任务

关于“相关分析”任务

相关分析是指用于描述数值变量之间关系的一个统计过程。该关系通过计算变量的相关系数来描述。相关系数值的范围从 –1 到 1。“相关分析”任务提供用于调查变量间关联性的图形和统计量。
注: 您必须使用 SAS/STAT 运行该任务。

示例:Sashelp.Cars 数据集中的相关

要创建此示例,请执行以下操作:
  1. 任务部分中,展开统计分析文件夹,然后双击相关分析。此时,系统会打开“相关分析”任务的用户界面。
  2. 数据选项卡中,选择 SASHELP.CARS 数据集。
  3. 向下列角色分配列:
    角色
    分析变量
    EngineSize
    Horsepower
    相关
    Cylinders
    MPG_Highway
  4. 要运行任务,点击 提交 SAS 代码
结果如下:
“相关分析”任务的数值结果

向角色分配数据

要运行“相关分析”任务,必须向分析变量角色分配至少两列,或者必须向分析变量角色和相关角色分别分配至少一列。
角色
说明
角色
分析变量
列出计算相关系数的变量。
相关
列出要计算与分析变量相关性的变量。
偏变量
移除这些变量在分析中的相关性,同时在计算相关性之前将这些变量进行关联。
其他角色
频数计数
列出其值代表观测频数的数值型变量。如果向此角色分配一个变量,则任务将假设每个观测代表 n 个观测,其中 n 表示频数变量值。如果 n 不是整数,则 SAS 会将其截断。如果 n 小于 1 或缺失,则系统会从分析中排除观测。频数变量的总和代表总观测数。
权重
列出计算 Pearson 加权积矩相关中所使用的权重。
分析分组依据
可获取由 BY 变量定义的组中单独的观测分析。

设置选项

选项名称
说明
方法
缺失值
指定如何处理带缺失值的观测。如果选择为所有选定变量使用非缺失值选项,则包含缺失值的所有观测将从分析中排除。如果选择为成对变量使用非缺失值选项,则将使用非缺失变量对计算相关性统计量。
统计量
默认情况下,结果中包括一个具有相关性和 p 值的表。您还可以添加以下统计量:
相关
选择此选项可以在结果中添加相关。您还可以指定与各个相关系数相关联的概率,以及是否按照绝对值从高到低的顺序进行相关排序。
协方差
选择此选项可以在结果中添加方差和协方差矩阵。此外,还将显示 Pearson 相关。如果向偏变量角色分配列,则此任务会计算偏协方差矩阵。
平方和与叉积
选择此选项可以在结果中显示平方和与叉积表。结果中还将包括 Pearson 相关。如果向偏变量角色分配列,则系统会显示非偏平方和与叉积矩阵。
校正平方和与叉积
选择此选项可以显示校正平方和与叉积表。结果中还将包括 Pearson 相关。如果向偏变量角色分配列,则此任务会同时计算非偏和偏校正平方和与叉积矩阵。
描述性统计量
选择此选项可以包含每个变量的简单描述性统计量。即使未选择该选项,当选择创建输出数据集时,该数据集也将包含该变量的描述性统计量。
Fisher z 转换
对于 Pearson 相关,可以使用 Fisher 转换选项请求以下指定备择(原)假设下的置信限和 P值,h sub 0 , colon rho equals , rho sub 0. 点击备用格式的图像。,用于使用 Fisher z 转换的相关系数。如果您选中 Fisher z 转换复选框,则必须在原假设框中指定值。
您可以从下面这些置信限类型中进行选择:
  • 双侧置信限可请求检验原假设 h sub 0 , colon rho equals , rho sub 0. 点击备用格式的图像。 的双侧置信限。这是默认设置。
  • 置信下限可请求检验单侧原假设 h sub 0 , colon rho less than or equal to , rho sub 0. 点击备用格式的图像。 的置信下限。
  • 置信上限可请求检验单侧原假设 h sub 0 , colon rho greater than or equal to , rho sub 0. 点击备用格式的图像。 的置信上限。
默认情况下,相关的置信限水平为 95%。
非参数相关
Spearman 秩顺序相关
用于计算 Spearman 秩顺序相关。这是基于数据值秩的非参数关联测度。相关系数值的范围从 –1 到 1。
Kendall tau-b
计算 Kendall tau-b。这是一个基于成对观测的一致性和非一致性数量的非参数关联测度。如果成对观测的变化趋势相同,则表现为一致性;如果变化趋势不同,则为非一致性。Kendall tau-b 的范围从 –1 到 1。
Hoeffding 相关测度
计算 Hoeffding 相关测度 D。这是一个用于检测更普遍违背独立性的非参数关联测度。此 D 统计量比通常定义大 30 倍,其值范围在 –0.5 到 1 之间,因此,只有较大的正值才会显示出相关性。
您可以在结果中包括下面两种图中的任一种:
  • 变量的散点图矩阵。还可以选择在对称矩阵图中包括分析变量的直方图。
  • 分析变量中各个适用的成对非重复变量的散点图。您可指定是显示新观测的预测椭圆还是均值的置信椭圆。
也可指定要绘制的变量数和要绘制的最大点数。

设置输出选项

您可指定是否创建包含 Pearson 相关统计量的输出数据集。该数据集还将包括均值、标准差,以及观测数。
还可以选择在输出数据集中包括以下统计量:
  • 相关 — 默认情况下,输出数据集中包含相关系数以及相应的 _TYPE_ 变量值“CORR”。
  • 协方差 — 如果选择此选项,则输出数据集中包含协方差矩阵以及相应的 _TYPE_ 变量值“COV”。
  • 平方和与叉积 — 如果向偏变量角色分配列,则输出数据集中不会包含平方和与叉积矩阵。
  • 校正平方和与叉积 — 如果向偏变量角色分配列,则输出数据集中包含偏校正平方和与叉积矩阵。
上一页|下一页|页首