上一页|下一页

“标准化数据”任务

关于“标准化数据”任务

“标准化数据”任务允许您使用多种方法将一个或多个数值变量居中或标准化。标准化变量保存在输出数据集中。

示例:SASHELP.BASEBALL 数据集中的标准化变量

要创建此示例,请执行以下操作:
  1. 任务部分中,展开数据文件夹,然后双击标准化数据。此时,系统将会打开“标准化数据”任务的用户界面。
  2. 数据选项卡中,选择 SASHELP.BASEBALL 数据集。
  3. nHits 列分配给要标准化的角色。
  4. 要运行任务,点击 提交 SAS 代码
部分输出数据如下所示:
“标准化数据”任务的部分输出数据

向角色分配数据

要运行“标准化数据”任务,必须向要标准化的变量角色分配一列。
角色
说明
角色
要标准化的变量
列出要标准化的数值型变量。
其他角色
频数计数
是包含观测中其他值发生频数的变量。该任务将数据集视为每个观测出现 n 次,其中 n 是观测的频数计数变量的值。
权重
在输入数据集中指定数值型变量,该变量的值用于权衡每个观测。这些值可以是非整数。仅当权重变量的值大于 0 时,观测才在分析中使用。
分析分组依据
在由 BY 变量定义的组中创建单独的观测分析。

设置选项

选项名称
说明
方法
仅居中数据
指定要使用均值还是中位数标准化方法。
标准化方法
指定要使用以下标准化方法中的一个:
  • 标准差(默认方法,且该方法通常与标准化相关联)
  • Andrew wave 估计。此方法的调节常数必须大于 0。默认值为 4.7。
  • Euclidean 长度
  • Huber 估计。此方法的调节常数必须大于 0。默认值为 1。
  • 四分位极差
  • 极差
  • 总和
  • Tukey biweight 估计。此方法的调节常数必须大于 0。默认值为 6。(Goodall 1983)
缺失值处理
缺失值方法
指定是忽略含缺失值的观测还是替换缺失值。可以用以下选项之一来替换缺失值:
  • 默认位置测度,是选定的居中或标准化方法所使用的位置测度。
  • 均值
  • 中位数
  • 最小值
  • 指定自定义值,可以指定所有标准化变量的值。
统计量
显示位置和尺度测度
在结果中显示位置和尺度测度。这些测度为您提供了标准化过程所完成内容的相关信息。

设置输出选项

默认情况下,“标准化数据”任务创建包括原始变量和标准化变量的输出数据集。您可以为变量名添加前缀,以区分是原始变量还是标准化变量。默认情况下,该任务将 Standardize_ 前缀添加至标准化变量。
显示输出数据选项指定是否包括出现在结果选项卡中结果的输出数据。可以选择所有输出数据或其中一个子集。该任务始终会在输出数据选项卡中创建输出数据集。该数据集会保存在指定位置。
上一页|下一页|页首