“排名数据”任务

关于“排名数据”任务

示例：按年龄和身高对学生进行排名

向角色分配数据

设置选项

关于“排名数据”任务

数据排名任务将为表中所有行的一个或多个数值型变量计算排名，并将排名包含在输出表中。

例如，在对产品销量进行排名时，可能会用到“排名数据”任务。在这种情况下，排名变量将显示产品销量的顺序。销量最高的产品将排在首位。

示例：按年龄和身高对学生进行排名

在该示例中，您希望对班级里的学生按年龄和身高进行排名。

要创建此示例，请执行以下操作：

在任务部分中，展开数据文件夹，并双击排名数据。此时将打开“排名数据”任务的用户界面。
在数据选项卡中，选择 SASHELP.CLASS 数据集。

向下列角色分配列：

角色	列名
角色
要排名的列	Height
其他角色
排名依据	Age

打开选项选项卡。从排名顺序下拉列表中，选择大到小。
要运行任务，点击。

“排名数据”任务将创建一个输出数据集。在 SAS Studio 中，此数据集将在输出数据选项卡中打开。该数据集包含额外的 rank_Height 列，该列将显示学生在其年龄组中的排名。例如，在 11 岁组中，Joyce 排在第二名。在 12 岁组中，Louise 排在第五名。

向角色分配数据

要运行“排名数据”任务，必须向要排名的列角色分配一个列。

角色	说明
角色
要排名的列	系统将对分配给该角色的每一列进行排名。必须为该角色分配至少一个变量。默认情况下，排名列命名为 rank_column-name, 其中 column-name 是原始列的名称。
其他角色
排名依据	向该角色分配一个或多个列时，输入表将按选定的一个或多个列进行排序，并且将在各个组内计算排名。
输出数据集
为排名变量创建新的变量	指定包含原始列和排名列的输出表。如果您希望将原始列替换为排名列，清除为排名变量创建新变量复选框。默认情况下，排名列命名为 rank_column-name，其中 column-name 是原始列的名称。
显示输出数据	指定显示结果中的所有输出数据还是部分输出数据。

设置选项

必须至少选择一个输出选项。

选项名称	说明
选项
排名方法	指定进行数据排名时使用的方法。下面是有效值：排名将原始值分入 100 组，其中最小值接收的是值为 0 的百分位数，最大值接收的是值为 99 的百分位数。分位数将原始值分入以下分位数之一：百分位数将数据分为 100 个组，其中最小值接收百分比值 0，最大值接收百分比值 99。十分位数将原始值分为 10 组，其中最小值接收十分位数值 0，最大值接收十分位数值 9。四分位数将原始值分为 4 组，其中最小值接收四分位数值 0，最大值接收四分位数值 3。 N 分位数组将原始值分为 n 组，其中最小值接收值 0，最大值接收值 n–1。在组数框中，指定 n 值。
排名方法（续）	分数排名使用分母 N 或 N+1 计算分数排名。分母 N 计算分数排名，方法是用每个排名除以包含排名变量非缺失值的观测数。分母 N+1 计算分数排名，方法是用每个排名除以分母 n+1，其中 n 是指包含排名变量的非缺失值的观测数。百分比用每个排名除以包含变量的非缺失值的观测数，再用结果乘以 100 得出百分比。
排名方法（续）	排名的正态评分计算排名的正态评分。作为结果的变量将正态分布。公式如下： Blom 公式 $y sub i , equals , cap phi super negative 1 end super , open . fraction open , r sub i , minus , 3 eighths , close , over open n plus , 1 fourth , close end fraction . close. 点击备用格式的图像。$ Tukey 公式 $y sub i , equals , cap phi super negative 1 end super , open . fraction open , r sub i , minus , 1 third , close , over open n plus , 1 third , close end fraction . close. 点击备用格式的图像。$ van der Waerden 公式 $y sub i , equals , cap phi super negative 1 end super , open . fraction r sub i , over open n plus 1 close end fraction . close. 点击备用格式的图像。$ 在以上公式中，是逆累积正态 (PROBIT) 函数，r_i 是第 i 个观测的排名，n 是排名变量的非缺失观测量。注: 如果设置若值为绑定的，则使用选项，则“排名数据”任务会根据非绑定值计算排名的正态评分，并将绑定指定应用于计算出的评分。排名的 Savage 评分计算排名的 Savage（或指数）评分。注: 如果设置若值为绑定的，则使用选项，则“排名数据”任务会根据非绑定值计算排名的 Savage 评分，并将绑定指定应用于计算出的评分。
若值为绑定的，则使用	指定如何计算绑定数据值的正态评分或排名。默认方法为您的排名方法分配默认方法。如果选择百分比或者分数排名作为排名方法，则高值为默认值。对于其他所有排名方法，均值是默认值。排名均值分配相应排名或正态评分的均值。高排名分配相应排名或正态评分的最大值。低排名分配相应排名或正态评分的最小值。密集排名（绑定为相同排名）将绑定值视为单一次序统计量，以计算评分和排名。对于默认方法，排名是连续整数，最小值是 1，最大值是进行排名的变量的唯一非缺失值数量。系统将为绑定值分配相同排名。
秩序	指定是按照从小到大还是从大到小列出值。