上一页|下一页

“排名数据”任务

关于“排名数据”任务

数据排名任务将为表中所有行的一个或多个数值型变量计算排名,并将排名包含在输出表中。
例如,在对产品销量进行排名时,可能会用到“排名数据”任务。在这种情况下,排名变量将显示产品销量的顺序。销量最高的产品将排在首位。

示例:按年龄和身高对学生进行排名

在该示例中,您希望对班级里的学生按年龄和身高进行排名。
要创建此示例,请执行以下操作:
  1. 任务部分中,展开数据文件夹,并双击排名数据。此时将打开“排名数据”任务的用户界面。
  2. 数据选项卡中,选择 SASHELP.CLASS 数据集。
  3. 向下列角色分配列:
    角色
    列名
    角色
    要排名的列
    Height
    其他角色
    排名依据
    Age
  4. 打开选项选项卡。从排名顺序下拉列表中,选择大到小
  5. 要运行任务,点击 提交 SAS 代码
“排名数据”任务将创建一个输出数据集。在 SAS Studio 中,此数据集将在输出数据选项卡中打开。该数据集包含额外的 rank_Height 列,该列将显示学生在其年龄组中的排名。例如,在 11 岁组中,Joyce 排在第二名。在 12 岁组中,Louise 排在第五名。
“排名数据”任务创建的输出数据集

向角色分配数据

要运行“排名数据”任务,必须向要排名的列角色分配一个列。
角色
说明
角色
要排名的列
系统将对分配给该角色的每一列进行排名。必须为该角色分配至少一个变量。默认情况下,排名列命名为 rank_column-name, 其中 column-name 是原始列的名称。
其他角色
排名依据
向该角色分配一个或多个列时,输入表将按选定的一个或多个列进行排序,并且将在各个组内计算排名。
输出数据集
为排名变量创建新的变量
指定包含原始列和排名列的输出表。如果您希望将原始列替换为排名列,清除为排名变量创建新变量复选框。
默认情况下,排名列命名为 rank_column-name,其中 column-name 是原始列的名称。
显示输出数据
指定显示结果中的所有输出数据还是部分输出数据。

设置选项

必须至少选择一个输出选项。
选项名称
说明
选项
排名方法
指定进行数据排名时使用的方法。下面是有效值:
排名
将原始值分入 100 组,其中最小值接收的是值为 0 的百分位数,最大值接收的是值为 99 的百分位数。
分位数
将原始值分入以下分位数之一:
  • 百分位数将数据分为 100 个组,其中最小值接收百分比值 0,最大值接收百分比值 99。
  • 十分位数将原始值分为 10 组,其中最小值接收十分位数值 0,最大值接收十分位数值 9。
  • 四分位数将原始值分为 4 组,其中最小值接收四分位数值 0,最大值接收四分位数值 3。
  • N 分位数组将原始值分为 n 组,其中最小值接收值 0,最大值接收值 n–1。在组数框中,指定 n 值。
排名方法(续)
分数排名
使用分母 N 或 N+1 计算分数排名。分母 N 计算分数排名,方法是用每个排名除以包含排名变量非缺失值的观测数。分母 N+1 计算分数排名,方法是用每个排名除以分母 n+1,其中 n 是指包含排名变量的非缺失值的观测数。
百分比
用每个排名除以包含变量的非缺失值的观测数,再用结果乘以 100 得出百分比。
排名方法(续)
排名的正态评分
计算排名的正态评分。作为结果的变量将正态分布。公式如下:
Blom 公式
y sub i , equals , cap phi super negative 1 end super , open . fraction open , r sub i , minus , 3 eighths , close , over open n plus , 1 fourth , close end fraction . close. 点击备用格式的图像。
Tukey 公式
y sub i , equals , cap phi super negative 1 end super , open . fraction open , r sub i , minus , 1 third , close , over open n plus , 1 third , close end fraction . close. 点击备用格式的图像。
van der Waerden 公式
y sub i , equals , cap phi super negative 1 end super , open . fraction r sub i , over open n plus 1 close end fraction . close. 点击备用格式的图像。
在以上公式中,cap phi super negative 1 end super. 点击备用格式的图像。 是逆累积正态 (PROBIT) 函数,ri 是第 i 个观测的排名,n 是排名变量的非缺失观测量。
注: 如果设置若值为绑定的,则使用选项,则“排名数据”任务会根据非绑定值计算排名的正态评分,并将绑定指定应用于计算出的评分。
排名的 Savage 评分
计算排名的 Savage(或指数)评分。
注: 如果设置若值为绑定的,则使用选项,则“排名数据”任务会根据非绑定值计算排名的 Savage 评分,并将绑定指定应用于计算出的评分。
若值为绑定的,则使用
指定如何计算绑定数据值的正态评分或排名。
默认方法
为您的排名方法分配默认方法。如果选择百分比或者分数排名作为排名方法,则高值为默认值。对于其他所有排名方法,均值是默认值。
排名均值
分配相应排名或正态评分的均值。
高排名
分配相应排名或正态评分的最大值。
低排名
分配相应排名或正态评分的最小值。
密集排名(绑定为相同排名)
将绑定值视为单一次序统计量,以计算评分和排名。对于默认方法,排名是连续整数,最小值是 1,最大值是进行排名的变量的唯一非缺失值数量。系统将为绑定值分配相同排名。
秩序
指定是按照从小到大还是从大到小列出值。
上一页|下一页|页首