上一页|下一页

变量和交互作用项

变量

类别变量

类别变量是具有离散水平的数值或非数值变量。SAS Visual Statistics 将类别变量的水平视为无序。类别变量的示例包括饮料大小(小、中或大)、引擎中的汽缸数(2、4、6 或 8)或客户是否进行了购买(是或否)。
您可以通过右击变量并选择类别,从响应变量创建类别变量。在此情况下,测度变量的每个非重复值都将变为该类别变量的水平。
类别变量可用作分类模型的响应变量、分类效应变量、决策树预测值、过滤器变量和分组依据变量。
注: 为确保获得优越的性能和有效的建模结果,将根据模型类型和变量角色限制类别变量允许的最大非重复水平数。

测度变量

测度变量是可假设两个数值之间具有无限个可能值的连续数值变量。即使一些数值变量不连续(例如计数变量),但是可以将这些变量视为连续值以用于建模。测度变量的示例包括饮料温度、引擎排量或客户的总购买金额。
通过在数据窗格中右击变量并选择属性,可获取汇总统计量和每个测度变量的直方图。使用名称下拉菜单可指定要查看的变量。
测度变量可用作连续模型的响应变量、连续效应变量、决策树预测值、偏移变量、频数变量、权重变量和过滤器变量。

交互作用项

两个变量 A 和 B 中,若模型中一个变量的效应随另一个变量的变化而变化,则这两个变量交互作用。也就是说,变量 A 和 B 的效应在模型中不可相加。
通过 SAS Visual Statistics,您可以创建两个或更多输入变量之间的交互作用,包括平方交互作用。平方交互作用是变量自身的交互作用。您不能为类别变量创建平方交互作用。
有关交互作用项可能的用途的示例,可以考虑您对多辆车的燃油里程 (MPG) 进行建模的情况。您的两个输入变量为引擎排量(以升为单位)和引擎大小(汽缸数)。您期望随着任一值的增加,燃油里程也随之变化。但是,若您怀疑源于引擎排量的燃油里程效应在引擎大小之间不恒定,则应考虑在这些变量之间创建交互作用项。
SAS Visual Statistics 并不局限于仅创建双向交互作用。您可以创建 n 向交互作用,其中可以包括任意数量的变量,但是不能超过可用的输入变量数。
交互作用项的非重复水平数是该项中各个变量水平数的乘积。测度变量被视为其包含一个水平。交互作用项中的水平数根据回归模型中允许的最大非重复水平数进行计数。
上一页|下一页|页首