上一页|下一页

“时间序列数据准备”任务

关于“时间序列数据准备”任务

“时间序列数据准备”任务将带时间戳的事务数据转换为等间距时间序列数据。该格式对于更多的时间序列分析是必须的。该任务不需要时间 ID 变量。如果未指定时间 ID 变量,观测号即为时间序列的 ID。

了解 SAS 时间间隔

“时间数据准备”任务可分析分配给时间 ID 角色的变量以检测数据的时间间隔。SAS 假定时间 ID 变量中的所有值都是日期或者日期时间值,并能通过大小在值之间区分。如果您的日期晚于 2196 年 7 月 21 日或日期时间在 1960 年 1 月 1 日之前,则该假定失败。
对于许多业务来说,其时间序列数据是等间距的,或任何两个连续的指标在时间间隔之间有相同差值。下表显示了时间间隔为 1 年的等间距时间序列。
销量
2012
42,100
2013
45,000
2014
47,000
2015
50,000
如果从分配的变量中无法检测时间间隔,则需要指定时间间隔和季节长度。例如,下表显示了非等间距时间序列。
销量
2009
32,100
2010
45,000
2014
47,000
2015
50,000
通常,无法检测事务数据(不以特定频率记录的时间戳数据)的时间间隔。如果情况如此,则该任务会将数据积累至指定时间间隔相对应的观测。对于非事务性数据,如果数据中有许多缺口(缺失值),可能需要指定时间间隔和季节长度。在这种情况下,该任务将提供缺失值。验证例程检查时间 ID 值以确定它们的间距是否符合指定的间隔。
时间间隔确定了输出的频数。您可以修改时间间隔。可以从较高频率更改为较低频率,也可从较低频率数更改为较高频率。通过使用字符串在 SAS 中指定时间间隔。每个字符串都根据一组规则形成,这些规则使您能够创建几乎无限的特性集。对每个时间间隔,可以指定其类型(如每月或每周)、乘数和偏移(间隔的偏移)。可以指定比输入数据中原有的更大的时间间隔。不要使用更小的时间间隔,因为更小的间隔会生成大量的观测。
季节周期长度指定季节的长度。如果该任务能够从时间 ID 变量中确定季节长度,则该值自动填充。不过,如果您想在数据中对周期建模,可以指定季节长度而不使用默认值。例如,您的数据可能包含一个 13 周的周期,因此,需要指定一个 13 周的季节长度。
时间间隔的语法如下所示:
name<multipler><.shift>
每个用户提供值的说明如下:
name
是时间间隔的名称。
multipler
指定时间间隔的乘数。该值可以是任何正数。默认情况下,乘数是 1。例如,YEAR2 表示 2 年时间间隔。
.shift
指定时间间隔的起点。默认情况下,该值为 1。大于 1 的值将起点偏移至时间间隔内后面的一个点。偏移的单位取决于时间间隔。例如,YEAR.4 指定 4 个月的偏移,因此该年是从 4 月 1 日到第二年的 3 月 31 日。
下表中的示例显示您为时间间隔、季节长度、乘数和偏移指定的值各代表何种含义。
间隔名称(SAS 代码格式)
默认
偏移期间
示例
YEARm.s
1 月 1 日
YEAR2.7 指定时间间隔为每两年。因为偏移值为 7,所以该年的第一个月为 7 月。
QTRm.s
1 月 1 日
4 月 1 日
7 月 1 日
10 月 1 日
QTR3.2 指定三个月的时间间隔,起点分别为 4 月 1 日、7 月 1 日、10 月 1 日和 1 月 1 日。
MONTHm.s
每月的
第一天
MONTH2.2 指定第二年的 2 月-3 月、4 月-5 月、6 月-7 月、8 月-9 月、10 月-11 月和 12 月-1 月。
WEEKm.s
每星期日
(1=星期日 ...
7=星期六)
WEEK6.3 指定六周的时间间隔,从星期二开始。
DAYm.s
每天
DAY3 指定三天的时间间隔,从星期日开始。

示例:转换 SASHELP.PRICEDATA 数据集中的数据

要创建此示例,请执行以下操作:
  1. 任务部分中,展开预测文件夹,然后双击时间序列数据准备。此时,系统会打开“时间序列数据准备”任务的用户界面。
  2. 数据选项卡中,选择 SASHELP.PRICEDATA 数据集。
  3. 向下列角色分配列:
    角色
    角色
    时间序列变量
    sale
    price1
    其他角色
    时间 ID
    date
    属性
    时间间隔
    Quarter
  4. 点击转换选项卡,指定 sale 变量的以下值。
    • 累积下拉列表中,选择总和
    • 转换下拉列表中,选择对数
    • 简单差分框中,输入 1
    • 季节差分框中,输入 0
  5. 对于价格变量,从累积下拉列表中选择总和
  6. 点击输出选项卡。选中显示输出数据复选框。在要显示的观测数框中,输入 10
  7. 要运行任务,点击 提交 SAS 代码
结果如下:
WORK.tsPrep 的子集

向角色分配数据

要运行“时间序列数据准备”任务,必须向时间序列变量角色分配一列。
角色
说明
角色
时间序列变量
列出包含带时间戳数据的变量
缺失值的处理
指定如何处理带时间戳数据中的缺失值。可从下列选项中选择:
  • 缺失值
  • 累积时间序列的平均值
  • 累积时间序列的最小值
  • 累积时间序列的中位数值
  • 累积时间序列的最大值
  • 累积时间序列的第一个非缺失值
  • 累积时间序列的最后一个非缺失值
  • 上一个期间的累积非缺失值 缺失值设置为上一个累积非缺失值。累积序列开始的缺失值保持缺失。
  • 下一个期间的累积非缺失值 缺失值设置为下一个累积非缺失值。累计序列结尾的缺失值保持缺失。
  • 数值指定用于缺失值的值。
其他角色
时间 ID
指定包含时间 ID 值的列。
属性
时间间隔
指定时间 ID 变量的间隔。有关时间间隔的详细信息,请参见了解 SAS 时间间隔
乘数
指定时间间隔的乘数。默认情况下,乘数是 1。该值不能为负数。
偏移
指定时间间隔的偏移。默认情况下,偏移为 1。该值不能为负数。
季节长度
指定时间间隔的季节性。默认值取决于时间间隔。
其他角色
季节长度
未分配时间 ID 变量时,您能够指定数据的季节性。
分析分组依据
列出您想用作分类 (BY) 变量的一个变量或多个变量。

设置转换选项

转换表针对分配给时间序列变量角色的每一列包含了一行。
选项名称
说明
累积
为变量指定累积方法。如果您向时间 ID 变量角色分配变量,则该选项可用。
可从下列选项中选择:
不累积向量值。
总和
基于值总和累积向量值。
求和中忽略缺失值。如果 q sub n , equals 0. Click image for alternative formats.,那么 a 设置为缺失。
平均
基于值的平均数积累向量值。
求和中忽略缺失值。如果 q sub n , equals 0. Click image for alternative formats.,那么 a 设置为缺失。
转换
指定应用于时间序列变量的转换。您可以从下列转换中选择;
  • 对数
  • 平方根
  • Logistic
简单差分
为简单差分指定值。
季节差分
为季节差分指定值。如果数据选项卡上季节长度选项的值大于 1,则该选项可用。

创建输出数据集

显示输出数据复选框 指定是否包括出现在结果选项卡中结果的输出数据。可以选择所有输出数据或其中一个子集。该任务始终会在输出数据选项卡中创建输出数据集。该数据集会保存在指定位置。
上一页|下一页|页首