上一页|下一页

导入数据

关于将数据导入 SAS Studio

可以将以下类型的数据文件导入 SAS Studio:
  • Microsoft Access 数据库文件。要导入这些文件,您必须使用 SAS LIBNAME 语句。
  • 带分隔符的文件,例如逗点分隔值文件。
  • dBASE 5.0、IV、III+,以及 III。
  • Stata 文件。
  • Microsoft Excel 文件。要导入 XLSB 和 XLSM 文件,您必须使用 SAS LIBNAME 语句。
  • JMP 文件。
  • Paradox DB 文件。
  • SPSS 文件。
  • Lotus 1-2-3 文件,版本 2、3、4 或 5。
如果您正在使用 SAS Studio 企业版本或 SAS Studio 基本版本,数据文件可能保存至本地计算机。在这种情况下,在导入之前必须将文件上载至 SAS Studio。
其他语言/区域的数据是否正确导入取决于 SAS 服务器是否支持要导入数据的语言/区域。如果正在导入的数据包含与当前语言/区域不同的字符,请使用 Unicode (UTF–8) 服务器来导入数据。如果不使用 UTF–8 服务器,并且数据的语言/区域也不支持,则不支持的值在导入数据中可能显示为问号 (?)。关于如何设置默认文本编码选项的详细信息,请参见设置常规参数选择
注: 您不能导入远程文件(通过 FTP 文件快捷方式访问的文件)。

导入 Excel 工作表

要导入 Excel 工作表,请执行以下操作:
  1. 点击导航窗格中的服务器文件和文件夹,然后浏览以查找您希望导入的文件。
  2. 右击您希望导入的文件,然后选择导入数据。在导入数据选项卡的最上方会显示该 Excel 文件的名称及位置。此外,还会显示您可以定制的若干个选项。
    该示例显示如何导入 as_products.xls 文件。
    文件信息及选项示例
  3. 要导入特定工作表中的数据,请在工作表名称框中输入该工作表的名称。默认情况下,SAS Studio 从第一个工作表中导入数据。
  4. 要指定输出数据集的位置,点击更改。默认情况下,输出数据集保存至 Work 逻辑库,这是一个临时位置。当您退出 SAS Studio 时,该逻辑库中的内容将被删除。
  5. 要从工作表首行的数据值中生成 SAS 变量名,请选择生成 SAS 变量名。如果输入文件首行的数据值可以读取,并且包含在 SAS 名称中无效的特殊字符,例如空格,那么 SAS 会将字符转换为下划线。
  6. 要导入 Excel 工作表,点击 提交 SAS 代码
结果选项卡将显示新 SAS 数据集的特性。
新 SAS 数据集的特性
输出数据选项卡将显示新数据集的内容。如果该数据集在 Work 逻辑库中(如该示例所示),可以将其保存至一个更永久的位置。Work 逻辑库中的数据是临时的,并且当您退出 SAS Studio 时,数据就会被删除。
导入工具的结果

导入带分隔符的文件

注: 对于一些带分隔符的文件(例如扩展名为 .dat 的文件),导入工具可能无效。要导入这些带分隔符的文件,请将文件保存为文本文件。然后即可使用导入工具。
要导入带分隔符的文件,请执行以下操作:
  1. 点击导航窗格中的服务器文件和文件夹,然后浏览以查找您希望导入的文件。
  2. 要确定文件分隔符,右击文件名并选择以文本方式查看文件。文件内容将在文本编辑器中打开。注意各值之间使用的分隔符以及数据首行是否包括标题。
  3. 确定该文件的分隔符后,点击 “新选项”按钮,然后选择新建导入数据。此时,导入数据选项卡将在 SAS Studio 工作区中打开。
  4. 将选中的文本文件从导航窗格中的服务器文件和文件夹拖至导入数据选项卡。此时,在导入数据选项卡顶部会显示文件的属性(例如文件名及文件保存位置)、导入数据源的名称以及您可以指定的任何选项。导入数据选项卡底部会显示已经生成的 SAS 代码。
    该示例显示如何导入名为 FixWidth.txt 的文本文件。
    文本文件的文件信息及选项示例
  5. 要指定输出数据集的位置,点击更改。默认情况下,输出数据集保存至 Work 逻辑库,这是一个临时位置。当您退出 SAS Studio 时,该逻辑库中的内容将被删除。
  6. 要从文本文件首行的数据值中生成 SAS 变量名,选择生成 SAS 变量名。如果输入文件首行的数据值可以读取,并且包含在 SAS 名称中无效的特殊字符(例如空格),则 SAS 会将字符转换为下划线。
  7. 分隔符框中,输入文件中值的分隔符。默认分隔符为一个空格。例如,分隔符可以为逗号 (,) 和制表符。
    注: 如果您使用十六进制值指定分隔符,则无需选中为分隔值加引号复选框。
  8. (可选)要从带分隔符的文本文件的特定行中开始读取数据,可以在在以下行开始读取数据框中输入起始行。如果文本文件的顶部有注释,或文件首行是列标题,可能需要使用该选项。
  9. (可选)SAS Studio 要想确定合适的数据类型以及变量长度,可在猜测行框中输入值。此时,任务会从第一行到您指定的行扫描导入数据文件。默认情况下,系统将扫描前 20 行。
  10. 要导入数据,点击 提交 SAS 代码
点击结果选项卡查看导入数据集的特性。
Work.Import 数据集的特性
点击输出数据选项卡以查看新 SAS 数据集。如果该数据集在 Work 逻辑库中(如该示例所示),您可以将其保存至一个更永久的位置。Work 逻辑库中的数据是临时的,并且当您退出 SAS Studio 时,数据就会被删除。
Work.Import 数据集

导入 DBMS 文件

当您从数据库管理系统 (DBMS) 中导入文件时,可用选项取决于文件类型。有关支持的文件类型列表,请参见关于将数据导入 SAS Studio
  1. 点击导航窗格中的服务器文件和文件夹,然后浏览以查找您希望导入的文件。
  2. 右击您希望导入的文件,然后选择导入数据。此时,系统将打开导入数据选项卡。该选项卡上的可用选项取决于文件类型。
  3. 要指定输出数据集的位置,点击更改。默认情况下,输出数据集保存至 Work 逻辑库,这是一个临时位置。当您退出 SAS Studio 时,该逻辑库中的内容将被删除。
  4. (可选)要从工作表首行的数据值中生成 SAS 变量名,选择生成 SAS 变量名。如果读取输入文件首行的数据值,并且它包含 SAS 名称中无效的特殊字符(例如空格),则 SAS 会将字符转换为下划线。
  5. 要导入文件,点击 提交 SAS 代码

导入过程流中的数据

如果您正在使用 SAS 可视程序员视角,您也可以使用过程流导入数据。如果您想导入的文件更新频繁,可以添加导入节点。
要创建导入节点,可以将想要导入的文件名拖至过程流中。
以下是过程流中一个导入节点(名为 Import as_products.xls)的示例。然后,导入的数据将在“汇总统计量”任务中使用。
过程流 1

保存导入任务

您可能希望保存导入数据工具的实例,以便在您的软件安装点上与他人共享导入特定文件的设置。此时,SAS Studio 会将这些实例保存为 CTL 文件。CTL 文件必须在创建它们的操作环境中运行。例如,如果您使用 Windows 创建一个 CTL 文件,则该 CTL 文件必须在 Windows 中运行。
要保存导入任务,请执行以下操作:
  1. 点击 “保存”图标
    导入数据任务中“保存”图标的位置
  2. 另存为窗口中,指定名称及位置,然后点击保存。文件以 CTL 扩展名保存。
    “另存为”窗口的示例
上一页|下一页|页首