上一頁|下一頁

分散式伺服器:大量存取較小的表格

簡介

本主題說明具有下列所有狀況的特殊情況:
  • 您必須支援較小表格的大量讀取存取。
    附註: 較小是一種相對概念。小於 2 GB 的表格是不錯的候選項目。2 GB 和 20 GB 之間的表格可能是不錯的候選項目 (視伺服器容量、可用記憶體數量和節點數目這類因素而定)。
  • 高電腦間網路通訊 (相對於表格大小) 會對資料擷取效能造成負面影響。
  • 您願意將經常存取的較小表格分成不同的 LASR 資料館。
對於較小的表格,合併而非分散資料時,In-Memory 存取比較快。例如:較小表格作為報表的資料來源時,如果表格可完整用於單一電腦上,而非分散到多部電腦,則擷取該報表會較快。對於廣泛且經常存取的報表,擷取效能的差異可能相當於管理較小表格的不同資料館。
若要最佳化較小表格的擷取效能,分散式 SAS LASR Analytic Server 可以保有每個表格的多個合併 (完整非分散式) 複本。每個複本都會寫入至單一電腦,並從中進行擷取。每部電腦都會視需要啟動它自己的非分散式伺服器處理序,滿足載入和存取要求。負載平衡和重複使用非分散式伺服器處理序,可進一步加強效能。
若需要更多資訊,請參閱 SAS LASR Analytic Server: Reference Guide 中的 High Volume Access to Smaller Tables

指示

最佳化分散式 SAS LASR Analytic Server 中較小表格的大量存取:
  1. 識別或建立較小表格適用的 LASR 資料館。
    • 指定資料館的名稱,讓使用者知道他們絕對不應該將大型表格載入或匯入到其中。
    • 關聯資料館與分散式 SAS LASR Analytic Server。
  2. 將 LASR 資料館的延伸特性 VA.TableFullCopies 設定為正整數。(可以使用 SAS Management Console 或 SAS Environment Manager 設定 LASR 資料館的延伸特性。)
  3. 若要確認結果,請將表格載入到 LASR 資料館。在 [LASR 表格] 標籤上,確認表格的狀態。請參閱取得表格資訊

延伸特性

下列資料館層級延伸特性已啟用較小的表格最佳化,以及控制每個表格的 In-Memory 執行個體數目。
VA.TableFullCopies
指定每個已載入表格要建立多少個完整記憶體內單一節點執行個體。預設未指定值,因此不會建立任何完整複本執行個體。如果您的 LASR 資料館只包含較小表格,並且與分散式伺服器關聯,請將值設定為正整數。
注意:
如果您指定高值,或有人將大型表格載入到資料館,則可能會快速耗用伺服器記憶體。
請考慮一開始指定小於 4 的值 (並視需要遞增值)、設定關聯伺服器的表格限制以及限制資料館的管理權限。
下面是一些其他詳細資料:
  • 自動載入支援此特性。
  • 您不能將資料附加到已載入其他完整複本的表格。
  • LASR 星狀結構描述、從 Twitter 的匯入,以及從 Facebook 的匯入,則會忽略此特性。
  • 非分散式 SAS LASR Analytic Servers 會忽略此特性。
  • 一般而言,使用其他完整複本載入的表格不適合使用壓縮。

範例

案例

  • LibraryA 是只包含較小表格的 LASR 資料館。
  • LibraryA 與 ServerA (分散式 SAS LASR Analytic Server) 關聯。
  • LibraryA 的 [延伸特性] 標籤指定 3 是 VA.TableFullCopies 的值。

結果

  • 將 TableA 載入到 LibraryA 時,ServerA 上的三個節點會取得 TableA 的完整複本。
  • 要求存取 TableA 時,三個節點中的其中一個會提供 TableA 的完整複本。
  • TableA 也會以一般分散方式進行載入。但是,沒有履行來自 TableA 分散式執行個體的存取要求。
  • 您無法附加到 TableA。
上一頁|下一頁|頁面頂端
上次更新時間:2018年10月24日