Kurs ten opisuje funkcjonalność oprogramowania SAS Text Miner, które jest odrębnie licencjonowanym komponentem dostępnym dla SAS Enterprise Miner. W ramach tego kursu nauczysz się korzystać z programu SAS Text Miner, aby odkryć podstawowe tematy lub koncepcje zawarte w dużych zbiorach dokumentów, automatycznie grupować dokumenty w tematyczne klastry, klasyfikować dokumenty w predefiniowane kategorie oraz integrować dane tekstowe z danymi strukturalnymi w celu wzbogacenia działań w zakresie modelowania predykcyjnego.
Naucz się
- konwertować dokumenty przechowywane w standardowych formatach (Microsoft Word, Adobe PDF itp.) do formatów HTML lub TXT ogólnego przeznaczenia.
- odczytywać dokumenty z różnych źródeł (strony internetowe, pliki płaskie, elementy danych w relacyjnej bazie danych, komórki arkusza kalkulacyjnego itd.) do tabel SAS.
- przetwarzać dane tekstowe do eksploracji tekstu (np. poprawna pisownia lub przekodowanie akronimów i skrótów).
- przekształcać nieustrukturyzowane dane tekstowe na ustrukturyzowane dane liczbowe.
- wyszukiwać słowa i wyrażenia w zbiorze dokumentów.
- odpytywać kolekcje dokumentów przy użyciu słów kluczowych (tzn. identyfikować dokumenty zawierające określone słowa lub frazy).
- identyfikować tematy lub pojęcia, które występują w kolekcji dokumentów.
- tworzyć od podstaw tabele tematyczne inspirowane przez użytkownika lub modyfikować tematy lub pojęcia generowane maszynowo, wykorzystując wiedzę z dziedziny.
- używać pochodnych tabel tematycznych lub istniejących wcześniej tabel tematycznych inspirowanych przez użytkownika (lub obu) w celu usprawnienia wyszukiwania informacji i klasyfikacji dokumentów.
- klasteryzować dokumenty w jednorodne podgrupy.
- klasyfikować dokumentów do predefiniowanych kategorii.
Kto powinien uczestniczyć
Statystycy, analitycy biznesowi i badacze rynku, którzy włączają do swoich analiz informacje tekstowe w dowolnym formacie; kierownicy dużych zbiorów dokumentów, którzy muszą organizować i wybierać dokumenty za pomocą eksploracji danych; studenci eksploracji danych, którzy chcą się więcej dowiedzieć o eksploracji tekstów
Przed uczestnictwem w tym kursie należy mieć doświadczenie w korzystaniu z SAS Enterprise Miner do odkrywania wzorców i modelowania predykcyjnego lub ukończyć kurs Analityka praktyczna w SAS Enterprise Miner.
Trzydniowa wersja tego kursu zawiera odpowiedni materiał wprowadzający do korzystania z SAS Enterprise Miner. W przypadku trzydniowego kursu, należy również:
- być zaznajomionym ze standardem Microsoft Windows i oprogramowaniem opartym na Windows
- mieć co najmniej wstępną znajomość podstawowych statystyk i modelowania regresji.
Wcześniejsze doświadczenia z oprogramowaniem SAS, zwłaszcza z SAS Enterprise Miner, są pomocne, ale nie są wymagane. Ten kurs używa SAS Text Miner i SAS Enterprise Miner
To szkolenie wykorzystuje oprogramowanie SAS Text Miner  
Kurs ten wykorzystuje SAS Text Miner 15.1 i SAS Enterprise Miner 15.1.
Wprowadzenie do SAS Enterprise Miner i SAS Text Miner- wyszukiwanie danych i wydobywanie tekstu
- praca ze źródłami danych z wykorzystaniem SAS Enterprise Miner i SAS Text Miner
Przegląd narzędzia Text Analytics- użycie węzła importu tekstu, dodanie zmiennej docelowej i porównanie modeli
- aplikacja lingwistyk
- wyszukiwanie informacji
Rozważania algorytmiczne i metodologiczne w eksploracji tekstów- metody parsowania i kwantyfikacji tekstu
- zmniejszenie wymiaru z SVD
Dodatkowe pomysły i węzły- szczegóły modelowania predykcyjnego
- węzeł kreatora reguł tekstowych
- węzeł eksploracji tekstu (HP)