Продвинутая аналитика в мире больших данных (Advanced Analytics in a Big Data World)
Business Knowledge Series курс
В современном мире многие компании накопили огромное количество данных о продажах, использовании финансовых сервисов, использовании сети и даже данных о мошенничестве. В соответствии с заданными тенденциями и потребностями, такими как: массовая кастомизация, персонализация, Web 2.0, персонифицированный маркетинг, риск менеджмент, обнаружение мошенничества - становится особенно важным извлечь, понять и разработать аналитические модели поведения клиентов и стратегических знаний. Этот курс помогает выяснить, как успешно применять предложенные современные аналитические техники Data Science для продвинутых приложений Customer Intelligence. Данный курс предоставляет теоретические и технические методы, так же как и методы практической реализации, иллюстрированных реальными практическими примерами. Так же предоставляются ссылки на статьи, учебники и практические советы.
Изучается
Вы научитесь как:- Применять набор новейших, мощных, актуальных методов аналитики и data science
- Убедитесь в практической применимости данных методов для оптимизации бизнес-процессов и принятия решений
- Исследуйте современное видение того, как выявленные техники data science могут изменить ваши ключевые бизнес-процессы
- Создавать, проводить мониторинг и оптимально тестировать аналитические модели.
Аудитория Курс подходит для тех, кто вовлечен в процессы оценки, мониторинга, аудита или поддержки моделей для различных типов интеллектуальных данных о клиентах; Для тех, кто связан с использованием методов интеллектуального анализа данных для различных типов информации о клиентах. Для лиц следующих должностей: бизнес-аналитик в различных сферах (таких как: риск менеджмент, производство, телеком, ритейл, развлечения, фармацевтика и так далее), маркетинг и CRM менеджеры, специалисты по обнаружению мошенничества, менеджеры по работе с клиентами, риск-аналитики, CRM-аналитики, аналитики по маркетингу, старшие аналитики данных и data miners.
Вы должны уметь:- Подготавливать данные (создание выборок, очистка данных, классификация и так далее)
- Разрабатывать прогнозные модели, используя логистическую регрессию
- Разрабатывать прогнозные модели, используя деревья принятия решений
- Разрабатывать описательные модели, используя базовые техники сегментирования
- Количественно оценивать работу прогнозных моделей (такие как подъем кривой, кривая ошибок и так далее)Необходимый опыт вы можете получить, пройдя курсы Data Mining: Principles and Best Practices and Decision Tree ModelingЭти курсы изучаются на SAS Enterprise Miner
Используется SAS Enterprise Miner ПО
Аналитическая модель процесса- Базовая номенклатура (определение клиента, определение цели и тд)
- Коллекция данных и предобработка (создание выборки, очистка данных, весовые коэффициенты и тд)
- Прогнозная и описательная аналитика (майнинг данных)
- Запуск аналитики в работу
- Требования к аналитической модели (производительность, интерпретация, операционная эффективность)
- Ключевые области применения (CRM, риск менеджмент, мошенничество, онлайн аналитика)
Деревья принятия решений- Разделение/остановка/назначение решения
- Ключевые алгоритмы: C4.5 (See5), CART, CHAID
- Рекомендации по использованию деревьев в бизнес-контексте
Деревья регрессии- Разделение/остановка/назначение критерия
- Практический пример: использование дерева регрессии для предсказания потерь
Методы группировки- Бутстреппинг
- Бэггинг
- Бустинг
- Пакетирование
- Cлучайный лес
Форматы представления альтернативных правил- Типы правил (пропозициональный, кривой, m из n, расплывчатый и тд)
- Таблицы решений (лексикографическое упорядочение, методы сокращения и тд)
- Диаграммы решений
- Практический пример: таблицы и диаграммы решений для скоринга клиентов
- Практический пример: таблицы решений для верификации текстовых знаний
Нейронные сети- Многослойный перцептрон (MLPs)
- Типы MLP (RBF, периодический и тд)
- Изучение весовых коэффициентов (обратная связь, сопряженный градиент и тд)
- Переполнение, ранняя остановка, и регулировка весов
- Выбор архитектуры (поиск по набору, SNC и тд)
- Выбор входных данных (граф Хинтона, статистика вероятностей, перебор и тд)
- Самоорганизующаяся карта (SOMs) для кластеризации
- Практический пример: использование SOMs для анализа коррупции в стране
Метод опорных векторов (SVMs)- Линейное программирование
- Kernel trick и теорема Мерсера
- SVM для классификации и регрессии
- Многоклассовые SVM (один на один, один против всех)
- Настройка гиперпараметров, используя методы кроссвалидации
- Практический пример: Бенчмаркинг SVM классификаторов
Открытие черного ящика нейронной сети и SVM- Бизнес приложения нейронных сетей и SVM
- Методы извлечения правил (педагогические и декомпозиционные подходы, такие как neurorule, neurolinear and trepan)
- Двухэтапные модели (комбинирование линейных моделей с высокопроизводительными нейронными сетями)
- Практические примеры
Классификаторы сетей Байеса- Наивный байесовский классификатор
- Увеличенный деревом наивный Байесовский классификатор
- Не запрещенные классификаторы сетей Байеса
- Байесовский вывод
- Практический пример: сети Байеса для прогнозирование оттока
Анализ выживания- Цензурирование
- Функция выживания и функция риска
- Анализ Каплана-Майера
- Параметрический анализ выживания
- регрессия пропорциональных опасностей
- Изменяющиеся во времени ковариаты
- Конкурирующие риски
- Нейронные сети для анализа выживания
- Практический пример: анализ выживания моделирования пожизненной ценности клиента (CLV)
Изучение и вывод социальных сетей- Неявные и явные социальные сети
- Обучение использованию сетевых данных
- Основные области применения (Facebook/twitter, сбои, мошенничество, онлайн аналитика и тд)
- Случайные поля Маркова
- Homophily (вина по ассоциации)
- Локальные классификаторы
- Реляционные Классификаторы (реляционные соседи, вероятностный реляционный сосед, реляционная логическая регрессия и тд)
- Featurization
- Коллективный вывод (сэмплинг Гиббса, итерационная классификация и тд)
- Практический пример: использование социальных сетей для поиска сбоев в контексте телекомунникаций
Мониторинг и тестирование аналитических моделей- Количественный и качественный мониторинг моделей
- Тестирование моделей (стабильность моделей, дискриминация модели, калибровка модели, биномиальный тест Хосмера-Лемешева, индикатор светофор, влияние макро экономических эффектов)
- Бенчмаркинг модели (внутренний и внешний бенчмаркинг, статистика бенчмаркинга)
- Качественная проверка аналитических моделей (качество данных и управление основными данными, дизайн моделей, документация, участие руководства и корпоративного управления)
- Практический пример: тестирование модели скоринга клиентов
Другие алгоритмы обучения и приложения (кратко)- Полуконтролируемое обучение
- Нечеткие методы
- Эволюционные алгоритмы
- Муравьиный алгоритм
- Приложения онлайн аналитики
- Приложения для использования в социальных сетях
- Приложения для анализа процессов
BDMC13
|
|