Открыто

Основы Data Science [2021] [it-academy] [Роман Сидоренко]

Тема в разделе "Курсы по программированию", создана пользователем Toxich, 7 май 2021.

Цена: 87901р.-87%
Взнос: 10663р.

Основной список: 9 участников

Резервный список: 2 участников

  1. 7 май 2021
    #1
    Toxich
    Toxich ЧКЧлен клуба
    Основы Data Science [2021]
    it-academy
    Роман Сидоренко


    Курс по Data Science направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников.

    Он охватывает основные современные средства Data Mining, Machine Learning и Big Data. Использование указанных технологий даёт неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

    1. Для разработчиков, желающих расширить свои компетенции;
    2. Для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;
    3. Для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;
    4. Для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.
    1. Приобретения знаний в областях Data Mining, Big Data и Data Science;
    2. Формирования устойчивых навыков и умений по постановке и решению аналитических и исследовательских задач с использованием математической статистики и современных информационных технологий, а также разработки информационных рекомендательных систем.
    1. Осуществлять сбор, обобщение и очистку исходных информационных данных;
    2. Находить аналитические зависимости в структурированных и неструктурированных данных;
    3. Осуществлять постановку и решение задач математического программирования и исследования операций;
    4. Знать и уметь применять основные алгоритмы машинного обучения и математического программирования;
    5. Знать, как работает Machine Learning;
    6. Уметь пользоваться основными инструментами Data Mining, Big Data и Data Science;
    7. Знать основные типы и архитектуру нейронных сетей;
    8. Реализовывать, внедрять и обучать Machine Learning модели;
    9. Решать задачи Computer Vision, Natural Language Toolkit, а также прогнозирования временных рядов;
    10. Знать концепции Map Reduce и CUDA;
    11. Знать принципы функционирования высоконагруженных систем;
    12. Разрабатывать рекомендательные системы.
    Модуль 1 - Введение в Data Science
    • Объект Data Science.
    • Взаимосвязь Data Mining, Big Data и Data Science.
    • Инструментарий Data Science.
    • Основные способы получения данных.
    • Базовый эксплоративный анализ и визуализация данных.
    Модуль 2 - Математические основы Data Science
    • Основы матричного исчисления.
    • Реализация матричных операций в Python.
    • Основы теории вероятности и математической статистики.
    • Проверка статистических гипотез в Python.
    • Основы математического программирования и исследования операций.
    • Классификация алгоритмов математического программирования.
    • Визуализация данных в Python.
    Модуль 3 - Основы Data Science и Machine Learning
    • Принципы построения моделей в Data Science.
    • Метрики качества моделей. Проверка качества модели.
    • Введение в Deep Learning и Machine learning.
    • Объект Deep Learnig и Machine Learning. Классы решаемых задач.
    • Большие данные и параллельные вычисления.
    • Подходы к построению высоконагруженных систем.
    • Обобщение и сбор данных для обучения их очистка и нормализация.
    • Обзор и классификация алгоритмов ML.
    Модуль 4 - Основные алгоритмы Machine Learning
    • Алгоритмы «Дерево решений», «Случайный лес», «K-ближайших соседей», «Градиентный бустинг».
    • Кластеризация и поиск ассоциаций.
    • Линейная и логистическая регрессия. Ограничения, преимущества и недостатки.
    • Обучение с учителем.
    • Обучение классификатора на размеченных данных.
    • Проверка качества модели: переобучение, регуляризация, обучающая и тестовая выборки.
    • Борьба с переобучением: ансамблирование. Обзор методов ансамблирования.
    • Реализация алгоритмов в Python.
    Модуль 5 - Методы предобработки данных
    • Снижение размерности, разреженные данные, многомерные пространства.
    • Коррелирующие параметры.
    • Нерациональное использование памяти, сложность моделей.
    • Статистический анализ данных, выбор параметров на основе корреляции.
    • Снижение размерности данных: поиск подмножеств, регуляризация, уменьшение пространства.
    • Векторное разложение.
    • Методы декомпозиции.
    • Спрямляющие пространства.
    Модуль 6 - Рекомендательные системы
    • Введение в рекомендательные системы.
    • Различие между предсказаниями и рекомендациями.
    • Типы рекомендательных систем.
    • Постановка целей.
    • Неперсонализированные рекомендации.
    • Способы построения рекомендательных систем.
    • Цепи Маркова.
    • Групповые рекомендации.
    Модуль 7 - Распознавание изображений, машинное зрение
    • Теоретические основы обработки изображений.
    • Форматы данных (RGB, CMYK, B&W), принципы и алгоритмы сжатия изображений, примеры чтения и конвертации изображений.
    • Выделение признаков изображений.
    • Задача поиска изображения по шаблону, представление свойств изображения с помощью гистограмм.
    • Поиск похожих картинок по контенту.
    • Сегментация изображений, детекция объектов.
    • Детектор лиц на изображении.
    Модуль 8 - Введение в нейронные сети
    • Основные элементы нейронных сетей.
    • Классификация архитектур нейронных сетей.
    • Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
    • Регуляризация.
    • Инициализация весов.
    • Сверточные нейронные сети.
    • Практическое применение сверточных рекурентных и генеративно-конкурирующих сетей в задачах Computer Vision.
    Модуль 9 - Распознавание естественного языка
    1. Введение в обработку текста.
    2. Частотный анализ.
    3. Законы Ципфа и Хипса.
    4. Морфологический и синтаксический анализ.
    5. Векторная модель и методы снижения размерности в ней.
    6. Классификация текстов.
    7. Извлечение именованных сущностей.
    8. Языковые модели.
    9. Извлечение информации.
    10. Генерация текстов.
    Модуль 10 - Временные ряды
    • Временные ряды.
    • Модели построения прогнозов.
    • Разложение временного ряда на компоненты.
    • Автокорреляция и корелограммы.
    • Стационарность ряда.
    • Сложные модели прогнозирования.
    • Прогнозирование временных рядов на цепях Маркова.
    Модуль 11 - Общение с заказчиком. Требования к Data Science проектам
    • Cпособы выяснения требований, проверка их выполнимости.
    • Формализация и утверждение требований с заказчиком.
    • Общий порядок составления отчетов.
    • Цели, явные и неявные ожидания заказчиков проекта.
    • Описание зависимостей и способов воздействия на важные для заказчика факторы.
    • Практический опыт создания хайлоад моделей.
    • Выбор алгоритмов, библиотек, тонкой настройки моделей.
    Модуль 12 - Подведение итогов
    • Защита дипломных проектов.

    Примечание: полная стоимость курса 2 999 (BYN)

    Продажник
     
  2. Последние события

    1. blackfish
      blackfish не участвует.
      24 янв 2023
    2. sibbora
      sibbora не участвует.
      17 янв 2023
    3. bbt_ttb
      bbt_ttb не участвует.
      13 янв 2023
    4. vtrader93
      vtrader93 не участвует.
      14 июн 2022

Поделиться этой страницей