Открыто

Python/R for Data Science [2021] [itea online] [Олег Сорокин, Роман Кириченко]

Тема в разделе "Курсы по программированию", создана пользователем Toxich, 23 май 2021.

Цена: 29127р.
Взнос: 1786р.-93%

Основной список: 18 участников

Резервный список: 1 участников

  1. 23 май 2021
    #1
    Toxich
    Toxich ЧКЧлен клуба
    Python/R for Data Science [2021]
    Itea Online
    Олег Сорокин, Роман Кириченко


    Python/R for Data Science — это целый комплекс подготовки Data Science-специалистов к работе с большими данными и использованию возможностей программирования в обработке больших данных.

    Использование R и Python поможет эффективнее кластеризировать и визуализировать большие массивы данных.


    1. Курс нацелен на Data Scientists, которые имеют базовые навыки программирования и математического анализа.
    2. Также курс будет полезен специалистам, работающим с данными (аналитикам, бизнес-аналитикам, исследователям), которые хотят освоить новые гибкие инструменты для работы с данными.
    1. Понимать основные алгоритмы машинного обучения и практически их использовать для задач классификации и регрессии.
    2. Делать качественные и интерактивные визуализации данных
    3. Анализировать данные и строить модели машинного обучения с помощью языков Python и R
    Модуль 1 - Введение в машинного обучения и Data science
    • Определение машинного обучения и науки о данных, их задачи.
    • Инструментарий для анализа данных: языки программирования Python и R.
    • Типы машинного обучения.
    • Составные части модели машинного обучения.
    • Базовые концепты машинного обучения.
    Модуль 2 - Основы языков программирования Python и R для Data science
    • IDE для удобной работы: Jupyter, Spyder & Rstudio.
    • Семантика языка
    • Типы данных
    • Структуры данных
    • Операторы контроля исполнения (разветвления и циклов)
    • Векторизация в Python (numpy) i R
    Модуль 3 - Функциональное программирование в Python и R
    • Comprehension, Generators, Iterators в Python.
    • Функции в Python i R.
    • Встроенные функции Python.
    • ФункцииApply-family в R.
    • Библиотека purrr для функционального программирования в R.
    Модуль 4 - Исследование и подготовка данных к анализу
    • Numpy.
    • Pandas.
    • Фильтрация и агрегация данных в dplyr.
    • Long & wide форматы таблиц, их преобразования в библиотеках pandas & tidyr.
    Модуль 5 - Визуализация данных в R и Python
    • Визуализация данных в R.
    • ggplot2 — grammar of graphics.
    • Интерактивная графика в R.
    • Matplotlib & seaborn.
    Модуль 6 - Основные понятия статистического анализа
    • Scipy.stats.
    • Описательные статистики.
    • Зависимости между переменными.
    Модуль 7 - Типичные проблемы в подготовке данных к анализу
    • Преобразование факторных переменных.
    • Борьба с пробелами в данных.
    • Проблема мультиколлинеарности.
    • Шкалирования данных.
    • Выбор информативных переменных для модели.
    • Типичный алгоритм подготовки данных к моделированию.
    Модуль 8 - Базовые регрессионные модели
    • Линейная регрессия.
    • Полиномиальная регрессия.
    • Метод ближайших соседей.
    • Метрики оценки качества регрессии.
    • Тюнинг регрессионных моделей.
    Модуль 9 - Базовые модели классификации
    • Логистическая регрессия.
    • Метод опорных векторов.
    • Наивный Байесовский классификатор.
    • Метрики оценки качества классификации.
    • Тюнинг параметров моделей классификации.
    Модуль 10 - Базовые модели кластеризации и снижения размерности
    • Метод к-средних.
    • Иерархический кластерный анализ.
    • DBSCAN.
    • Анализ.
    • Корреспонденс-анализ.
    Модуль 11 - Деревья решений и ансамбли
    • Базовые древовидные модели.
    • Random forest.
    • Xgboost, lightgbm.
    • Тюнинг гиперпараметров в ансамблевых моделях.
    Модуль 12 - Методы улучшения качества моделей машинного обучения
    • Аугментация.
    • Feature engineering.
    • Cross-validation.
    • Борьба с переобучением.
    • Борьба с дисбалансом данных.
    • Регуляризация модели.
    Модуль 13 - Введение в архитектуры нейронных сетей. Нейронные сети для классификации изображений
    • Keras.
    • tensorflow.
    • Персептрон.
    • CNN.
    Модуль 14 - Прогнозирование временных рядов
    • AR, MA, ARMA.
    • ARIMA.
    • VAR.
    • Lstm.
    Модуль 15 - Документация data science проектов, data science in prod
    • Пути организации продакшна для data science-проектов.
    • Специфика документации data science проектов.
    • Markdown, Latex.
    Модуль 16 - Практикум по пути улучшения качества моделей
    • Презентация и обсуждение курсовых проектов
    • Подведение итогов курса

    Примечание: стоимость курса 325 (EUR)

    Продажник
     
  2. Последние события

    1. skladchik.com
      В складчине участвует 20 человек(а).
      28 сен 2023
    2. skladchik.com
      В складчине участвует 20 человек(а).
      13 сен 2023
    3. Lera78
      Lera78 не участвует.
      20 май 2023
    4. skladchik.com
      В складчине участвует 20 человек(а).
      19 фев 2023

Поделиться этой страницей