1. Новые складчины: Показать еще

    28.04.2017: Говори, вдохновляй. Как завоевать доверие слушателей и увлечь их своими идеями (Саймон Ланкастер)

    28.04.2017: Как создать капитал и жить на проценты (Анна Тюрнева)

    28.04.2017: Точки жизни. Акупунктурный массаж для снятия боли (Ки Шенг Ю)

    28.04.2017: Высшее сексуальное мастерство 2.0 [Премиум] (Лев Вожеватов, Федорова Екатерина)

    28.04.2017: Точки управления болью: 20 методик для жизни без боли (Ки Шенг Ю)

  2. Нужен организатор: Показать еще

    28.04.2017: Высшее сексуальное мастерство 2.0 [Премиум] (Лев Вожеватов, Федорова Екатерина)

    28.04.2017: (Повтор) Очищение организма дарами природы (Виталий Островский)

    28.04.2017: Как стать девушкой-плюс 2.0 (март-апрель 2017). Стандарт+ВСЕ доп. лекции (Мила Левчук)

    28.04.2017: Складчина на "Ставка дня" от Хочу Прогноз

    27.04.2017: АСПЕКТЫ (2-й семестр ВШКА)

  3. Сбор взносов Показать еще

    28.04.2017: Тестостерон Release (Арсен Маркарян) 2 и 3 ступени последнего онлайн курса

    28.04.2017: Матрица партнерских продаж (Евгений Вергус)

    27.04.2017: Коммерческая fashion-иллюстрация. Онлайн-курс с Аленой Лавдовской

    27.04.2017: Стратегия slybet. Только для проверенных... (Сергей Град)

    24.04.2017: Визуальные заметки на практике. Продвинутые техники скетчноутинга (Майкл Роуди)

Куплено

DSCource 2. Data Mining с помощью Python (Юрий Кашницкий)

Тема в разделе "Курсы по программированию", создана пользователем Aplication, 12 апр 2016.

Цена:
7000 руб
Взнос:
254 руб
Организатор:
Aplication
Участников:
3/30

Основной список:

1. Aplication
2. sk0012 3. a1ik
    Тип: Стандартная складчина
    1. Aplication

      Aplication Организатор складчин

      DSCource 2. Data Mining с помощью Python (Юрий Кашницкий)

      Юрий Кашницкий, Data Mining с помощью Python
      Видео лекций, презентации, ссылки по второму курсу данной серии


      "Мы постарались сделать программу так, чтобы в нее входили только самые основные навыки, необходимые в реальной работе. Здесь не будет длинной теории, только практически важные вещи."
      • Юрий Кашницкий, преподаватель Высшей Школы Экономики, умеющий объяснять сложные вещи простым языком, познакомит слушателей сперва с основными инструментами, которые пригодятся начинающему Data Scientist'у, а после проведет курс по машинному обучению, в котором даст необходимые навыки для построения прогнозных моделей

      Data Mining (добыча данных, интеллектуальный анализ данных, глубинный анализ данных) – собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности

      Kaggle – это платформа для исследователей разных уровней, где они могут опробовать свои модели анализа данных на серьезных и актуальных задачах. Суть такого ресурса – не только в возможности получить неплохой денежный приз в случае, если именно ваша модель окажется лучшей, но и в том (а, это, пожалуй, гораздо важнее), чтобы набраться опыта и стать специалистом в области анализа данных и машинного обучения.


      Данный курс освящает практическое применение алгоритмов обработки данных на примере решения одной из самых популярных задач платформы Kaggle, Titanic: Learning from Disaster (предсказание выживших в катастрофе пассажиров)
      Урок 1. Введение
      - Введение в машинное обучение, необходимые навыки
      - Задачи классификации, регрессии и кластеризации
      - Краткий обзор Kaggle
      - Открытие соревнования Kaggle Inclass
      - Знакомство с набором данных по автострахованию этого соревнования
      - Статистические распределения, нормализация признаков, приведение к нормальному распределению
      - Деревья решений
      - Применение дерева решений Scikit-learn к набору данных iris и данным из контеста Kaggle Inclass
      - Настройка параметров дерева, кросс-валидация

      Урок 2. Обзор инструментов
      - Работа с векторами и матрицами в библиотеке NumPy
      - Обзор библиотеки для научных выичслений SciPy
      - Тетрадки Jupyter (IPython) для презентации материала, содержащего код
      - Визуализация данных с Matplotlib
      - Чтение и обработка данных с библиотекой Pandas
      - Решение задачи соревнования Kaggle "Titanic: Learning from Disaster" c помощью Pandas
      - Обзор библиотеки машинного обучения Scikit-learn

      Урок 3. Обучение с учителем. Классификация
      - Работа с признаками – отбор, преобразование, построение
      - Метрики качества алгоритмов машинного обучения (accuracy, precision, recall, F-score). ROC-кривая, AUC
      - Метод максимального правдоподобия
      - Логистическая регрессия

      Урок 4. Обучение с учителем. Ансамбли. Переобучение
      - Случайный лес (Random Forest)
      - Случайный лес на примере набора данных Titanic
      - Случайный лес на примере набора данных по автострахованию
      - Бустинг (boosting) и бэггинг (bagging)
      - Сравнение бустинга и бэггинга на наборах данных репозитория UCI
      - Стекинг. Демонстрация решения задачи категоризации продуктов Otto (вкратце)
      - Переобучение, кросс-валидация, регуляризация
      - Пример регуляризации для логистической регрессии

      Урок 5. Обучение без учителя
      - Обзор методов кластеризации, снижения размерности, поиска аномалий в данных
      - Кластеризации городов России по социально-экономическим показателям
      - Сингулярное разложение матрицы
      - Пример снижения размерности изображений, сжатие изображений
      - Снижение размерности как способ визуализации даных
      - Решение задачи соревнования Kaggle "Titanic: Learning from Disaster" с помощью Python

      Урок 6. Продвинутые методы. API Scikit-learn
      - Нейронные сети, библиотеки nolearn и Lasagne NN
      - Библиотека XGBoost, сравнение с градиентным бустингом в Scikit-learn
      - Пример голосования между алгоритмами для повышения качества классификации
      - Смешивание (блендинг) алгоритмов на примере задачи Kaggle "Titanic: Learning from Disaster"
      - Стекинг. Пример для Titanic
      - Разработка собственного класса Scikit-learn Estimator для задачи по автострахованию Kaggle Inclass. kNN с подобранной метрикой.
       
      Aplication, 12 апр 2016
    2. Загрузка...

      Похожие складчины
      1. Telegram
        Запись

        [ML/Класс] DSCource 2. Data Mining с помощью Python

        Telegram, 14 ноя 2015, в разделе: Курсы по программированию
      2. Telegram
        Запись

        [ML/Класс] DSCource 1. Инструментарий Data Science

        Telegram, 14 ноя 2015, в разделе: Курсы по программированию
      3. Telegram
        Запись

        [ML/Класс] DSCource 4. Прикладные области

        Telegram, 14 ноя 2015, в разделе: Курсы по программированию
      4. Telegram
        Запись

        [ML/Класс] DSCource 3. Kaggle Tips & Tricks

        Telegram, 14 ноя 2015, в разделе: Курсы по программированию
      5. Bulion
        Запись

        Основы Data Science и Big Data. Python и наука о данных

        Bulion, 30 янв 2017, в разделе: Электронные книги
      6. Aplication
        Запись

        Data driven marketing (Костя Солодянников, Максим Зорин)

        Aplication, 16 янв 2017, в разделе: SEO, анализ, юзабилити, продвижение сайтов
      7. Telegram
        Запись

        [WP] Advanced Database Cleaner - Мощный плагин очистки хлама из базы...

        Telegram, 30 авг 2016, в разделе: Программы, скрипты

    3. Aplication

      Aplication Организатор складчин

Наверх