ВШЭ, осень 2023
Прикладной курс, посвященный спецификации и реализации ML моделей. Другие темы курса включают изучение ассоциативных правил и проблемы оптимизации. Курс сфокусирован на теории машинного обучения. Оценка 8/10.
Темы:data processing, visualization, EDA, clusterization, classification, random forest, gradient boosting, association rule mining
Библиотеки: pandas, matplotlib, sklearn.
Углубленная работа с недостающими и неверными данными, экономическая интерпретация на основе EDA.
Сравнение моделей классификации с использованием стандартных показателей, таких как точность, показатель f-1, ROC-AUC. Интерпретация логистической регрессии.
Выбор оптимального количества кластеров с использованием иерархической кластеризации и оценки силуэта и инерции. Кластеризация KMeans и DBSCAN, интерпретация модели.
EDA, проверка гипотез, выбор признаков, интерпретация модели случайного леса.
Выбор признаков, сравнение моделей градиентного бустинга и случайного леса, интерпретация моделей.
Определение распространненных правил с помощью алгоритмов Apriori и FPgrowth и метрик support, confidence, lift.