Skip to content

Latest commit

 

History

History
24 lines (23 loc) · 3.22 KB

README.md

File metadata and controls

24 lines (23 loc) · 3.22 KB

Конкурс для начинающих аналитиков данных

Краткое описание файлов:

.ipynb:

  • eda - Подготовка данных (конструирование единых таблиц для каждого ТС) и разведовательный анализ (с помощью pandas_profiling отчетов) именно здесь была обнаружена ошибка в refueling2
  • refueling eda - Анализ refueling2
  • rolling_data - Выбор метода сглаживания fuellevel
  • interval extraction - Все измерения группируются по интервалам с небольшой разницей между измерениями во времени внутри одного интервала. Далее каждый интервал разбивается на промежутки возрастания/убывания. Возрастания классифицируются как заправки, убывания кллассифицируются либо как штатный расход, либо как слив в зависимости от скорости убывания топлива и уменьшения объема топлива за интервал.
  • fuel level shift - Анализ событий изменения уровня топлива
  • problems1_2-preparation - Подготовка данных для решения 1 и 2 задач (создание матрицы строками которой являются события изменения уровня топлива, столбцы - то, как мы их характеризуем
  • problems1_2-clustering - Попытка решить 1 и 2 задачи предполагая, что 1 и 2 задачи являются задачами без учителя (т.к. refueling некорректный)
  • problems1_2-classification - Попытка решить 1 и 2 задачи предполагая, что 1 и 2 задачи являются задачами с учителем (допустим refueling корректный) (построение двух классификаторов, оба провалились)
  • problems3_6 - Попытка классифицировать ТС по скорости, расходу топлива, емкости бака.
  • problem6 - Разделение ТС по типам с помощью иерархической кластеризации.
  • constants-and-functions - Код с константами и часто используемыми самописными функциями

folders:

  • data/ - Все данные, связанные непосредственно с задачей
    • data/vehicle_dataset_public - Выданные данные
    • data/vehicle_proccessed - Предобработанные данные с графиками и отчетами
      • data/vehicle_proccessed/reports - pandas_profiling отчеты по данным, на их базе делается разведовательный анализ
      • data/vehicle_proccessed/plots - Графики уровня топлива