Skip to content

Galaktik1/starter_pack

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 

Repository files navigation

Welcome

Привет, Эльбрусовец!

Поздравляю, ты прошел непростой путь и уже в понедельник начнется твой путь самурая в Elbrus Bootcamp. Давай разберемся с тем, что тебе необходимо сделать, чтобы быть во всеоружии к старту обучения:

Настройка рабочего окружения

1. Установка UNIX системы

Если у тебя MacOS - пропусти этот шаг, Ubuntu устанавливать не нужно

Для наиболее производительной и комфортной работы вам понадобится Unix-подобная операционная система.
Если вы решаете остаться на Windows - тогда отвественность за решение проблем работы на ней вы принимаете на себя, на свой страх и риск. Надежнее вместо Windows использовать Linux, например Ubuntu.

Инструкций по установке огромное множество. Можно воспользоваться официальной инструкцией или вот этой на русском.
Основная рекомендация по установке заключаются в выборе для установки последней Long-term support (LTS) версии, так вы сможете получить наиболее стабильную систему, проблем при установке библиотек машинного обучения в будущем с такой версией должно быть меньше всего.

Дополнительные материалы

2. Git

2.1 Что такое Git?

Это система контроля версий. Вам она понадобится с первого дня работы. Работа с git-командами через терминал - это тот навык, который вам будет полезен. Но сначала будет достаточно уметь применять ряд простых команд и сценариев работы.

2.2 Установка Git

При чистой установке Ubuntu 22.04 git по умолчанию не поставляется, как и для macOS.
Можно проверить это в терминале (сочетание клавиш для linux Ctrl + Alt + T, на macOS - ищите Terminal (но рекомендую установить iTerm2 и использовать его) через Spotlight): напишите в новом окне git. Если терминал вам говорит, что такого пакета нет - идём его устанавливать.
Следуйте инструкции для вашей ОС

3. GitHub

3.1 Что такое GitHub?

🎥 Видео по github и настройке доступа

GitHub - это cистема управления версиями с социальной составляющей. В соцсети вы выкладываете фотографии, а тут исходный код. Это ещё и самая большая площадка для opensource проектов. Веб-сервис основан на системе контроля версий Git. Ну и конечно, вы можете сделать свою гитхаб страницу своим резюме.

3.2 Настройка доступа по SSH

Для начала настроим доступ к репозиториям аккаунта.

Пример для Linux(Ubuntu)

  • откройте терминал (Ctrl + Alt + T) на своём компьютере и выполните ряд команд
    • обновление списков пакетов для обновлений
    • установка пакета ssh
    sudo apt update    
    sudo apt-get install ssh    
    

на MacOS начинайте отсюда

  • далее мы запустим команды, для генерации собственных SSH-ключей (ed25519 - это крипто-схема)
    ssh-keygen -t ed25519 -C "подставь сюда свою почту, на которую регистрировался github и кавычки оставь"
    
    • нажми на Enter три раза (так проще, заполнять ответы/фразы не обязательно)

Теперь в корневой папке твоего компьютера есть скрытая папка .ssh (на mac command+shift+.), внутри лежат два файла id_ed25519 и id_ed25519.pub. Первый - твой приватный ключ устройства, второй - публичный, его мы и будем использовать в качестве ключа на странице добавления публичных ключей в аккаунт GitHub.

  • можно запустить команду чтения содержимого файла cat .ssh/id_ed25519.pub,
  • выделить и скопировать из терминала, через сочетание клавиш ctrl+shift+c, содержимое публичного ключа (на mac просто command+c)
  • копируем всю строку от включительно ssh-ed25519 ... и до ... ваша@почта.com включительно
  • пора скопировать ключ на GitHub
  • название Title можно задать любое, обычно такое, чтобы вам было понятно, о ключе с какого компьютера идёт речь

3.3 Проверка настройки SSH или твой первый Fork

Когда ваша система уже настроена, получен и подключен SSH-ключ, вам ничего не мешает создать копию этого репозитория у себя в аккаунте. Нужно лишь нажать на кнопку Fork сверху справа на главной странице репозитория - https://github.com/Elbrus-DataScience/starter_pack

Теперь можно перейти на свою страницу c репозиториями https://github.com/USER?tab=repositories, здесь и далее USER – ваш ник в GitHub. Второй вариант - вы кликаете на фото профиля в правом верхнем углу и переходим во вкладку Your profile или Your repositories для доступа к странице аккаунта и репозиториев соответственно.

  • переходим на страницу вашего форка (в поле ввода браузера должно быть https://github.com/USER/starter_pack)
  • здесь нажимаем на зелёную кнопку Code
  • выбираем вкладку SSH
  • копируем ссылку на репозиторий (она должна быть такого вида: git@github.com:USER/starter_pack.git)

3.4 Дополнительные материалы

📑 Инструкция по генерации ключа SSH
📑 Статья про fork на GitHub

4. Conda

4.1 Что такое Conda?

Окружения или виртуальные среды - они необходимы для корректной работы. Как правило, для каждого рабочего проекта создаётся своя изолированная среда/окружение, куда устанавливаются необходимые только для этого проекта пакеты/библиотеки, чтобы не возникало конфликтов разных версий библиотек и можно было корректно отслеживать перечень зависимостей для проекта.

В процессе обучения мы будем использовать сonda для создания и управления окружениями Python. Это один из вариантов, например, здесь описана работа с окружениями другого инструмента - virtualenv. Можно использовать и его, но поговорим об этом ниже.

4.2 Установка Conda

Напоминаем, что мы рекомендуем установить Ubuntu, если у вас Windows компьютер.

Conda - менеджер пакетов для Python. Как и pip - который по умолчанию.

Мы выбрали минимальную версию установщика conda, так называемую miniforge. Выбор пал на эту версию, т.к. при использовании этого варианта все пакеты работают корректно у всех, в том числе с процессорами Apple silicon. Тем самым воспроизводимость условий будет максимальна.

Для установки будет необходимо перейти на git репозиторий miniforge и скачать соответствующую версию установщика для своей операционной системы. Затем установить его. Ниже пример для linux.

Linux

Если у вас компьютер с процессором x86_64, а это в 99% случаев, любой не Apple компьютер, то выбирайте эту версию для скачивания и следуй дальнейшим шагам:

  • скачайте по ссылке Miniforge3-Linux-x86_64, файл сохранится где-то в Downloads или в Загрузки

  • в терминале перейдите папку, где сохранился файл и запустите команды

    chmod +x Miniforge3-Linux-x86_64.sh
    sh Miniforge3-Linux-x86_64.sh
    source ~/miniforge3/bin/activate 
    
  • если при перезапуске терминала после установки miniforge нет "префикса" (base) перед именем пользователя, то чтобы всегда запускалась эта среда, можно открыть файл .bashrc и добавить в конце файла строку source ~/miniforge3/bin/activate

  • проверить доступные вам среды можно по команде conda env list, подробнее про управление средами в conda здесь

macOS

Если компьютер от Apple, необходимо уточнить соответствующую версию для вашего процессора и скачать нужный установщик miniforge
Дальше по аналогии с инструкцией по установке на Linux (меняем Miniforge3-Linux-x86_64.sh на название скачанного файла)

5. Jupyter notebook/lab

5.1 Что такое Jupyter notebook/lab?

Один из основных инструментов работы, позволяющий разрабатывать и представлять результаты работы в Data Science. Использует интерактивный Python на локальном компьютере. Notebook - это "блокнот", который соединяет код и его визуализацию в ячейках - исполняемых и для разметки.

5.2 Установка Jupyter notebook/lab

  1. Заходим сюда
  2. Выбираем версию либо notebook либо lab и устанавливаем

Доп Материалы

6. VS Code

6.1 Что такое VS Code?

Visual Studio Code (VS Code) — это редактор кода для разных языков программирования.
В нем можно писать, форматировать и редактировать код на разных языках.
Это будет нашим основным инструментом, где мы будем писать код и делать проекты.

6.2 Установка VS Code

  • Переходим на сайт
  • Скачиваем пакет в зависимости от нужной OS. Для Linux(Ubuntu) выбираем пакет .deb
  • Устанавливаем

6.3 Оптимизация работы в VSCode

6.3.1 Автосохранение

Откройте VS Code и пройдите по пути Files -> Auto Save.
Измените значение с «Off» на «afterDelay», задайте промежуток времени — и файлы будут автоматически сохраняться в заданный промежуток.

6.3.2 Расширения

Jupyter

Расширение позволяет работать с файлами формата .ibynb
ссылка на установку

Python Environment Manager

Расширение предоставляет удобный менеджер просмотра всех созданных окружений в питоне
ссылка на установку

Доп материалы

Подробное руководство по VS Code
10 рекомендаций для новичков по ускорению работы в VS Code

Итог

На этом установка необходимого ПО завершена. Необходимо переходить к инструкциям по настройке VS Code и использование GitHub

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published