Привет, Эльбрусовец!
Поздравляю, ты прошел непростой путь и уже в понедельник начнется твой путь самурая в Elbrus Bootcamp. Давай разберемся с тем, что тебе необходимо сделать, чтобы быть во всеоружии к старту обучения:
1. Установка UNIX системы
Если у тебя MacOS - пропусти этот шаг, Ubuntu устанавливать не нужно
Для наиболее производительной и комфортной работы вам понадобится Unix-подобная операционная система.
Если вы решаете остаться на Windows - тогда отвественность за решение проблем работы на ней вы принимаете на себя, на свой страх и риск. Надежнее вместо Windows использовать Linux, например Ubuntu.
Инструкций по установке огромное множество. Можно воспользоваться официальной инструкцией или вот этой на русском.
Основная рекомендация по установке заключаются в выборе для установки последней Long-term support (LTS) версии, так вы сможете получить наиболее стабильную систему, проблем при установке библиотек машинного обучения в будущем с такой версией должно быть меньше всего.
2. Git
Это система контроля версий. Вам она понадобится с первого дня работы. Работа с git-командами через терминал - это тот навык, который вам будет полезен. Но сначала будет достаточно уметь применять ряд простых команд и сценариев работы.
При чистой установке Ubuntu 22.04 git
по умолчанию не поставляется, как и для macOS.
Можно проверить это в терминале (сочетание клавиш для linux Ctrl + Alt + T
, на macOS - ищите Terminal
(но рекомендую установить iTerm2
и использовать его) через Spotlight): напишите в новом окне git
. Если терминал вам говорит, что такого пакета нет - идём его устанавливать.
Следуйте инструкции для вашей ОС
3. GitHub
🎥 Видео по github и настройке доступа
GitHub - это cистема управления версиями с социальной составляющей. В соцсети вы выкладываете фотографии, а тут исходный код. Это ещё и самая большая площадка для opensource проектов. Веб-сервис основан на системе контроля версий Git. Ну и конечно, вы можете сделать свою гитхаб страницу своим резюме.
Для начала настроим доступ к репозиториям аккаунта.
- откройте терминал (
Ctrl + Alt + T
) на своём компьютере и выполните ряд командобновление списков пакетов для обновлений
установка пакета ssh
sudo apt update sudo apt-get install ssh
на MacOS начинайте отсюда
- далее мы запустим команды, для генерации собственных SSH-ключей (ed25519 - это крипто-схема)
ssh-keygen -t ed25519 -C "подставь сюда свою почту, на которую регистрировался github и кавычки оставь"
- нажми на Enter три раза (так проще, заполнять ответы/фразы не обязательно)
Теперь в корневой папке твоего компьютера есть скрытая папка .ssh
(на mac command+shift+.
), внутри лежат два файла id_ed25519
и id_ed25519.pub
. Первый - твой приватный ключ устройства, второй - публичный, его мы и будем использовать в качестве ключа на странице добавления публичных ключей в аккаунт GitHub.
- можно запустить команду чтения содержимого файла
cat .ssh/id_ed25519.pub
, - выделить и скопировать из терминала, через сочетание клавиш
ctrl+shift+c
, содержимое публичного ключа (на mac простоcommand+c
) - копируем всю строку от включительно
ssh-ed25519 ...
и до... ваша@почта.com
включительно - пора скопировать ключ на GitHub
- название
Title
можно задать любое, обычно такое, чтобы вам было понятно, о ключе с какого компьютера идёт речь
Когда ваша система уже настроена, получен и подключен SSH-ключ, вам ничего не мешает создать копию этого репозитория у себя в аккаунте. Нужно лишь нажать на кнопку Fork
сверху справа на главной странице репозитория - https://github.com/Elbrus-DataScience/starter_pack
Теперь можно перейти на свою страницу c репозиториями https://github.com/USER?tab=repositories
, здесь и далее USER
– ваш ник в GitHub. Второй вариант - вы кликаете на фото профиля в правом верхнем углу и переходим во вкладку Your profile
или Your repositories
для доступа к странице аккаунта и репозиториев соответственно.
- переходим на страницу вашего форка (в поле ввода браузера должно быть
https://github.com/USER/starter_pack
) - здесь нажимаем на зелёную кнопку Code
- выбираем вкладку SSH
- копируем ссылку на репозиторий (она должна быть такого вида:
git@github.com:USER/starter_pack.git
)
📑 Инструкция по генерации ключа SSH
📑 Статья про fork на GitHub
4. Conda
Окружения или виртуальные среды - они необходимы для корректной работы. Как правило, для каждого рабочего проекта создаётся своя изолированная среда/окружение, куда устанавливаются необходимые только для этого проекта пакеты/библиотеки, чтобы не возникало конфликтов разных версий библиотек и можно было корректно отслеживать перечень зависимостей для проекта.
В процессе обучения мы будем использовать сonda для создания и управления окружениями Python. Это один из вариантов, например, здесь описана работа с окружениями другого инструмента - virtualenv. Можно использовать и его, но поговорим об этом ниже.
Напоминаем, что мы рекомендуем установить Ubuntu, если у вас Windows компьютер.
Conda - менеджер пакетов для Python. Как и pip - который по умолчанию.
Мы выбрали минимальную версию установщика conda, так называемую miniforge. Выбор пал на эту версию, т.к. при использовании этого варианта все пакеты работают корректно у всех, в том числе с процессорами Apple silicon. Тем самым воспроизводимость условий будет максимальна.
Для установки будет необходимо перейти на git репозиторий miniforge и скачать соответствующую версию установщика для своей операционной системы. Затем установить его. Ниже пример для linux.
Если у вас компьютер с процессором x86_64, а это в 99% случаев, любой не Apple компьютер, то выбирайте эту версию для скачивания и следуй дальнейшим шагам:
-
скачайте по ссылке Miniforge3-Linux-x86_64, файл сохранится где-то в
Downloads
или вЗагрузки
-
в терминале перейдите папку, где сохранился файл и запустите команды
chmod +x Miniforge3-Linux-x86_64.sh sh Miniforge3-Linux-x86_64.sh source ~/miniforge3/bin/activate
-
если при перезапуске терминала после установки miniforge нет "префикса"
(base)
перед именем пользователя, то чтобы всегда запускалась эта среда, можно открыть файл.bashrc
и добавить в конце файла строкуsource ~/miniforge3/bin/activate
-
проверить доступные вам среды можно по команде
conda env list
, подробнее про управление средами в conda здесь
Если компьютер от Apple, необходимо уточнить соответствующую версию для вашего процессора и скачать нужный установщик miniforge
Дальше по аналогии с инструкцией по установке на Linux (меняем Miniforge3-Linux-x86_64.sh
на название скачанного файла)
5. Jupyter notebook/lab
Один из основных инструментов работы, позволяющий разрабатывать и представлять результаты работы в Data Science. Использует интерактивный Python на локальном компьютере. Notebook - это "блокнот", который соединяет код и его визуализацию в ячейках - исполняемых и для разметки.
- Заходим сюда
- Выбираем версию либо notebook либо lab и устанавливаем
6. VS Code
Visual Studio Code (VS Code) — это редактор кода для разных языков программирования.
В нем можно писать, форматировать и редактировать код на разных языках.
Это будет нашим основным инструментом, где мы будем писать код и делать проекты.
- Переходим на сайт
- Скачиваем пакет в зависимости от нужной OS. Для Linux(Ubuntu) выбираем пакет
.deb
- Устанавливаем
Откройте VS Code и пройдите по пути Files
-> Auto Save
.
Измените значение с «Off» на «afterDelay», задайте промежуток времени — и файлы будут автоматически сохраняться в заданный промежуток.
Jupyter
Расширение позволяет работать с файлами формата
.ibynb
ссылка на установку
Python Environment Manager
Расширение предоставляет удобный менеджер просмотра всех созданных окружений в питоне
ссылка на установку
Подробное руководство по VS Code
10 рекомендаций для новичков по ускорению работы в VS Code
На этом установка необходимого ПО завершена. Необходимо переходить к инструкциям по настройке VS Code и использование GitHub