📢 2024년 1학기 AIKU 활동으로 진행한 프로젝트입니다
도심 내 자율주행에 필수적인 Sementic Segmentation을 위한 모델을 구현합니다.
Object Detection과 Segmentation에 관한 논문을 공부하고 이를 재구현하며 이해도를 높이고자 진행했습니다. 또한, 최종적으로 AIKU에서 진행한 AIKUTHON; Semantic Segmentation for Self-Driving Car를 위한 모델을 구현하는 프로젝트입니다.
차량 관점에서 사진이 주어졌을 때 이를 13개의 label(사람, 인도, 차도, 나무, 벽, 신호등 등)으로 구분하는 semantic segmetation model을 구현해야 합니다.
- U-Net 논문 리뷰 이후 프로젝트 팀원들과 피드백을 주고 받았습니다.
- AIKUTHON의 RLE encoding data를 사용하는 U-Net을 구현했습니다.
- Faster R-CNN 논문 리뷰 이후 프로젝트 팀원들과 피드백을 주고 받았습니다.
- R-CNN은 Object Detection task이기에 AIKUTHON data는 부적합합니다.
- 때문에, Kaggle의 'Cityscapes Image Pairs' 데이터셋을 활용하여 구현했습니다.
- SegFormer 논문 리뷰 이후 프로젝트 팀원들과 피드백을 주고 받았습니다.
- 일반적인 상황에서 U-Net과 SegFormer의 성능을 비교하고, SegFormer의 성능을 높이기 위한 Hyperparameter tuning과 Data Augmentation 등의 기법을 활용했니다.
pip install segmentation_models_pytorch
pip install -U git+https://github.com/huggingface/transformers.git
pip install -U git+https://github.com/huggingface/accelerate.git
segformer를 위해 위 설치가 필요합니다.
추가로, oneformer를 사용하기 위해 natten
의 설치가 필요하며 아래와 같은 방식을 추천합니다.
pip install natten==0.17.1+torch230cu121 -f https://shi-labs.com/natten/wheels/
drive_dir을 지정한 후 학습을 진행할 수 있습니다.
![test](https://private-user-images.githubusercontent.com/129763673/345380089-2607b8d1-c594-444f-9c44-320fa3b394d6.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3Mzg5MDc3ODQsIm5iZiI6MTczODkwNzQ4NCwicGF0aCI6Ii8xMjk3NjM2NzMvMzQ1MzgwMDg5LTI2MDdiOGQxLWM1OTQtNDQ0Zi05YzQ0LTMyMGZhM2IzOTRkNi5wbmc_WC1BbXotQWxnb3JpdGhtPUFXUzQtSE1BQy1TSEEyNTYmWC1BbXotQ3JlZGVudGlhbD1BS0lBVkNPRFlMU0E1M1BRSzRaQSUyRjIwMjUwMjA3JTJGdXMtZWFzdC0xJTJGczMlMkZhd3M0X3JlcXVlc3QmWC1BbXotRGF0ZT0yMDI1MDIwN1QwNTUxMjRaJlgtQW16LUV4cGlyZXM9MzAwJlgtQW16LVNpZ25hdHVyZT1lODcxZWZhODJmMzU2ZjgzOWJhYmI4OGVhMGEzNTJiMTg2ZWY0Njc2NGQwN2EyZmRlZmZmNDgxNjQ2NTliMDAzJlgtQW16LVNpZ25lZEhlYWRlcnM9aG9zdCJ9.OpD6SJVJivMY3hToq53gVD6H_Yxsfc3dAfSdtb-ifKI)
Cityscapes Image Pairs Data를 통해 학습한 model의 결과. 대체로 잘 나타내나 일부 작은 사물; 얇은 표지판 기둥, 하늘의 신호등 등을 잘 잡아내지는 못하여 성능 개선이 필요합니다.
- [김승주]: 논문 리서치, 코드 작성
- [구영서]: 논문 리서치, 코드 작성
- [박경빈]: 논문 리서치, 코드 작성
- [윤혜원]: 논문 리서치, 코드 작성