Semantic Segmentation with Vision Transformers (ViT)

This repository uses the SegFormer model proposed in SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers by Enze Xie, Wenhai Wang, Zhiding Yu, Anima Anandkumar, Jose M. Alvarez, Ping Luo.

Prerequisites

Create a .env file in the root directory of this repository with your Hugging Face token:

HF_TOKEN=<your_token>
CUDA_LAUNCH_BLOCKING=1

Open this repository as a VS Devcontainer and open the following demos:

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.devcontainer		.devcontainer
.gitignore		.gitignore
README.md		README.md
dataset.py		dataset.py
requirements.txt		requirements.txt
segformer-vineyard-inference.ipynb		segformer-vineyard-inference.ipynb
segformer-vineyard-train.ipynb		segformer-vineyard-train.ipynb
segformer_demo.py		segformer_demo.py
semantic_segmentation.ipynb		semantic_segmentation.ipynb