5mins - 우리집 고양이도 메리 크리스마스 🎅

📢 2024년 2/겨울학기 AIKU 활동으로 진행한 프로젝트입니다 🎉 2024년 2/겨울학기 AIKU Conference 열심히상 수상!

소개

우리집 고양이도 메리 크리스마스!

기존 image editing 모델들의 한계점으로 지적되어 온 것 중 하나는 객체 간의 관계성입니다. 즉, 특정 객체만을 편집하거나 관계(두 객체의 위치, 크기 등)을 바꾸는 것에서 한계가 있었습니다. 이번 프로젝트에서는 강아지, 고양이 사진을 크리스마스 분위기로 바꾸는 image editing을 하며 다음 문제를 해결해보고자 합니다.

특정 객체를 추가하거나 수정하는 능력 높이기
다양성이 보장된 고품질의 image editing dataset 생성

방법론

데이터셋 생성

1. 텍스트

GPT-3.5 turbo 모델을 활용하여 input으로 주어진 instruction 문장을 패러프레이징하여 다양한 instruction 문장 생성

2. 이미지

위에서 생성한 instruction을 랜덤 샘플링하여 이에 맞는 edited image 생성, 이때 instruct pix2pix 모델을 사용하여 paired 데이터셋 생성 다양한 생성 결과를 위해 image guidance scale을 하나의 값으로 고정하지 않고 여러 값을 사용

Fine-tuning

0. 생성한 이미지 필터링

생성된 이미지들을 manual-data-filtering을 통해 finetuning에 활용할 데이터를 선별

1. 허깅페이스 삼중항 데이터셋 구축

만들어진 데이터셋을 선별하여 삼중항 데이터셋 구축 및 허깅페이스 업로드(input_image, instruction, output_image)

2. 학습 과정

diffusers에서 제공하는 train_instruct_pix2pix.py를 실행하여 further training 진행 1390개 pair row에 대해서, 총 8000 step 만큼 파인튜닝 진행

3. huggingface 배포

pwnhyo/instruct-pix2pix-model

환경 설정

conda create --name 5min python=3.9
conda actibate 5min

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

git clone https://github.com/huggingface/diffusers
cd diffusers
pip install .

cd examples/instruct_pix2pix
pip install -r requirements.txt

accelerate config (default)

사용 방법

Trainining:

sh train.sh

Inference:

python inference.py

예시 결과

팀원

*정혜민: Team leader/ 아이디어 제시 및 파이프라인 구축 / 데이터셋 생성
이성민: 모델 파인튜닝 / 데이터셋 생성
이현진: 데모 제작 / 데이터셋 생성
홍예진: 데모 제작 / 데이터셋 생성
이효민: 모델 파인튜닝 / 데이터셋 생성

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
README.md		README.md
data-generation.ipynb		data-generation.ipynb
demo.py		demo.py
inference.py		inference.py
instruction.ipynb		instruction.ipynb
instruction_total.csv		instruction_total.csv
train.sh		train.sh
train_instruct_pix2pix.py		train_instruct_pix2pix.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

5mins - 우리집 고양이도 메리 크리스마스 🎅

소개

방법론

데이터셋 생성

1. 텍스트

2. 이미지

Fine-tuning

0. 생성한 이미지 필터링

1. 허깅페이스 삼중항 데이터셋 구축

2. 학습 과정

3. huggingface 배포

환경 설정

사용 방법

Trainining:

Inference:

예시 결과

팀원

About

Releases

Packages

Contributors 4

Languages

AIKU-Official/aiku-24-2-5mins

Folders and files

Latest commit

History

Repository files navigation

5mins - 우리집 고양이도 메리 크리스마스 🎅

소개

방법론

데이터셋 생성

1. 텍스트

2. 이미지

Fine-tuning

0. 생성한 이미지 필터링

1. 허깅페이스 삼중항 데이터셋 구축

2. 학습 과정

3. huggingface 배포

환경 설정

사용 방법

Trainining:

Inference:

예시 결과

팀원

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages