Skip to content

leegyoungmin/data_plumber13

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

개요

  • V2X 시스템에서 생성되는 실시간 데이터 처리 파이프라인 구축
  • 자율 주행 차량 분석 플랫폼 구축
  • Airflow, Kafka, Spark, HDFS, PostgreSQL

프로젝트 소개

  • 실시간으로 생성되는 대량의 데이터를 처리하고, 서버의 상태를 추적하며 문제가 발생할 경우 이를 해결하여 서버의 안정성을 향상시킬 필요성의 등장했다.
  • 따라서 대량의 실시간 데이터를 처리하기 위해 확장가능한 프레임워크, 기술을 사용한 아키텍처를 구성해야한다.
  • 에어플로우, 카프카, 스파크, 하둡 hdfs, postgresql 등을 사용하여 실시간 데이터 파이프라인을 구축하는 것을 목적으로 프로젝트를 진행한다.
  • 데이터 시각화는 Streamlit을 통해서 수행 및 배포한다.

파이프라인 아키텍처

Architecture diagram

Server Architecture

사용 기술 및 환경

링크를 통해서 자세한 내용을 확인할 수 있습니다.

기술명 버전정보
Hadoop & HDFS 3.3.6
PostgreSQL 16.3
Spark 3.5.1
Kafka 2.13
Airflow 2.9.3

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published