Spark 처리 테스트 (Jupyter Lab 환경 .ipynb) #17
wwkler
started this conversation in
Show and tell
Replies: 1 comment
-
어떤식으로 카프카 컨슈머로 submit 통해서 해야 하는지 저도 찾아보고 있겠습니다! |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
Spark 처리 테스트 (Jupyter Lab 환경 .ipynb)
목표 : Jupyter Lab에서 Pyspark로 Spark Cluster를 활용하여 데이터 처리를 한다.
Server1에 Python 3.11.6 Image를 기반으로 pyspark, Jupyterlab이 설치된 Dockerfile를 정의한다.
Server1에 최종 docker-compose.yaml은 다음과 같이 설계되었다.
Server2,3에 최종 docker-compose.yaml은 다음과 같이 설계되어 있다.
Jupyter lab를 가지고 Spark를 활용해 데이터를 처리한다.
그리고 ipynb 파일은 분석, 테스트 환경에 적합하고 Spark Cluster를 활용할 수 있지만, 설정에 대한 작업이 귀찮은 것들이 있다고 말씀하셨다.
py 파일로 구현을 했을 떄 아키텍처 자동화 환경에 적합하고 Spark Cluster를 활용하기 위한 설정 작업이 간단하고 확장성이 좋다고 말씀하셨다.
Beta Was this translation helpful? Give feedback.
All reactions