Skip to content
This repository has been archived by the owner on Jul 23, 2023. It is now read-only.
Kwangchun Lee edited this page Jul 13, 2022 · 2 revisions

bitTA 패키지

기능

  • 형태소 분석
  • 한글 자동 띄어쓰기

사전

  • KOSAC(Korean Sentiment Analysis Corpus) 감성사전: 서울대학교 언어학과에서 세종 구문분석 코퍼스로부터 선별한 332개 신문기사의 7,744 문장을 주석 대상으로 구축한 한국어 감정 코퍼스 (polarity.R)
  • 군산대학교(KNU) 한국어 감성사전: 2018년도 군산대학교 소프트웨어융합공학과 Data Intelligence Lab에서 개발한 한국어 감성사전 (sentiment_dic.R)

데이터

  • 대통령의 연설문: 대통령기록연구실 홈페이지에서 수집한 역대 퇴임 대통령들의 연설문 (president_speech.R)
  • Naver sentiment movie corpus v1.0: 네이버 영화 리뷰에서 스크랩한 데이터이며, 모두 140자 미만의 길이고, 0(Negative)과 1(Positive)로 라벨링 되어있음

Shiny APP

데이터 전처리

Clone this wiki locally