This repository has been archived by the owner on Jul 23, 2023. It is now read-only.
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathNEWS
137 lines (113 loc) · 5.68 KB
/
NEWS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
CHANGES IN R VERSION 1.3.3.9003:
MINOR CHANGES:
* tokenize_noun_ngrams() 함수에 mc.cores 인수를 추가하여 사용자가 연산에
사용할 코어를 선택할 수 있도록함 (#32)
- RStudio Cloud 무료 환경은 CPU 자원으로 Core를 1개만 지원하면서 에러가
발생하였는데, mc.cores 인수를 1로 지정하여 에러를 회피할 수 있음
* 설치 에러 발생 수정을 위한 데이터 파일 버전 변경 (#35)
NEW FEATURES:
* 한글의 종성 여부를 체크하는 함수 (#34)
- has_final_consonant()
CHANGES IN R VERSION 1.3.2:
BUG FIXES:
* MS-Windows에서 문자열 조작함수의 에러 발생 오류 수정
(#31, thanks to 송치호 선생님)
- filter_text()
- replace_text()
- concat_text()
- split_text()
- remove_text()
CHANGES IN R VERSION 1.3.1:
NEW FEATURES:
* KNU Korean Sentiment Dictionary를 이용한 감성분석 (#25)
- get_polarity()
* tidytext와 궁합이 맞도록 morpho_mecab() 함수 기능 보완 (#27)
- as_list 인수 추가
BUG FIXES:
* 내장 데이터셋 sentiment_dic의 중복 데이터 제거 (#26)
* Text Data Explorer의 조건 선택 후 텍스트 대체의 오류 수정 (#28)
CHANGES IN R VERSION 1.3.0:
NEW FEATURES:
* 토크나이즈한 명사를 묶어서 문서로 만들어주는 함수 (#8)
- collapse_noun()
* 한글 명사 n-grams 토크나이저 (#8, #10)
- tokenize_noun_ngrams()
* 한글 명사 n-grams 토큰을 tibble에 붙여주는 함수 (#10)
- unnest_noun_ngrams()
* Windows에서 기존에 mecab-ko가 설치되어 있을 경우에 경로를 등록하는 함수 (#15)
- regist_mecab_ko()
* vignettes 추가 (#2)
- Explore Docs
- Morphological Analysis
- Manipulate Documents
- Install bitTA in RStudio Cloud (#20)
* bitTA 로고 개발 및 등록 (thanks to @statkclee-이광춘, #16)
BUG FIXES:
* 대통령 연설문 데이터인 president_speech의 한글 인코딩 오류 수정
* 병렬처리를 위한 문서의 개수가 코어의 개수보다 작아서, 청크의 개수가 0으로
계산되는 오류 해결
- replace_text()
- concat_text()
- remove_text()
- filter_text()
* .GlobalEnv에 데이터 프레임 객체가 하나도 없을 경우에 Docs Explorer 구동과
동시에 발생하는 에러 수정 (#13)
* MS-Windows에서 기존에 mecab-ko가 설치되어 있을 경우에, 이를 인식하지 못하고
에러가 발생하는 오류 수정 (thanks to Kwangchun Lee, #15)
* 인코딩 처리 오류로 morpho_mecab()에서 형태소 분석을 잘못 처리하는
문제의 해결 (thanks to @csh01470, #17)
* president_speech 도움말의 데이터셋 변수 이름 오류 및 vignettes의 변수 이름
수정 (thanks to @sens5900r, #19)
* get_ngrams()에서 "객체 'ngram_delim'를 찾을 수 없습니다" 오류 수정
(thanks to @statkclee-이광춘, #23)
* explore_docs()에서 "객체 'ngram_delim'를 찾을 수 없습니다" 오류 수정
(thanks to @statkclee-이광춘, #23)
* collapse_noun()에서 MS-Windows에서 병렬처리가 불가하다는 오류 수정
(thanks to @statkclee-이광춘, #22)
* tokenize_noun_ngrams()에서 MS-Windows에서 병렬처리가 불가하다는 오류 수정
(thanks to @statkclee-이광춘, #22)
MINOR CHANGES:
* 함수 이름으로 기능을 명확이 유추할 수 있도록 doc_quality()의 이름을
explore_docs()로 변경
* filter_text()에 as_logical 인수를 추가해서 필터링한 단일 문자열 벡터를
반환하거나, 필터링할 대상을 선택하기 위한 논리 벡터를 반환할지를 선택하는
기능을 추가. 논리벡터는 tidytext 패키지와의 협업에 사용. (#14)
CHANGES IN R VERSION 1.2.0:
NEW FEATURES:
* 은전한닢 형태소분석기(mecab-ko)와 사전(mecab-ko-dic)을 사용자 환경에
설치하는 함수 추가 (thanks to @stacklee, #5)
- install_mecab_ko()
- Linix, Mac, Windows 운영체제 지원
* n-gram 토큰화 기능 추가
- get_ngram()
* KOSAC 감성사전 기반의 감성분석
- get_opinion()
* vignettes 추가 (#2)
- Introduce bitTA
- Install mecab-ko (#6)
CHANGES IN R VERSION 1.1.0:
MAJOR CHANGES:
* 형태소분석기를 이용한 토크나이저 함수에서 복수개의 문서에 대해서 복수개의
벡터를 갖는 리스트 객체로 반환
- morpho_mecab()
MINOR CHANGES:
* morpho_mecab() type 인수의 기능 확장
- "noun" : 일반명사(NNG)만 토큰화
- "noun2" : 모든 명사를 토큰화
CHANGES IN R VERSION 1.0.0:
NEW FEATURES:
* 문자열을 분리하는 함수인 split_text() 추가
* 네이버 카페 게시물 스크래핑 샘플 데이터인 buzz 데이터셋 추가
MAJOR CHANGES:
* 함수이름을 카멜 표기법(Camel Case)에서 스네이크 표기법(Snake Case)으로 변경
- from getMeta() to get_meta()
- from getMeta() to get_meta()
- from getMorpHann() to morpho_hann()
- from getMorpMecab() to morpho_mecab()
- from getMorpWise() to morpho_wise()
- from changeStr() to replace_text()
- from concatStr() to concat_text()
- from eraseStr() to remove_text()
- from filterStr() to filter_text()
- from docQuality() to doc_quality()
- from getSpacing() to get_spacing()