-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathanalisis_koleksem_khas_paper.Rmd
314 lines (230 loc) · 29.6 KB
/
analisis_koleksem_khas_paper.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
---
title: Analisis Koleksem Khas dan Potensinya untuk Kajian Kemiripan Makna Konstruksional dalam Bahasa Indonesia
csl: apa-doi.csl
output:
bookdown::pdf_document2:
toc: yes
number_sections: yes
fig_caption: true
bookdown::word_document2:
df_print: kable
fig_caption: yes
fig_width: 6
reference_docx: analisis_koleksem_khas_paper_template.docx
html_notebook:
code_folding: hide
fig_caption: yes
fig_width: 6
number_sections: yes
toc: yes
toc_float: no
link-citations: no
bibliography: references.bib
---
```{r setup, include = FALSE, message = FALSE, warning = FALSE, echo = FALSE}
knitr::opts_chunk$set(fig.width = 6,
fig.asp = 0.618,
dpi = 300,
echo = FALSE,
tidy = FALSE)
library(tidyverse)
my_pattern <- c("membesarkan", "memperbesar")
my_leipzig_path <- readRDS("data/my_leipzig_path.rda")
colloc_out <- readRDS("data/colloc_out_r1.rda")
stoplist <- readRDS("data/stopwords.rda")
leipzig_size <- readRDS("data/leipzig_size.rda")
```
^1^^,^ ^2^ Gede Primahadi Wijaya Rajeg & ^1^ I Made Rajeg
^1^ Universitas Udayana, Indonesia & ^2^ Monash University, Australia
primahadiwijaya@gmail.com & made_rajeg@unud.ac.id
**ABSTRAK**
Makalah ini mengenalkan Analisis Koleksem Khas (*Distinctive Collexeme Analysis*) dan mengulas potensinya terhadap salah satu isu linguistik dalam Bahasa Indonesia (BI), yaitu perbedaan semantis pasangan verba kausatif deajektiva sebagai pencontohan dua konstruksi kausatif morfologis (yaitu [*per-* + AJ] dan [AJ + *-kan*]), yang, menurut salah satu buku tatabahasa BI, perbedaan maknanya dianggap tidak begitu disadari oleh kebanyakan penutur BI. Dengan menggunakan pasangan kata _memperbesar_ dan _membesarkan_ sebagai contoh awal, ditemukan adanya perbedaan substansial berdasarkan distribusi dan tipe semantis koleksem R1 khas pada masing-masing verba. Lebih lanjut, koleksem khas kedua verba tersebut mencerminkan ciri semantis dominan yang dilandasi dengan dua metafora konseptual berbeda: (i) <span style = "font-variant:small-caps;">penting adalah besar</span> untuk _membesarkan_, dan (ii) metafora ikutan dari <span style = "font-variant:small-caps;">kuantitas adalah ukuran</span>, yaitu <span style = "font-variant:small-caps;">lebih (banyak) adalah besar</span>, untuk _memperbesar_.
*Kata kunci*: Linguistik Korpus Kuantitatif; Analisis Koleksem Khas; Korpus Bahasa Indonesia Leipzig; konstruksi kausatif morfologis Bahasa Indonesia; kemiripan makna; metafora konseptual
**ABSTRACT**
This contribution introduces *Distinctive Collexeme Analysis* (DCA) and explores its potential to address a theoretical issue in Indonesian linguistics, namely semantic dissimilarity between a pair of deadjectival causative verbs of the same root realising two causative morphological constructions, which, according to one of the Indonesian grammar textbooks, are assumed to be semantically indistinguishable by many Indonesian speakers; the constructions are [*per-* + ADJ] and [ADJ + *-kan*]. Using the pair of active-voiced verbs with the root *besar* 'big' (i.e. _memperbesar_ and _membesarkan_) as a preliminary example, we demonstrate that there are substantial distributional and semantic differences concerning the distinctive R1 collexemes of these verbs. We argue that the predominant semantics of the verbs based on their distinctive collexemes reflect two different metaphorical conceptualisations: (i) <span style = "font-variant:small-caps;">importance is big</span> for _membesarkan_, and (ii) the entailment of <span style = "font-variant:small-caps;">quantity is size</span> metaphor, namely <span style = "font-variant:small-caps;">more is big</span>, for _memperbesar_.
*Keywords*: Quantitative Corpus Linguistics; Distinctive Collexeme Analysis; Indonesian Leipzig Corpora; Indonesian morphological causative constructions; near-synonymy; conceptual metaphors
# Pengantar^[Penelitian dan penulisan makalah ini didukung oleh skema dana penelitian doktoral dari Monash University, Australia yang diberikan kepada GPWR, yaitu *Monash International Postgraduate Research Scholarships* (MIPRS) dan *Monash Graduate Scholarships* (MGS).] {#intro}
Perkembangan linguistik terkini mencakup pemanfaatan bank data elektronik kebahasaan (atau korpus) dan penerapan beragam metode analisis kuantitatif guna mengkaji aspek-aspek kebahasaan [@dancygier_quantitative_2017]. Keberadaan korpus sebagai sumber data pemakaian bahasa, beserta informasi kuantitatif yang ditawarkan, memungkinkan peneliti untuk meninjau kembali asumsi-asumsi teoretis dari penelitian sebelumnya melalui pendekatan berbeda. Makalah ini mencoba menunjukkan bagaimana suatu klaim teoretis dapat ditinjau dan diuji melalui data korpus dan metode linguistik korpus kuantitatif. Secara khusus, makalah ini membahas klaim terkait dua konstruksi kausatif morfologis dalam Bahasa Indonesia (BI), yaitu [*per-* + AJ(EKTIVA)] dan [AJ(EKTIVA) + *-kan*]; kajian ini sekaligus melanjutkan penelitian korpus sebelumnya perihal konstruksi [*per-* + AJ] [@rajeg_mempertemukan_2017]. Penulis akan menguji salah satu klaim yang diajukan oleh Sneddon et al. [-@sneddon_indonesian_2010, hlm. 103] terkait kemiripan semantis verba kausatif deajektiva dalam skema konstruksi morfologis *per-* dan *-kan*.
Secara teoretis, terdapat perbedaan kandungan semantis yang disampaikan oleh verba deajektiva yang dilandasi dengan konstruksi *per-* dan *-kan*. Verba kausatif dengan *-kan* dipandang menyampaikan makna bahwa 'objek langsungnya disebabkan memiliki ciri yang dirujuk oleh akar ajektivanya dan yang belum dimiliki sebelumnya', sedangkan verba kausatif dengan *per-* dianggap memiliki unsur komparatif dalam kandungan semantisnya, yaitu bahwa 'objek langsungnya disebabkan untuk memiliki peningkatan kadar ciri yang telah ada sebelumnya' [@sneddon_indonesian_2010, hlm. 103]. Salah satu contohnya ialah pasangan kata *membesarkan* ('membuat sesuatu yang sebelumnya tidak besar menjadi besar') dan *memperbesar* ('membuat sesuatu yang sudah besar menjadi lebih besar'). Akan tetapi, Sneddon et al. [-@sneddon_indonesian_2010, hlm. 103] menambahkan bahwa kebanyakan penutur BI pada umumnya tidak mengenali perbedaan semantis yang dimiliki oleh kedua konstruksi tersebut terhadap verba turunannya, meskipun keragaman pemakaian di antara penutur bisa saja ditemukan:
> "It is probable there is considerable variation in usage between different speakers, with many people making no distinction between the functions of the two affixes." [@sneddon_indonesian_2010, hlm. 103]
Sneddon et al. khususnya berasumsi bahwa kebanyakan penutur memahami verba dengan *per-* sebagai tindakan yang menyebabkan objek langsungnya memiliki ciri yang dirujuk oleh akar ajektivanya, terlepas dari apakah ciri tersebut sudah dimiliki sebelumnya ataupun belum. Selain klaim terkait ketidaksadaran penutur terhadap perbedaan makna dari kedua konstruksi tersebut, Sneddon et al [-@sneddon_indonesian_2010, hlm. 103] juga menambahkan bahwa terdapat pasangan verba kausatif *per-* dan *-kan* yang secara semantis tidak dapat saling menggantikan karena memiliki makna lazim yang berbeda. Salah satu contoh pasangan kata yang diberikan ialah *memperpanjang* dan *memanjangkan*. Dalam hal ini, *memperpanjang* dianggap hanya digunakan pada ranah temporal dan *memanjangkan* untuk ranah fisik.
Asumsi terkait pemahaman penutur atas kemiripan dan/atau perbedaan pasangan verba kausatif deajektiva dengan *per-* dan *-kan* bisa diuji, misalnya melalui experimen psikolinguistik. Namun, makalah ini mencoba merumuskan asumsi tersebut untuk terlebih dahulu dapat diuji melalui data pemakaian dalam korpus. Asumsinya ialah sebagai berikut.
> Apabila penutur dianggap tidak membedakan fungsi atau kontribusi semantis dari *per-* dan *-kan* terhadap verba kausatifnya (dengan akar ajektiva yang sama), maka data korpus seharusnya tidak menunjukkan perbedaan pemakaian dari verba tersebut; perihal "pemakaian" dapat dirumuskan, salah satunya, melalui pola kolokasi ketika verba tersebut digunakan dalam korpus [@hoffmann_collostructional_2013; @gries_extending_2004; @herbst_collostructional_2014]. Dengan kata lain, jika *membesarkan* dan *memperbesar* dianggap tidak berbeda secara semantis, seharusnya kedua kata tersebut dapat saling menggantikan dan memiliki pola kolokasi yang sama.
Rumusan asumsi di atas berpijak pada pendekatan **semantik distribusional** [lihat @lenci_distributional_2008 untuk pengantar] yang menyatakan bahwa (i) makna suatu unsur linguistik (mis. kata) dapat dicirikan berdasarkan konteks pemakaiannya (mis. kolokasi) [@gries_extending_2004, hlm. 100], dan (ii) perbedaan makna antara dua atau lebih kata tercermin dalam perbedaan distribusi konteks kata tersebut. Sebagai contoh permulaan, asumsi tersebut akan diujikan pada pasangan kata *membesarkan* dan *memperbesar* menggunakan salah satu metode linguistik korpus kuantitatif, yaitu **Analisis Koleksem Khas** atau *Distinctive Collexeme Analysis* (DCA) [@gries_extending_2004; @chapelle_corpus_2013] ([§\@ref(dcaintro)](#dcaintro)).
Berdasarkan analisis korpus kuantitatif dengan DCA ([§\@ref(results)](#results)), penulis menunjukkan bukti awal adanya perbedaan semantis substansial di antara salah satu pasangan verba kausatif berkonstruksi [*per-* + AJ] dan [AJ + *-kan*]. Penulis juga berpendapat bahwa koleksem khas dari *memperbesar* dan *membesarkan* mencerminkan dua konseptualisasi metaforis berbeda yang melandasi makna dominan dari kedua verba tersebut. Temuan ini dipandang dapat mendukung salah satu asumsi dari Sneddon et al [-@sneddon_indonesian_2010, hlm. 103] bahwa terdapat pasangan verba yang tidak dapat saling menggantikan.
# Data dan metode {#datametode}
## Berkas Korpus dan Pencarian Koleksem {#data}
Makalah ini menggunakan lima berkas korpus surat kabar daring ([Tabel \@ref(tab:corpus-text-size)](#corpus-text-size)) yang menjadi bagian dari Korpus Leipzig Bahasa Indonesia [@biemann_leipzig_2007]. Kelima korpus ini secara keseluruhan berjumlah `r prettyNum(sum(leipzig_size$Size), big.mark = ",")` juta kata.
```{r corpus-text-size}
leipzig_size$Size_print <- prettyNum(leipzig_size$Size_print, big.mark = ",")
leipzig_size %>%
select(`Berkas korpus` = Corpus,
`Jumlah kata` = Size_print) %>%
knitr::kable(caption = "Berkas korpus Leipzig yang digunakan beserta ukurannya.")
```
Pencarian koleksem dilakukan menggunakan piranti pemrograman R [@rcore_2018], khususnya melalui fungsi `colloc_leipzig()`, yang terdapat dalam modul `collogetr` [@rajeg_collogetr_2018]. Koleksem untuk *memperbesar* dan *membesarkan* dibatasi pada lingkup satu kata di sebelah kanan kedua verba tersebut (atau disebut dengan koleksem R1). Pilihan ini dilandasi dengan dua asumsi. Pertama, satu kata yang tepat mengikuti verba transitif tersebut diasumsikan sebagai objek langsungnya. Kedua, objek langsung yang secara kuantitatif khas mengikuti verba tersebut dipandang sebagai salah satu konteks penting guna mencirikan perbedaan semantis kedua verba transitif tersebut (§[\@ref(dcaintro)](#dcaintro)); makalah ini akan menunjukkan bagaimana pencirian semantis berbasis koleksem tersebut dapat dibahas secara kualitatif (§[\@ref(results)](#results)).
## Analisis Koleksem Khas {#dcaintro}
Analisis Koleksem Khas (DCA) merupakan salah satu ragam dari gugusan metode linguistik korpus kuantitatif yang disebut Analisis Kolostruksional (*Collostructional Analysis*^[Unsur *collostruction* pada *Collostructional Analysis* (CA) merupakan perpaduan antara kata *collocation* dan *construction* [@stefanowitsch_collostructions_2003]. CA ialah salah satu metode lazim dalam kajian yang dilandasi pendekatan konstruksional, seperti Tatabahasa Konstruksi (*Construction Grammar*) [@hoffmann_collostructional_2013].], selanjutnya CA) [@stefanowitsch_collostructions_2003; @hoffmann_collostructional_2013; @herbst_collostructional_2014]. DCA dikembangkan untuk mengkaji perbedaan dua konstruksi, yang mirip secara semantis/fungsional, berdasarkan unsur leksikal (disebut **koleksem**) yang memiliki keterkaitan khas secara statistik terhadap satu dari kedua konstruksi tersebut. Sebagai contoh, DCA dapat digunakan untuk membedakan konstruksi Datif Preposisional dengan Ditransitif; konstruksi *Will + infinitive* dengan *be going to + infinitive*; atau konstruksi Aktif dengan Pasif [@gries_extending_2004; lihat juga @hoffmann_collostructional_2013, hlm. 302-303, untuk rentangan terkini penerapan CA secara umum]. Penerapan DCA pada data Bahasa Indonesia khususnya telah mencakup kajian interaksi antara metafora dan sinonim emosi [@rajeg_happyr_2018; @rajeg_metaphorical_2014; @rajeg_collostructional_2016] dan konstruksi negasi dengan *tak* dan *tidak* [@rajeg_working_2018].
Makalah ini bertujuan melihat potensi DCA untuk menemukan perbedaan pemakaian sepasang verba pencontohan dua konstruksi kausatif morfologis pada BI, yaitu [*per-* + AJ] dan [AJ + *-kan*], yang perbedaan maknanya tidak diperhatikan oleh kebanyakan penutur BI (periksa §[\@ref(intro)](#intro)). Analisis statistik dalam DCA didasari dengan tabulasi kekerapan dua dimensi seperti pada [Tabel \@ref(tab:xtab-greater)](#xtab-greater), yang mencontohkan distribusi nomina *jumlah* sebagai koleksem R1 untuk *memperbesar* dan *membesarkan* dalam kelima berkas korpus pada [Tabel \@ref(tab:corpus-text-size) di atas](#corpus-text-size).
```{r dca-tb, eval = TRUE}
# process into dca input table and perform dca
fye <- function(a, b, c, d, alt) {
# get into crosstabulation format
crosstab <- rbind(c(a, b), c(c, d))
# FYE computation
fye_pval <- fisher.test(crosstab, alternative = alt)$p.value
return(fye_pval)
}
rounding <- 2
rawdata <- filter(colloc_out, !w %in% stoplist)
dca_tb <- rawdata %>%
count(w, node) %>%
spread(node, n, fill = 0)
cxnsum <- colSums(dca_tb[,-1])
collsum <- rowSums(dca_tb[,-1])
dca_tb <- dca_tb %>%
mutate(c = cxnsum[1] - dca_tb[[2]],
d = cxnsum[2] - dca_tb[[3]],
collsum,
tokens = sum(cxnsum),
a_exp = round((cxnsum[1] * collsum)/tokens, digits = rounding),
b_exp = round((cxnsum[2] * collsum)/tokens, digits = rounding),
cxnsum_a = cxnsum[1],
cxnsum_b = cxnsum[2],
alt = "two.sided",
alt = if_else(dca_tb[[2]] > a_exp, "greater", alt),
alt = if_else(dca_tb[[2]] < a_exp, "less", alt))
fye_args <- list(a = dca_tb[[2]],
b = dca_tb[[3]],
c = dca_tb[["c"]],
d = dca_tb[["d"]],
alt = dca_tb[["alt"]])
# perform FYE test and convert into distinctiveness scores
dca_tb <- dca_tb %>%
mutate(pfye = pmap_dbl(fye_args, fye),
collstr = if_else(dca_tb[[2]] > a_exp, -log10(pfye), -log10(pfye)),
collstr = round(collstr, digits = rounding))
```
```{r xtab-greater}
tb <- as.data.frame(subset(dca_tb, w == "jumlah", -w))
a <- tb[, "memperbesar"]
b <- tb[, "membesarkan"]
c <- tb[, "d"]
d <- tb[, "c"]
mtx <- matrix(c(a, b, c, d), nrow = 2, byrow = TRUE, dimnames = list(koleksem = c("*jumlah*", "*¬jumlah*"), verba = c("*memperbesar*", "*membesarkan*")))
mtxsum <- addmargins(mtx)
attr(mtxsum, "dimnames")[[1]][3] <- "Total"
attr(mtxsum, "dimnames")[[2]][3] <- "Total"
mtxexp <- suppressWarnings(round(chisq.test(mtx)$expected, digits = 2))
obs_exp <- paste(mtx, " (", mtxexp, ")", sep = "")
mtxsum[c(1:2, 4:5)] <- obs_exp
mtxsum[1,1] <- gsub("^(\\d+)", "**\\1**", mtxsum[1,1], perl = TRUE)
knitr::kable(mtxsum, caption = 'Tabulasi silang dua dimensional sebagai masukan DCA^[Tanda "`¬`" pada baris "*¬jumlah*" menyatakan kekerapan koleksem **selain** *jumlah*.]')
```
Nilai dalam kurung `"(...)"` merupakan kekerapan harapan (*expected frequency*) untuk tiap-tiap sel apabila diasumsikan bahwa suatu koleksem memiliki rasio distribusi yang setara untuk kedua konstruksi. Sedangkan nilai yang tidak dikurung ialah nilai pengamatan dalam korpus. Nilai harapan masing-masing sel diperoleh dengan mengalikan jumlah total kolom dan baris yang dibagi dengan nilai total tabel (yang ada di pojok kanan bawah). Misalnya, penghitungan nilai harapan untuk sel *jumlah* dan *membesarkan* ialah (`r colSums(mtx)[2]` $\cdot$ `r rowSums(mtx)[1]`)/`r sum(mtx)` = `r round((colSums(mtx)[2] * rowSums(mtx)[1])/sum(mtx), digits = 2)`.
CA mengukur nilai keterkaitan, yang diistilahkan dengan Kadar Kekhasan (*Distinctiveness*), antara suatu koleksem dan salah satu dari kedua konstruksi berdasarkan *p~one-tailed~-value* dari uji signifikansi statistik *Fisher-Yates Exact* (FYE) yang kemudian diubah menjadi nilai log negatif 10 [@chapelle_corpus_2013]. Sel yang diperhatikan dari masukan tabel seperti pada [Tabel \@ref(tab:xtab-greater)](#xtab-greater) ialah pertemuan antara baris dan kolom pertama, yaitu sel *a* (ditebalkan pada [Tabel \@ref(tab:xtab-greater)](#xtab-greater)). Perbandingan dilakukan terkait apakah nilai sel *a* muncul lebih sering atau jarang dari yang diharapkan karena ini akan menentukan (i) parameter terkait uji FYE yang dilakukan, serta (ii) arah asosiasi (positif/khas atau negatif/tertolak) antara koleksem (baris) dan salah satu dari dua konstruksi yang dikaji (kolom). Berikut ini adalah kode untuk melakukan FYE melalui R. Data masukannya ialah empat sel (selain nilai Total) pada [Tabel \@ref(tab:xtab-greater)](#xtab-greater); mengingat sel *a*-nya lebih tinggi dari yang diharapkan, parameter `alternative` pada fungsi `fisher.test()` di bawah diberi masukan `"greater"`.
```{r fishertest-greater, echo = TRUE}
# buat matrix tabulasi silang dengan 4 sel (Tabel 2)
xtab <- matrix(c(9, 1, 408, 305), nrow = 2, byrow = TRUE)
# One-tailed FYE dengan `alternative` = "greater",
# lalu ambil `p.value`
p_fye <- fisher.test(xtab, alternative = "greater")$p.value
# Tampilkan nilai `p.value`
p_fye
# Ubah `p.value` menjadi kadar kekhasan
# dengan negative log10
collstr <- -log10(p_fye)
round(collstr, digits = 2)
# Kode ALTERNATIF menggunakan `dhyper()` (Gries, 2013)----
# Penghitungan p~FYE~ bila sel *a* lebih besar dari harapan:
p_fye <- sum(dhyper(9:10, 417, 306, 10))
p_fye
# Ubah `p.value` menjadi kadar kekhasan
collstr <- -log10(p_fye)
round(collstr, digits = 2)
```
Tingkat signifikansi keterkaitan antara suatu koleksem dengan satu dari kedua konstruksi umumnya dibatasi pada *p*~FYE~ < 0.05, yang menghasilkan Kadar Kekhasan (`collstr`) > 1.30103 jika diubah menjadi nilai log negative 10. Koleksem yang (secara signifikan) muncul lebih sering dari yang diharapkan dengan salah satu dari kedua konstruksi tersebut (dan yang otomatis membuat koleksem tersebut [secara signifikan] muncul lebih sedikit dari yang diharapkan dengan konstruksi yang lain) diistilahkan dengan **koleksem khas (signifikan)** untuk konstruksi tersebut. Untuk [Tabel \@ref(tab:xtab-greater)](#xtab-greater), nilai *p*~FYE~ ialah `r round(p_fye, digits = 3)` (lebih kecil dari 0.05) dan memiliki `collstr` = `r round(collstr, digits = 2)`. Luaran FYE tersebut, dan perbandingan kekerapan pengamatan dengan yang diharapkan, menunjukkan bahwa *jumlah* merupakan koleksem R1 khas signifikan untuk *memperbesar* tapi tidak untuk *membesarkan*.
```{r fishertest-less, echo = FALSE, include = FALSE}
# Buat matrix tabulasi silang dengan 4 sel
xtab_less <- matrix(c(1, 6, 416, 300), nrow = 2, byrow = TRUE)
# One-tailed FYE dengan parameter `alternative` = "greater",
# lalu ambil `p.value`
p_fye_less <- fisher.test(xtab_less, alternative = "less")$p.value
# ubah `p.value` menjadi kadar kekhasan
collstr_less <- -log10(p_fye_less)
round(collstr_less, digits = 2)
```
Keterkaitan sebaliknya ditunjukkan oleh *PAN* (salah satu partai politik di Indonesia) pada [Tabel \@ref(tab:xtab-less) berikut](#xtab-less) yang memiliki asosiasi positif dengan *membesarkan* (collstr~*membesarkan*~ = `r round(collstr_less, digits = 2)`; *p*~FYE~ = `r round(p_fye_less, digits = 3)`) tapi tidak dengan *memperbesar*, yang muncul dengan *PAN* lebih sedikit dari yang diharapkan.
```{r xtab-less}
tb <- as.data.frame(subset(dca_tb, w == "pan", -w))
a <- tb[, "memperbesar"]
b <- tb[, "membesarkan"]
c <- tb[, "d"]
d <- tb[, "c"]
mtx_less <- matrix(c(a, b, c, d), nrow = 2, byrow = TRUE, dimnames = list(koleksem = c("*PAN*", "*¬PAN*"), verba = c("*memperbesar*", "*membesarkan*")))
mtxsum <- addmargins(mtx_less)
attr(mtxsum, "dimnames")[[1]][3] <- "Total"
attr(mtxsum, "dimnames")[[2]][3] <- "Total"
mtxexp <- suppressWarnings(round(chisq.test(mtx_less)$expected, digits = 2))
obs_exp <- paste(mtx_less, " (", mtxexp, ")", sep = "")
mtxsum[c(1:2, 4:5)] <- obs_exp
mtxsum[1,1] <- gsub("^(\\d+)", "**\\1**", mtxsum[1,1], perl = TRUE)
knitr::kable(mtxsum, caption = "Tabulasi silang bila sel *a* lebih kecil dari harapan")
```
Apabila nilai pengamatan pada sel *a* lebih kecil dari yang diharapkan seperti pada [Tabel \@ref(tab:xtab-less)](#xtab-less), parameter `alternative` dalam uji statistik FYE di R diberi masukan `"less"`. Perhatikan nukilan kode R berikut.
```{r fishertest-less-print, echo = TRUE}
# Buat matrix tabulasi silang dengan 4 sel (Tabel 3)
xtab_less <- matrix(c(1, 6, 416, 300), nrow = 2, byrow = TRUE)
# One-tailed FYE dengan parameter `alternative` = "less",
# lalu ambil `p.value`
p_fye_less <- fisher.test(xtab_less, alternative = "less")$p.value
# Tampilkan nilai `p.value`
p_fye_less
# Ubah `p.value` menjadi kadar kekhasan
# dengan negative log10
collstr_less <- -log10(p_fye_less)
round(collstr_less, digits = 2)
# Kode ALTERNATIF menggunakan `dhyper()` (Gries, 2013)----
# Penghitungan p~FYE~ bila sel *a* lebih kecil dari harapan:
p_fye_less <- sum(dhyper(0:1, 417, 306, 7))
p_fye_less
# Ubah `p.value` menjadi kadar kekhasan
collstr_less <- -log10(p_fye_less)
round(collstr_less, digits = 2)
```
Penghitungan yang sama dapat dilakukan untuk semua koleksem R1 yang muncul paling tidak satu kali dengan *memperbesar* atau *membesarkan*. Kemudian, koleksem ini dapat diurutkan berdasarkan Kadar Kekhasan terhadap satu dari kedua verba tersebut. Daftar koleksem khas ini menjadi data pemakaian empiris guna menafsirkan pencirian dan perbedaan semantis kedua konstruksi tersebut (§[\@ref(results)](#results)). Data dan berkas *R Markdown Notebook*, yang digunakan untuk menulis makalah ini dan berisikan kode pemrograman R untuk semua analisis kuantitatif, dapat diunduh melalui dua tautan berikut: https://github.com/gederajeg/analisis_koleksem_khas atau https://doi.org/10.26180/5bf4e49ea1582.
# Hasil dan pembahasan {#results}
[Tabel \@ref(tab:dist-kan)](#dist-kan) menampilkan koleksem R1 khas yang secara signifikan lebih sering muncul dengan *membesarkan* dibandingkan dengan *memperbesar*; nilai dalam kurung adalah kekerapan harapan.
```{r dist-kan}
distout_kan <- filter(dca_tb, dca_tb[[2]] > a_exp, collstr > 1.30103) %>%
select(1, 3, b_exp, 2, a_exp, collstr) %>%
arrange(desc(collstr))
distout_kan[[4]] <- paste(distout_kan[[4]], " (", distout_kan$a_exp, ")", sep = "")
distout_kan[[2]] <- paste(distout_kan[[2]], " (", distout_kan$b_exp, ")", sep = "")
distout_kan <- select(distout_kan, -a_exp, -b_exp)
org_sem_collstr <-
colnames(distout_kan)[1] <- "koleksem"
knitr::kable(distout_kan, caption = "Koleksem R1 khas signifikan untuk *membesarkan* dibandingkan dengan *memperbesar*", row.names = TRUE)
```
Jika diamati dari segi distribusi ketigabelas koleksem khas signifikan pada [Tabel \@ref(tab:dist-kan)](#dist-kan), tampak jelas bahwa hanya *PAN* yang juga muncul satu kali dengan *memperbesar*. Koleksem lainnya sama sekali tidak pernah muncul sebagai koleksem R1 dari *memperbesar*. Hal ini sedikitnya mengindikasikan perbedaan substantial mengenai pemakaian dan pilihan pola kolokasi di antara *membesarkan* dan *memperbesar*.
Secara semantis, tampak bahwa koleksem R1 khas untuk *membesarkan* didominasi oleh nomina yang merujuk pada konsep organisasi (seperti *partai*, *organisasi*, *NU*), khususnya partai politik (*PKB*, *PAN*, *PKS*).
(@partai) "Kami siap *membesarkan __Partai__* Demokrat di tahun 2014." (ind_news_2011_300K:116578)
Berdasarkan tipe koleksem organisasi ini, dan juga koleksem *nama* dan *namanya* (@namanya), verba *membesarkan* secara dominan (dalam korpus dan data yang dikaji) menyampaikan makna metaforis 'membuat sesuatu memiliki posisi penting'. Makna ini dilandasi dengan metafora konseptual <span style = "font-variant:small-caps;">penting adalah besar</span> [@lakoff_metaphors_1980, hlm. 50]. Metafora ini juga dicerminkan oleh ungkapan seperti *nama/partai __besar__*, *hari __raya__*, *hari __besar__ keagamaan*.
(@namanya) Sementara itu, terkait band Garasi yang telah *membesarkan __namanya__*, ia mengatakan [....] (ind_news_2011_300K:241163)
Makna metaforis lain yang diungkap berdasarkan koleksem pada [Tabel \@ref(tab:dist-kan)](#dist-kan) berkaitan dengan emosi (*membesarkan __hati__*) dan merawat anak (*membesarkan __anak__[__-anak__[__nya__]]*). Distribusi koleksem serta ciri semantis berbeda dimiliki oleh *memperbesar*, seperti ditunjukkan pada [Tabel \@ref(tab:dist-per)](#dist-per).
```{r dist-per}
distout_per <- filter(dca_tb, dca_tb[[3]] > a_exp, collstr > 1.30103) %>%
select(1, 3, b_exp, 2, a_exp, collstr) %>%
arrange(desc(collstr))
distout_per[[4]] <- paste(distout_per[[4]], " (", distout_per$a_exp, ")", sep = "")
distout_per[[2]] <- paste(distout_per[[2]], " (", distout_per$b_exp, ")", sep = "")
distout_per <- select(distout_per, -a_exp, -b_exp)
knitr::kable(distout_per, caption = "Koleksem R1 khas signifikan untuk *memperbesar* dibandingkan dengan *membesarkan*", row.names = TRUE)
```
Salah satu temuan yang menarik dari [Tabel \@ref(tab:dist-per)](#dist-per) ialah hampir sebagian besar koleksem R1 khas signifikan untuk *memperbesar* juga tidak pernah muncul dengan *membesarkan*, kecuali *jumlah*, yang hanya muncul satu kali. Hal ini kembali menunjukkan ketimpangan distribusi di antara kedua verba tersebut seperti pada [Tabel \@ref(tab:dist-kan) sebelumnya](#dist-kan).
Temuan menarik selanjutnya adalah tipe semantis dari koleksem khas *memperbesar* mencerminkan motivasi metafora konseptual yang berbeda terkait makna yang diungkap oleh *memperbesar* dibandingkan dengan *membesarkan*. Penulis berpendapat bahwa koleksem khas *memperbesar* tersebut mengisyaratkan makna 'peningkatan kuantitas' dari entitas yang diacu oleh koleksemnya. Makna ini tampak dilandasi oleh metafora konseptual <span style = "font-variant:small-caps;">kuantitas adalah ukuran</span>, khususnya <span style = "font-variant:small-caps;">lebih (banyak) adalah besar</span>, yang juga tercermin dalam ungkapan *makan __besar__*, *diskon __besar-besaran__* [periksa @borkent_creativity_2013 untuk kajian eksperimental terhadap metafora <span style = "font-variant:small-caps;">lebih (banyak) adalah besar</span>]. Sebaliknya, konsep 'penting' atau 'signifikansi' yang diacu oleh *membesarkan* sebelumnya dapat dikatakan terpusat pada unsur 'kualitas' (mis. ketenaran) yang dimiliki oleh objek langsungnya (mis. suatu partai atau seseorang).
# Penutup {#conclusion}
Makalah ini berangkat dari salah satu klaim yang diajukan oleh Sneddon et al. [-@sneddon_indonesian_2010, hlm. 103] bahwa kebanyakan penutur BI tidak begitu memperhatikan perbedaan semantis antara dua verba kausatif deajektiva berdasarkan konstruksi morfologis *per-* dan *-kan* (§[\@ref(intro)](#intro)). Dengan merumuskan asumsi tersebut berdasarkan pendekatan linguistik korpus dan semantik distribusional, makalah ini memperkenalkan Analisis Koleksem Khas (*Distinctive Collexeme Analysis* [*DCA*]) (§[\@ref(dcaintro)](#dcaintro)) sebagai salah satu metode kuantitatif untuk menguji asumsi tersebut berdasarkan data koleksem dari verba *membesarkan* dan *memperbesar*; koleksem yang difokuskan ialah satu kata yang mengikuti (atau di sebelah kanan) verba tersebut dalam korpus (koleksem R1) (§[\@ref(data)](#data)).
Luaran DCA menunjukkan perbedaan substansial di antara *membesarkan* dan *memperbesar*, baik dari segi distribusi maupaun tipe semantis koleksem khasnya yang berkontribusi terhadap perbedaan semantis kedua verba tersebut (§[\@ref(results)](#results)). Secara khusus, penulis berpendapat bahwa koleksem R1 khas untuk *membesarkan* dan *memperbesar* mencerminkan dua motivasi metafora konseptual berbeda yang mencirikan makna dominan masing-masing verba tersebut: (i) <span style = "font-variant:small-caps;">penting adalah besar</span> untuk *membesarkan* dan (ii) <span style = "font-variant:small-caps;">kuantitas adalah ukuran</span> dan <span style = "font-variant:small-caps;">lebih (banyak) adalah besar</span> untuk *memperbesar*. Hasil DCA untuk kedua verba ini menunjukkan bahwa klaim terkait kemiripan semantis antara pasangan verba kausatif berakar sama dengan konstruksi [*per-* + AJ] dan [AJ + *-kan*] belum bisa dipertahankan, setidaknya berdasarkan data korpus dan untuk verba dengan akar kata *besar*. Di sisi lain, temuan ini mendukung asumsi bahwa terdapat pasangan verba deajektiva dengan *per-* dan *-kan* yang tidak dapat saling menggantikan secara semantis [@sneddon_indonesian_2010, hlm. 103].
Namun, sedikitnya terdapat dua hal yang mesti diperhatikan dari temuan ini. Pertama, hasil analisis makalah ini sangat terbatas pada (i) kata berakar *besar*, (ii) bentuk verba dalam diatesis aktif, (iii) rentang koleksem yang dikaji, serta (iv) ukuran dan jenis teks dalam korpus yang menjadi sumber data. Kedua, asumsi yang belum dapat dibuktikan melalui temuan korpus ini ialah representasi kognitif sejumlah pasangan verba deajektiva dengan *per-* dan *-kan* dalam minda penutur, yang bisa diuji melalui eksperimen psikolinguistik: apakah pengetahuan koleksem khas, khususnya untuk *memperbesar* dan *membesarkan* (beserta pasangan verba lainnya), juga menjadi bagian dari khasanah kebahasaan penutur BI? [periksa @gries_converging_2005 sebagai contoh kajian awal yang memadukan temuan Analisis Kolostruksional dengan hasil eksperimen] Kajian linguistik korpus kuantitatif menggunakan DCA (i) sedikitnya membantu menemukenali perbedaan dan batasan semantis di antara dua bentuk linguistik, yang dianggap memiliki kemiripan makna, dan (ii) menghasilkan suatu hipotesis berdasarkan data pemakaian (*usage-based data*) yang dapat diujikan dengan metode berbeda (mis. eksperimen psikolinguistik).
# Daftar pustaka {-}