-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy paththesis.tex
266 lines (218 loc) · 8.3 KB
/
thesis.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
%CLASSE DOCUMENTO - LINGUA E DIMENSIONE FONT
\documentclass[11pt,twoside]{toptesi}
%cucitura
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% INCLUSIONE PACCHETTI
%s\usepackage{fullpage}
\usepackage{graphicx}
\usepackage[pagestyles]{titlesec}
\usepackage[flushleft,justification=centering]{caption}
\usepackage{setspace}
\usepackage[utf8]{inputenc} %utf8 % lettere accentate da tastiera
\usepackage[italian]{babel} % lingua del documento
\usepackage[T1]{fontenc} % codifica dei font
\usepackage{blindtext}
\usepackage{graphicx,wrapfig}
\usepackage{graphbox}
\usepackage[export]{adjustbox}
\usepackage{booktabs}
\usepackage[table,xcdraw]{xcolor}
\usepackage{lmodern}
\usepackage{varioref}
\usepackage{url}
\usepackage{array}
\usepackage{paralist}{\obeyspaces\global\let =\space}
\usepackage{verbatim}
\usepackage[caption=false]{subfig}
\usepackage{tabularx}
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{float}
\usepackage{amssymb}
\usepackage{multicol}
\usepackage{multirow}
\usepackage{color}
\usepackage{multirow}
\usepackage{listings}
\usepackage[pass]{geometry}
\usepackage[figuresright]{rotating}
\usepackage{algorithm}
\usepackage{algorithmic}
\usepackage{amsmath}
\usepackage[babel]{csquotes}
\usepackage{hyperref}
\usepackage[backend=bibtex,sorting=none, backref=true]{biblatex}
\usepackage{array}
\usepackage{nameref}
\usepackage{numprint}
\usepackage{microtype}
%\newcommand{\cellavuota}{\multicolumn{1}{c|}{}}
%\newcommand{\centra}[1]{\begin{center}#1\end{center} }
\newcommand{\setfont}[1]{\fontfamily{iwona}\selectfont \scshape #1}
\hyphenation{algo-rithms}
\DeclareMathOperator{\mean}{E}
\DeclareMathOperator{\variance}{Var}
\DeclareMathOperator{\mse}{MSE}
\DeclareMathOperator{\rmse}{RMSE}
\newcolumntype{P}[1]{>{\centering\arraybackslash}p{#1}}
\makeatletter
\def\thickhline{%
\noalign{\ifnum0=`}\fi\hrule \@height \thickarrayrulewidth \futurelet
\reserved@a\@xthickhline}
\def\@xthickhline{\ifx\reserved@a\thickhline
\vskip\doublerulesep
\vskip-\thickarrayrulewidth
\fi
\ifnum0=`{\fi}}
\makeatother
\newlength{\thickarrayrulewidth}
\setlength{\thickarrayrulewidth}{4\arrayrulewidth}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% CONFIGURAZIONE LINK E RIFERIMENTI
\hypersetup{%
pdfpagemode={UseOutlines},
bookmarksopen,
pdfstartview={FitH},
colorlinks,
linkcolor={black}, %COLORE DEI RIFERIMENTI AL TESTO
citecolor={black}, %COLORE DEI RIFERIMENTI ALLE CITAZIONI
urlcolor={black} %COLORI DEGLI URL
}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% CONFIGURAZIONE LISTATI/CODICE - CANCELLARE SE NON NECESSARIO
% PYTHON - BIANCO E NERO
\lstset{%
captionpos=b,
language=Python,
basicstyle =\small\ttfamily,
keywordstyle=\color{black}\bfseries,
breaklines=true,
breakatwhitespace=true,
frame=lines,
numbers=left,
numberstyle=\footnotesize,
}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% FRENCHSPACING VA _SEMPRE_ ABILITATO PER DOCUMENTI IN ITALIANO
\frenchspacing
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%DEFINIZIONE SEZIONI IN NUMERAZIONE ROMANA
%ELENCO DEI LISTATI/CODICI
\makeatletter
\newcommand\listofcodes{%
\iffrontmatter\else\frontmattertrue\fi
\if@openright\cleardoublepage\else\clearpage\fi
% change the meaning of \chapter in a group
\begingroup\def\chapter##1{\@schapter}
\phantomsection % for the hyperlink
\lstlistoflistings
\endgroup
}
\makeatother
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% INFORMAZIONI PDF - PERSONALIZZARE
\pdfinfo{%
/Title (Reti neurali per l’apprendimento dei tratti della personalità dal linguaggio naturale)
/Author (Giorgia Adorni)
/Subject (Laura Informatica)
/Keywords (Tesi)
}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% LISTA DEI CAPITOLI DA INCLUDERE - PERSONALIZZARE
\includeonly{%
frontespizio,%
abstract,%
introduzione,%
contesto, %
neural_network,%
formulazione,
esperimenti,
conclusioni,
%app_a,%
}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% FILE DI BIBLIOGRAFIA
\bibliography{bibliography}
% INIZIO DOCUMENTO
\begin{document}
% FRONTESPIZIO
\include{frontespizio}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%INTERLINEA - DEFAULT 1 - NON ESAGERATE, NON SUPERATE MAI 1.3 ;)
%\interlinea{1.2}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\frontmatter
% DEDICA
% VSPACE - PROPORZIONE USATA PER CENTRATURA VERTICALE DEL TESTO
% FLUSHRIGHT - ALLINEAMENTO ORIZZONTALE A DESTRA
\vspace*{\stretch{1}}
\begin{flushright}
\noindent
\textit{A mio padre, per il suo sostegno quotidiano.}\\
\textit{Ad Elia, per tutto il supporto e l'amore dimostrato.} \\
\end{flushright}
\vspace*{\stretch{6}}
\cleardoublepage
% CITAZIONE
% VSPACE - PROPORZIONE USATA PER CENTRATURA VERTICALE DEL TESTO
% FLUSHRIGHT - ALLINEAMENTO ORIZZONTALE A DESTRA
%\vspace*{\stretch{1}}
%\begin{flushright}
%\noindent
%Citatemi dicendo che sono stato citato male.
%\textit{Groucho Marx}
%\end{flushright}
%
%\vspace*{\stretch{6}}
%\cleardoublepage
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% RINGRAZIAMENTI - PERSONALIZZARE
\ringraziamenti
Grazie al mio relatore Fabio Stella, per avermi trasmesso la sua passione e per avermi fornito gli strumenti necessari per intraprendere questo percorso.\\
Grazie ai ragazzi del Laboratorio MAD (Models and Algorithms for Data \& Text Mining), per tutti i loro consigli.
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% ABSTRACT - PERSONALIZZARE
\sommario
La personalità è considerata come uno degli argomenti di ricerca più influenti in psicologia poiché predittiva di molti esiti consequenziali come la salute mentale e fisica, ed è in grado di spiegare il comportamento umano.
Grazie alla diffusione dei Social Network come mezzo di comunicazione, sta diventando sempre più importante sviluppare modelli che possano leggere automaticamente e con precisione l'essenza di individui basandosi esclusivamente sulla scrittura.
\\
In particolare, la convergenza tra scienze sociali e informatiche ha portato i ricercatori a sviluppare approcci automatici per estrarre e studiare le informazioni ''nascoste'' nei dati testuali presenti in rete.
La natura di questo progetto di tesi è altamente sperimentale, e la motivazione alla base di questo lavoro è presentare delle analisi dettagliate sull'argomento, in quanto allo stato attuale non esistono importanti indagini che si basino interamente su testo in linguaggio naturale.
\\
L'obiettivo è identificare un adeguato spazio semantico che permetta di definire sia la personalità dell'oggetto a cui un determinato testo si riferisce, sia quella dell'autore. Punto di partenza è un dizionario di aggettivi che la letteratura psicologica definisce come \emph{marker} dei cinque grandi tratti di personalità, i Big Five.
\\
In questo lavoro siamo partiti dall'implementazione di reti neurali fully-connected come base per capire come modelli semplici di Deep Learning possano fornire informazioni sulle caratteristiche nascoste della personalità.
\\
Infine, utilizziamo una classe di algoritmi distribuzionali inventati nel 2013 da \emph{Tomas Mikolov}, che consistono nell'utilizzo di una rete neurale convoluzionale in grado di imparare, in modo non supervisionato, i contesti delle parole.
In questo modo costruiamo un embedding in cui sono contenute le informazioni semantiche del testo, ottenendo una sorta di “geometria del significato” in cui i concetti sono tradotti in relazioni lineari.
Con quest'ultimo esperimento ipotizziamo che uno stile di scrittura individuale sia in gran parte accoppiato con i tratti della sua personalità.
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% INDICI
% INDICE GENERALE
\tableofcontents
% INDICE DELLE FIGURE
\listoffigures
% INDICE DELLE TABELLE
\listoftables
% INDICE DEI CODICI
%\listofcodes
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\introduzione
\input{introduzione}
% INCLUSIONE FILE CAPITOLI - TENERE COERENTE CON LISTA IN ALTO
\mainmatter
%\include{introduzione}
\include{contesto}
\include{neural_network}
\include{formulazione}
\include{esperimenti}
\include{conclusioni}
%\appendix
%% INCLUSIONE APPENDICI -
%\include{app_a}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% BIBLIOGRAFIA
\printbibliography
\addcontentsline{toc}{chapter}{\refname}
%\nocite{*}
\end{document}