Neural networks for learning personality traits from natural language

Giorgia Adorni

arXiv:2302.13782·cs.CL·February 28, 2023

Neural networks for learning personality traits from natural language

Giorgia Adorni

PDF

Open Access

TL;DR

This paper explores using neural networks and distributional algorithms to automatically infer personality traits from natural language texts, aiming to uncover hidden psychological information through semantic embeddings.

Contribution

It introduces a novel approach combining neural networks and word context algorithms to analyze personality traits from textual data, filling a gap in existing research.

Findings

01

Neural networks can extract meaningful personality-related features from text.

02

Semantic embeddings reveal relationships between language use and personality.

03

Style and personality traits are closely linked in textual data.

Abstract

Personality is considered one of the most influential research topics in psychology, as it predicts many consequential outcomes such as mental and physical health and explains human behaviour. With the widespread use of social networks as a means of communication, it is becoming increasingly important to develop models that can automatically and accurately read the essence of individuals based solely on their writing. In particular, the convergence of social and computer sciences has led researchers to develop automatic approaches for extracting and studying "hidden" information in textual data on the internet. The nature of this thesis project is highly experimental, and the motivation behind this work is to present detailed analyses on the topic, as currently there are no significant investigations of this kind. The objective is to identify an adequate semantic space that allows for…

Peer Reviews

No public reviews on file for this paper yet. If you reviewed it on a platform where reviews are public (OpenReview, ICLR, NeurIPS, ICML), you can paste yours below so the community can read it here.

Videos

No videos yet. Explain this paper in a talk, walkthrough, or lecture? Add one.

Taxonomy

TopicsAdvanced Text Analysis Techniques

Full text

**RETI NEURALI PER L’APPRENDIMENTO DEI TRATTI DELLA PERSONALITÀ DAL LINGUAGGIO NATURALE

**

[TABLE]

**Relazione della prova finale di:

**Giorgia Adorni

Matricola 806787

Anno Accademico 2017-2018

*A mio padre, per il suo sostegno quotidiano.

Ad Elia, per tutto il supporto e l’amore dimostrato.*

\ringraziamenti

Grazie al mio relatore Fabio Stella, per avermi trasmesso la sua passione e per avermi fornito gli strumenti necessari per intraprendere questo percorso.

Grazie ai ragazzi del Laboratorio MAD (Models and Algorithms for Data & Text Mining), per tutti i loro consigli.

\sommario

La personalità è considerata come uno degli argomenti di ricerca più influenti in psicologia poiché predittiva di molti esiti consequenziali come la salute mentale e fisica, ed è in grado di spiegare il comportamento umano. Grazie alla diffusione dei Social Network come mezzo di comunicazione, sta diventando sempre più importante sviluppare modelli che possano leggere automaticamente e con precisione l’essenza di individui basandosi esclusivamente sulla scrittura.

In particolare, la convergenza tra scienze sociali e informatiche ha portato i ricercatori a sviluppare approcci automatici per estrarre e studiare le informazioni ”nascoste” nei dati testuali presenti in rete. La natura di questo progetto di tesi è altamente sperimentale, e la motivazione alla base di questo lavoro è presentare delle analisi dettagliate sull’argomento, in quanto allo stato attuale non esistono importanti indagini che si basino interamente su testo in linguaggio naturale.

L’obiettivo è identificare un adeguato spazio semantico che permetta di definire sia la personalità dell’oggetto a cui un determinato testo si riferisce, sia quella dell’autore. Punto di partenza è un dizionario di aggettivi che la letteratura psicologica definisce come marker dei cinque grandi tratti di personalità, i Big Five.

In questo lavoro siamo partiti dall’implementazione di reti neurali fully-connected come base per capire come modelli semplici di Deep Learning possano fornire informazioni sulle caratteristiche nascoste della personalità.

Infine, utilizziamo una classe di algoritmi distribuzionali inventati nel 2013 da Tomas Mikolov, che consistono nell’utilizzo di una rete neurale convoluzionale in grado di imparare, in modo non supervisionato, i contesti delle parole. In questo modo costruiamo un embedding in cui sono contenute le informazioni semantiche del testo, ottenendo una sorta di “geometria del significato” in cui i concetti sono tradotti in relazioni lineari. Con quest’ultimo esperimento ipotizziamo che uno stile di scrittura individuale sia in gran parte accoppiato con i tratti della sua personalità.

\introduzione

La personalità è un fattore chiave che influenza le interazioni, i comportamenti e le emozioni delle persone. Al giorno d’oggi, essa viene considera come uno degli argomenti di ricerca più influenti in psicologia.

La crescente immersione negli ambienti digitali e la diffusione dei social network come mezzo di comunicazione, ha contribuito alla creazione di un enorme quantità di dati, anche chiamati Big Data, aprendo la necessità allo sviluppo di modelli automatici in grado di leggere con precisione l’essenza degli individui basandosi esclusivamente sulla scrittura.

L’esigenza di produrre analisi sempre più velocemente ha imposto lo sviluppo di metodi meccanici per selezionare e interpretare i dati, favorendo la ricerca nel campo dell’apprendimento automatico o Machine Learning [samuel1959some].

Nello specifico, il Data Mining è un approccio che consiste nell’individuazione d’informazioni significative tramite l’applicazione di algoritmi in grado di determinare le associazioni “nascoste” tra di esse [chakrabarti2006data, franklin2005elements].

Una sua forma particolare è il Text Mining, nell’ambito del quale si sono sviluppate metodologie che consentono ai computer di confrontarsi con il linguaggio umano, di elaborarlo e comprenderlo [tan1999text].

L’interesse nello studio delle informazioni digitali e le abilità necessarie per farlo non sempre coincidono tra gli scienziati sociali. Di conseguenza, tale ricerca viene generalmente affidata a scienziati e ingegneri informatici, facilitando la scoperta di modelli che non sarebbe possibile individuare ed offrendo l’opportunità di instaurare collaborazioni interdisciplinari.

La maggior parte degli attuali studi automatici di rilevamento della personalità si sono concentrati sulla teoria dei Big Five come quadro per studiare le caratteristiche intrinseche dell’essere umano [barrick1991big]. Secondo questo modello esistono cinque dimensioni fondamentali dei tratti, stabili nel tempo e condivisi a livello interculturale. Le cinque caratteristiche, note appunto come i “Grandi Cinque”, sono Openness (apertura all’esperienza), Conscientiousness (coscienziosità), Extraversion (estroversione), Agreeableness (gradevolezza), Neuroticism (nevroticismo), riconosciuti dall’acronimo OCEAN.

Sviluppare un modello accurato e aprire questa domanda di ricerca avrebbe implicazioni significative in diversi ambiti della sociologia, ma non solo.

Struttura della tesi

Di seguito si passano in rassegna gli argomenti affrontati capitolo per capitolo.

Nel capitolo LABEL:chap:contesto

vengono introdotti i concetti teorici alla base del lavoro, in particolare viene introdotta la teoria dei Big Five.

Nel capitolo LABEL:chap:RetiNeurali

si descrivono le principali tecniche di Deep Learning, in particolare soffermandosi sulle architetture adottate negli esperimenti.

Nel capitolo LABEL:chap:formulazione

viene definito il problema ed illustrati approcci e strumenti risolutivi.

Nel capitolo LABEL:chap:esperimenti

viene presentata una panoramica degli esperimenti effettuati e una relativa analisi dei risultati.

Nel capitolo LABEL:chap:conclusioni

vengono esposte le considerazioni finali.

Motivazioni

La natura di questo progetto di tesi è altamente sperimentale. Le motivazioni che hanno portato alla realizzazione di questo lavoro sono la presentazione di analisi dettagliate sull’argomento, in quanto allo stato attuale non esistono importanti indagini di questo tipo.

Contributi

I dati che verranno utilizzati per definire lo spazio semantico e testare la sua funzionalità sono messi a disposizione da Yelp Dataset Challenge, che contiene 5 200 000 recensioni relative a 174 000 attività commerciali di 11 aree metropolitane nel mondo.