Quality of Word Embeddings on Sentiment Analysis Tasks

Tipo di pubblicazione: Articolo in atti di convegno
Tipologia MIUR: Contributo in Atti di Convegno (Proceeding) > Contributo in atti di convegno
Titolo: Quality of Word Embeddings on Sentiment Analysis Tasks
Autori: Çano, Erion; Morisio, Maurizio;
Autori di ateneo:
Intervallo pagine: pp. 332-338
Tipo di referee: Esperti anonimi
Editore: Springer International Publishing
ISBN: 978-3-319-59569-6
Volume: 10260
Titolo del convegno: NLDB 2017 22nd International Conference on Natural Language & Information Systems
Luogo dell'evento: Liege, Belgium
Data dell'evento: 21 - 23 June 2017
Luogo di pubblicazione: Berlino
Abstract: Word embeddings or distributed representations of words are being used in various applications like machine translation, sentiment analysis, topic identification etc. Quality of word embeddings and performance of their applications depends on several factors like training method, corpus size and relevance etc. In this study we compare performance of a dozen of pretrained word embedding models on lyrics sentiment analysis and movie review polarity tasks. According to our results, Twitter Tweets is the best on lyrics sentiment analysis, whereas Google News and Common Crawl are the top performers on movie polarity analysis. Glove trained models slightly outrun those trained with Skipgram. Also, factors like topic relevance and size of corpus significantly impact the quality of the models. When medium or large-sized text sets are available, obtaining word embeddings from same training dataset is usually the best choice.
Data: 2017
Status: Pubblicato
Lingua della pubblicazione: Inglese
Parole chiave: word embeddings, lyrics mood analysis, movie review polarity, movie review polarity, word embeddings, lyrics mood analysis, word embeddings, lyrics mood analysis, movie review polarity, lyrics mood analysis, movie review polarity, word embeddings
Dipartimenti (originale): DAUIN - Dipartimento di Automatica Informatica
Dipartimenti: DAUIN - Dipartimento di Automatica e Informatica
URL correlate:
Area disciplinare: Area 09 - Ingegneria industriale e dell'informazione > SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Data di deposito: 02 Apr 2017 14:34
Data ultima modifica (IRIS): 09 Nov 2017 12:07:20
Data inserimento (PORTO): 15 Nov 2017 08:50
Numero Identificativo (DOI): 10.1007/978-3-319-59569-6_42
Permalink: http://porto.polito.it/id/eprint/2668229
Link resolver URL: Link resolver link
Citazioni:

Il campo presenta il numero di citazioni presenti sulle banche dati Scopus e Web of Science e permette di accedere ai relativi record. Visualizza inoltre il link al record presente su Google Scholar.

Possono verificarsi discrepanze rispetto ai dati presenti sulle banche dati per i seguenti motivi:

  • Differenze tra i dati riportati su IRIS e quelli presenti nelle banche dati.
  • Il numero di citazioni riportate su PORTO viene estratto mensilmente. Il dato citazionale presente sulle singole banche dati è aggiornato in tempo reale
  • Il numero di citazioni per WoS viene calcolato sulla base delle collezioni in abbonamento (Science citation index Expanded e Conference Proceedings Citation Index)

Per informazioni o segnalazioni contattare scrivia/porto

+
-

Allegati

[img]
Preview
PDF (ErionCanoWordEmbNLDB2017.pdf) - Postprint
Accesso al documento: Visibile (Ad accesso aperto)
Licenza: Pubblico - Tutti i diritti riservati.

Download (461Kb (472467 bytes)) | Preview

Azioni (richiesto il login)

Visualizza il documento (riservato amministratori) Visualizza il documento (riservato amministratori)

Statistiche sul Download degli allegati

Altre statistiche su questa pubblicazione...