PaWI: Parallel Weighted Itemset Mining by means of MapReduce

Tipo di pubblicazione: Articolo in atti di convegno
Tipologia MIUR: Contributo in Atti di Convegno (Proceeding) > Contributo in atti di convegno
Titolo: PaWI: Parallel Weighted Itemset Mining by means of MapReduce
Autori: Baralis, Elena; Cagliero, Luca; Garza, Paolo; Grimaudo, Luigi
Autori di ateneo:
Intervallo pagine: pp. 25-32
Tipo di referee: Esperti anonimi
Editore: IEEE Computer Society
ISBN: 978-1-4673-7278-7
Volume: Proceedings of the 2015 IEEE International Congress on Big Data
Titolo del convegno: 2015 IEEE International Congress on Big Data
Luogo dell'evento: New York (USA)
Data dell'evento: 26-30 giugno 2015
Luogo di pubblicazione: Piscataway (NJ)
Abstract: Frequent itemset mining is an exploratory data mining technique that has fruitfully been exploited to extract recurrent co-occurrences between data items. Since in many application contexts items are enriched with weights denoting their relative importance in the analyzed data, pushing item weights into the itemset mining process, i.e., mining weighted itemsets rather than traditional itemsets, is an appealing research direction. Although many efficient in-memory weighted itemset mining algorithms are available in literature, there is a lack of parallel and distributed solutions which are able to scale towards Big Weighted Data. This paper presents a scalable frequent weighted itemset mining algorithm based on the MapReduce paradigm. To demonstrate its actionability and scalability, the proposed algorithm was tested on a real Big dataset collecting approximately 34 millions of reviews of Amazon items. Weights indicate the ratings given by users to the purchased items. The mined itemsets represent combinations of items that were frequently bought together with an overall rating above average
Data: 2015
Status: Pubblicato
Lingua della pubblicazione: Inglese
Parole chiave: clustering, classification, and association rules, data mining
Dipartimenti (originale): DAUIN - Dipartimento di Automatica Informatica
Dipartimenti: DAUIN - Dipartimento di Automatica e Informatica
URL correlate:
Area disciplinare: Area 09 - Ingegneria industriale e dell'informazione > SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Data di deposito: 14 Apr 2016 15:34
Data ultima modifica (IRIS): 14 Apr 2016 13:34:50
Data inserimento (PORTO): 31 Ago 2017 03:05
Numero Identificativo (DOI): 10.1109/BigDataCongress.2015.14
Permalink: http://porto.polito.it/id/eprint/2639847
Link resolver URL: Link resolver link
Citazioni:

Il campo presenta il numero di citazioni presenti sulle banche dati Scopus e Web of Science e permette di accedere ai relativi record. Visualizza inoltre il link al record presente su Google Scholar.

Possono verificarsi discrepanze rispetto ai dati presenti sulle banche dati per i seguenti motivi:

  • Differenze tra i dati riportati su IRIS e quelli presenti nelle banche dati.
  • Il numero di citazioni riportate su PORTO viene estratto mensilmente. Il dato citazionale presente sulle singole banche dati è aggiornato in tempo reale
  • Il numero di citazioni per WoS viene calcolato sulla base delle collezioni in abbonamento (Science citation index Expanded e Conference Proceedings Citation Index)

Per informazioni o segnalazioni contattare scrivia/porto

+
-

Allegati

[img]
Preview
PDF (PaWI.pdf) - Postprint
Accesso al documento: Visibile (Ad accesso aperto)
Licenza: Pubblico - Tutti i diritti riservati.

Download (111Kb (114392 bytes)) | Preview
[img] PDF (07207198.pdf) - Postprint
Accesso al documento: Non visibile (accessibile solo al proprietario del dato)
Licenza: Non pubblico - Accesso privato / Ristretto.

Download (186Kb (191314 bytes)) | Spedisci una richiesta all'autore per una copia del documento

Azioni (richiesto il login)

Visualizza il documento (riservato amministratori) Visualizza il documento (riservato amministratori)

Statistiche sul Download degli allegati

Altre statistiche su questa pubblicazione...