Scalable out-of-core itemset mining

Tipo di pubblicazione: Articolo su rivista
Tipologia MIUR: Contributo su Rivista > Articolo in rivista
Titolo: Scalable out-of-core itemset mining
Autori: Baralis, Elena; Cerquitelli, Tania; Chiusano, Silvia; Grand, Alberto
Autori di ateneo:
Titolo del periodico: INFORMATION SCIENCES
Tipo di referee: Esperti anonimi
Editore: Elsevier
Volume: 293
Intervallo pagine: pp. 146-162
Numero di pagine: 17
ISSN: 0020-0255
Abstract: Itemset mining looks for correlations among data items in large transactional datasets. Traditional in-core mining algorithms do not scale well with huge data volumes, and are hindered by critical issues such as long execution times due to massive memory swap and main-memory exhaustion. This work is aimed at overcoming the scalability issues of existing in-core algorithms by improving their memory usage. A persistent structure, VLDBMine, to compactly store huge transactional datasets on disk and efficiently support large-scale itemset mining is proposed. VLDBMine provides a compact and complete representation of the data, by exploiting two different data structures suitable for diverse data distributions, and includes an appropriate indexing structure, allowing selective data retrieval. Experimental validation, performed on both real and synthetic datasets, shows the compactness of the VLDBMine data structure and the efficiency and scalability on large datasets of the mining algorithms supported by it
Data: 2015
Status: Pubblicato
Lingua della pubblicazione: Inglese
Parole chiave: data mining, large-scale itemset mining, disk-based data structures
Dipartimenti (originale): DAUIN - Dipartimento di Automatica Informatica
Dipartimenti: DAUIN - Dipartimento di Automatica e Informatica
URL correlate:
Area disciplinare: Area 09 - Ingegneria industriale e dell'informazione > SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Data di deposito: 15 Apr 2016 17:29
Data ultima modifica (IRIS): 09 Mag 2016 16:16:49
Data inserimento (PORTO): 11 Mag 2016 03:42
Numero Identificativo (DOI): 10.1016/j.ins.2014.08.073
Permalink: http://porto.polito.it/id/eprint/2562339
Link resolver URL: Link resolver link
Citazioni:

Il campo presenta il numero di citazioni presenti sulle banche dati Scopus e Web of Science e permette di accedere ai relativi record. Visualizza inoltre il link al record presente su Google Scholar.

Possono verificarsi discrepanze rispetto ai dati presenti sulle banche dati per i seguenti motivi:

  • Differenze tra i dati riportati su IRIS e quelli presenti nelle banche dati.
  • Il numero di citazioni riportate su PORTO viene estratto mensilmente. Il dato citazionale presente sulle singole banche dati è aggiornato in tempo reale
  • Il numero di citazioni per WoS viene calcolato sulla base delle collezioni in abbonamento (Science citation index Expanded e Conference Proceedings Citation Index)

Per informazioni o segnalazioni contattare scrivia/porto

+
-

Allegati

[img] PDF (1_s2.0_S0020025514009098_Cerquitelli_etAl.pdf) - Postprint
Accesso al documento: Non visibile (accessibile solo al proprietario del dato)
Licenza: Non pubblico - Accesso privato / Ristretto.

Download (1024Kb (1049154 bytes)) | Spedisci una richiesta all'autore per una copia del documento

Azioni (richiesto il login)

Visualizza il documento (riservato amministratori) Visualizza il documento (riservato amministratori)