Pattern Set Mining with Schema-based Constraint

Tipo di pubblicazione: Articolo su rivista
Tipologia MIUR: Contributo su Rivista > Articolo in rivista
Titolo: Pattern Set Mining with Schema-based Constraint
Autori: Cagliero, Luca; Chiusano, Silvia; Garza, Paolo; Bruno, Giulia
Autori di ateneo:
Titolo del periodico: KNOWLEDGE-BASED SYSTEMS
Tipo di referee: Esperti anonimi
Editore: Elsevier
Volume: 84
Intervallo pagine: pp. 224-238
Numero di pagine: 15
ISSN: 0950-7051
Abstract: Pattern set mining entails discovering groups of frequent itemsets that represent potentially relevant knowledge. Global constraints are commonly enforced to focus the analysis on most interesting pattern sets. However, these constraints evaluate and select each pattern set individually based on its itemset characteristics. This paper extends traditional global constraints by proposing a novel constraint, called schema-based constraint, tailored to relational data. When coping with relational data itemsets consist of sets of items belonging to distinct data attributes, which constitute the itemset schema. The schema-based constraint allows us to effectively combine all the itemsets that are semantically correlated with each other into a unique pattern set, while filtering out those pattern sets covering a mixture of different data facets or giving a partial view of a single facet. Specifically, it selects all the pattern sets that are (i) composed only of frequent itemsets with the same schema and (ii) characterized by maximal size among those corresponding to that schema. Since existing approaches are unable to select one representative pattern set per schema in a single extraction, we propose a new Apriori-based algorithm to efficiently mine pattern sets satisfying the schema-based constraint. The experimental results achieved on both real and synthetic datasets demonstrate the efficiency and effectiveness of our approach
Data: 2015
Status: Pubblicato
Lingua della pubblicazione: Inglese
Parole chiave: data mining, itemset mining, pattern set mining
Dipartimenti (originale): DAUIN - Dipartimento di Automatica Informatica
DIGEP - Dipartimento di Ingegneria Gestionale e della Produzione
Dipartimenti: DIGEP - Dipartimento di Ingegneria Gestionale e della Produzione
DAUIN - Dipartimento di Automatica e Informatica
URL correlate:
Area disciplinare: Area 09 - Ingegneria industriale e dell'informazione > SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
Data di deposito: 28 Lug 2015 21:37
Data ultima modifica (IRIS): 05 Mag 2016 16:24:16
Data inserimento (PORTO): 07 Mag 2016 20:06
Numero Identificativo (DOI): 10.1016/j.knosys.2015.04.023
Permalink: http://porto.polito.it/id/eprint/2603982
Link resolver URL: Link resolver link
Citazioni:

Il campo presenta il numero di citazioni presenti sulle banche dati Scopus e Web of Science e permette di accedere ai relativi record. Visualizza inoltre il link al record presente su Google Scholar.

Possono verificarsi discrepanze rispetto ai dati presenti sulle banche dati per i seguenti motivi:

  • Differenze tra i dati riportati su IRIS e quelli presenti nelle banche dati.
  • Il numero di citazioni riportate su PORTO viene estratto mensilmente. Il dato citazionale presente sulle singole banche dati è aggiornato in tempo reale
  • Il numero di citazioni per WoS viene calcolato sulla base delle collezioni in abbonamento (Science citation index Expanded e Conference Proceedings Citation Index)

Per informazioni o segnalazioni contattare scrivia/porto

+
-

Allegati

[img]
Preview
PDF (group_contraints.pdf) - Preprint
Accesso al documento: Visibile (Ad accesso aperto)
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (322Kb (330285 bytes)) | Preview

Azioni (richiesto il login)

Visualizza il documento (riservato amministratori) Visualizza il documento (riservato amministratori)

Statistiche sul Download degli allegati

Altre statistiche su questa pubblicazione...