Speaker recognition by means of Deep Belief Networks

Tipo di pubblicazione: Articolo in atti di convegno
Tipologia MIUR: Contributo in Atti di Convegno (Proceeding) > Contributo in atti di convegno
Titolo: Speaker recognition by means of Deep Belief Networks
Autori: Vasilakakis V., Cumani S., Laface P.
Autori di ateneo:
Tipo di referee: Esperti anonimi
Editore: BBfor2
Titolo del convegno: Biometric Technologies in Forensic Science
Luogo dell'evento: Nijmegen
Data dell'evento: 14-15 October 2013
Rilevanza dell'evento: Internazionale
Luogo di pubblicazione: Nijmegen
Abstract: Most state-of-the-art speaker recognition systems are based on Gaussian Mixture Models (GMMs), where a speech segment is represented by a compact representation, referred to as "identity vector" (ivector for short), extracted by means of Factor Analysis. The main advantage of this representation is that the problem of intersession variability is deferred to a second stage, dealing with low-dimensional vectors rather than with the high-dimensional space of the GMM means. In this paper, we propose to use as a pseudo-ivector extractor a Deep Belief Network (DBN) architecture, trained with the utterances of several hundred speakers. In this approach, the DBN performs a non-linear transformation of the input features, which produces the probability that an output unit is on, given the input features. We model the distribution of the output units, given an utterance, by a reduced set of parameters that embed the speaker characteristics. Tested on the dataset exploited for training the systems that have been used for the NIST 2012 Speaker Recognition Evaluation, this approach shows promising results
Data: 2013
Status: Pubblicato
Lingua della pubblicazione: Inglese
Parole chiave: speaker recognition, neural networks
Dipartimenti (originale): DAUIN - Dipartimento di Automatica Informatica
Dipartimenti: DAUIN - Dipartimento di Automatica e Informatica
URL correlate:
    Area disciplinare: Area 09 - Ingegneria industriale e dell'informazione > SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI
    Data di deposito: 31 Ott 2013 16:54
    Data ultima modifica (IRIS): 09 Gen 2015 13:08:56
    Data inserimento (PORTO): 22 Gen 2015 22:35
    Permalink: http://porto.polito.it/id/eprint/2518972
    Link resolver URL: Link resolver link

    Allegati

    [img]
    Preview
    PDF (BTFS_2013) - Postprint
    Accesso al documento: Visibile (Ad accesso aperto)
    Licenza: Pubblico - Tutti i diritti riservati.

    Download (298Kb (305577 bytes)) | Preview

    Azioni (richiesto il login)

    Visualizza il documento (riservato amministratori) Visualizza il documento (riservato amministratori)

    Statistiche sul Download degli allegati

    Altre statistiche su questa pubblicazione...