|
|
Tipo de Mídia:
Texto
|
|
Formato:
.pdf
|
Tamanho:
1,65
MB
|
|
|
|
|
|
|
|
|
|
|
|
|
Título: |
|
Técnicas eficientes de identificação automática de locutores |
Autor: |
|
Frederico Quadros D''almeida
|
Categoria: |
|
Teses e Dissertações |
Idioma: |
|
Português |
Instituição:/Parceiro |
|
[cp] Programas de Pós-graduação da CAPES
|
Instituição:/Programa |
|
UNB/ENGENHARIA ELÉTRICA |
Área Conhecimento |
|
ENGENHARIA ELÉTRICA |
Nível |
|
Doutorado
|
Ano da Tese |
|
2009 |
Acessos: |
|
728 |
Resumo |
|
Os sistemas de identificação automática de locutor têm despertado crescente interesse cien-tífico atualmente. A aplicação de novas formas de modelagem da voz dos locutores tem melhorado de modo significativo a robustez desses sistemas a ruído; tornando sua aplicação prática viável em situações reais nas quais não se dispõe de áudio de boa qualidade. Contudo; essa crescente qualidade na modelagem e a consequente melhora no desempenho dos sistemas de identificação têm promovido; como efeito colateral; o aumento no custo computacional das tarefas de identificação. Em muitas situações; seja pelo grande número de locutores a serem testados; seja pela necessidade de uma resposta rápida do sistema; esse custo elevado torna proibitiva a aplicação efetiva das ferramentas de identificação automática de locutor.
Neste trabalho são propostas; implementadas; avaliadas e validadas novas técnicas que buscam reduzir significativamente o custo computacional associado a tarefas de identifica-ção automática de locutores sem; contudo; afetar o desempenho do sistema no que concer-ne às taxas de identificações corretas.
Os métodos apresentados exploram características próprias dos modelos multicondicionais de mistura de gaussianas (GMM Gaussian Mixture Models); modelagem comumente aplicada nos sistemas de identificação de locutores robustos a variações na qualidade do áudio questionado. O foco principal das novas técnicas apresentadas é reduzir o número de componentes gaussianas a serem calculadas no processo de identificação; o que possibilita a consequente redução do custo computacional.
Os resultados obtidos com as técnicas introduzidas neste trabalho demonstram que é possí-vel obter reduções superiores a 90% no custo computacional das tarefas de identificação de locutores sem afetar o desempenho do sistema. |
|
|
|
|
|
|
|
|
|