Title
The Kth Speech Database
Abstract
De grandes bases de données sont nécessaires pour tester des modèles de production et de perception à différents niveaux linguistiques. La gestion de telles bases de données pose d'importants problèmes à la fois pour étiqueter le signal de parole et pour accéder au matériel stocké. De manière à simplifier certains de ces problèmes, nous avons créé un système d'analyse de la parole. Les signaux de parole sont archivés dans des fichiers de la taille d'une phrase. Ces fichiers sont segmentés et transcrits de manière semi-automatique à partir d'une transcription phonétique de la phrase. La transcription est générée par les règles lettres-sons de notre système de conversion texte-parole. La base de données est plutôt orientée vers la recherche de type acoustico-phonétique que, par exemple, vers l'évaluation de systèmes de reconnaissance. L'accent a donc été mis sur la souplesse et la spécification linguistique des requêtes de recherche dans la base de données. Dans notre solution — inhabituelle — à ce problème, nous utilisons pour l'accès aux données la structure de nos règles de synthèse qui est similaire aux notations de la phonologie générative. Grâce à une formulation sous forme de règles, on peut identifier facilement les segments de parole satisfaisant certaines conditions relatives au contexte. On peut recueillir directement des informations sur la durée durant la recherche dans la base de données. Des programmes d'analyse spectrale utilisant une variété de représentations spectrales sont également disponibles. Ils permettent d'afficher des résultats sous forme de spectres moyens ou liés à l'écart-type ou sous forme d'histogrammes de contour.
Year
DOI
Venue
1990
10.1016/0167-6393(90)90013-Y
SPEECH COMMUNICATION
Keywords
Field
DocType
labelling,database,text-to-speech,corpora,segmentation,text to speech
Speech corpus,Histogram,Phonetic transcription,Computer science,Utterance,Natural language processing,Artificial intelligence,Speech synthesis,Speech analytics,Audio mining,Speech recognition,Phonology,Database
Journal
Volume
Issue
ISSN
9
4
0167-6393
Citations 
PageRank 
References 
2
2.13
1
Authors
3
Name
Order
Citations
PageRank
Rolf Carlson119272.90
Björn Granström2374108.67
Lennart Nord35029.13