Title
ASR and TTS telecommunications applications in Japan
Abstract
Ce papier commence par décrire les nouvelles directions d'applications aux télécommunications de la reconnaissance automatique de la parole et de la synthèse vocale à partir du texte au Japon. Les applications de la reconnaissance automatique de la parole se focalisent sur les services publics tels que l'automatisation du travail des opérateurs, l'assistance aux opérateurs, la commande vocale des serveurs d'information, et la numérotation vocale. Les applications majeures de la synthèse vocale incluent les services d'information par la voix et la lecture des messages électroniques (e-mail). On estime que l'utilisation de la reconnaissance de la parole et de la synthèse vocale à partir du texte va fortement augmenter dans un avenir proche avec la pénétration des terminaux téléphoniques mobiles et des portables, en particulier dans des domaines comme la diffusion de textes et la communication numérique. Deuxièmement, ce papier décrit le paramètrage expérimental du système vocal interactif de NTT qui comporte (1) une reconnaissance de la parole hautement performante en mode indépendant du locuteur et grand vocabulaire, basée sur une modélisation par HMM des phonèmes en contexte dont les paramètres sont appris sur des données parole provenant de plus de 10 000 locuteurs et collectées à travers le réseau téléphonique, (2) une synthèse de parole à partir du texte de haute qualité qui génère de la parole en concaténant des segments de signal représentant des triphones, (3) une configuration logicielle qui ne demande aucune architecture matérielle spécifique autre qu'un PC équipé d'une carte son et d'un modem vocal, (4) un prototypage facile et rapide qui permet à l'utilisateur de construire un système en écrivant certains types de scénarios du service.
Year
DOI
Venue
1997
10.1016/S0167-6393(97)00044-7
Speech Communication
Keywords
Field
DocType
speech recognition,text-to-speech,tts telecommunications application,telecommunication applications,voice interaction,information retrieval,type of service,text to speech,context dependent
Rapid prototyping,Telephone network,Broadcasting,Speech processing,Speech synthesis,Telecommunications,Computer science,Speech recognition,Automation,Software,Hidden Markov model
Journal
Volume
Issue
ISSN
23
1-2
Speech Communication
Citations 
PageRank 
References 
3
0.46
3
Authors
12
Name
Order
Citations
PageRank
Mikio Kitai131.14
Kazuo Hakoda2245.07
Shigeki Sagayama31217137.97
Tomokazu Yamada4135.00
Hajime Tsukada544929.46
Satoshi Takahashi630.46
Yoshiaki Noda7102.17
Jun-ichi Takahashi8304.22
Yuki Yoshida930.46
Kazuhiro Arai10253.54
Takashi Imoto11191.56
Tomohisa Hirokawa12469.64