Sintesi vocale
La sintesi vocale (in inglese speech synthesis) è la tecnica per la riproduzione artificiale della voce umana. Un sistema usato per questo scopo è detto sintetizzatore vocale e può essere realizzato tramite software o via hardware. I sistemi di sintesi vocale sono noti anche come sistemi text-to-speech (TTS) (in italiano: da testo a voce) per la loro possibilità di convertire il testo in parlato. Esistono inoltre sistemi in grado di convertire simboli fonetici in parlato .
La sintesi vocale... —
| approfondisci »
Sintesi vocale cinese
La sintesi vocale cinese è l'applicazione delle tecniche di sintesi vocale alla lingua cinese, o più propriamente al cinese mandarino standard.
Rispetto alla sintesi vocale degli altri linguaggi, l'applicazione alla lingua cinese comporta una serie di difficoltà aggiuntive legate alla determinazione della corretta pronuncia dei caratteri cinesi, che è pesantemente dipendente dal contesto; alla complessità della prosodia, essenziale per veicolare il significato corretto; e in alcuni casi anche... —
| approfondisci »
Homer Dudley
Bibliografia
Voci correlate
• Sintesi vocale
Collegamenti esterni
... —
| approfondisci »
SSML
Lo Speech Synthesis Markup Language (SSML) (in inglese: linguaggio di markup per la sintesi vocale) è un linguaggio di markup basato su XML e orientato ai sistemi di conversione del testo in parlato, per controllarne e ottimizzarne la resa. Il linguaggio è stato specificato dal gruppo di studio "Voice browser" del World Wide Web Consortium (W3C) e trova frequente applicazioni in script di tipo VoiceXML per sistemi di telefonia interattiva automatizzata. Viene impiegato inoltre per la... —
| approfondisci »
Festival (informatica)
Festival è un software di sintesi vocale, sviluppato presso il " Centre for Speech Technology Research" dell'università di Edimburgo. Viene distribuito liberamente sia per scopi commerciali che personali ed è disponibile per parecchi sistemi operativi tra cui:
Collegamenti esterni
• Sito ufficiale
... —
| approfondisci »
Espeak
Espeak è un programma di Sintesi vocale utilizzato in un ampio spettro di applicazioni, soprattutto in ambiente Linux.
In ambiente Windows si interfaccia al sistema tramite le chiamate di sistema Sapi5. In tale ambiente viene anche distribuito assieme allo screen reader per non vedenti NVDA.
La qualità della sintesi attualmente è sensibilmente peggiore rispetto a quella offerta da IBM con Via Voice e dai prodotti della ditta italiana Loquendo, soprattutto per la lingua italiana.
È... —
| approfondisci »
Riconoscimento vocale
40% dei costi di manodopera e più del 45% degli errori nelle operazioni del magazzino).
Standardizzazione
Il W3C ha definito degli standard per le tecnologie vocali, che sono il VoiceXML (a dicembre 2007, alla versione 2.1) e il CCXML. Per la specifica di grammatiche vocali ha introdotto Speech Recognition Grammar Specification, per la sintesi vocale SSML 1.0 (Speech Synthesis Markup Language), per la pronuncia PLS 1.0 (Pronunciation Lexicon Specification), per l'interpretazione semantica dei... —
| approfondisci »
Pronunciation Lexicon Specification
Pronunciation Lexicon Specification o PLS (Specifica del lessico di pronuncia) è una raccomandazione del World Wide Web Consortium (W3C) indirizzata alle applicazioni di sintesi vocale.
La raccomandazione, attualmente alla versione 1.0, ha raggiunto il suo stato finale con la pubblicazione ufficiale il 14 ottobre 2008.
Caratteristiche
Il termine lessico di pronuncia indica la relazione di corrispondenza tra una parola o una breve frase, la sua forma scritta e la sua pronuncia. La... —
| approfondisci »
MBROLA
MBROLA è un algoritmo di sintesi vocale, in particolare si tratta di un software sviluppato su un progetto collaborativo a livello mondiale e distribuito gratuitamente ma nel solo formato binario. Il sito web del progetto MBROLA http://tcts.fpms.ac.be/synthesis/mbrola.html mette a disposizione database di difoni per la sintesi vocale in un numero considerevole di lingue diverse.
Va osservato comunque che per tutti i linguaggi supportati il software MBROLA non è un sistema text-to-speech... —
| approfondisci »
PSOLA
PSOLA (acronimo di Pitch-Synchronous Overlap and Add, sovrapposizione e aggiunta a toni sincroni) è un algoritmo usato nella sintesi vocale.
PSOLA, come MBROLA, si basa sui difoni, che sono le unità elementari del discorso che spaziano dal centro di una regione di suono stazionario al centro della regione successiva, ossia rappresentano la transizione da un suono all'altro. Secondo alcuni ricercatori, la classificazione delle transizioni tra suoni costituirebbe l'elemento chiave per il... —
| approfondisci »
Audiolibro
Un audiolibro è la registrazione audio di un libro letto ad alta voce da uno o più attori, uno speaker (un lettore) oppure da un motore di sintesi vocale. Il testo registrato può essere la versione integrale di un libro, un testo scritto appositamente per vivere esclusivamente come audiolibro, una riduzione o una sceneggiatura (originale o non) scritta appositamente per la registrazione audio. Gli audiolibri possono presentare anche musiche e ricostruzioni sonore (sound design), anche se... —
| approfondisci »
Nvda
NVDA, acronimo di NonVisual Desktop Access è uno Screen reader, per il sistema operativo Windows, distribuito con licenza GPL. Si tratta di un programma rivolto principalmente a non vedenti o ipovedenti gravi, sviluppato a partire dal 2006 su iniziativa del programmatore non vedente Michael Curran.
Il software legge tramite un programma di sintesi vocale, di default Espeak, ciò che compare su schermo.
Sono inoltre supportati tutti i sintetizzatori aderenti agli standard Sapi4 o Sapi5. Con... —
| approfondisci »