Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 21 reacties
Bron: Scientific American

Bij Scientific American is een artikel verschenen over speech synthesizing, oftewel de techniek waarbij een computer stukken tekst voorleest. Het stuk, dat geschreven is door twee onderzoekers bij IBM, bespreekt de techniek waarbij klanken aan elkaar geplakt worden door middel van opgenomen samples. De Engelse taal bevat 40 verschillende van deze klanken. De auteur gaat er onder andere op in hoe deze klanken aan elkaar gelijmd worden en hoe bepaald wordt waar de klemtoon ligt. Die klemtoon blijkt erg belangrijk voor de betekenis van zinnen, en op dit gebied is dan ook nog veel verbetering mogelijk:

SpraakherkenningThis sort of expressiveness is the biggest remaining challenge for technology like Supervoices, even though it already sounds astonishingly close to live human speech. After all, the software doesn't truly comprehend what it's saying, so it may lack subtle changes in speaking style that you'd expect from an eighth grader, who can interpret what he or she is reading. Given the limitless range of the human voice, we'll have our work cut out for us for a long time.
Moderatie-faq Wijzig weergave

Reacties (21)

Een spraak synthesizer waar ik zelf erg van onder de indruk ben is RealSpeak. Er is een on-line demo beschikbaar: http://www.scansoft.com/realspeak/demo/

Vooral de Vlaamse stem is erg vermakelijk. ;)

[edit] Oh ja. Je moet waarschijnlijk wel een aantal keren proberen voordat je er doorheen komt. De site is nogal populair volgens mij. :P
Dit is inderdaad een zeer goede spraaksynthesizer!!! :9~

De link die je krijgt bij het behoren is http://demo.lhsl.com/realspeak/speak.asp en die LHSL is volgens mij afkomstig van het failliet Lernhout en Hauspie.
dit is een erg mooie spraak synthesizer de stemmen zijn mooi duidelijk en de vlaamse is idd erg vermakelijk (bedankt voor de info)
oa IBM heeft al een hele tijd een zeer goede speech generator. Het lijkt me erg moeilijk om een betere engine te maken dan bijvoorbeeld deze:
http://www-3.ibm.com/able/hpr.html

Download maar eens een trial: http://www-3.ibm.com/able/hprreg3tr.html
Ik heb die trial even geprobeerd, maar het klinkt nog altijd het zelfde als mijn Commodore Amiga eind jaren tachtig.
Mijn andere post in deze thread verwijst naar een speech engine die écht realistisch klinkt.
Naar mijn inziens moet deze technologie niet alleen worden doorgevoerd op het perfectioneren van het spraakmechanisme, maar ook op een vorm van AI. En dan AI in die zin, dat de reader context gevoelig is. Vooral bij ports naar andere talen zoals het nederlands lijkt me dit noodzakelijk.

Uit het originele artikel:
For example, we've developed systems that can "read" a breaking news story or a bunch of e-mail messages aloud over the phone.
In de nederlandse taal wordt veel gebruik gemaakt van engelse woorden, zoals in "Ik ben een tweaker".
Een correcte uitspraak van het woord "tweaker" is noodzakelijk om iets van de zin te begrijpen als het wordt uitgesproken door een computer. De speech software zou bijvoorbeeld in een dictionary kunnen opzoeken of een bepaald woord engels of nederlands is en aan de hand daarvan een correcte uitspraak produceren. Maar wat als deze software een e-mail moet voorlezen waarin het woord "lamp" voorkomt? "lamp" is een zowel nederlands als engels woord. De software moet gebaseerd op, in welke context in het bericht zich dit woord bevind, een correcte uitspraak produceren. Als het programma dit niet onderzoekt, weet het niet of "lamp" uitgesproken moet worden als "lamp" (nederlands) of "lemp" (engels).

Daarom denk ik dat het nog wel een tijdje duurd voordat bijv. blinde nederlanders breaking news stories kunnen krijgen voorgelezen door een machine.
Intonatie meegeven aan synthesized voices lijkt een beetje op het probleem van spraakherkenning:

"What is that on the road ahead?"

"What is that on the road, a head?"

't is een klein verschil, maar een hele andere betekenis :)
wel leuk dacht ik zo...
kan wellicht een toepassing worden voor slechtziende mensen....

hup.. boek laden in de PC en "lezen" maar...

misschien ook makkelijk als er dan een soort zakcomputertje voor komt?
Zo'n programma bestaat allang hoor voor blinde en / of slechtziende mensen! Zelfs in Windoos XP zit al zoiets (Narrator) maar die heeft maar 1 monotone intonatie. Die Text To Speech Syntesizer is dacht ik van het inmiddels failliete Lernout&Hauspie...

Wel een goede ontwikkelling dat er nu gewerkt wordt aan intonatie, maar het werkt dus nog steeds dmv samples...

Ik zie liever de ontwikkelling dat de computer echt helemaal zelf alles uitrekend zonder dat er een mensen stem vantevoren aan te pas komt.

De ontwikkelling van nu zie ik meer als de evolutie van midi-software synth naar midi-wavetable synth... Nu op naar de volgende evolutie! :)
een Digi-cam... met tekst herkenning en die software erop... dat is pas een ideale uikomst!
voor enkele pagina's wellicht...

tenzij je alle delen van LOTR wilt ehm.. inscannen/fotograferen....
ben je uren mee bezig.. :?

nee, dan kun je beter een e-book downloaden en 'm door die speech synthesizer knallen.. 8-)
offtopic:
Laat iemand dit al eens gedaan hebben! :)
Een hoorspel van de BBC, op 14 CeeDees. 8-)
En dat al in 1981... Zonder gebruik van e-books.
Krijg je der ook zo'n vrouw bij :D
Ja, maar die headset moet je er appart bijkopen. :D
Ik ben zelf meer fan van AT&T's Natural Voices
http://www.naturalvoices.com/

Je kunt wat demo's beluisteren, maar ook zelf eigen teksten :)
Ook mooi voor vrijgezellen, toch nog iemand die op een realistiche manier 'I love you' tegen ze kan zeggen :Y)
Ik vind het ook een mooie ontwikkeling, maar er moet nog wel ene hoop gebeuren idd. De AI moet idd kijken in welke taal hij iets moet uitspreken en de klemtonen moet ie beter zetten.

Maar volgens mij moet er ook rekening gehouden worden met spelfouten. De techniek om achter te komen welke woordEN er mischien bedoeld zijn met het foutgespelde woord is niet zo moeilijk (bijv 'Word'), maar om automatisch de goeie eruit te kiezen die bij het context past wel.
Mag KPN ook wel gaan gebruiken met hun SMS-naar voice computer...

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True