![]() |
Spraakherkenning
Ik vraag mij af hoe ver de spraaktechnologie tegenwoordig staat. Ik vermoed dat bij live-uitzendingen op tv (sport bvb) de teletekst rechtstreeks uit de spraak wordt afgeleid. Werkt deze software ook in een wat rumoerige omgeving ? En vooral : tegen wanneer mogen we appraatjes verwachten die op een scherm(pje) tonen wat er gezegd wordt in de omgeving van de microfoon (een mooi hulpmiddel voor slechthorenden/doven, en voor normaal horenden in een lawaaiierige buurt) ?
|
Met deze techniek wordt al velen jaren mee geexpimenteerd, maar de onderzoekers komen toch niet verder dan apparaten/computers die maar hooguit enkele woorden of klanken kunnen 'herkennen', en dan mogen er ook nog geen omgevingsgeluiden of frequentie verschillen zijn. Veel GSM telefoons hebben ook een soort spraak herkenning om telefoonnummers te kiezen, maar werkt niet altijd even goed, en is bovendien ook gevoelig voor omgevingsgeluiden. :o
|
Tegenwoordig heeft Word een optie waarmee je kunt praten, en Word het intypt. Het probleem is dat het alleen werkt bij mensen met een zuiver Amerikaans accent en bovendien moet je de software enkele uren "trainen". Het is dan ook niet verwonderlijk dat er flink veel onzin uitkwam toen ik het probeerde. Overigens is de maximale effciëntie van deze software op dit moment zo'n 95% per woord, dus één op de 20 woorden zal sowieso fout zijn.
|
ik had een telefoon, waarbij je de naam van iemand moest opnoemen, om hem op te bellen. In 90% van de gevallen was het ook de juiste persoon.
Maar het lijkt me wel handig ( of juist onhandig :p ), maar we worden zo wel erg lui...en er zijn al zoveel dikke mensen. |
Maar de 'spraak herkenning' op telefoons is heel wat anders dan daadwerkelijke spraak herkenning. Bij telefoons is het gewoon welke van de opgeslagen geluiden het meest lijkt. In het andere geval moet het geluid ontleed worden in de afzonderlijke klanken en die weer naar letters en lettergrepen wat een stuk lastiger is.
Een eventueel apparaat dat in een rumoerige omgeving beter werkt dat een mensen oor is vrijwel onmogelijk, het apparaat ontvangt immers dezelfde storing als je oren. |
In een rumoerige omgeving werkt spraakherkenning moeilijker, omdat er dan natuurlijk meer achtergrondruis is. Wat een spraakherkenner namelijk ongeveer doet is geluid omzetten in bruikbare stukjes geluid, fonemen (http://www.vandale.nl/opzoeken/woord...ekwoord=foneem), en die vervolgens resp. testen op syntax, semantiek en verdere betekenis (in welke situatie wordt het gezegd, door wie, op welke toon, etc.). Dit gaat moeilijker als er veel ruis is, dan is er meer onduidelijkheid over de uitgesproken foneem, als het ware. Als een dergelijk systeem echter intelligent genoeg is, zal het vaker succesvol herkennen.
Er wordt veel gewerkt aan dit soort systemen, ook in Nederland, en het hele gebied is dus duidelijk aan het beteren. Momenteel zijn er nog beperkingen (woordenschat, stemgeluid, taal, achtergrondgeluid, overlap, turntaking, etc.), maar die moeten met slimmere systemen overbrugd worden. |
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
ivm de teletekst : Ik zie heel soms woorden staan zoals ze uitgesproken worden ipv geschreven, dus vandaar mijn misvatting. |
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Bij ons op school gebruiken dyslextische mensen als ze dat willen spraakherkenning. Eerst zijn er 6 middagen waarmee je dan leert het spraakherkenningsprogramma je stem kennen enzo.
Het schijnt goed te zijn omdat je werkstukken etc kan inspreken. Een oppaskindje van mij heeft het gedaan omdat ze dyslectisch was en ze zei dat het soms wel irritant was omdat je steeds "wordt wakker" en "ga slapen" moet zeggen om hem aan/uit te doen en dat hij dat soms niet pakt.. Maargoed ik vind het wel goed dat het er is :) |
Citaat:
Voorbeeld instromenten zeggen ipv. instrumenten. |
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Het is natuurlijk wel zo handig een spraakherkenner eerst te baseren op iemand die een bep. taal vloeiend spreekt, niet een of andere randdebiel die spastisch is, roggelt en alles door elkaar haalt. Die mensen zijn dan zeg maar de volgende stap.
|
Citaat:
|
Citaat:
|
Ik denk dat ik me ook eens ga bezig houden met een simpel spraakherkennertje te bouwen als ik tijd heb.
De Java Speech API lijkt me wel wat. |
Citaat:
|
Citaat:
|
Citaat:
komt er eigenlijk op neer dat je een signaal wiskundig bewerkt en ombouwd naar een frequentie spectrum. krijg je op de y-as de amplitude en op de x-as de verschillende frequenties. kan je precies zien welke frequenties in welke mate in je signaal voorkomen. erg handig |
Citaat:
Welnu, het grammaticale morfeem -d (soms ook -t, maar niet i. c. )wordt achter aan een ander, lexicaal morfeem, i. c. de werkwoorstam, gevoegd, en geeft aan, dikwijls in combinatie met het voor aangevoegde morfeem ge-, dat het proces dat de werkwoordstam denoteert, voltooid is. Het grammaticale morfeem -t daarentegen, dat eveneens achter aan zo'n stam gevoegd wordt, geeft aan, dat het proces dat die stam denoteert -ombouwen bv.- door een bepaalde grammaticale persoon (2e of 3e) op een bepaald grammaticaal tijdstip (de ott) verricht wordt. Dit probeerde jij, geloof ik, weer te geven. Zo heerlijk systematisch is taal. :D |
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
sd
|
Citaat:
Ze moeten ook maar zo''n mode benaming vaan bedenken voor mensen die te lam zijn om meer tijd in wiskunde te steken. |
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Citaat:
|
Dat je niet dyslectisch bent maakt je nog geen taalwonder. :D
|
Ik had maar 22 fouten in het Groot Dictee! :(
:D |
Dat je een taalwonder bent maakt je nog geen jofele knapert.
|
| Alle tijden zijn GMT +1. Het is nu 12:38. |
Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.