Scholieren.com forum

Scholieren.com forum (https://forum.scholieren.com/index.php)
-   Levensbeschouwing & Filosofie (https://forum.scholieren.com/forumdisplay.php?f=90)
-   -   Spraakherkenning (https://forum.scholieren.com/showthread.php?t=1160474)

Gambokkur 20-04-2005 23:43

Spraakherkenning
 
Ik vraag mij af hoe ver de spraaktechnologie tegenwoordig staat. Ik vermoed dat bij live-uitzendingen op tv (sport bvb) de teletekst rechtstreeks uit de spraak wordt afgeleid. Werkt deze software ook in een wat rumoerige omgeving ? En vooral : tegen wanneer mogen we appraatjes verwachten die op een scherm(pje) tonen wat er gezegd wordt in de omgeving van de microfoon (een mooi hulpmiddel voor slechthorenden/doven, en voor normaal horenden in een lawaaiierige buurt) ?

Hakuna 21-04-2005 18:21

Met deze techniek wordt al velen jaren mee geexpimenteerd, maar de onderzoekers komen toch niet verder dan apparaten/computers die maar hooguit enkele woorden of klanken kunnen 'herkennen', en dan mogen er ook nog geen omgevingsgeluiden of frequentie verschillen zijn. Veel GSM telefoons hebben ook een soort spraak herkenning om telefoonnummers te kiezen, maar werkt niet altijd even goed, en is bovendien ook gevoelig voor omgevingsgeluiden. :o

Kazet Nagorra 21-04-2005 20:28

Tegenwoordig heeft Word een optie waarmee je kunt praten, en Word het intypt. Het probleem is dat het alleen werkt bij mensen met een zuiver Amerikaans accent en bovendien moet je de software enkele uren "trainen". Het is dan ook niet verwonderlijk dat er flink veel onzin uitkwam toen ik het probeerde. Overigens is de maximale effciëntie van deze software op dit moment zo'n 95% per woord, dus één op de 20 woorden zal sowieso fout zijn.

Love & Peace 21-04-2005 22:46

ik had een telefoon, waarbij je de naam van iemand moest opnoemen, om hem op te bellen. In 90% van de gevallen was het ook de juiste persoon.

Maar het lijkt me wel handig ( of juist onhandig :p ), maar we worden zo wel erg lui...en er zijn al zoveel dikke mensen.

GVR 21-04-2005 23:17

Maar de 'spraak herkenning' op telefoons is heel wat anders dan daadwerkelijke spraak herkenning. Bij telefoons is het gewoon welke van de opgeslagen geluiden het meest lijkt. In het andere geval moet het geluid ontleed worden in de afzonderlijke klanken en die weer naar letters en lettergrepen wat een stuk lastiger is.

Een eventueel apparaat dat in een rumoerige omgeving beter werkt dat een mensen oor is vrijwel onmogelijk, het apparaat ontvangt immers dezelfde storing als je oren.

EggeD 21-04-2005 23:35

In een rumoerige omgeving werkt spraakherkenning moeilijker, omdat er dan natuurlijk meer achtergrondruis is. Wat een spraakherkenner namelijk ongeveer doet is geluid omzetten in bruikbare stukjes geluid, fonemen (http://www.vandale.nl/opzoeken/woord...ekwoord=foneem), en die vervolgens resp. testen op syntax, semantiek en verdere betekenis (in welke situatie wordt het gezegd, door wie, op welke toon, etc.). Dit gaat moeilijker als er veel ruis is, dan is er meer onduidelijkheid over de uitgesproken foneem, als het ware. Als een dergelijk systeem echter intelligent genoeg is, zal het vaker succesvol herkennen.

Er wordt veel gewerkt aan dit soort systemen, ook in Nederland, en het hele gebied is dus duidelijk aan het beteren. Momenteel zijn er nog beperkingen (woordenschat, stemgeluid, taal, achtergrondgeluid, overlap, turntaking, etc.), maar die moeten met slimmere systemen overbrugd worden.

Kazet Nagorra 22-04-2005 14:57

Citaat:

GVR schreef op 21-04-2005 @ 23:17 :
Een eventueel apparaat dat in een rumoerige omgeving beter werkt dat een mensen oor is vrijwel onmogelijk, het apparaat ontvangt immers dezelfde storing als je oren.
Niet helemaal waar, het is niet zo moeilijk richtinggevoeligheid in te bouwen. Nadeel daarvan is dan wel weer dat je vanuit een bepaalde richting in het apparaat moet praten.

ZSA 22-04-2005 15:52

Citaat:

Mephostophilis schreef op 21-04-2005 @ 20:28 :
Tegenwoordig heeft Word een optie waarmee je kunt praten, en Word het intypt. Het probleem is dat het alleen werkt bij mensen met een zuiver Amerikaans accent en bovendien moet je de software enkele uren "trainen". Het is dan ook niet verwonderlijk dat er flink veel onzin uitkwam toen ik het probeerde. Overigens is de maximale effciëntie van deze software op dit moment zo'n 95% per woord, dus één op de 20 woorden zal sowieso fout zijn.
ehm je meot ook geen word gebruiken he

Gambokkur 22-04-2005 21:10

Citaat:

Mephostophilis schreef op 21-04-2005 @ 20:28 :
Tegenwoordig heeft Word een optie waarmee je kunt praten, en Word het intypt. de maximale effciëntie van deze software op dit moment zo'n 95% per woord, dus één op de 20 woorden zal sowieso fout zijn.
Dit klinkt veelbelovend. 95 % is bijlange niet slecht, als je weet hoe moeilijk spraakherkenning is.

Gambokkur 22-04-2005 21:12

Citaat:

GVR schreef op 21-04-2005 @ 23:17 :
Een eventueel apparaat dat in een rumoerige omgeving beter werkt dat een mensen oor is vrijwel onmogelijk, het apparaat ontvangt immers dezelfde storing als je oren.
Volgens mij moet het ooit mogelijk zijn elektronische oren te bouwen die véél beter horen dan mensen. Katten horen toch ook veel beter dan mensen ?

Gambokkur 22-04-2005 21:15

Citaat:

EggeD schreef op 21-04-2005 @ 23:35 :
Wat een spraakherkenner namelijk ongeveer doet is geluid omzetten in bruikbare stukjes geluid, fonemen en die vervolgens resp. testen op syntax, semantiek en verdere betekenis (in welke situatie wordt het gezegd, door wie, op welke toon, etc.).
Dan zou een taal als Esperanto vermoedelijk beter verstaan kunnen worden door zo'n spraakherkenner dan pakweg Nederlands ? Het is immers een taal met een eenduidige uitspraak.

EggeD 23-04-2005 00:30

Citaat:

Gambokkur schreef op 22-04-2005 @ 21:15 :
Dan zou een taal als Esperanto vermoedelijk beter verstaan kunnen worden door zo'n spraakherkenner dan pakweg Nederlands ? Het is immers een taal met een eenduidige uitspraak.
Gaanderweg de ontwikkeling van spraakherkenningstechnologie wel. Uiteindelijk zullen alle talen perfect werken, tenminste, in theorie. Ik spreek zelf geen Esperanto, die taal heeft volgens mij maar een kort leven gehad, maar in principe is het geknipt voor spraakherkenners, ja.

blalb 23-04-2005 10:58

Citaat:

Gambokkur schreef op 20-04-2005 @ 23:43 :
Ik vraag mij af hoe ver de spraaktechnologie tegenwoordig staat. Ik vermoed dat bij live-uitzendingen op tv (sport bvb) de teletekst rechtstreeks uit de spraak wordt afgeleid. Werkt deze software ook in een wat rumoerige omgeving ? En vooral : tegen wanneer mogen we appraatjes verwachten die op een scherm(pje) tonen wat er gezegd wordt in de omgeving van de microfoon (een mooi hulpmiddel voor slechthorenden/doven, en voor normaal horenden in een lawaaiierige buurt) ?
wij hebben op school wel eens een spraakherkennings programma moeten schrijven. hoefde dan natuurlijk maar een paar woorden te herkennen. maar wat ruis betreft dat moet je gewoon goed filteren. en wat betreft de teletekst ik denk niet dat dat met spraak herkenning gaat want wat er als tokst in beeld komt dat is niet exact wat er gesproken wordt. En er zit ook nog een vertaging tussen.

Gambokkur 23-04-2005 19:54

Citaat:

renee182 schreef op 23-04-2005 @ 10:58 :
wij hebben op school wel eens een spraakherkennings programma moeten schrijven. hoefde dan natuurlijk maar een paar woorden te herkennen. maar wat ruis betreft dat moet je gewoon goed filteren. en wat betreft de teletekst ik denk niet dat dat met spraak herkenning gaat want wat er als tokst in beeld komt dat is niet exact wat er gesproken wordt. En er zit ook nog een vertaging tussen.
Jij doet vermoedelijk informatica ? In welke taal progden jullie en was dat moeilijk ?

ivm de teletekst : Ik zie heel soms woorden staan zoals ze uitgesproken worden ipv geschreven, dus vandaar mijn misvatting.

blalb 25-04-2005 19:02

Citaat:

Gambokkur schreef op 23-04-2005 @ 19:54 :
Jij doet vermoedelijk informatica ? In welke taal progden jullie en was dat moeilijk ?

ivm de teletekst : Ik zie heel soms woorden staan zoals ze uitgesproken worden ipv geschreven, dus vandaar mijn misvatting.

ik doe technische natuurkunde. wij deden dat in labview. Maar hoe dat met teletekst zit weet ik niet precies maar ik dacht het zo.

JaJ 29-04-2005 00:05

Citaat:

renee182 schreef op 25-04-2005 @ 19:02 :
ik doe technische natuurkunde. wij deden dat in labview. Maar hoe dat met teletekst zit weet ik niet precies maar ik dacht het zo.
hoe heb je dat gemaakt? door te vergelijken met voorbeeldgeluidjes, of met een superinteligente code?

blalb 30-04-2005 16:07

Citaat:

JaJ schreef op 29-04-2005 @ 00:05 :
hoe heb je dat gemaakt? door te vergelijken met voorbeeldgeluidjes, of met een superinteligente code?
vergelijken binnen bepaalde randvoorwaarden. Maar het kon ook maar een paar woorden herkennen.

JaJ 30-04-2005 17:53

Citaat:

renee182 schreef op 30-04-2005 @ 16:07 :
vergelijken binnen bepaalde randvoorwaarden. Maar het kon ook maar een paar woorden herkennen.
ja, dat snap ik, maar ik vroeg het me af, want als je op die manier een spraakherkennings programma bouwt, wordt dat toch gigantisch? weet je misschien ook hoe het zeg maar door bedrijven wordt gemaakt?

blalb 01-05-2005 18:48

Citaat:

JaJ schreef op 30-04-2005 @ 17:53 :
ja, dat snap ik, maar ik vroeg het me af, want als je op die manier een spraakherkennings programma bouwt, wordt dat toch gigantisch? weet je misschien ook hoe het zeg maar door bedrijven wordt gemaakt?
Dat weet ik echt niet. Als ik dat geweten had dan had ik wel een super uitgebreide spraakherkenning gebouwd. Kan me wel herrinneren dat bestaande spraakherkennings systemen vaak eerst ingeleerd moeten worden. Maar daar weet ik het fijne niet van

Evatjuhhhh 01-05-2005 19:56

Bij ons op school gebruiken dyslextische mensen als ze dat willen spraakherkenning. Eerst zijn er 6 middagen waarmee je dan leert het spraakherkenningsprogramma je stem kennen enzo.

Het schijnt goed te zijn omdat je werkstukken etc kan inspreken.
Een oppaskindje van mij heeft het gedaan omdat ze dyslectisch was en ze zei dat het soms wel irritant was omdat je steeds "wordt wakker" en "ga slapen" moet zeggen om hem aan/uit te doen en dat hij dat soms niet pakt..

Maargoed ik vind het wel goed dat het er is :)

I love stars 01-05-2005 20:04

Citaat:

Evatjuhhhh schreef op 01-05-2005 @ 19:56 :
Bij ons op school gebruiken dyslextische mensen als ze dat willen spraakherkenning. Eerst zijn er 6 middagen waarmee je dan leert het spraakherkenningsprogramma je stem kennen enzo.

Het schijnt goed te zijn omdat je werkstukken etc kan inspreken.
Een oppaskindje van mij heeft het gedaan omdat ze dyslectisch was en ze zei dat het soms wel irritant was omdat je steeds "wordt wakker" en "ga slapen" moet zeggen om hem aan/uit te doen en dat hij dat soms niet pakt..

Maargoed ik vind het wel goed dat het er is :)

maar wat doet dat ding dan bij het fout uitspreken van woorden , wat bij dyslectische mensen wat vaker voor komt.

Voorbeeld instromenten zeggen ipv. instrumenten.

Kazet Nagorra 01-05-2005 22:21

Citaat:

I love stars schreef op 01-05-2005 @ 20:04 :
maar wat doet dat ding dan bij het fout uitspreken van woorden , wat bij dyslectische mensen wat vaker voor komt.

Voorbeeld instromenten zeggen ipv. instrumenten.

Het programma vergelijkt met je eerdere uitspraak.

JaJ 02-05-2005 17:50

Citaat:

Mephostophilis schreef op 01-05-2005 @ 22:21 :
Het programma vergelijkt met je eerdere uitspraak.
maak je bij dyslectie dan eigenlijk steeds dezelfde fouten?

Kazet Nagorra 02-05-2005 18:07

Citaat:

JaJ schreef op 02-05-2005 @ 17:50 :
maak je bij dyslectie dan eigenlijk steeds dezelfde fouten?
Geen idee.

blalb 02-05-2005 18:43

Citaat:

JaJ schreef op 02-05-2005 @ 17:50 :
maak je bij dyslectie dan eigenlijk steeds dezelfde fouten?
ik in iedergeval wel!

EggeD 02-05-2005 18:56

Het is natuurlijk wel zo handig een spraakherkenner eerst te baseren op iemand die een bep. taal vloeiend spreekt, niet een of andere randdebiel die spastisch is, roggelt en alles door elkaar haalt. Die mensen zijn dan zeg maar de volgende stap.

JaJ 02-05-2005 20:22

Citaat:

EggeD schreef op 02-05-2005 @ 18:56 :
Het is natuurlijk wel zo handig een spraakherkenner eerst te baseren op iemand die een bep. taal vloeiend spreekt, niet een of andere randdebiel die spastisch is, roggelt en alles door elkaar haalt. Die mensen zijn dan zeg maar de volgende stap.
natuurlijk, natuurlijk :) het lijkt me evenzogoed moeilijk om het code-matig te doen. het zal wel van het ontrafelen van frequenties afhangen ofzo?

blalb 03-05-2005 13:22

Citaat:

JaJ schreef op 02-05-2005 @ 20:22 :
het zal wel van het ontrafelen van frequenties afhangen ofzo?
Goedzo!!!! Gewoon FFT transformaties toepassen en dan vergelijken

Gambokkur 05-05-2005 12:21

Ik denk dat ik me ook eens ga bezig houden met een simpel spraakherkennertje te bouwen als ik tijd heb.
De Java Speech API lijkt me wel wat.

JaJ 05-05-2005 12:51

Citaat:

renee182 schreef op 03-05-2005 @ 13:22 :
Goedzo!!!! Gewoon FFT transformaties toepassen en dan vergelijken
hey, weet ik veel :P. care to explain FFT?

mathfreak 05-05-2005 15:15

Citaat:

JaJ schreef op 05-05-2005 @ 12:51 :
hey, weet ik veel :P. care to explain FFT?
Kijk maar eens op http://mathworld.wolfram.com/FastFourierTransform.html

blalb 05-05-2005 17:25

Citaat:

JaJ schreef op 05-05-2005 @ 12:51 :
hey, weet ik veel :P. care to explain FFT?
idd fast fourrier transformaties
komt er eigenlijk op neer dat je een signaal wiskundig bewerkt en ombouwd naar een frequentie spectrum. krijg je op de y-as de amplitude en op de x-as de verschillende frequenties. kan je precies zien welke frequenties in welke mate in je signaal voorkomen. erg handig

MickeyV 05-05-2005 18:40

Citaat:

renee182 schreef op 05-05-2005 @ 17:25 :
ombouwd
Wel stereotype bevestigend. :D

Welnu, het grammaticale morfeem -d (soms ook -t, maar niet i. c. )wordt achter aan een ander, lexicaal morfeem, i. c. de werkwoorstam, gevoegd, en geeft aan, dikwijls in combinatie met het voor aangevoegde morfeem ge-, dat het proces dat de werkwoordstam denoteert, voltooid is. Het grammaticale morfeem -t daarentegen, dat eveneens achter aan zo'n stam gevoegd wordt, geeft aan, dat het proces dat die stam denoteert -ombouwen bv.- door een bepaalde grammaticale persoon (2e of 3e) op een bepaald grammaticaal tijdstip (de ott) verricht wordt. Dit probeerde jij, geloof ik, weer te geven.

Zo heerlijk systematisch is taal. :D

JaJ 05-05-2005 20:20

Citaat:

MickeyV schreef op 05-05-2005 @ 18:40 :
Wel stereotype bevestigend. :D

Welnu, het grammaticale morfeem -d (soms ook -t, maar niet i. c. )wordt achter aan een ander, lexicaal morfeem, i. c. de werkwoorstam, gevoegd, en geeft aan, dikwijls in combinatie met het voor aangevoegde morfeem ge-, dat het proces dat de werkwoordstam denoteert, voltooid is. Het grammaticale morfeem -t daarentegen, dat eveneens achter aan zo'n stam gevoegd wordt, geeft aan, dat het proces dat die stam denoteert -ombouwen bv.- door een bepaalde grammaticale persoon (2e of 3e) op een bepaald grammaticaal tijdstip (de ott) verricht wordt. Dit probeerde jij, geloof ik, weer te geven.

Zo heerlijk systematisch is taal. :D

voor een spraakherkenningsprogramma zou het anders helemaal een interessante opgave zijn om het goed te doen :)

blalb 07-05-2005 10:10

Citaat:

MickeyV schreef op 05-05-2005 @ 18:40 :
Wel stereotype bevestigend. :D

Welnu, het grammaticale morfeem -d (soms ook -t, maar niet i. c. )wordt achter aan een ander, lexicaal morfeem, i. c. de werkwoorstam, gevoegd, en geeft aan, dikwijls in combinatie met het voor aangevoegde morfeem ge-, dat het proces dat de werkwoordstam denoteert, voltooid is. Het grammaticale morfeem -t daarentegen, dat eveneens achter aan zo'n stam gevoegd wordt, geeft aan, dat het proces dat die stam denoteert -ombouwen bv.- door een bepaalde grammaticale persoon (2e of 3e) op een bepaald grammaticaal tijdstip (de ott) verricht wordt. Dit probeerde jij, geloof ik, weer te geven.

Zo heerlijk systematisch is taal. :D

Sorry ik zei toch dat ik dislectisch was. Maar FFT-en een beetje duidelijk???

blalb 07-05-2005 10:12

Citaat:

JaJ schreef op 05-05-2005 @ 20:20 :
voor een spraakherkenningsprogramma zou het anders helemaal een interessante opgave zijn om het goed te doen :)
hoezo??? de uitspraak blijft toch het zelfde???

JaJ 07-05-2005 16:15

Citaat:

renee182 schreef op 07-05-2005 @ 10:12 :
hoezo??? de uitspraak blijft toch het zelfde???
jah, maar spraakherkenning kan bijvoorbeeld ook gebruikt worden om tekst op het scherm te praten

Kazet Nagorra 07-05-2005 17:02

Citaat:

JaJ schreef op 07-05-2005 @ 16:15 :
jah, maar spraakherkenning kan bijvoorbeeld ook gebruikt worden om tekst op het scherm te praten
Daarom moet je ook eerst het programma aan jouw stem laten 'wennen'. Spraakherkenningsprogramma's die de tekst op het scherm plaatsen doen dit door je eerst een stuk tekst te laten oplezen. Hoe meer tekst je opleest, hoe beter het programma werkt.

MickeyV 08-05-2005 00:56

Citaat:

renee182 schreef op 07-05-2005 @ 10:10 :
Sorry ik zei toch dat ik dislectisch was. Maar FFT-en een beetje duidelijk???
Nou ja, het is ook niet vervelend bedoeld hoor. Ik vind het alleen zo opmerkelijk dat bepaalde mensen, enerzijds, geen problemen hebben met de moeilijke materie die wis-, natuur-, scheikunde etc toch inhouden, anderzijds bij de vervoeging van werkwoorden toch op vrij elementaire punten de mist in gaan. :) En ziet dyslectie niet eerder op het herkennen van woorden, althans van hun schriftelijke weergave?

Hippetitus 08-05-2005 15:34

sd

blalb 08-05-2005 15:35

Citaat:

MickeyV schreef op 08-05-2005 @ 00:56 :
Nou ja, het is ook niet vervelend bedoeld hoor. Ik vind het alleen zo opmerkelijk dat bepaalde mensen, enerzijds, geen problemen hebben met de moeilijke materie die wis-, natuur-, scheikunde etc toch inhouden, anderzijds bij de vervoeging van werkwoorden toch op vrij elementaire punten de mist in gaan. :) En ziet dyslectie niet eerder op het herkennen van woorden, althans van hun schriftelijke weergave?
Waarom heb je dan mensen die wel goed zijn in talen en niet in exacte vakken?? Zie niet in waarom dit niet andersom kan zijn. En dyslectie kan zich volgens mij ook uiten in "schriftelijke"weergaven en niet alleen "woordblind" zijn.
Ze moeten ook maar zo''n mode benaming vaan bedenken voor mensen die te lam zijn om meer tijd in wiskunde te steken.

blalb 08-05-2005 15:37

Citaat:

JaJ schreef op 07-05-2005 @ 16:15 :
jah, maar spraakherkenning kan bijvoorbeeld ook gebruikt worden om tekst op het scherm te praten
maar dan maakt het toch niet uit of je dyslectisch bent. je spreekt het toch goed uit! naar mijn weten klinkt een ei of een ij het zelfde en een d, t ook , DUS ( hihi, die gene ziet dan toch niet of het goed geschreven is.)

mathfreak 08-05-2005 18:43

Citaat:

renee182 schreef op 08-05-2005 @ 15:35 :
Waarom heb je dan mensen die wel goed zijn in talen en niet in exacte vakken?? Zie niet in waarom dit niet andersom kan zijn.
Het is ook beide mogelijk, en er zijn ook mensen die in beide richtingen goed zijn.

matt trakker 08-05-2005 19:57

Citaat:

renee182 schreef op 05-05-2005 @ 17:25 :
idd fast fourrier transformaties
komt er eigenlijk op neer dat je een signaal wiskundig bewerkt en ombouwd naar een frequentie spectrum. krijg je op de y-as de amplitude en op de x-as de verschillende frequenties. kan je precies zien welke frequenties in welke mate in je signaal voorkomen. erg handig

dit is allemaal goed te doen in cycling '74 MaxMSP

blalb 08-05-2005 20:44

Citaat:

matt trakker schreef op 08-05-2005 @ 19:57 :
dit is allemaal goed te doen in cycling '74 MaxMSP
ken ik niet

MickeyV 08-05-2005 21:06

Citaat:

mathfreak schreef op 08-05-2005 @ 18:43 :
Het is ook beide mogelijk, en er zijn ook mensen die in beide richtingen goed zijn.
Zoals mathfreak. :)

Kazet Nagorra 08-05-2005 21:11

Citaat:

MickeyV schreef op 08-05-2005 @ 21:06 :
Zoals mathfreak. :)
En ik. :o

MickeyV 09-05-2005 00:01

Dat je niet dyslectisch bent maakt je nog geen taalwonder. :D

Kazet Nagorra 09-05-2005 00:43

Ik had maar 22 fouten in het Groot Dictee! :(

:D

EggeD 09-05-2005 12:04

Dat je een taalwonder bent maakt je nog geen jofele knapert.


Alle tijden zijn GMT +1. Het is nu 18:20.

Powered by vBulletin® Version 3.8.8
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.