Hoofdcategorieën
Device Settings

Woordenlijst 'OpenTaal'-project bereikt bètastatus

Door René Wichers, donderdag 11 januari 2007 16:36
Bron: OSOSS, submitter: kidde, views: 21.811

De OpenTaal-projectgroep heeft een woordenlijst online gezet die aan de nieuwe spelling voldoet. De lijst, bedoeld voor gebruik in combinatie met opensourcesoftware, zal 'begin 2007' door de Nederlandse TaalUnie gecertificeerd worden.

Inktpotje met ganzenveer Het OpenTaal-project werd eind 2005 in het leven geroepen door het 'Project Open Standaarden en Open Source Software voor de overheid'. Doel van het project is het beschikbaar maken van vrije Nederlandstalige taalhulpbestanden, die zorgen dat software als OpenOffice.org, TeX, Thunderbird en Firefox over een bijdetijdse spellingscontrole kan beschikken. Leden van onder andere de Nederlandse Tex Gebruikersgroep, de Nederlandse TaalUnie en het Nederlandse deel van het OpenOffice.org-project werken al sinds eind 2005 samen aan een vrij beschikbare woordenlijst die aan de nieuwe spelling voldoet. Via uitwisselplatform.nl zijn al extensies voor Thunderbird en Firefox te downloaden, en ook een spellingsmodule voor OpenOffice.org zit inmiddels in het assortiment.

De beschikbare taalhulpbestanden bevinden zich nog in het bètastadium, maar certificatie door de TaalUnie zou niet al te lang meer op zich laten wachten. De projectgroep werkt ondertussen ook aan grammaticacontrolesoftware en aan een synoniemenlijst. Dat het werk van de groep nuttig is, lijdt geen twijfel; de vele fouten in de aankondiging op ososs.nl ('sofwtare', 'ondermeer', 'gecontrolleerd') maken dat wel duidelijk. Toch blijft het volstrekt onbegrijpelijk dat de overheden van de bij de Nederlandse TaalUnie aangesloten landen niet meer aandacht - en geld - besteden aan de vrije beschikbaarheid van de officiële, in het Groene Boekje vervatte woordenlijst. Dat de opensourcehulpmiddelen niet op 1 augustus 2006, toen de nieuwe spelling voor overheidsdienaren verplicht werd, beschikbaar waren, kan de vrijwilligers van het OpenTaal-project immers niet worden aangerekend.

Volgende 19:59 'Apple TV'-settop verbindt televisie met computer
Vorige 16:25 Ritek maakt hd-schijven met tien datalagen
Advertentie

Reacties

«  1  2  »

mooi! hopelijk wordt de spellingscontrole van openoffice hiermee wat draaglijker.

Spellingscontrole is maar een hulpmiddel, die halen spelfoutjes uit je tekst. Grove fouten zoals zinsconstructies of idiote fouten als "jij loop" blijven zitten omdat het geldige waardes zijn.

Autocorrect levert soms lachwekkende situaties op.

grammaticacontrole kan dingen zoals "jij loop" er wel uit halen...

Maar zoals lblies ook probeert te verdedigen, heeft OO.org geen grammaticacontrole.

Dingen zoals "ik heb een broer(boer) gelaten" zijn enorm lastig op te speuren want daar heb je óf een gigantische zinscontructielijst voor nodig óf een heel goede AI. Spelfoutjes en simpele grammatica is er gelukkig wel uit te vissen.

@Daimanta
Neehoor het is maar net hoeveel CPU krachten je kunt bundelen in het spellen van de definitie van grammatica controle en hoeveel werknemers en werkruimte je ervoor gereserveerd hebt.

@ Diamanta
Erger nog: die zijn een computer niet bij te brengen. Dat wordt wel geprobeerd maar de gevolgen daarvan zijn catastrofaal. We hebben nu geen tikfouten meer in kranten, maar wel grammaticafouten... Omdat een computer wél spelling kan corrigeren maar de grammaticale context niet begrijpt. Een complex gegeven zoals taal is moeilijk te implementeren in software, anders was het al lang gedaan - en hadden we volautomatisch teksten kunnen vertalen. Taal bevat teveel variabelen (woorden met meerdere betekenissen, nuances, stijlniveaus, zinsconstructies, stijlfiguren, enz.). Probeer dat maar es uit te leggen aan een ding dat alleen binair begrijpt :Y)

@ Diamanta

contaminaties als 'op te speuren' is daar ook een goed voorbeeld van ja ;)

Programma's als WordPerfect en Word krijgen het toch prima voor elkaar om grammatica te controleren.

Ik kom nooit rare dingen tegen. Maar al wel een paar maal gehad dat hij 'problemen' in een tekst opspoorde die ik over het hoofd zag. Bijvoorbeeld een zinsbouw waardoor de betekenis dubbel opgevat kan worden. Dat waren complexe zinnen, waarbij ik eerst een paar minuten nodig had om te begrijpen waarover Word eigenlijk klaagde. Maar Word had wel degelijk gelijk!

Daar stond ik toch wel even met bewondering naar te kijken, dat de grammatica controle zoiets kon doorgronden.

Nou was dat voor mijn proefschrift, en dus in het Engels. Engelse grammatica is veel strikter dan Nederlands, dus wellicht ook wat makkelijker te controleren.

Van waneer was de huidige spellingscontrole ook alweer? Er staat me iets bij van 1993 maar dat weet ik niet zeker :P

Hopelijk wordt het nu mogelijk om de spellingcontrole nu in meerdere opensource applicaties te integreren. Ik denk aan Firefox, Thunderbird en OpenOffice.

Zouden ze ook zo'n project bij de Mapuche indianen hebben lopen?
nieuws: Chileense indianen klagen Microsoft aan

Wel een super initiatief overigens!

Edit: Irritante modders! De helft van de status Overbodig hier is echt totaal niet overbodig!

Er is al een tijdje een update (groene boekje) van de spellingchecker van Word verkrijgbaar bij M$. Deze kun je gratis downloaden. (http://www.microsoft.com/...euwespellingcontrole.aspx)

Een 'nadeel': je moet wel een legale versie van office hebben om het te kunnen downloaden ;)

In de nieuwe office 2007 zit ie al ingebouwd, tenminste dat geeft mijn nederlandse versie aan. Dus hoeft ie ook niet te validaten (8>

Goed initiatief! Wordt er alleen ook aan zoiets gewerkt voor het witte boekje?

Wil OpenOffice voor kranten interessant worden, dan moeten ze inderdaad ook een 'witte' variant uitbrengen.

Maar het initiatief is voorlopig gericht op de overheid, en die werkt met groene spelling.

Uitermate interessant initiatief. Ik vind dat dit soort projecten zoiezo vanuit de overheid gesteund en gecontroleerd moeten worden. Het is alleen wel zaak en hopen dat na de oplevering een groep mensen de juistheid blijft controleren.

En als de grammatica software straks ook in Firefox werkt kunnen eindelijk alle tweakers reageren zonder grammadica of typvouten. :Y)

2 nadelen wat mij betreft:
- In Nederland is de taal iets wat niet echt door de overheid wordt geregeld. We kennen hierdoor momenteel een groen boekje. Dit is de spelling van de Nederlandse Taalunie en die werken voor Nederland, Belgie en Suriname. Daarnaast is er de witte spelling, deze is volgens mij van het genootschap onze taal. Als je dan als overheid een initiatief als dit wil ondersteunen kan je hiermee dus problemen krijgen.
- Als in Nederland iets wordt ontwikkeld van overheidsgeld zou het naar mijn idee open source moeten zijn: We hebben er belastinggeld voor betaald. Helaas sluiten veel universiteiten vaak deals met bedrijven. Dit heeft als voordeel dat er samengewerkt wordt en kennisoverdracht plaatsvind. Het nadeel is dat het bedrijf kennis opbouwt van overheidsgeld en dit vervolgens commercieel kan inzetten.

Kan je woorden ook veranderen in de lijst? Ik weiger om pannenkoek te schrijven. Ik wil namelijk niet zo stom lijken dat ik twee pannen nodig zou zijn om 1 koek te bakken.

edit: spelvout hehehehehe

Enig idee wat het idee achter "open source" is? ;)

Je antwoord is laag gewaardeerd, maar wel nuttig. Iedereen zal de spelling aan kunnen passen, varianten zoals de Witte Spelling en mogelijke dialecten zullen uiteraard ook allemaal mogelijk worden, en dat is toch wel erg interessant.

Ik vind dat wel een leuk idee, laten we een blauw boekje invoeren: de Mallen-Pietjen-tussen-n wordt integraal afgeschaft omdat hij niets met spreektaal te maken heeft.

als ik me niet vergis, is dat regeltje van "als je er meerdere voor ndig hebt, is het +n" al een hele tijd niet meer van toepassing

Ik weiger om pannenkoek te schrijven

Waarschijnlijk onbedoeld, maar ik vind het een schoolvoorbeeld van een paradox. :D

ik heb cadeau leren schrijven;
heeft iemand de woordenlijst volgens de regels van 1954 voor me?
(ik geloof dat dat de laatste 2-delige dikke van Dale is)

daarna zijn ze er een potje van gaan maken, :(
en toen was ik al van school.

Voor mij de spelling van de taalherziening van 1954.

http://www.telegraaf.nl/b...tml?pageOffset=2#reacties
Wie of wat is eigenlijk de Taalunie en met welk gezag spreekt dit orgaan namens wie? Ik wil en kan de zich in steeds hoger tempo aandienende nieuwe spellingen niet meer volgen, ben daar ook niet toe bereid en spreek en schrijf het ABN zoals ik dat heb geleerd rond 1960. De nieuwste spellingskronkels gaan geheel in tegen mijn taalgevoel. Het lijkt erop dat het vroeger fameuze Groene Boekje is gekaapt door taalterroristen. Ik vind het Witte Boekje dan ook een volstrekt logische ontwikkeling die deze taalterroristen zelf hebben uitgelokt.
Joop, Tilburg zo 12/2, 21:32

Nou hopen dat het idd wat oplevert. Ik vind de spellingcontrole in Firefox belabberd. Er zijn tig woorden die worden gesplitst terwijl het toch één woord is.

Dat verkeerd splitsen is ook mijn grootste ergernis in de bestaande spellingscontrole van Firefox en Thunderbird. Vol goede moed heb ik dus bovenstaand woordenboek gedownload, geïnstalleerd en geactiveerd, maar bijvoorbeeld het woord 'internetredacteur' ziet ook dit woordenboek als fout en hoopt mij via een minder subtiele rode stippellijn ertoe te bewegen alsnog een spatie te plaatsen.

Natuurlijk is dit wel te begrijpen. Het moet onmenselijk veel tijd kosten om alle mogelijke combinaties in zo'n woordenboek te krijgen, of regels die zo sluitend zijn dat ze op correcte wijze kunnen voorspellen welke woorden aan elkaar moeten en welke gescheiden moeten worden. Maar goed: als consument vind ik dat het moet werken, en wil ik me niet bezighouden met waarom het niet werkt.

Zoals de schrijver van het artikel al terecht opmerkt, is het van de zotte dat de Nederlandse overheid niet meer zijn best doet om de spelling via diverse media in zijn juiste vorm beschikbaar te maken. De autoriteit van een spelling staat of valt bij de waarde die gebruikers eraan hechten en het geloof dat de gebruikers erin hebben. Voor je het weet, komen alle nieuwe spellingsregels in de categorie 'hen/hun', waarbij het de massa onduidelijk is hoe het werkt (naamvallen zijn niet onze sterkste kant) en daarom het onderscheid maar achterwege laat.

Dat verkeerd splitsen is ook mijn grootste ergernis in de bestaande spellingscontrole[...]
Dit probleem is uiteraard bekend maar valt niet op te lossen middels de woordenlijst. De algoritmen in myspell/hunspell zijn niet berekend op germaanse samengestelde woorden en moeten erop worden aangepast.

/offtopic

dit lijkt me een mooie gelegenheid om alle tweakers erop te attenderen dat het meest fout geschreven woord op dit forum "sowieso" is.

je ziet zo vaak van die "ziezo" enzo :)

edit, |:( typo

Ja en dan neem je natuurlijk een ontzettend germanisme als voorbeeld, want eigenlijk dient het natuurlijk "so wie so" te zijn.....

Ik heb het idee dat er vaak een beetje 'vergeten' word dat het een spellingscontrole is, en geen text-to-speech oid. Het blijft natuurlijk gewoon een hulpje :)

/offtopic: Geniaal plaatje op de frontpage van dit artikel :+
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 19:59 'Apple TV'-settop verbindt televisie met computer
Vorige 16:25 Ritek maakt hd-schijven met tien datalagen
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011