Woordenlijst 'OpenTaal'-project bereikt bètastatus

De OpenTaal-projectgroep heeft een woordenlijst online gezet die aan de nieuwe spelling voldoet. De lijst, bedoeld voor gebruik in combinatie met opensourcesoftware, zal 'begin 2007' door de Nederlandse TaalUnie gecertificeerd worden.

Inktpotje met ganzenveer Het OpenTaal-project werd eind 2005 in het leven geroepen door het 'Project Open Standaarden en Open Source Software voor de overheid'. Doel van het project is het beschikbaar maken van vrije Nederlandstalige taalhulpbestanden, die zorgen dat software als OpenOffice.org, TeX, Thunderbird en Firefox over een bijdetijdse spellingscontrole kan beschikken. Leden van onder andere de Nederlandse Tex Gebruikersgroep, de Nederlandse TaalUnie en het Nederlandse deel van het OpenOffice.org-project werken al sinds eind 2005 samen aan een vrij beschikbare woordenlijst die aan de nieuwe spelling voldoet. Via uitwisselplatform.nl zijn al extensies voor Thunderbird en Firefox te downloaden, en ook een spellingsmodule voor OpenOffice.org zit inmiddels in het assortiment.

De beschikbare taalhulpbestanden bevinden zich nog in het bètastadium, maar certificatie door de TaalUnie zou niet al te lang meer op zich laten wachten. De projectgroep werkt ondertussen ook aan grammaticacontrolesoftware en aan een synoniemenlijst. Dat het werk van de groep nuttig is, lijdt geen twijfel; de vele fouten in de aankondiging op ososs.nl ('sofwtare', 'ondermeer', 'gecontrolleerd') maken dat wel duidelijk. Toch blijft het volstrekt onbegrijpelijk dat de overheden van de bij de Nederlandse TaalUnie aangesloten landen niet meer aandacht - en geld - besteden aan de vrije beschikbaarheid van de officiële, in het Groene Boekje vervatte woordenlijst. Dat de opensourcehulpmiddelen niet op 1 augustus 2006, toen de nieuwe spelling voor overheidsdienaren verplicht werd, beschikbaar waren, kan de vrijwilligers van het OpenTaal-project immers niet worden aangerekend.

Door René Wichers

Eindredacteur

11-01-2007 • 16:36

49

Submitter: kidde

Bron: OSOSS

Reacties (49)

49
49
34
13
5
12
Wijzig sortering
Anoniem: 204303 11 januari 2007 17:08
Goed initiatief! Wordt er alleen ook aan zoiets gewerkt voor het witte boekje?
Wil OpenOffice voor kranten interessant worden, dan moeten ze inderdaad ook een 'witte' variant uitbrengen.

Maar het initiatief is voorlopig gericht op de overheid, en die werkt met groene spelling.
mooi! hopelijk wordt de spellingscontrole van openoffice hiermee wat draaglijker.
Spellingscontrole is maar een hulpmiddel, die halen spelfoutjes uit je tekst. Grove fouten zoals zinsconstructies of idiote fouten als "jij loop" blijven zitten omdat het geldige waardes zijn.

Autocorrect levert soms lachwekkende situaties op.
grammaticacontrole kan dingen zoals "jij loop" er wel uit halen...
Maar zoals lblies ook probeert te verdedigen, heeft OO.org geen grammaticacontrole.
Anoniem: 175233 @Mayco12 januari 2007 10:24
Programma's als WordPerfect en Word krijgen het toch prima voor elkaar om grammatica te controleren.

Ik kom nooit rare dingen tegen. Maar al wel een paar maal gehad dat hij 'problemen' in een tekst opspoorde die ik over het hoofd zag. Bijvoorbeeld een zinsbouw waardoor de betekenis dubbel opgevat kan worden. Dat waren complexe zinnen, waarbij ik eerst een paar minuten nodig had om te begrijpen waarover Word eigenlijk klaagde. Maar Word had wel degelijk gelijk!

Daar stond ik toch wel even met bewondering naar te kijken, dat de grammatica controle zoiets kon doorgronden.

Nou was dat voor mijn proefschrift, en dus in het Engels. Engelse grammatica is veel strikter dan Nederlands, dus wellicht ook wat makkelijker te controleren.
Dingen zoals "ik heb een broer(boer) gelaten" zijn enorm lastig op te speuren want daar heb je óf een gigantische zinscontructielijst voor nodig óf een heel goede AI. Spelfoutjes en simpele grammatica is er gelukkig wel uit te vissen.
@ Diamanta
Erger nog: die zijn een computer niet bij te brengen. Dat wordt wel geprobeerd maar de gevolgen daarvan zijn catastrofaal. We hebben nu geen tikfouten meer in kranten, maar wel grammaticafouten... Omdat een computer wél spelling kan corrigeren maar de grammaticale context niet begrijpt. Een complex gegeven zoals taal is moeilijk te implementeren in software, anders was het al lang gedaan - en hadden we volautomatisch teksten kunnen vertalen. Taal bevat teveel variabelen (woorden met meerdere betekenissen, nuances, stijlniveaus, zinsconstructies, stijlfiguren, enz.). Probeer dat maar es uit te leggen aan een ding dat alleen binair begrijpt :Y)
@ Diamanta

contaminaties als 'op te speuren' is daar ook een goed voorbeeld van ja ;)
@Daimanta
Neehoor het is maar net hoeveel CPU krachten je kunt bundelen in het spellen van de definitie van grammatica controle en hoeveel werknemers en werkruimte je ervoor gereserveerd hebt.
Waarschijnlijk trap ik hier een opendeur in maar mag dit wel. Kunnen de makers van Van Dale en Het Groen Boekje nu niet naar de rechtbank stappen indien de staat dit werkelijk heeft gesteund, want zij verliezen nu inkomsten.

Dit is dan gewoon een kwestie van ongeoorloofde staatssteun.

Zelfde vb met die helicopters die het leger inzette om organen over te brengen voor spoedtransplantaties. Een privé bedrijf heeft hiertegen een rechtzaak aangespannen en gewonnen.
Dat zou inderdaad mogen als Van Dale en Het Groene Boekje woorden fabriceerden of ontworpen ipv. ze te noteren en te bundelen. Het kopiëerrecht op woorden is een hard lachertje.
En wat dan met mijn voorbeeld het recht op levensredden komt toch ook niet de privé toe en toch heeft de rechtbank geopperd dat de transporten van het leger gelijk stonden met broodroof.
Goed dat het er eindelijk van komt...

Tja... auteursrecht blijft lastig soms (vanuit de gebruiker gezien dan). Maar neem toch aan dat de overheid dat goed voor elkaar heeft voor ze iets publiceren.
Op die manier zou je bijna elke overheidssteun wel kunnen bombarderen tot onrechtvaardig. Naast dat moet Van Dale het ook hard kunnen maken dat door overheidssteun aan een project dat al een flink deel van het werk zelf heeft gedaan, echt schade heeft opgelopen. Zo duidelijk meetbaar als een misgelopen helikoptervlucht is dat niet.

Het Groene Boekje is van de Nederlandse Taalunie, en naast het feit dat ze zelf meewerken aan dit project staat het groene boekje gewoon online dus die kunnen niet klagen ;).
Uitermate interessant initiatief. Ik vind dat dit soort projecten zoiezo vanuit de overheid gesteund en gecontroleerd moeten worden. Het is alleen wel zaak en hopen dat na de oplevering een groep mensen de juistheid blijft controleren.

En als de grammatica software straks ook in Firefox werkt kunnen eindelijk alle tweakers reageren zonder grammadica of typvouten. :Y)
2 nadelen wat mij betreft:
- In Nederland is de taal iets wat niet echt door de overheid wordt geregeld. We kennen hierdoor momenteel een groen boekje. Dit is de spelling van de Nederlandse Taalunie en die werken voor Nederland, Belgie en Suriname. Daarnaast is er de witte spelling, deze is volgens mij van het genootschap onze taal. Als je dan als overheid een initiatief als dit wil ondersteunen kan je hiermee dus problemen krijgen.
- Als in Nederland iets wordt ontwikkeld van overheidsgeld zou het naar mijn idee open source moeten zijn: We hebben er belastinggeld voor betaald. Helaas sluiten veel universiteiten vaak deals met bedrijven. Dit heeft als voordeel dat er samengewerkt wordt en kennisoverdracht plaatsvind. Het nadeel is dat het bedrijf kennis opbouwt van overheidsgeld en dit vervolgens commercieel kan inzetten.
/offtopic

dit lijkt me een mooie gelegenheid om alle tweakers erop te attenderen dat het meest fout geschreven woord op dit forum "sowieso" is.

je ziet zo vaak van die "ziezo" enzo :)

edit, |:( typo
Ja en dan neem je natuurlijk een ontzettend germanisme als voorbeeld, want eigenlijk dient het natuurlijk "so wie so" te zijn.....
Kan je woorden ook veranderen in de lijst? Ik weiger om pannenkoek te schrijven. Ik wil namelijk niet zo stom lijken dat ik twee pannen nodig zou zijn om 1 koek te bakken.

edit: spelvout hehehehehe
Enig idee wat het idee achter "open source" is? ;)

Je antwoord is laag gewaardeerd, maar wel nuttig. Iedereen zal de spelling aan kunnen passen, varianten zoals de Witte Spelling en mogelijke dialecten zullen uiteraard ook allemaal mogelijk worden, en dat is toch wel erg interessant.
Ik weiger om pannenkoek te schrijven

Waarschijnlijk onbedoeld, maar ik vind het een schoolvoorbeeld van een paradox. :D
Ik vind dat wel een leuk idee, laten we een blauw boekje invoeren: de Mallen-Pietjen-tussen-n wordt integraal afgeschaft omdat hij niets met spreektaal te maken heeft.
Anoniem: 198334 @abot1312 januari 2007 12:54
als ik me niet vergis, is dat regeltje van "als je er meerdere voor ndig hebt, is het +n" al een hele tijd niet meer van toepassing
ik heb cadeau leren schrijven;
heeft iemand de woordenlijst volgens de regels van 1954 voor me?
(ik geloof dat dat de laatste 2-delige dikke van Dale is)

daarna zijn ze er een potje van gaan maken, :(
en toen was ik al van school.

Voor mij de spelling van de taalherziening van 1954.

http://www.telegraaf.nl/b...tml?pageOffset=2#reacties
Wie of wat is eigenlijk de Taalunie en met welk gezag spreekt dit orgaan namens wie? Ik wil en kan de zich in steeds hoger tempo aandienende nieuwe spellingen niet meer volgen, ben daar ook niet toe bereid en spreek en schrijf het ABN zoals ik dat heb geleerd rond 1960. De nieuwste spellingskronkels gaan geheel in tegen mijn taalgevoel. Het lijkt erop dat het vroeger fameuze Groene Boekje is gekaapt door taalterroristen. Ik vind het Witte Boekje dan ook een volstrekt logische ontwikkeling die deze taalterroristen zelf hebben uitgelokt.
Joop, Tilburg zo 12/2, 21:32
Nou hopen dat het idd wat oplevert. Ik vind de spellingcontrole in Firefox belabberd. Er zijn tig woorden die worden gesplitst terwijl het toch één woord is.
Dat verkeerd splitsen is ook mijn grootste ergernis in de bestaande spellingscontrole van Firefox en Thunderbird. Vol goede moed heb ik dus bovenstaand woordenboek gedownload, geïnstalleerd en geactiveerd, maar bijvoorbeeld het woord 'internetredacteur' ziet ook dit woordenboek als fout en hoopt mij via een minder subtiele rode stippellijn ertoe te bewegen alsnog een spatie te plaatsen.

Natuurlijk is dit wel te begrijpen. Het moet onmenselijk veel tijd kosten om alle mogelijke combinaties in zo'n woordenboek te krijgen, of regels die zo sluitend zijn dat ze op correcte wijze kunnen voorspellen welke woorden aan elkaar moeten en welke gescheiden moeten worden. Maar goed: als consument vind ik dat het moet werken, en wil ik me niet bezighouden met waarom het niet werkt.

Zoals de schrijver van het artikel al terecht opmerkt, is het van de zotte dat de Nederlandse overheid niet meer zijn best doet om de spelling via diverse media in zijn juiste vorm beschikbaar te maken. De autoriteit van een spelling staat of valt bij de waarde die gebruikers eraan hechten en het geloof dat de gebruikers erin hebben. Voor je het weet, komen alle nieuwe spellingsregels in de categorie 'hen/hun', waarbij het de massa onduidelijk is hoe het werkt (naamvallen zijn niet onze sterkste kant) en daarom het onderscheid maar achterwege laat.
Dat verkeerd splitsen is ook mijn grootste ergernis in de bestaande spellingscontrole[...]
Dit probleem is uiteraard bekend maar valt niet op te lossen middels de woordenlijst. De algoritmen in myspell/hunspell zijn niet berekend op germaanse samengestelde woorden en moeten erop worden aangepast.
De spellingscontrole van OpenOffice is echt tenenkrommend. Kan niet tippen aan die van microsoft Office helaas....
De laatste keer dat ik OOo downloadde (check: daar staat ie nog steeds) moest ik hem van de "development" pagina afhalen. Ik neem aan dat ze nog wel met een complete Nederlandse versie komen, waarin de spellingscontrole minimaal net zo goed is als die van MS.

Immers, de Engelse versie heb ik nog niet kunnen betrappen op een fout.
Engels is ook makkelijker omdat de woorden los staan van elkaar.

Achteruitkijkspiegelschoonmaakdoekje is feitelijk een goed woord, maar dat ziet een spellchecker niet...
Maar het mag nou eenmaal wel. Als de woorden maar goed passen dan mag je inderdaad hottentottensoldatententententoonstellingsgebouwen als goed woord beschouwen
Zo zeker is dat niet :-)

"Heeft een aantal woorden een tussen‑n gekregen, andere woorden (zoals ideeënloos) hebben hem juist verloren. Verder zijn de regels voor hoofdlettergebruik veranderd (adam en jonas voortaan met kleine letter en Oscar en Zonnekoning voortaan met hoofdletter), en zijn de regels voor het aaneenschrijven van woorden 'verfijnd'. Voortaan schrijven we co-educatie in plaats van coëducatie, maar coschap in plaats van co-schap, en locoburgemeester in plaats van loco-burgemeester, maar na-ijlen in plaats van naijlen. Hier een streepje erbij, daar een streepje eraf. Kunt u het nog uit elkaar houden? De Office-spellingcontrole in ieder geval wel."
De van Dale kent het niet.
En volgens mij kan je niet zomaar woorden aan elkaar plakken, en zolang het goed klinkt, het als één woord zien.

Anders krijg je van dit soort dingen;

autobandventieldopjesfabrieksonderdirecteurssecretaressewerkzaamheden- parkeerbijeenkomsten

<div class="b3">Admin break: koppelteken geplaatst om layout te redden.</div>
Ik stel dan ook voor dat we met zn allen het Nederlands afschaffen en op Engels overstappen, wel zo makkelijk.
@Raymond P. Naast "sowieso" is de grootste fout van Tweakers om de woorden los te schrijven. Waarom? Omdat ze zoveel Engels lezen.
Het woord dat je noemt, is grammaticaal correct, echter heeft het totaal geen betekenis.

De 3 niveaus van correcte zinnen:
- spelling
- grammatica
- context
Het genoemde voorbeeld van "broeren laten" valt onder de derde categorie. Had Word niet iets met blauw onderlijnde woorden voor dit soort zinnen?

Dus... stap 1 is gedaan. Grammatica is echt veel minder werk dan spelling, gelukkig.
Af en toe lijkt het erop dat de nieuwe spelling alleen bedoeld is om zo veel mogelijk verwarring te scheppen...

Misschien worden ze gesponserd door een fabrikant van spelling controle software? ;)
Grammatica is echt veel minder werk dan spelling, gelukkig.
Waarom denk je dat het zo lang duurt voordat OO.o een grammaticacontrolemodule heeft? Omdat het zo weinig werk is om er eentje te maken? Ik denk dat je geen idee hebt wat erbij komt kijken...
Er is al een tijdje een update (groene boekje) van de spellingchecker van Word verkrijgbaar bij M$. Deze kun je gratis downloaden. (http://www.microsoft.com/...euwespellingcontrole.aspx)

Een 'nadeel': je moet wel een legale versie van office hebben om het te kunnen downloaden ;)
In de nieuwe office 2007 zit ie al ingebouwd, tenminste dat geeft mijn nederlandse versie aan. Dus hoeft ie ook niet te validaten (8>
Van waneer was de huidige spellingscontrole ook alweer? Er staat me iets bij van 1993 maar dat weet ik niet zeker :P
Hopelijk wordt het nu mogelijk om de spellingcontrole nu in meerdere opensource applicaties te integreren. Ik denk aan Firefox, Thunderbird en OpenOffice.

Op dit item kan niet meer gereageerd worden.