'Volgend jaar domeinnamen met niet-Latijnse tekens'

Tijdens de oprichtingsbijeenkomst van het Internet Governance Forum is druk gesproken over domeinnamen met niet-Latijnse tekens, de idn. Het ontbreken daarvan is veel mensen in landen waarin het schrift andere dan Latijnse tekens bevat een doorn in het oog.

Mensen in deze landen kunnen websites niet via een url in hun eigen taal bezoeken; alleen Latijnse tekens zijn mogelijk. Bezoekers uit bijvoorbeeld China zullen dus altijd voor hen vreemde letters moeten gebruiken. De Icann heeft tot nu toe weinig daadkrachtig opgetreden om dit probleem aan te pakken, en dringt ook nu aan op geduld. Volgens de organisatie loopt het hele internet gevaar als verschillende landen hun eigen systeem voor niet-Latijnse domeinnamen gaan invoeren. Ook is het een potentieel veiligheidsrisico. Een domeinnaam als www.twëakers.net zou eenvoudig gebruikt kunnen worden voor een phishing-site. Volgens Icann-directeur Paul Twomey moeten alle systemen die bovenop het dns-systeem werken aangepast worden om met de nieuwe domeinnamen om te kunnen gaan.

Internationalized Domain NamesIn een voorlopige planning geeft de Icann aan dat er een werkend systeem voor internationale domeinnamen zou kunnen zijn aan het einde van 2007. Voor het zover is moeten nog vele testen worden gedaan. Voor het uitvoeren van deze testen is de Zweedse firma Autonomica door de Icann in de arm genomen. Gezien het feit dat er al 3 jaar gewerkt wordt aan het systeem is de voorlopige planning realistisch te noemen. De tweaker die al heel lang een al bezette domeinnaam wil hebben heeft dus volgend jaar de kans deze in het Farsi te krijgen.

Door Peter de Boer

Doktersteam

22-11-2006 • 22:32

99

Bron: Ars Technica

Reacties (99)

99
99
49
24
1
40
Wijzig sortering
heel leuk, en tegelijk ook weer heel gevaarlijk, want dan kunnen al die bedrijven weer extra domeinen opkopen

want www.abn-amrö.nl zou je normaal gezegd niet zo snel typen, maar imho toch lekker weer voor die phising site's om uit te proberen

probleem 2, hoe voeg ik vanuit mijn huidige browser, opeens allemaal die vreemde tekens in :?
''ga even naar deze site: ''japanse tekens''
ja, typ dat maar eens over :Y)
Nou denk ik niet dat veel mensen in West-Europa en VSA Aziatische websites bezoeken. En de enkele keer dat dit gebeurd zal het wel via een link gaan, dus veel typwerk komt er niet aan te pas.
Nou denk ik niet dat veel mensen in West-Europa en VSA Aziatische websites bezoeken.
Eigenlijk is dat jammer dat door steeds extremere lokalisatie het Internet steeds meer versplinterd. Nog heel even en het inter mag er van weer van af.

Was het een tien jaar geleden vooral een plek waar je mensen van allerlei naties kon ontmoeten, omdat op de fora en communitie sites van destijds iedereen gewoon Engels sprak, zo zit je tegenwoordig weer vooral in je eigen taal te werken en ontmoet je dus alleen medelanders.

Door hier te posten doe ik er natuurlijk zelf ook aan mee, maar het blijft in z'n geheel toch wel jammer...
Remond_FRL はばかです
Zoiets?  :+
En tweakers.net?
tweak = 扭动
maar tweakers kent babelfish niet :?
www.トウィーカス.net misschien?
Volgens mij zou je Tweakers.net zo schrijven in het .jp
Maar goed, doet het ertoe? www.tweakers.net is er al dus ik denk niet dat we snel een andere url nodig zullen hebben :z
Dat is Japans (Hiragana). D'r zijn nog best nederlanders die dat kunnen lezen.

ha baka desu. Geen idee wat ha betekent in deze context, maar goed, ik ben d'r dan ook niet zo heel handig in.

@usachan
Dank je wel. Ik heb net geleerd dat は ook voor wa gebruikt kan worden in deze constructie. Ik dacht dat het altijd わ was. Met wa komt het me bekender voor. Baka desu wist ik al :). Sukoshi wakarimasu.

@Waswat
wa is een voegwoord, wat het voorgaande aanduidt als onderwerp en de nadruk legt op het eropvolgende (voorzover ik het heb begrepen kun je het ook vervangen door ga, dan ligt de nadruk op het onderwerp zelf). Ik kende alleen de schrijfwijze als ha niet. Desu is het werkwoord.

@Simen
zet de vertaling er even bij (honto=werkelijk, echt (?)) dan kunnen we er nog wat van leren
wa baka desu betekent ongeveer zoveel als 'is dom, idioot'
De 'ha' ken ik ook niet, maar 'baka desu' zonder onderwerp slaat meestal op de eerste persoon enkelvoud, dus 'ik ben dom'. De correcte manieren om dit volledig te doen zijn:

- watashi wa baka desu
- ore wa baka desu
- boku wa baka desu

IIRC, 'ore' betekent 'ik' in de vrouwelijke vorm, 'boku' in de mannelijke vorm, en 'watashi' kan voor beide geslachten, maar is meer beleefd.
"wa" (het japanse equivalent van "is") wordt als "ha" aangeduidt in de japanse schrijftaal ;)
er is geen correcte vertaling van japans naar latijnse letters, wa of ha maakt niet uit, het gaat om de klank.

Itsumari, kimi wa honto ni baka desu ne?
Ik dacht dat simen "Dus jij bent echt een idioot of niet?" zei (of zoiets)

Sore wa uso desu. Genoeg offtopic praat :D
Ik vraag me af hoe het zit als je de taalpaketten niet hebt geinstalleerd.
Zal je dan. wanneer je dan die vierkantjes die je ziet gaat kopieren en plakken, toch wel op de goede site terecht komen?
Domein registratie met exotische tekens is niet toegestaan; indien dezelfde domein zonder exotische tekens al bestaat.

Dit was (naar mijn weten) al het geval bij .de domeinen.
Incorrect, de laatste udrp die hierover handelde met betrekking tot een duitse idn stelde dat het bezit van de getransliteerde versie geen rechten gaf over de correcte (idn) versie en dat is logisch omdat vrijwel iedere correcte vertaling op meerdere manieren kan worden getranslitereerd.


Domein registratie met exotische tekens is niet toegestaan; indien dezelfde domein zonder exotische tekens al bestaat.


Bovenstaande is hoe dan ook onzin, een dergelijke voorwaarde bestaat helemaal niet.

First come, first serve, bovendien zijn 5 jaar geleden de eerste idn-domeinen geregistreerd, je denkt toch niet dat de miljoenen namen (over 5 jaar) die zijn geregistreerd eigenlijk toebehoren aan mensen met een compleet andere tekenset. Het zijn unieke domeinen die in de eerste plaats toebehoren aan de registreerder.

Je mag registreren wat je wilt in de taal die je maar wilt zolang er mag geen trademark issues zijn.
CTRL + C ---> CTRL + V

:) :+
Waarom zorg je er niet voor dat enkel specifieke top-level domeinen niet-latijnse tekens kunnen gebruiken? Je laat de ç en alle accenten op klinkers toe in .fr; je laat de volledige chinese tekenset toe op .cn, enzovoort. .com blijft latijns, aangezien dit internationaal zou moeten zijn.
Dat is te kort door de bocht, gtld staat voor generic tld, het is van functionele aard en het zou dan uiteindelijk ook alleen betrekking hebben op de taal waarin het geschreven is.

com -> commercial
net -> network
org -> organisation
..
etc
Er zullen vast wel tekentjes komen die lijken op een 'o' maar het toch niet zijn.

Ook als je een emailtje krijgt, en de minder slimme ( om niet te zeggen 'de dommere' ) gebruiker ziet www.abn-amrö.nl in zijn url staan, who cares, foutje van het systeem?
Dat was een tijdje geleden al eens uitgevoerd met een variant op paypal. Beide a's kwamen uit het Griekse Unicode gedeelte. De proof-of-concept site had zelfs een certificaat! Toen werd aanbevolen om IDN in Firefox e.d. uit te schakelen (IE ondersteunt helemaal geen IDN)
Anoniem: 189898 @KoKro22 november 2006 22:49
IE ondersteunt wel degelijk IDN. Of je bedoelt IE6?
WWW.ABNAMR0.NL is al geregistreerd (en dan niet door DE bank zelf...) (8>
en dan krijgde is nen email van nen buitelander


יכםשצנפהҹ@.צנפהש

:+
Dat is ook weer een probleem dat je daar opbrengt, emails worden gecodeerd als 7-bit ASCII, en kunnen dus standaard geen unicode tekens bevatten, in de inhoud van de berichten wordt fat opgelost door met HTML entities te werken, voor het euro-teken wordt er dan dan bijvoorbeeld € neergezet, maar in hostnamen kan dat niet.
En daarvoor is weer utf7 uitgevonden waarmee je wel Unicode tekens door een 7bit systeem krijgt. Maar dit zijn idd wel de randgevallen die last krijgen met de nieuwe domeinnamen.
Ik krijg nu al veel Russische spam (don't ask!) maar het is eigenlijk best handig te filteren. Dit: "приходи с подарком, который сразит всех наповал." kan ik toch niet lezen dus alle mail met cyrillische karakterset gaat direct de Junk-folder in.

Het maakt allemaal minder uit dan je denkt. Als je de doelgroep van de e-mail of website niet bent zul je het dus ook zelden of nooit tegenkomen.
Ik krijg al aardig wat serieuze mail met Koreaanse namen in het afzender-veld. :-)
En dan nu nog maar hopen dat ze ook nieuwe extensies maken in niet latijnse tekens....

Want om nou voor .com even je andere toetsenbord te pakken :+
Op mijn Thaise toetsenbord kan ik met een speciale toets omschakelen van Thais naar "normaal" alfabet (en weer terug).
เกลียว.com ?

Onhandiger lijkt het mij om een domeinnnaam van een billboard over te tikken als die niet in ons alfabet staat :S
みんあさんわばかです。jp :)
@shades: Kansloos? Leuk voor die landen die wel talen hanteren? Beetje kortzichting .. Chinees is de meest gesproken taal ter wereld, op grote afstand gevolgd door Spaans. En meer talen met vreemde tekens, zie meest gesproken talen.

Als je in de toekomst nog mee wilt doen op internet ga dan maar vast hierlangs chinees leren en leer meteen 10 vinger chinees typen :P
Anoniem: 113966 @RwinG22 november 2006 23:58
klopt geen k*t van die stats, Hindi en mandarijn zijn de meest gesproken talen ter wereld en spaans staat op de derde plaats. MAAR dat geldt alleen voor NATIVE gesproken. Als je kijkt naar hoeveel mensen Engels beheersen op de wereld kom je ver boven het Mandarijn uit.

Ik bedoel dus dat in Nederland men Nederlands praat (NATIVE), echter wij kunnen ook Engels spreken (SECONDARY) maar dat tellen ze helaas nooit mee.

Op de Harvard university hadden ze ooit een onderzoek gepubliceerd waaruit bleek dat ruim 2 miljard mensen verstaanbaar Engels beheersen! dat is pas een hoop.
Op de Harvard university hadden ze ooit een onderzoek gepubliceerd waaruit bleek dat ruim 2 miljard mensen verstaanbaar Engels beheersen!
ik wil ook wel een onderzoek zien hoeveel mensen verstaanbaar chinees spreken op de wereld. let wel: die 1,2 miljard chinezen zijn inwoners in china alleen ;)
er zijn namelijk ontzettend veel chinese migranten buiten china.

Er zijn ook andere onderzoeken die anders beweren, bijv. Ethnologue, een instituut die meer dan 70 jaar talen in de wereld catalogiseert en onderzoekt. Zij nemen wel de distributie van talen buiten hun landsgrenzen in beschouwing. Ook zij geven aan dat chinees 2x zoveel gesproken wordt als engels.
dat klopt toch niet,

Je moet mijn post eens goed gaan lezen, en dan zie je wat ik bedoel.

Als er 2x zoveel mensen zijn die Chinees (mandarijn) beheersen dan Engels, dan zouden dat er volgens jou er 4 miljard moeten zijn? op 6 miljard mensen op de wereld?
@sagher:
jij moet ook goed lezen.
Ethnologue geeft andere cijfers. dus niks 2 miljard engelssprekenden.
Anoniem: 183483 @RwinG23 november 2006 00:33
helaas voor jou is de internationaal de meest breed beheerste taal toch echt het engels
inderdaad... imho een vrij kansloos verhaal. deze tekens (enzo) zitten niet op mijn toetsenboard en als ik ze al wil invoeren wordt ik tegengehouden door tenenkrommende (euh vingerkrommende) toetscombinaties of altcodes. Leuk voor die landen die wel talen hanteren

blaaaaaahhh
lang leve copy&paste :)
Japans typen is niet moeilijk... Zet Japanese - Microsoft IME maar aan in Windows. Dan kan je de kana gewoon met latijnse karaters typen, door de klanken te typen.

Anata wa baka desu - あなたわばかです

Even op spatie duwen en hij maakt er (waar van toepassing) Kanji van: あなた輪馬鹿です, helemaal makkelijk :)
It is to see it is the あ わ foolish. Jp

Lang leve Babel Fish!
皆さんは馬鹿です.jp
Anoniem: 147846 22 november 2006 22:37
Hmm, nu ga je links krijgen met blokjes als je OS de taal niet ondersteund.
Ondanks dit lijkt het me wel een goed idee :)
zijn er dan OSen die zulke talen niet ondersteunen?
Nee, maar er zijn er wel die dit niet standaard meeleveren (Windows).
Nee, maar er zijn er wel die dit niet standaard meeleveren (Windows).
wat heet standaard?
in china, taiwan en HK is windows standaard in het chinees ;)
ja ik draai hier xp en ik zie overal in dit topic vraagtekens staan ipv japanse karakters :)
zijn er dan OSen die zulke talen niet ondersteunen?
ja. msdos 1.0 t/m 6.6
DOS kent ook codepages.
Dat veiligheidsprobleem los je simpel op.

Rare tekens alleen toelaten voor landextensies/landen die het nodig hebben. Dus ook niet .com .org. net etc. Desnoods nog rare-tekens-extensies :)
Dat is weer niet echt fair tegenover mensen uit bijvoorbeeld china. Waarom zouden die geen internationaal .com domein kunnen aanvragen in tekens. Neem bijvoorbeeld de duitste ringel "s" . Ik kan me best voorstellen dat duitse bedrijven die ook in hun .com domein naam willen hebben.

Alleen voor bepaalde landextenties is dus niet echt eerlijk. Het internet is er juist op gebaseerd dat iedereen er alles mee kan. En niet een bepaalde groep maar beperkte dingen.
Anoniem: 32579 @roan23 november 2006 12:59
Dit bericht gaat juist over ".com,.net...." in die 'rare tekens'. Ieder land met een eigen extensie bepaalt zelf of het wel of niet .idn nodig heeft.
dit wordt dus bigbusiness straks nieuwe .com tijden breken aan :)
Ik heb er al een aantal in gedachte die nog wel eens wat centjes op zouden kunnen gaan leveren

séx.com
sèx.com
sêx.com
sëx.com
Ik denk dat dat het wel meevalt. sex.com is duur omdat mensen dat intikken in hun browser. Lekker kort, populair onderwerp.

De door jou voorgestelde domeinnamen zal niemand zomaar intikken. Daar moet je altijd via linken komen. Het is dus daarom niet beter dan welke andere domeinnaam ook.

Maar er zullen altijd mensen zijn die zover niet nadenken en blind registreren. Ze kunnen om die reden nog wel wat opleveren.
Anoniem: 175502 22 november 2006 22:40
dus straks zitten we met 20 verschillende toetsenborden achter de computer? :+
Nee, want als de URL in een ander schrift is dan dat wij kunnen typen op onze huidige toetsenborden, mag je er wel vanuit gaan dat wij de gehele website niet kunnen lezen. ;)

Dus 20 toetsenborden zijn overbodig.

Overigens een goeie vooruitgang, heb me al een behoorlijke tijd afgevraagd hoe chinezen dat nou konden, zo even met hun chinese toetsenbord latijnse letters typen... Dit zal zeker voor die miljard mensen daar erg handig zijn, er vanuit gaande dat een groot deel daar geen ander schrift kent dan het Chinese.

Aan de andere kant: Nu zullen bedrijven die voor andere schriften een domeinnaam aanmaken, ook hun gehele site moeten aanpassen aan dat schrift, dus dat wordt vertaalwerk. :+
Ik heb nooit gesnapt hoe een chinees zijn woordenboek op een tobo krijgt

1 woord -> 1 teken

10.000 woorden...

Mijn G15 is al groot met zijn 140/150 ( weet niet ) knoppen
Het overgrote deel van de Chinezen typt gewoon met een Qwerty keyboard. De tekst in het nieuwsbericht dat mensen in hun niet eigen schrift URLs moeten intypen is in de praktijk helemaal geen probleem.

Ik spreek dan voornamelijk voor China en Japan, maar die gebruiken al gewoon latijnse karakters voor van alles en nog wat.

Daarnaast, net zoals geen enkele Nederlander 100% Nederlandse software gebruikt (niemand heeft een Nederlandse winzip, Eclipse, Nero, etc), zo gebruiken alle Chinezen ook gewoon massa's Engelse utils die natuurlijk latijnse karakters gebruiken.

Ik vind deze hele ontwikkeling een beetje een gemaakt probleem vanuit een Westers standpunt. Voor ons is het 'raar' om een nieuw karakter te leren, want dat zijn we niet gewend. Voor Chinezen is dat anders. Met enkele duizenden karakters leert men er om de zoveel tijd wel weer een nieuwe bij, net zoals wij nieuwe woorden leren.

Denkt men dan echt dat Chinezen moeite hebben om die 26 super eenvoudige karakters te leren?

Voor Japanners geldt een zelfde verhaal. Die hebben wel significant minder karakters (+-2000 op betekenis, +- 100 op klank), maar hebben nog steeds absoluut geen moeite met die 26 simpele karakters van ons er bij te leren.

Nogmaals, dat is echt peanuts voor de lui. Men bedenkt een probleem dat er eigenlijk niet is.
Anoniem: 32579 @Snake23 november 2006 12:36
Je begrijpt het niet helemaal geloof ik(flowerp), dit is een ontwikkeling die 10 jaar geleden is opgestart omdat het van fundamenteel belang werd gezien om het internet volledig toegankelijk te maken voor iedereen. Nu is het zo dat de niet-westerse landen vinden dat die ontwikkeling niet snel genoeg gaat en dus hebben ze eigen initiatieven ontplooid, daar gaat dit bericht mede over.

Het klopt verder niet wat je zegt over het gebruik van latijnse tekens, het is helemaal niet "populair" maar het is lange tijd de enige mogelijkheid geweest om software te gebruiken danwel het internet te hanteren. Ja natuurlijk kunnen ze het zich eigen maken maar het zou toch vanzelfsprekend moeten zijn dat ze zich liever direct in hun eigen taal uiten. Chinese,koreanen en japanners gebruiken engelse namen die in een voor hun enigzins acceptabele vorm zijn gegoten, namelijk getallen, pinyin of afgeleiden daarvan. Dat wil natuurlijk niet zeggen dat het optimaal is en dat de gebruikers niet liever een op een taalkundig correcte wijze hun taal willen hanteren, wat toch echt voor hand zou moeten liggen.
Je denkt toch niet dat een Chinees liever een fonetische versie van een chinees begrip invoert in niet-chinese karakters dan dat hij simpelweg direct het chinees invoert ? Als je praat over de invoermethodes van het chinese dan het is niet noodzakelijk om daar iets aan te veranderen, het gaat met name om de weergave van wat ze typen, pinyin zouden dus leiden tot meerdere mogelijkheden in het chinees of ze kunnen het met een wudi-toetsenbord invoeren.

Wat jij hier opschrijft is juist de westerse kijk op zaken, namelijk dat het "geen probleem is" alsof dat vereist om deze ontwikkeling te rechtvaardigen en bovendien heb je dan een compleet verkeerde voorstelling van zaken over het zogenaamde het gemak waarmee latijnse karakters worden gehanteerd, alsof iemand niet de voorkeur zou hebben om niet noodgedwongen een andere tekenset te gebruiken.
Volgens mij typen ze met een qwerty (-achtig) toetsenbord de klank van de tekens en maakt software er nette Chinese karakters van.
edit:
Te laat en zo te zien zit ook nog fout.
Nu ik dit zie, lijkt het tikken in chinees (traditioneel) eigenlijk heel makkelijk. Zolang je maar kan onthouden hoe het karakter "gemaakt" wordt. Namelijk uit losse onderdelen. Hetzelfde systeem dus als Nederlands.
Denkt men dan echt dat Chinezen moeite hebben om die 26 super eenvoudige karakters te leren?
Ik heb ooit weleens gelezen dat chinezen ongeveer tot hun 12e bezig zijn met leren schrijven ;) Gewoon omdat die tekens te moeilijk zijn om in een jaar te leren zoals wij dat doen.
Maar als een Chinese tweaker cool nieuws op zijn weblog/site wil potsen in het engels om ons ter wille te zijn moeten we dus wel met die URL gaan kutten of hij moet er twee hebben?!
Allemaal een Optimus toetsenbord met lcd-schermpjes in de toetsen kopen! :Y)
Als ze de phishing willen tegen gaan kan je dan niet voor elk schrift aparte extensies nemen?
Dat geldt natuurlijk al voor .ctld's die gerust een idn-versie mogen toepassen maar het gaat hier om .gtld's.

Als je voor elk schrift aparte .gtld's in de root gaat zetten dan praten we over vele tientallen extra extensies die in de root en bij de registries beheerd moeten worden.

Op dit item kan niet meer gereageerd worden.