Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Kandidaat-specificatie XML versie 1.1 stuit op verzet

News.com vertelt dat de recent uitgebracht XML 1.1 specificatie niet door iedereen met open armen werd ontvangen. Het W3C heeft een voorstel voor de standaard deze week openbaar gemaakt, en men heeft ongeveer vier maanden de tijd om aanvullingen of verbeteringen te suggereren voor het document het stempel "final" zal krijgen. De belangrijkste verbeteringen in versie 1.1 ten opzichte van 1.0 liggen op het gebied van Unicode ondersteuning. Dit is nodig om bijvoorbeeld met Russische of Japanse tekens te werken, maar ook voor bepaalde Westerse tekens als é en ç. Het eerste commentaar dook echter al snel op. De schoen wringt bij een teken dat alleen door IBM gebruikt wordt om een nieuwe regel aan te geven. Het bedrijf wordt er van beschuldigd zijn macht te misbruiken om een standaard erdoor te duwen. Het opnemen van het IBM-newline karakter zou betekenen dat een deel van de huidige XML 1.0 documenten kapot zou gaan met het invoeren van versie 1.1. IBM meent dat programma's die met XML werken dan maar de versie van de gebruikte standaard moeten controleren:

XML "IBM mostly grew out of their anti-competitive monopolistic tendencies over the last thirty years (with a large dose of assistance from the U.S. government)," reads an editorial on the XML news site Cafe con Leche that has circulated within the W3C's own XML 1.1 discussion forum.

"However, there are still some legacy issues relating to their attempt to dictate standards to the rest of the industry, and this is one of them. Now rather than fixing their own broken mainframe text-editing software, they want everyone else on the planet to change their software so IBM doesn't have to," it said.

Door Wouter Tinus

18-10-2002 • 00:10

28 Linkedin Google+

Submitter: Wouter Tinus

Bron: News.com

Reacties (28)

Wijzig sortering
Het probleem is dus dat veel van de huidige parsers 'op hun bek' zullen gaan als er tekens voorkomen die wel scheidingstekens (zouden moeten) zijn, maar die niet als zodanig wordt herkend. Een XML 1.0 parser kan dus bijvoorbeeld een foutmelding geven als er een XML 1.1 document met IBM newline characters wordt geparset.

Lees hier trouwens meer over de [NEL] character:
http://www.w3.org/TR/2001/NOTE-newline-20010314

Het is vrij onwaarschijnlijk dat er gewone XML 1.0 documenten 'kapot gaan', aangezien teken #x85 toch niet zo gauw gebruikt werd, lijkt me.

Ik zie het probleem eerder bij de oude parsers die het nieuwe formaat niet goed zullen herkennen. Ook mijn eigen XML parser (in java) zou dit namelijk niet begrijpen.

Er is echter maar een zeer kleine aanpassing van de software nodig. Ik denk dat het probleem echt enorm overdreven wordt, en het was al lang geleden bekend dat dit zou gebeuren.
hoe breder kwa standaard hoe beter

echter is het jammer dat het niet backwardscompatible zou zijn

IBM meent dat programma's die met XML werken dan maar de versie van de gebruikte standaard moeten controleren:

tja das niet zo makkelijk natuurlijk. ik weet niet in hoeverre xml al imbedded wordt gebruikt en hoeveel bedrijven er al mee werken, maar het is natuurlijk een tactiek die ze van microsoft hebben afgekeken...

het is natuurlijk slim om te zorgen dat anderen hun software aan moeten passen ipv dat je het zelf moet doen, scheelt je toch weer een aantal programmeurs voor een periode aan het werk hebben.
De vraag is: Hoe graag wil de XML community de data van deze IBM systemen delen?

Ik denk: Hoe meer hoe beter.

Dus als het niet te moeilijk te intergreren is moet dat vooral gebeuren. (d.w.z: wel karakter gaat verloren en hoeveel impact heeft dat?)
Het zou me niets verbazen als IBM zijn zin krijgt. Tenslotte is een standaard end-of-line char in XML ook de LF en niet de CRLF ... zoals dat op een Microsoft OS het geval is. Unix / Linux gebruikers zijn hier natuurlijk blij mee en hier zijn ook de XML docs naar gevormd. Sterker nog, de XML editors die draaien op Windows zien in de LF ook een nieuwe regel beginnen. Dit wijzigen maakt veel in productie zijnde docs kapot.

(Al heeft de gemiddelde XML developer natuurlijk een nette XSD of DTD die de inkomende XML stream valideert voordat de parser deze naar de app stuurt.)
Dat [NEL] als newline character gebruikt gaat worden is helemaal niet zo vreemd, het is nl de newline charchacter van Unicode 3.0, waar XML 1.1 support voor bied. Of het goed is, is een andere vraag.
Ik denk dat de backwards compatibility er ook niet is als dat tekentje er niet in zit, aangezien de rest van unicode er wel bij zit, die snappen de huidige 1.0 XML parsers natuurlijk ook niet.

Ik denk dat het er vooral om gaat dat de 1.1 XML standaard een standaard is, wat dus inhoud dat een of ander tekentje van IBM daar niet in thuis hoort.
Zoals al door anderen gezegd is: de afhandeling van new lines is ook niet standaard, die is anders voor Windows dan voor Unix bijvoorbeeld en er is vast geen ISO standaard die zegt dat een new line op Windows CrLf moet zijn en op Unix alleen Lf.

Aangezien de huidige parsers helemaal geen 1.1 documenten MOGEN parsen zie ik verder geen probleem (als men aanneemt dat documenten zonder versie als 1.0 worden gezien) als IBM probeert om "hun" new line ook op te laten in de XML standaard.

Een standaard is maar een afspraak en veel standaarden beginnen hun leven als een idee/implementatie bij een of ander bedrijf of bij iemand op een zolderkamertje. Het wordt een standaard op het moment dat zo'n idee door een standaard organisatie wordt overgenomen. Zo kan het ook heel makkelijk met dit IBM voorstel gaan.

Op dit item kan niet meer gereageerd worden.


Apple iPhone XS Red Dead Redemption 2 LG W7 Google Pixel 3 XL OnePlus 6T (6GB ram) FIFA 19 Samsung Galaxy S10 Google Pixel 3

Tweakers vormt samen met Tweakers Elect, Hardware.Info, Autotrack, Nationale Vacaturebank, Intermediair en Independer de Persgroep Online Services B.V.
Alle rechten voorbehouden © 1998 - 2019 Hosting door True