Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 57 reacties

Microsoft heeft nieuwe documentatie gepubliceerd over de bestandsindelingen van documenten die zijn gemaakt met de kantoorbundel Office. De documentatie beschrijft onder andere binaire Word-, Excel- en Powerpoint-bestanden.

Hoewel Microsoft eerder al voorlopige versies van de protocoldocumentatie publiceerde, labelt de fabrikant de nu vrijgegeven documentatie als versie 1.0. De technische documenten bevatten informatie over de protocollen die worden gebruikt in Office 2007, Sharepoint Server 2007 en Exchange Server 2007. Ook heeft de fabrikant zo'n vijfduizend pagina's met nieuwe technische documentatie voor de binaire Office-formaten gepubliceerd, zo heeft Microsoft bekendgemaakt.

Doc icoonMet de vrijgegeven specificaties kunnen ontwikkelaars hun applicaties compatibel maken met de veelgebruikte Office-formaten van de softwaregigant. De gegevens beschrijven niet alleen de ooxml-indeling van Office 2007, maar ook de binaire file formats van oudere versies van de kantoorbundel. Hoewel in enkele delen van de documentatie code staat beschreven waarop Microsoft-patenten rusten, heeft het bedrijf aangegeven dat het bij niet-commercieel gebruik geen rechtszaken tegen software-ontwikkelaars zal aanspannen.

De publicatie van de informatie over de bestandsindelingen van Office-bestanden maakt onderdeel uit van een inhaalslag die de softwaregigant moet maken: het bedrijf werd door de Europese kartelwaakhond gedwongen om details over zijn tot dan toe angstvallig gesloten gehouden kantoorsoftware openbaar te maken. In april publiceerde Microsoft al rudimentaire technische informatie over de diverse Office-protocollen; inmiddels is versie 1.0 van deze documentatie online gezet.

Microsoft is ook met een aantal projecten begonnen om tools te bouwen waarmee ooxml-bestanden vanuit bijvoorbeeld Word of Excel geconverteerd kunnen worden naar andere formaten, waaronder uof en odf. De laatstgenoemde specificatie werd in 2006 tot ISO-standaard verheven en onlangs gaf Microsoft schoorvoetend toe dat het de slag met zijn ooxml-formaat heeft verloren.

Moderatie-faq Wijzig weergave

Reacties (57)

Voordat iedereen hosanna en halleluja gaat roepen omdat het nu dus wel snel mogelijk zal zijn om bijvoorbeeld OpenOffice te voorzien van perfecte ondersteuning voor de 'oude' Office files moeten we wel even kijken hoe die formaten nu precies in elkaar zitten.

Joel Spolsky heeft hier een leuk stuk over geschreven. Een paar highlights:
You see, Excel 97-2003 files are OLE compound documents, which are, essentially, file systems inside a single file. These are sufficiently complicated that you have to read another 9 page spec to figure that out. And these “specs” look more like C data structures than what we traditionally think of as a spec. It's a whole hierarchical file system.
Kortom, je krijgt eigenlijk alleen een wat andere view op bijvoorbeeld stukken source van Excel. Deze verwevenheid met de source van Office komt vaker naar voren:
The assumption, and a fairly reasonable one at the time, was that the Word file format only had to be read and written by Word. That means that whenever a programmer on the Word team had to make a decision about how to change the file format, the only thing they cared about was (a) what was fast and (b) what took the fewest lines of code in the Word code base.
Als het formaat zich inderdaad op die manier heeft ontwikkeld dan is het niet meer dan logisch dat heel veel zaken zeer sterk verweven zijn met de implementatie van een feature in MS Office.

Bovendien moet je erg veel weten over hoe Office zich gedraagt als er een file wordt ingelezen/bewerkt:
Indeed, as you work on your Excel clone, you'll discover all kinds of subtle details about date handling. When does Excel convert numbers to dates? How does the formatting work? Why is 1/31 interpreted as January 31 of this year, while 1/50 is interpreted as January 1st, 1950? All of these subtle bits of behavior cannot be fully documented without writing a document that has the same amount of information as the Excel source code.
Voordat je dat allemaal hebt uitgevogeld ben je wel een paar jaar verder....
Goede nuancering :)

Wat ik ook erg sterk vind uit het artikel:
Every checkbox, every formatting option, and every feature in Microsoft Office has to be represented in file formats somewhere. That checkbox in Word's paragraph menu called 'Keep With Next' that causes a paragraph to be moved to the next page if necessary so that it's on the same page as the paragraph after it? That has to be in the file format.

That means if you want to implement a perfect Word clone than can correctly read Word documents, you have to implement that feature. If you're creating a competitive word processor that has to load Word documents, it may only take you a minute to write the code to load that bit from the file format, but it might take you weeks to change your page layout algorithm to accommodate it. If you don't, customers will open their Word files in your clone and all the pages will be messed up.
Daarmee is aardig het probleem samengevat van OpenOffice. Het kan je Word document erg goed lezen, maar dat verschil tussen 99.9% en 100% nekt je. Bij een klein foutje schuiven gebruikers het pakket al af. Erg begrijpelijk omdat je Word document idd niet goed weergegeven wordt, maar het geeft wel aan hoe lastig het is om daarwerkelijke compatibility te krijgen.

[Reactie gewijzigd door YaPP op 1 juli 2008 13:42]

En dit is nou een van de redenen waarom het hebben van 1 formaat niet werkt en ook helemaal niet interessant is. Voordat je het weet kies je geen office app die je wilt gebruiken, maar kies je nog maar enkel een skin. Geen innovatie meer, markt geschaad, en wij als eindgebruiker kunnen niet mooie unieke content gebruiken (zoals SmartArt bijvoorbeeld, wat echt een stukje top innovatie is)
Dat zal ook de reden zijn waarom dat hele Internet nooit een succes is geworden. Een standaard voor de uitwisseling van informatie, het moet niet veel gekker worden....
Is SmartArt trouwens iets dat actief wordt bijgewerkt als je de lijst aanpast op basis waarvan de afbeelding is gemaakt? In dat geval is er wellicht een probleem, anders zou het zo in een bestaand fileformaat kunnen passen.
Well dat is het probleem met Propiety spul!

voor jaren is er ontwikkelt met alleen de applicatie in zicht en niet wat als het moet samenwerken. Nu zit je dus met een ramp van een formaat die zelfs mensen bij microsoft waarschijnlijk niet meer kennen!
Yeah, nog meer kans op Office virussen....
Wie kan ik daar voor gaan bedanken?
De OSS groeperingen of Neelie "ik heb geen crusade tegen Ms" Kroes??

Zeg het maar.
Daarbij ben ik heel benieuwd hoe lang het gaat duren voordat er ook maar 1 nuttig ding voor uitkomt voor Office....
Euhm, het is niet omdat een bestandsformaat open is, dat er meer virussen voor uitkomen. Integendeel, door het open maken van bepaalde broncode of formaten genereer je juist meer awareness en kan ook iedereen meedenken die dat niet wilt dat er meer virussen uitkomen. Ik veronderstel ook dat er meer mensen zijn die mekaar geen problemen toewensen als daar zijn die dat juist wel willen (hackers/virusschrijvers etc) ;)

BTW. ik maak de vergelijking met bijvoorbeeld *populaire*¨open source projecten, daar zijn de oplossingen voor vulnerabilites sneller uit dan bij MS e.d.

[Reactie gewijzigd door fryelectro op 2 juli 2008 12:49]

Een stap in de goede richting, mits deze natuurlijk zonder NDA of andere vervelende licentiefratsen verkrijgbaar en te gebruiken zijn! We zijn allemaal gebaat bij open formaten en deze specificaties kunnen helpen om document archieven om te zetten naar open formaten.

[edit]
Zo te zien zijn alle files vrij te downloaden zonder akkoord te moeten gaan met allemaal licenties en beperkingen. Er zijn momenteel echter nogal veel mensen hetzelfde aan het proberen dus het daadwerkelijke downloaden wil nog niet zo.

[Reactie gewijzigd door Gerco op 1 juli 2008 10:39]

De binary office specifcations waren al in de vorige eeuw beschikbaar voor overheden en onderwijsdoeleinden en zijn ook al een flink aantal jaren op basis van een gratis licentie beschikbaar voor iedereen:
http://support.microsoft.com/kb/840817
en zijn al sinds februari 2008 makkelijk zelfs makkelijk vrijelijk te downloaden
http://www.microsoft.com/.../OfficeBinaryFormats.mspx
op basis van een vrije patent licentie
http://www.microsoft.com/interop/osp

Het artikel doelt dus vermoedelijk op het nu aanvullend vrijgeven van aanvullende Office protocollen maar is dus verder volslagen onzin op het gebied van de Office binary formaat specificaties die al jarenlang beschikbaar waren en die bijvoorbeeld door Sun (OOo) al jaren geleden zijn opgevraagd.

[Reactie gewijzigd door 80466 op 2 juli 2008 07:46]

Dat pas na ongeveer 15 jaar na de introductie van het DOC-formaat de specificaties worden vrijgegeven, is erg opmerkzaam. Gedurende die tijd hebben andere applicaties, waaronder OpenOffice maar zelf moeten uitvogelen hoe het formaat in elkaar zat, en dat ging niet altijd vlekkeloos.

Gelukkig kan iedereen nu inzicht krijgen in de specificaties en hopelijk zorgt dit voor betere ondersteuning voor Office-documenten.

[Reactie gewijzigd door Nordlys op 1 juli 2008 10:38]

Iedereen had natuurlijk ook een licentie kunnen aanschaffen.
Sun heeft al jaren geleden de specs gewoon gratis bij Microsoft bestelt. Zoals iedereen dat kon.
Ondanks wat het artikel beweert waren de formaat specificaties al lang verkrijgbaar maar zijn daar nu allerlei protocollen die door office programmatuur gebruikt worden bijgekomen
Ik ben wel benieuwd naar de kwaliteit van deze documentatie. Het commentaar op de OpenXML specs was niet van de lucht, en terecht. Het valt nog te bezien of deze specificaties van betere kwaliteit zijn. Als ze bol staan naar verwijzingen naar gedrag van een specifieke (versie van een) applicatie, dan zijn ze nog altijd niet echt bruikbaar.
Eindelijk! Respect voor MS. _/-\o_
Dit snap ik dus niet. Als MS zo lang achter de feiten aan loopt en pas over de brug komt wanneer er klanten en potentiŽle klanten wegblijven krijgt zo'n MS respect? Als ik altijd de klootzak uithang en een keer aardig ga doen krijg ik dan ook respect, maar de mensen die gewoon altijd aardig doen niet? Ze moeten gewoon wel, en daar is weinig respect voor te geven. Ze lopen op de laatste ontwikkelingen achter en zien hun klanten overstappen op andere standaarden. Het is dus allemaal eigen belang en niet zozeer om de uiteindelijke gebruiker het makkelijker te maken.

Ik als software developer (.net) begrijp ook niet waarom het alleen voor niet commercieel gebruik gebruikt mag worden. Wie heeft er dan nog profijt van, als je de code vrij geeft voor ontwikkelaars? Software bedrijven die ontwikkelen in MS-omgevingen doen dit om geld te verdienen, want de investeringen zijn niet mals. Dus wie heeft er nu profijt van dat het vrij gegeven wordt?
Dit snap ik dus niet. Als MS zo lang achter de feiten aan loopt en pas over de brug komt wanneer er klanten en potentiŽle klanten wegblijven krijgt zo'n MS respect?
dit is echt niet vrijwillig maar gedwongen door de EU.

en dit is bijvoorbeeld voor de ontwikkelaar van openoffice en star office. en dat zou er voor zorgen dat er weer een obstakel is weggenomen voor het gebruik van OSS software (linux omgeving) in het bedrijfsleven.

[Reactie gewijzigd door Countess op 1 juli 2008 11:15]

Als ik altijd de klootzak uithang en een keer aardig ga doen krijg ik dan ook respect, maar de mensen die gewoon altijd aardig doen niet?
Zo werkt de wereld tegenwoordig.

Als je maar lang genoeg de klootzak uithangt en je doet dan een keer iets goed, dan ben je de held van de dag.

Net zoals in het echte leven.

Een grote crimineel doe jarenlang zware misdaden pleegt krijgt toch ook strafvermindering als hij plots spijt betuigt ?

Welcome to the real world..
Niets weerhoudt een commerciŽle uitgever om ODF support in te bouwen en dan een dikke verwijzing naar ťťn of ander open source DOC2ODF tool in hun import-dialogue te zetten... ;)
@tarabass
lezen is een vak...
het is ook voor commercieel gebruik, alleen moet je dan licentiekosten betalen vanwege de patenten die nog op het formaat rusten.
De publicatie van de informatie over de bestandsindelingen van Office-bestanden maakt onderdeel uit van een inhaalslag die de softwaregigant moet maken: het bedrijf werd door de Europese kartelwaakhond gedwongen om details over zijn tot dan toe angstvallig gesloten gehouden kantoorsoftware openbaar te maken"

Hoezo respect? Ze kunnen niet anders en hebben het al veel te lang uitgesteld.
En dan blijft het lastig, want wat is commercieel gebruik? Als OpenOffice.org het nou gaat gebruiken, is het dan commercieel? OpenOffice.org mag dan geen proprietair softwarepakket zijn, maar het wordt door veel commerciele instellingen gebruikt, en het ontwikkelende bedrijf erachter (Sun) kan dus blijkbaar deze specs niet zomaar gebruiken in StarOffice...
Nog een stapje verder: mag RedHat of Novel/Suse of Cononical een OpenOffice waar voor de import filters gebruik is gemaakt van deze specificaties wel distribureren? Dit zijn namelijk commerciŽle partijen, en die maken met hun distributies natuurlijk ook indirect commerciŽel gebruik van de patenten van Microsoft. Dat lijkt mij een linke situatie om eerlijk te zijn. Misschien is het niet onverstandig om van deze specs af te blijven tot duidelijk is hoe dit soort dingen geregeld zijn.
Novell (en de commerciŽle eindgebruikers van Novell producten) wel, want Novell heeft een patentendeal gemaakt met MS.
Ja, want Novell heeft al sinds 2006 een overeenkomst met Microsoft. Sun kan voor StarOffice niet de specificaties gebruiken omdat Sun een commercieel bedrijf is. Novell had al VBA support aan OpenOffice toegevoegd en nu kan OpenOffice mogelijk ook Word documenten beter inlezen en wegschrijven.

Red Hat is een grijs gebied. Red Hat mag niet zelf software ontwikkelen op basis van deze specificaties, maar als de specificaties zijn verwerkt in bijvoorbeeld OpenOffice/KOffice kan mag Red Hat wel die office pakketten verspreiden.

Dat deze stap eraan zat te komen was al langer bekend, zoals ik vorige week ook al aangaf in mijn reactie op de ooxml nederlaag.

Overigens is het grappig dat iedereen heeft over ooxml, terwijl de naam al maanden in veranderd naar OpenXml (ipv Open Office XML) om verwarring met OpenOffice te voorkomen.

Ik ben benieuwd of de specificaties in OpenOffice gebruikt zullen worden omdat deze naar GPLv3 zijn gegaan. In GPLv3 is expliciet aangegeven dat de software niet beschermd mag zijn door octrooien. Dat commerciele bedrijven de specificaties niet mogen gebruiken komt grotendeels omdat Microsoft zelf ook licenties op patenten heeft moeten nemen. Microsoft heeft dus eerst met o.a. IBM de licentie bepalingen moeten veranderen voordat zij de office specificaties konden vrijgeven.

De EU kan (mag) Microsoft niet dwingen patent licenties met andere bedrijven te overtreden door de specificaties vrij te geven. Op de mix conventie uit maart ging het gerucht de ronde dat Microsoft de EU boete zou doorsturen naar de partijen welke niet zouden meewerken aan het vrijgeven van de licenties op de patenten. Onder andere IBM en Eolas zou Microsoft tegen werken in het vrijgeven van de licenties/specificaties. Omdat Microsoft niet de enige licentie houder is op dergelijk technieken, mogen commerciele bedrijven de technieken niet gebruiken en dienen bij deze bedrijven zelf een licentie af te sluiten.
Sun kan dit inderdaad niet gebruiken, maar gebruikers van het OpenOffice pakket kunnen dit absoluut voor commercieel gebruik gebruiken. Kijk maar naar Linux, de kernel is niet commercieel, maar het wordt wel in heel veel commerciele setups gebruikt, zolang je maar niet de kernel source gaat verhandelen en je aanpassingen publiceert.
Sun kan het wel degelijk gebruiken, mits ze netjes een licentie nemen op de relevante patenten van Microsoft.
Aangezien OpenOffice nu onder de GPLv3 valt, die alleen gepatenteerde code met non-discriminatory patent grants toestaat (dus niet alleen Sun, maar ieder individu ter wereld), zal het nog steeds niet in OOo verschijnen.
Da's OO.o' s probleem dan, niet dat van Microsoft
voorzover ik weet is go-oo.org echter bij GPL v2 gebleven ???? en dan zou dat wel eens kunnen betekenen dat zij er wel gebruik van mogen maken. (als ze dat al willen)

ik vraag me echter af hoe dat nu zit, want OOo kan al een hele tijd met office word docs omgaan (ben dus benieuwd hoe ze op die patenten heen komen?)
Je kan het natuurlijk ook checken, OOo valt onder de GPLv3 vanaf de eerste beta van OpenOffice 3.

Oh, je hebt het over de Go-OOo fork... maar die is al eerder op GPLv3 overgestapt, check de home page maar.

Het is natuurlijk de vraag hoeveel patenten geschonden worden. Tot nu toe is Microsoft nog nooit in details getreden over welke patenten geschonden worden. Het kan best zijn dat het deel dat gepatenteerd is, helemaal niet door OOo geÔmplementeerd is. Of op zo'n manier dat het niet onder dat patent valt.

Die patenten zijn natuurlijk ook de wapens in een soort van koude oorlog tussen bedrijven met een groot patenten-portfolio. Men schendt altijd wel een patent van elkaar, dus als er 1 rechtszaak wordt gestart, dan kan je meteen een tegen-rechtszaak verwachten. Er zal dus niet zo gauw uit de doeken worden gedaan wat er precies aan de hand is.

En tot die tijd profiteert MS natuurlijk van de angst, onzekerheid, en twijfel van de potentiŽle klanten van OOo.

[Reactie gewijzigd door DOT op 2 juli 2008 04:42]

En terecht toch Microsoft is toch niet verplicht om zijn uitvindingen (en ja over de kwaliteit kunnen we discusieren) weg te geven aan de concurrentie en natuurlijk is openoffice een opensource pakket maar Sun ontwikkelt het natuurlijk niet voor niets dat heeft een commerciele reden namelijk een groter markt aandeel voor hun spullen bewerkstelligen en dat is een commercieel belang.
Het gaat hier niet over uitvindingen, maar over compatibiliteit ;)
Het commcerciŽle gebruik slaat op commerciŽle software-ontwikkelaars en niet op commerciŽle gebruikers van de software waarin de specificatie verwerkt zit. Dat is natuurlijk logisch, het gaat om een octrooi. Inbreuk maken op een octrooi doe je niet als eindgebruiker, maar als ontwikkelaar.
Daar denkt Microsoft anders over, waarom zouden ze anders gedreigd hebben met het aanklagen van alle Linux gebruikers?
Steve Ballmer heeft gezegd dat 'alle Linux-gebruikers schatplichtig aan Microsoft zijn'.
hulde aan MicroS :p

grappig dat alle 'hulde' hier wordt weggemaaid (gemod)...

dit is natuurlijk een goede stap, hij mag dan nog gedwongen geweest zijn, ze hebben kosten nog inspanning gespaard om dit ook goed te doen (iets waar ze anders niet voor verplicht zijn)

[Reactie gewijzigd door tommy22 op 1 juli 2008 11:27]

grappig dat alle 'hulde' hier wordt weggemaaid (gemod)...
En terecht natuurlijk. Zoals tarabass hierboven al zei: nu MS verplicht wordt hun specs vrij te geven door de EU worden ze ineens toegejuicht en opgehemeld? Vind ik maar een rare redenatie, en neigt naar fanboyism. Ze hebben zich gewoon aan regels te houden, en doen dit echt niet om aardig te zijn of goodwill te kweken, aangezien hun hele bedrijfsmodel op vendor lock-in gebaseerd is, en hun lock-in formaten openbaar maken gaat daar lijnrecht tegenin.
uhm, ze hebben eerder zo lang mogelijk gewacht en dan mondjes maat incomplete documentie uitgebracht, totdat de EU het echt beu was...
Vandaar dat alle huldes weggemod worden denk ik...
OOXML is niet ODF. ODF is al sinds november 2006 een iso standaard.

http://nl.wikipedia.org/wiki/OpenDocument
Correct, ik heb het gerepareerd.
Een poosje terug dacht ik te hebben gelezen dat het ODF ook niet echt dť standaard kon gaan worden, vanwege technische beperkingen. Hoe zit dat nu dan? is ODF aangepast? of loopt dat w3c-achtige formaat nog steeds? Iemand die daar iets zinnigs over gehoord heeft?
Hoe kom jij nou weer bij de W3C? Wat heeft een document type met websites te maken? ODF is ISO standaard, XHTML bijvoorbeeld een W3C standaard. Groot verschil.

Edit:
Wat nou ongewenst. Het is wel een grote fout om de organisaties door elkaar te halen.

[Reactie gewijzigd door Hero of Time op 1 juli 2008 14:50]

Hero, het is ongewenst, omdat je de link in bovenstaande post niet hebt gelezen, er is wel degelijk sprake van een w3c-achig formaat.
spijtig dat visio niet meegenomen is in de lijst van bestandsformaten, ik zou heel graag eindelijk eens binnen linux een programma willen vinden dat vsd en shapes kan inlezen...

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True