CERN heeft een groot gedeelte van de gegevens die door de Large Hadron Collider zijn verzameld vrijgegeven voor het publiek. Geïnteresseerden kunnen door 300 TB aan data spitten die is verzameld door de CMS-detector in het jaar 2011.
In de datasets staan gegevens over het botsen van protonen met een energie van 7 TeV. De data is vrijgegeven omdat CERN deze inmiddels zelf heeft geanalyseerd, en de organisatie het nu tijd vindt dat ook anderen er toegang toe krijgen. Wie geïnteresseerd is in de protonenbotsingen moet zich naar de Open Data Portal van het CERN begeven. Daar kunnen met de ingebouwde software simulaties worden gedaan waarbij ook beelden gemaakt kunnen worden. CERN heeft hier zelf een voorbeeld van online gezet.
Wetenschappers kunnen de zogenaamde primaire datasets downloaden, om hiermee onderzoek te kunnen doen. Andere belangstellenden, zoals scholen, kunnen de afgeleide datasets downloaden. Dit onderscheid is gemaakt omdat de afgeleide datasets veel gemakkelijker in het gebruik zijn en dus minder expertise vereisen voor de analyse. Volgens CERN zijn er positieve ervaringen met het vrijgeven van data, onder meer via samenwerkingen met onderzoekers van technologie-instituut MIT.
Overigens laat de LHC sinds vorig jaar al met energieniveaus van 13 TeV protonen op elkaar botsen, maar de vrijgegeven data is afkomstig uit 2011, toen de botsingen nog minder krachtig waren. Na een upgrade in 2022 is het overigens de bedoeling dat er nog veel krachtigere bundels met deeltjes op elkaar worden geschoten.
In de wetenschappelijke wereld is het delen van datasets afkomstig uit onderzoek controversieel. Zo zijn veel instellingen niet bereid brongegevens te delen, onder meer uit concurrentieoverwegingen. De EU heeft recentelijk een groot onderzoeksprogramma aangekondigd om wetenschappelijke data beter te ontsluiten en met elkaar te koppelen. Zo kunnen de conclusies van de onderzoekers gevalideerd worden en moet worden voorkomen dat onderzoek onnodig wordt herhaald.