Wetenschappers hernoemen genen omdat Excel ze als datum zag

Wetenschappers van het Human Gene Nomenclature Committee hebben afgelopen jaar 27 genen een nieuwe naam gegeven om een bijzondere reden. Excel bleef de namen van de genen omzetten in een datum en dat irriteerde veel wetenschappers.

Genen namen in Excel als datum
Input bij A1 is 'MARCH1', bij B1 'MARCHF1'

De wijziging staat in de nieuwe richtlijnen voor de naamgeving van genen die HGNC in Nature heeft gepubliceerd. Wetenschappers hadden moeite met bijvoorbeeld Membrane Associated Ring-CH-Type Finger 1, dat tot voor kort MARCH1 heette. Excel zette dat automatisch om in '1 maart' en wetenschappers die dat programma gebruiken, moeten dat dus elke keer ongedaan maken. Er is geen manier om te voorkomen dat Excel dat doet. MARCH1 heet nu MARCHF1 en SEPT1 heet nu SEPTIN1, waardoor Excel ze niet langer ziet als data en de inhoud van de cel erop aanpast.

De coördinator van HGNC, Elspeth Bruford, zegt tegen The Verge dat het beter was voor de wetenschappers om de naamgeving te veranderen dan voor Microsoft om de werking van Excel te wijzigen. "Dit is een heel beperkte use case voor Excel-software. Er is dus weinig reden voor Microsoft om een significante verandering door te voeren aan een functie die veel andere gebruikers wel vaak gebruiken." Microsoft heeft niet gereageerd op de kwestie.

Door Arnoud Wokke

Redacteur Tweakers

06-08-2020 • 15:41

298

Reacties (298)

298
274
127
20
0
108
Wijzig sortering
Het gaat wel vaker fout in Excel. Soms met grote effecten.
Hier is een leuk filmpje er over https://youtu.be/yb2zkxHDfUE
Ik kan me alle problemen nog herinneren tijdens de OpenDocument vs. OOXML bestandsformaatoorlog en alle keuzes die men daardoor moest maken.

Bepaalde bugs zitten al heel lang in Excel en gaan waarschijnlijk ook nooit opgelost worden (Excel incorrectly assumes that the year 1900 is a leap year bijvoorbeeld). Moet je dan als nieuw formaat deze bug overnemen zodat het compatibel blijft met oudere formaten of maak je juist van de gelegenheid gebruik om ze eindelijk te fixen? Dat zijn best complexe vragen.

Destijds is er door de mensen achter het OpenDocument fotmaat veel gebruik gemaakt van de kennis van The European Spreadsheet Risk Interest Group en een aantal wiskunde professoren om te zorgen dat applicaties die rondom OpenDocument gebouwd worden minder problemen hebben dan Excel.

Die episode heeft er bij mij in ieder geval voor gezorgd dat ik Excel veel minder ben gaan vertrouwen.
Excel is een raar produkt, ook als je standaard input plaatst in een veld ...
De fouten in het filmpje zijn de simpele dingetjes die in Excel fout gaan, dingen die je kunt zien, waar je op kunt filteren en zoeken. Er zitten zat fouten en features in Excel die lang zo simpel niet zijn, waarvan je de werking moet doorgronden om tot een accurate berekening te krijgen. Overigens vind ik de conclusie dat een spreadsheet onbetrouwbaar is als er een #N/A- of #DIV/0-fout in zit, nogal kort door de bocht. Dat ligt er maar helemaal aan waar het bestand voor bedoeld is. Gebruikers die die foutmeldingen wegpoetsen met een IFERROR zonder te checken of dat de juiste weg is, zijn veel gevaarlijker imho.

Wat mij betreft heel simpel: ieder softwarepakket zal her en der gebruikt worden op een manier die niet door de ontwikkelaars ervan is voorzien. En voor ieder softwarepakket geldt dat er door gebruikers af en toe fouten mee worden gemaakt die in de papieren kunnen lopen.

Dan krijg je dus fouten als een Gemeente Amsterdam die tot twee keer toe veel te hoge uitkeringen uitkeert (foutje met decimale komma), of het Oostenrijkse parlement dat bijna een begroting had goedgekeurd van € 102.000 in plaats van € 102.000.000.000 (in de begroting stond niet gemeld dat de genoemde bedragen in de tabelletjes in miljoenen Euro's waren).
Toont mooi aan wat een amateuristisch broddelwerkje het eigenlijk is. Zonder enige feedback lukraak gebruikersinvoer op anti-intuïtieve manier gaan wijzigen. Leuk om wat te spelen voor een hobbyist in de jaren '80, maar daar zou het bij gebleven moeten zijn.
Het komt erop neer dat je, in het algemeen, Excel uitsluitend veilig kunt gebruiken als je *alle* bizarre conversie regels uit je hoofd kent, en allerlei mechanismes inbouwt om ongewenste conversies te verhelpen.
Alle auto correct functies zijn zeer intuitief. Je weet direct waar de fout zit en hoe het gebeurd. Het enige wat Excel zou moeten doen is zorgen dat als je data importeert, dat je die functie kunt uitzetten.

Maar je moet Excel ook gebruiken waarvoor het bedoeld is. Het is in de basis nog altijd een rekenblad en geen database. Toch zijn we het steeds meer en meer gaan gebruiken als dat laatste. En het is net voor dat laatste gebruik dat MS dus volop dit soort converties is beginnen inbouwen.
Het is intuitief als je tante Annie heet en je proobeert je boekhoding te doen.
Maar bij het verwerken van grote data sets uit een backend systeem zoals een database of data warehouse zou je deze functies uit moeten kunnen zetten. De data is namelijk al juist geformatteerd.
Bij grote datasets is het nog maar de vraag of excel de juiste tool is of dat er betere alternatieven zijn, alleen al als je naar performance kijkt.
Je hebt helaas niet altijd de keuze bij de grote corporates. Ikzelf zit vooral in de backend, maar op het moment dat er interactie is met de business of met externe partijen mbt uitwisselen van data, dan wordt er heel snel met Excel geschakeld.

Ook zie je genoeg business consultants bij de business aanhaken en snel een prototype van een dashboard in elkaar smijten met wat flat files en vlookups, en dan vervolgesn dit "de specs" noemen en het over de heg gooien bij IT. En als je dan door de file gaat en je komt dit soort fouten tegen, terwijl het al een half jaar actief gebruikt wordt... dan fronsen je wenkbrauwen wel even ja :-)
Alle auto correct functies intuïtief? Heb je het filmpje van Calamor wel bekeken? Of het artikel gelezen?
Autocorrect? Ik zou zeggen autodestruct.
Zeker bij een csv import. Kom op zeg, wie gaat zijn import nalezen?
Uhm.. Maarja, geldt dat niet voor alle tools die je gebruikt? Excel is VERRE van 'leuk om wat te spelen voor een hobbyist', als jij dat denkt, dan ken je dus echt excel helemaal niet.
Excel the Root of all evil .. Als ik zie wat mensen allemaal doen met excel word ik er zelf gek van .. Waar ik freelance hebben ze zelfs alle config files in excel staan ... want het is gemakkelijk aanpassen ... natuurlijk weet niemand waar de laatste versie staat .. en commit en git is toch wat moeilijks ... maarja betaald goed op 5 minuten van de deur ... zijn belangrijkere dingen in het leven dan mij daar om te ergeren. En elke keer het fout gaat dan lig ik gewoon krom van het lachen (lees dus meerdere malen per week)

[Reactie gewijzigd door cricque op 22 juli 2024 20:20]

Ik heb hetzelfde als ik zie wat mensen allemaal doen met de Nederlandse taal. Daar probeer ik me dan niet aan te ergeren maar dat lukt niet altijd. :)
Autocorrect is ook evil :)
I didn’t Nintendo.
als je het in onedrive zet, krijg je dan niet een soort van historie? uiteraard niet hetzelfde als fatsoenlijke versionering maar je hebt tenminste dan iets?
Persoonlijk vind ik dit filmpje echt onzin.

- Ik maak zelf ook veel spreadsheets en soms heb je gewoon divided by null errors bij bepaalde rijen omdat je formules letterlijk uitkomen op 0. Vaak is het item wat je onderzoekt op die rij niet van toepassing en filter je dit later weg. Natuurlijk kan je dit mooi oplossen met een if statement ervoor bij de factor die 0 kan worden maar dat doet lang niet iedereen.
- Daarnaast heb je ook vaak excel templates met voorbeelden of uitwerkingen die nog ingevuld moeten worden. Voordat je ze invuld heb je dus mogelijk errors die nadat werkelijke getallen zijn ingevuld verdwijnen.
- Of je hebt excelsheets met heel veel uitwerkingen van metingen maar er is bijvoorbeeld niet elke seconde een goede meting verricht. Dit resultaten geven dan bijvoorbeeld bij de calculatie die erachter zit ook errors.

Ik kan nog wel even doorgaan wat voorbeelden betreft. Kortom er zit ontzettend veel bias in de analyse die ze gedaan hebben omdat ze de bedoeling van de bestanden niet hebben kunnen begrijpen. Neemt inderdaad niet weg dat onderzoek naar werking van spreadsheats altijd nuttig is maar zomaar de getallen op een hoop gooien zoals in dat filmpje is echt onzin.
Ik ben het helemaal met je eens.
Dit filmpje is erg populistisch ingestoken (zoals helaas tegenwoordig altijd met de filmpjes van Matt Parker, vroeger was hij beter) en geeft een misleidend beeld.
Ten eerste heeft Matt niet de optie aan staan dat automatische dataconversies worden gehighlight. Dan zie je namelijk meteen dat er iets gebeurd is, en kan je met een simpele Ctrl+z de auto-conversie ongedaan maken...

Het probleem ligt niet bij Excel maar de aannames die de gebruikers doen. Omdat Microsoft het promoot als makkelijk te gebruiken programma waarmee je supersimpel overzichten maakt en bewerkt, denken de gebruikers dat alles wat ze willen ook geen moeite kost. Dus nemen ze niet de tijd om zich te verdiepen in hoe ze bepaalde dingen goed in Excel doen. En interpreteren de gegevens die ze eruit krijgen verkeerd.
Helaas is dat onderzoek van het EuSpRiG een goed voorbeeld: ze hebben een grote dataset en veel gegevens, dus ze zouden betrouwbare resultaten moeten krijgen. Maar de conclusies die ze trekken (in ieder geval Matt Parker uit de video, misschien ligt de fout bij hem) die zijn gebaseerd op verkeerde aannames, waardoor die conclusies misleidend zijn.
Aan iedereen die een oplossing post d.m.v. een apostrof of cell formatting: je mist het punt.

Het punt is dat Excel automatische formatting doet, by default. Is dit uit te zetten? Vast. Kun je het fixen? Ongetwijfeld.

Maar als je met automatische dataprocessing gaat doen op duizenden rijen en toevallig zat het gen met de naam MARCH1 ertussen, dan gaat dit gewoon fout. Want mensen, ook wetenschappers, maken fouten.

Het beste wat je kunt doen is veranderingen maken zodat gehele categorieën van fouten niet meer gemaakt kunnen worden, by design. Het hernoemen van een arbitrair gekozen naam van een gen is daarin *veel* effectiever dan dat iedereen moeten onthouden dat als ergens in de processing pipeline Excel wordt gebruikt ergens een vinkje/apostrof/whatever gebruikt moet worden.

[Reactie gewijzigd door fiftyhillswest op 22 juli 2024 20:20]

Je kan in Excel de eigenschappen van de Cel omzetten zodat hij alles als Tekst leest, dat verhelpt dit probleem.
Je moet het wel weten.

Probleem is wel, zo gauw je copy paste doet naar een ander excel bestand kun je weer overnieuw beginnen...
Maar ja, het is en blijft wel weer een workaround...
Je kan in Excel de eigenschappen van de Cel omzetten zodat hij alles als Tekst leest, dat verhelpt dit probleem.
Het probleem is juist dat dit soort aanpassingen de hele tijd nodig zijn. In plaats van onderzoekers constant hierop te laten letten -wat nogal fout-gevoelig is-, is het makkelijker om de naamgeving te wijzigen.
zeker weten, vooral als 1 wetenschapper die instelling niet uitgezet heeft is er kans dat het Gehele bestand opnieuw gedaan moet worden.
Daarom is het ook zoals ik zei een workaround en geen oplossing.
Als je een externe file importeert, zoals bv een CSV bestand van elders, dan moet je dat iedere en elke keer weer opnieuw doen. En wat je zegt, met een nieuwe formule of een copy-paste ben je zo weer terug bij af idd.
Het gaat erom, als iemand dat vergeet en wanneer het gaat om een database van tienduizende genen je gewoon een groot probleem hebt.

De oplossing die de wetenschappers genomen hebben is gewoon logisch, het veranderd niks, niemand is gehecht aan de vorige namen en er kunnen geen fouten meer gemaakt worden.
Dit geeft ook gewoon aan dat Excel niet goed inelkaar zit. Het moet toch niet zo zijn dat je je data moet aanpassen omdat het programma het op een bepaalde manier interpreteert.
Daar ben ik het niet mee eens het is meer zoals
@The Zep Man hierboven aangeeft.
Excel is begonnen en bedoeld als handige tool om “complexe” berekeningen uit te voeren die door 99% van de bedrijven of personen regelmatig uitgevoerd moet worden. Als jij een use case hebt die in de ene procent valt heb je niet de goede tool te pakken met excel.
Ik ditto dat. Excel is een spreadsheet programma, bedoeld voor getallen, data en labels, geen tekstverwerker. Als je iets invoert dat op een datum lijkt vind ik het logisch dat je het daarbij behorend effect krijgt.
Waar ik mij wel erger is dat excel ipnummers converteert. In een nederlandse decimale installing zou het nog te verklaren zijn, echter in het engels mag een decimale punt slechts 1 keer voorkomen, kortom een meer dan 1 keer voorkomen (zoals bij een ipnummer) moet het echt tekst blijven (of als ipnummer naar het juiste decimale getal omgezet worden waarbij je als format getal of ipnummer zou moeten kunnen kiezen).

In openoffice met de sourcekode kan je het als echte tweaker natuurlijk gratis aanpassen....
Excel zit met zijn poten ongevraagd aan je data, als er nu een optie was waarmee je dat uit kon zetten in je werkboek, dan zou dat fantastisch zijn. Ik heb er vaker ellende mee dan dat het problemen oplost.

Ik heb er met name last van met data-analyses: ongevraagd voorloopnullen eraf slopen, de laatste cijfers van EAN-codes op nul zetten omdat het stiekem toch niet in een numeriek veld past, dingen die op een datum lijken, als datum formatteren. Of nog erger: van datums de dag en de maand omdraaien aan de hand van je system locale, totdat je bij dagnummer 13 uitkomt, en het dan niet meer doen, want maand 13 bestaat natuurlijk niet. Getallen met een andere decimaal dan je system locale compleet vernachelen.

Ik ben er vast een paar vergeten.
Probeer in Excel eens te rekenen met tijden of datums. Exact dezelfde waardes in een aantal kolommen maar 1 kan ie niet uitrekenen (allemaal hekjes) en de rest wel en meer inconsistenties. Bijvoorbeeld het uitrekenen van het aantal uren en minuten tussen 2 datums met tijden.
Als je allemaal hekjes ziet past het niet in de cel en moet je hem breder maken.

Uitrekenen van uren en minuten kan ook prima overigens.

Enige onhandige met datums is dat het geen datums voor 1900 accepteert.

[Reactie gewijzigd door i7x op 22 juli 2024 20:20]

het gaat om een hh:mm notatie, de kolom is even breed als de andere kolommen die wel goed worden weergegeven. Ik open de sheet nu net om te kijken en het probleem heeft zichzelf opgelost (het heeft er meer dan een maand verkeerd in gestaan). Schiet mij maar lek. En precies die willekeur is wat Excel zo vervelend maakt.
Kan zijn dat het bij sommige tijden te breed is en andere niet (minder cijfers). Of misschien was je uitgezoomed op je sheet, dan gebeurt het ook wel eens. Lijkt mij iig sterk dat er zonder reden hekjes komen, dat gebeurt normaal enkel als het niet past. Of bij dingen als N/A en NULL, maar dan is het maar 1 hekje.
"Bijvoorbeeld het uitrekenen van het aantal uren en minuten tussen 2 datums met tijden."
Bedoel je dat je max binnen 1 dag kan uitrekenen? Dat kun je oplossen met de celeigenschap [u]:mm:ss i.p.v. u:mm:ss. Bij u pakt hij maximaal 24 uur, bij [u] gaat hij ook daaroverheen.
Of de "d" erbij zetten als je intervallen hebt van >24 u, maar dat is qua formattering niet altijd prettig.
Ik zou zeggen gebruik als echte data analist python. Daar zijn veel handige tools voor om data te verwerken/analyseren.
Werkt naar mijn inzien beter dan excel.
Probleem is dat de data wordt aangepast op het moment van invoer, en niet moment van weergave of moment van gebruik.
Nou is Excel een Lotus123-afstammeling. En dat is toch wel de BASIC onder dat soort software hoor.
Met numerieke referenties, tabbladen die je niet naast elkaar kan zien, en ga zo maar door.
Waarom kan ik niet 2 sheetjes naast elkaar op 1 scherm hebben. Met naam en een datatype voor elke kolom. De eerste index altijd 1, en dus niet 2 "omdat er een titel boven moet staan".
Bah bah bah. Het is echt een soort BASIC met regelnummers wat dat betreft.
Zo beperkt, maar ook zo krachtig. Excel is prachtig of een gedrocht, afhankelijk van je standpunt. Het heeft idd wel iets van Basic wat dat betreft. Excel zou verbeterd kunnen worden, maar dan zou het geen Excel meer zijn dus dat zal niet gebeuren.
Zo beperkt, maar ook zo krachtig. Excel is prachtig of een gedrocht, afhankelijk van je standpunt. Het heeft idd wel iets van Basic wat dat betreft. Excel zou verbeterd kunnen worden, maar dan zou het geen Excel meer zijn dus dat zal niet gebeuren.
Wat dat betreft is Excel als Hyves
Met programmeer taal python kan je alles doen qwa data analyse met krachtige tools als panda...
Genoeg onderzoekers die daarmee werken. Zelf vind ik excel voor data analyse/verwerking veel minder handig dan python.
Dus als je iets invoert wat op een datum *lijkt*, maar het niet is (want het is de naam van een gen), vind je het logisch dat Excel z'n ding doet.

Maar als jij iets invoert wat op een decimaal getal *lijkt*, maar het niet is (want het is een IP-adres), erger jij je aan het gedrag van Excel.

Spreek je jezelf niet een heel klein beetje tegen?
Dan zet je het toch op textfield? En als het niet gecalculeerd moet worden dan hoort het ook niet in een sheet thuis.
Microsoft heeft een lange traditie in het scheppen van slimme functies. Wie herinnert zich Clippy in Microsoft Office 2000 nog met zijn vrolijke opgeruimde en vooral dienstbare karakter? Zelden zal een hulpmiddel zoveel gevloek opgeleverd hebben. Werd standaard geïnstalleerd en was niet uit te schakelen, ook niet te verwijderen zonder installatie-CD. Clippy was voor velen een tegenstander van formaat. Zijn vrolijke uiterlijk hielp hem niet. Vrouwen beschouwden Clippy zelfs als een enge gluurder.

Nou is fouten maken niet erg als je er maar van leert. Alleen het MS management blijkt daar extreem resistent tegen te zijn. Hun devies is eenvoudig: Liefde overwint alles. Als de klant het niet waardeert, komt dat omdat hij onze visie niet begrijpt. Geef hem tijd om de genialiteit van onze oplossingen te laten doordringen. Wij zijn bereid met zijn beperkingen rekening te houden. We vragen het over vijf jaar nog eens.

Toch moest Clippy het veld ruimen. De herinnering vervaagde... Toen was het weer tijd voor iets nieuws, onze nieuwe maatje heette Cortana... Ook deze schat boog zich achterover om ons te helpen en was alom aanwezig. En wederom meende Microsoft dat ze onze beste vriend had geschapen. Je kan Microsoft veel verwijten maar niet dat ze niet aan recycling doen. Smaak verandert, wat vandaag wordt afgebrand, kan morgen zo maar een succes worden. Maar Microsofts smaak is wel altijd een verworven smaak. Dus met frisse tegenzin naar binnen lepelen. Microsoft belooft dat je het op den duur lekker gaat vinden, het is net als spruitjes.

En wat dacht je van de live informatie op je bureaublad in Windows98 (active desktop). Lumineus idee, dat toch zeker iedereen moet aanspreken. Helaas zit de wereld vol ondankbaren en het werd weggehoond. Maar het idee was goed! En Microsoft onthoudt goede ideeën vandaar dat het als live tiles terugkeerde in Windows 8. Microsoft bereidde zich voor op applaus maar nog steeds bleek de wereld vol eng denkende personen te zitten, die creatieve meesterwerken van de kunstenaar niet op waarde kunnen schatten. Dan niet, zegt Microsoft tegen de ondankbaren. We stoppen het voortaan wel in het startmenu als herinnering aan wat jullie hadden kunnen hebben.

Maar stroomt nu eindelijk de dankbaarheid?
Nee!

Socrates wou helpen en werd de gifbeker gegeven
Jezus wou helpen en werd aan het kruis gehangen
Gandhi wou helpen en werd doodgeschoten
Dat is het lot dat alle grote helpers treft.

[Reactie gewijzigd door Elefant op 22 juli 2024 20:20]

Microsoft heeft een lange traditie in het scheppen van slimme functies. Wie herinnert zich Clippy in Microsoft Office 2000
Clippy (a.k.a. Clipp-It) is geintroduceerd als assistant in Microsoft BoB(tm), dat was inderdaad een OS met heel, heel veel slimme functies. Microsoft Clippy lijkt een beetje op Apple Moof, de laatste was erg functioneel (voor een ander gebruik). Ze zijn er in Redmond overigens niet uit hoe geweldig Clippy is ..
Microsoft produkten: een portfolio van betere gekochte en eigen slecht verzonnen produkten. De suite door marketing technisch kapot geleverd om in nieuwe versies steeds gereparereerde fouten (en nieuwe geintroduceerde) als lokkertjes voor te leggen.
Wie herinnert zich Foxbase, ze kopen het en stoppen het produkt om Access minder concurrentie te geven ! Microsoft is goed in marketing, Bij Quick/IBM DOS is de technische sluier begonnen.
Techniek ? Me thinks not ...

[Reactie gewijzigd door tweazer op 22 juli 2024 20:20]

Ik denk dat er bij MS hele goede developers zitten, maar dat het management totaal geen notie heeft van wat de gebruiker wil. Niet alleen slaan ze zo de plank regelmatig volkomen mis, maar gaan ook nog halsstarrig door waarbij ze de schuld bij de gebruiker leggen. Dat komt omdat Microsoft traditioneel gericht is op push-marketing waarbij je je product door de supply change probeert te drukken. Microsoft heeft hele hanige persoonlijk verkopers die professionals plat weten te praten.

Maar die kopers zijn niet de gebruikers. Om die laatste te begrijpen heb je een omgekeerde mentaliteit nodig, waarbij je de klant/gebruiker koning maakt. Dan nog is het ontzettend moeilijk om te achterhalen wat hij nou eigenlijk wil, want hij kan het zelf niet verwoorden. Alleen Steve Jobs wist bijna feilloos de diepere behoeften in te schatten en daar producten op te enten en zo meermaals een grote goudader aan te boren.

Het probleem met slimme functies is, dat ze pas meerwaarde krijgen als ze nagenoeg perfect zijn. Neem spraakherkenning, pas als dit gaat zonder dat je hoeft te corrigeren wordt het interessant voor de meeste mensen. Leg je het op dan wordt het snel een ergernis. Functies die soms eigenhandig onbedoelde aanpassingen doen, worden snel uitgekost. 1% dissatisfiers overstemt gemakkelijk 99% satisfiers. Door deze functies op te dringen aan mensen die helemaal niet geholpen willen worden maak je het nog erger. Dat doet denken aan de filmpjes van de komiek Benny Hill die een oud vrouwtje helpt oversteken en met de tas om het hoofd wordt geslagen.

Men is altijd bang dat mensen de nieuwe functies niet ontdekken en dus niet gebruiken. Logisch want zoiets als Windows en Office zit al zo vol functies dat de meeste mensen 99% niet gebruiken. Maar who cares? Als 1% er dankbaar voor is, is dat toch prima. De kracht van Office zit er in dat het aan ieders wensen tegemoet komt hoe divers, buitenissig, oppervlakkig of diep die ook zijn. Ik zeg altijd tegen mensen, de vraag met office is niet of het kan, maar hoe het kan. Het kan alles! Maar ga mensen niet opdringen waar ze zelf niet om vragen. Als je mensen bijvoorbeeld veel snellere manieren aanleert, blijkt dat ze die na een jaar toch weer vergeten zijn, omdat ze het te weinig gebruiken.

Daarom getuigt het ook van totaal onbegrip om mensen de lintbalk op te dringen om zo meer functies zichtbaar te maken om mensen ze zo meer te laten gebruiken. Hoe mensen jouw product gebruiken moet je helemaal niet willen veranderen. Ze vinden het vreselijk als jij ze steeds dwingt om anders te gaan werken. Douwe Egberts verbetert ook niet steeds de koffie om de smaakervaring te verbeteren, nee, ze doen enorm veel moeite om de smaak precies zo te houden aan wat mensen gewend zijn en lekker vinden.

Onze samenleving wordt steeds meer gedreven door hanige typen die alles steeds willen verbeteren omdat ze zo carrière kunnen maken. Met dooddoeners als "je mag de vooruitgang niet tegenhouden" worden grootschalig goede organisaties en producten gesloopt, zonder dat er ooit een evaluatie wordt gehouden omdat men al weer met het volgende verbetertraject, reorganisatie bezig is.

Daarom vind ik Linux zo heerlijk. Men denkt heel goed na voor men iets implementeert en schept zo een solide basis waarop men steeds verder kan bouwen. Er wordt niet om de zoveel tijd de resetknop ingedrukt om weer iets nieuws te maken dat weer marketing gedreven is. Microsoft loopt voortdurend de met veel moeite opgebouwde cognitieve kaart van gebruikers te vernietigen om zijn eigen ontwikkelafdelingen bezig te houden en zijn updates voor nieuwprijs te verkopen. Eigenlijk wordt je als klant zo dubbel genaaid. Je krijgt iets nieuws opgedrongen waar je niet op zit te wachten en moet er nog de hoofdprijs voor betalen ook.

Maar nu zijn ze overgegaan op services en is het nog erger. Nog meer vernieuwingen waar je nog meer voor mag betalen. Beste MS luitjes. De meeste afdelingen willen alleen maar steeds dezelfde documentjes de deur uit schoppen en wat zelfgemaakte spreadsheetjes bijhouden. Daarop hebben ze hun personeel met de nodige moeite afgericht. Hou eens op steeds de werkgang te saboteren met je interfaceveranderingen en nieuwe leukigheden. Nee, de werknemers mogen niet fröbelen met jullie leuke opmaaktools, het is in bedrijven geen handwerkclubje. Hoe het eruit ziet, maakt niet uit, en als het naar buiten moet vullen ze maar een sjabloon in. En sommigen zijn zo stom, dat ze niet door hebben dat jullie slimme hulpjes de data lopen verneuken.

Nou ja, de wereld is gek. En dus probeert iedereen zich daar aan aan te passen om normaal te lijken.

[Reactie gewijzigd door Elefant op 22 juli 2024 20:20]

Het is jammer dat ik je geen ++ mod kan geven, ik denk dat je vanuit een breder overzicht een sublieme, perfecte aanvulling geeft ! De laaatste alinea denk ik dat het gedrag gedreven wordt door het feit dat ze uit office en OS sales steeds minder inkomsten boeken. Wat doe je dan ? Je "brengt alles naar de cloud". geeft ze (qua tijd beperkte) subscription toegang tot software, ipv eigendom. Een model wat korte termijn goedkoper voor de koper lijkt te zijn, totdat het abonnement afloopt, en ojee, exit clouddata en diensten .... Time will tell...
Bedrijven die nieuwe falende producten maken als Microsoft en Intel hebben toch het gelijk aan hun zijde. Waarom? Omdat ze elk jaar hogere winsten weten te rapporteren, en dat is het enige waar deze bedrijven echt om geven. De rest is bijzaak. Dat is een van de gevolgen van monopolievorming. Zonder echte concurrentie hoeven nieuwe producten niet beter in de smaak te vallen dan oude. Je ziet vaak dat naarmate de monopoliepositie sterker wordt men het product gaat uitkleden om nog meer winst te maken door kostenbesparing en men voor elke extra, extra laat betalen. De marketingverhalen eromheen blijven steeds even verheerlijkend.

Waarom kopers hier in mee gaan? Dat heeft te maken met de interne logica van bedrijven, die zit vaak verrassend anders in elkaar dan mensen denken. Zo zal in de productie-afdeling elk boutje gewogen worden om nog een milicent te besparen, maar in automatiseringsafdelingen is het net omgekeerd. Daar is men dolblij met de dure, werkverschaffende Microsoft producten. Deze producten betekenen groter budget, meer personeel. Dat maakt de afdeling en zijn baas belangrijker, zorgt voor meer bestedingsruimte en vrijheid en er kan ook wat meer aan de strijkstok blijven hangen. Daarom vindt de automatiseringsafdeling het helemaal niet erg de directeur te vertellen dat het weer wat duurder geworden is. Ook vinden ze het niet erg om bezig gehouden te worden door alle onnodige veranderingen die Microsoft doorvoert. Mensen maken maar al te vaak de fout om bedrijfsbelangen, afdelingsbelangen, en persoonlijke belangen als gelijk te beschouwen. Het kost bedrijven juist ongelooflijk veel moeite om die op één lijn te krijgen al praat iedereen braaf mee en verklaart opzichtig zijn trouw aan het bedrijf. Alles voor de organisatie, tuurlijk. Zeker in deze tijd: Heb hart voor het bedrijf, want het bedrijf is ook hard voor jou.

Eerlijk gezegd zal het managers aan hun reet roesten of de Cloud goed is voor het bedrijf. Het is nieuw, je kan er weer leuk mee scoren als manager. Je laat zien dat je met je tijd meegaat. Als je er de verantwoordelijkheid van down time mee naar Microsoft kan schuiven is dat ook meegenomen. Als het duurder wordt betekent dat dat ons budget weer stijgt (lekker...), het moet alleen niet ten koste gaan van de hoeveelheid personeel en wel genoeg werk met zich mee blijven brengen. We gaan niet onszelf overbodig maken. Op de productie kan je bezuinigen, op automatisering niet. Dan laten ze de zaak even in de soep lopen en weet je weer je plaats als directeur, deze gasten kunnen je maken en breken. Het is net als de Romeinse Garde. Die mislukte automatiseringsprojecten komen ook ergens vandaan. Alle belanghebbenden willen ze zien falen en eeuwig aan de gang houden.

Inefficiënt? De sterke nadruk op efficiency is in feite de mensen aan de onderkant uitkleden zodat ze daarboven zichzelf meer kunnen verrijken. In het ideale geval geef je de CEO een grote bonus en stroopt hij de anderen hun huid af door middel van verticale intimidatie. Heil Aandeelhouder! Sieg Heil, Sieg Heil. Sieg Heil. Maar automatisering blijft lastig. Je kan niet zonder, het verandert steeds, het zit vol risico's die de productie stil kunnen leggen. Je hebt ze nodig om de rest steeds verder uit te kleden. En ze spreken een koeterwaals dat niemand kan begrijpen en waar je hoofdpijn van krijgt. Je wil een ding onthouden:

De automatiseringsafdeling is de enige afdeling die zich niet weg laat automatiseren.

[Reactie gewijzigd door Elefant op 22 juli 2024 20:20]

Intel gaat flink veel pijn voelen als apple omgestapt is op ARM. Mircosoft, tja. Ik heb het idee dat men de produkten uit redmond niet zo speciaal meer vindt. Indien ja, is men ook niet meer zo snel geneigd veel te betalen. Kansen voor de linux dialekten ? Als apple daarnaast een budget (onder de zeg 200E) computer uitbrengt kan helemaal een aardbeving toeslaan...Ze kunnen het wel bij apple, maar of ze dat willlen ?
Anoniem: 718943 @Menesis6 augustus 2020 21:55
excel wordt nog steeds, na zoveel jaar, door ontzettend veel bedrijven gebruikt. Het is gewoon super krachtig en veelzijdig. Het concept van de spreadsheet is gewoon ouder dan de grafische desktop. Het feit dat het nog zo veel gebruikt wordt spreekt boekdelen.

Al moet ik zeggen dat ik persoonlijk meer gebruik maak van pandas/numpy icm jupyter voor m'n analyses, maar dat is meer de ontwikkelaarsachtergrond.
Dat is jouw interpretatie.
Elke vorm van automatisering heeft ook nadelen. Zeker als het om het herkennen van woorden gaat. Kijk maar naar de woordherkenning op de telefoon. Daar worden woorden die je intikt ook wel eens vervangen door iets wat je beslist niet bedoelt.

In dit geval is er voor de mensen die hun Excel-taal op een andere taal dan Engels hebben staan niets aan de hand en er zijn een aantal mogelijke work-arounds. Juist in de wetenschap worden er veel data gedeeld en de meest work-arounds hebben als nadeel dat ze bij het delen van bestanden verloren kunnen gaan. Bovendien is het lastig om voor een paar genen er steeds aan te denken dat je die met een apostrof schrijft. Dat gaat geheid mis.

Het is lullig, maar ook wel grappig, dat je bij naamgevingen soms rekening moet houden met hoe sommige programma's daarmee omgaan. Gelukkig is Word al vrij snel van het automatisch vervangen van woorden afgestapt. Een collega werd daardoor steevast hernoemt naar Drumstel, terwijl de naam er niet eens op leek.
Ha ha daar zeg je wat. Ik herinner me ineens dat er een een naam in een document van ons team was veranderd in Aarsvin Gokhal. De koffie zat op de monitor toen ik die tegenkwam.
De hele reden dat het zo fout kan lopen is echter omdat excel niet ontworpen is om data in een vaste en duidelijke context te interpreteren; iets wat je met, bijvoorbeeld, databases wél kan doen; aangeven dat iets écht als blob, string, int, etc opgeslagen moet worden.

Nu blijft de mogelijkheid open dat er een nieuw automagisch filter bijkomt wat op het opnieuw openen van zon document lukraak aan de slag kan gaan; met als bijkomend risico dat op een dataset met redelijke grootte dit ongemerkt kan voorkomen als je er wel niet heel waaks tegen bent; zeker als we als argument willen voeren dat de eindgebruiker niet alle onderliggende werkingen van excel uit zijn/haar hoofd moet leren om de data foutloos te kunnen verwerken ;)

[Reactie gewijzigd door Annihlator op 22 juli 2024 20:20]

Vele jaren geleden is een studie gedaan naar correctheid van spredheets. Ongeveer de helft bevat graverende fouten.
Omdat het onhanteerbaar is, die manier van dataverwerking. Je ziet niet wat er wordt opgeteld. Formules worden gekopieerd en automatisch aangepast - goed of fout, dan moet je elk exemplaar los aanklikken.
Gelukkig kan Excel meer dan 1 miljoen rijen in 1 spreadheet. Dat is dus echt nooit te controleren.
Ik vind dat MS hier een verantwoordelijkheid in heeft. En het migreren van echte software naar spreadsheets zou niet moeten gebeuren.
Waar heeft MS verantwoordelijkheid voor dan? Het is vrij duidelijk waar Excel voor bedoeld is, dat je er ook andere dingen mee kunt doen wil niet zeggen dat ze dat moeten faciliteren.
Ze hebben als feature de support voor 1 miljoen regels ingevoerd.
Waarom dan niet ook tools om de data een beetje consistent te houden?
Een fors deel van beslissingen wordt genomen op basis van hun excel. En excel is gevaarlijk.
Beslissingen nemen is een bedrijfsrisico. Dat degene die de analyses doet het in Excel wil doen terwijl het daar niet geschikt voor is kun je nog steeds MS niet kwalijk nemen.
Dat mag je, we leven in een vrij land. Of dat reëel is, dat is wat anders.
Ik herinner mij een artikel van lang geleden waar als vraag gesteld werd welk produkt je moest kopen bij een beperkt budget. De eindconclusie was excel: je kon er mee tekstverwerken, plaatjes maken, spreadsheets doen, databases beheren. Raar maar waar...
MS is niet verantwoordelijk voor het "probleem" dat jij Benoemt.. MS ontwikkelde Excel op deze manier, als dat jou niet uitkomt dan is MS niet verplicht het aan te passen.

Als u zich erg stoort, en u denkt dat de meerderheid zich er ook aan stoort, dan wil ik u een groot advies aanbrengen. Schrijf een eigen Excel en breng het uit om de wereld van spreadsheet makers te bevrijden van de tirannie van Microsoft Excel
excel is als grafisch concurrent van visicalc neergezet. IBM veroverde vanuit zijn accounting/automation (avant la lettre) aktiviteiten de wereld met computers die pen en papier konden vervangen, apple kwam met de macintosh die applicaties nodig had: bill gates greep zijn kans met excel 1.0 en groeide met een grafische shell bovenop dos..

Er zijn tientallen, zoniet honderden concurrenten van excel. Ik denk alleen niet dat het produkt het landschap (populariteit) bepaalt, maar eerder marketing en goedgelovigheid van de gebruikers...
Het beste wat je kunt doen is veranderingen maken zodat gehele categorieën van fouten niet meer gemaakt kunnen worden, by design.
Dat is een workaround, en je weet niet of er in de toekomst opnieuw wijzigingen gemaakt moeten worden voor toekomstige namen.

Je moet voorkomen dat je gaat dweilen met de kraan open. Het beste wat men kan doen is het juiste gereedschap gebruiken voor de juiste klus. Excel is als Zwitsers zakmes niet bedoeld voor automatische dataprocessing. Daarvoor doet het zelf te veel intelligente zaken op ruwe data zonder expliciete opdracht daartoe.

[Reactie gewijzigd door The Zep Man op 22 juli 2024 20:20]

Aan de andere kant moet Excel zich niet bemoeien met inhoud van 1 cel als de overige waardes in de kolom niet related zijn aan het datatype.

Ik ben het dan op zich wel eens met een aanpassing door microsoft. Excel gaat in deze gevallen namelijk slecht om met de context van de data. Die is namelijk helemaal niet gerelateerd aan “datum”.

Ik heb zelf ook wel eens van dit soort vage cases gehad waarin een tijdsduur bijvoorbeeld werd omgezet in een DateTime object. Niet gerelateerd en dus vet irritant want het zorgt voor fouten in vervolg berekingen.

Zelfse als hier het geval is. MARCH1 is geen valide waarde voor een datum. Het lijkt er op, maar dit is gewoon niet goed. Excel zou hier dan ook vanaf moeten blijven. Zeker als uit context (de gehele kolom) blijkt dat de andere data ook niet gemapt kan worden naar een datum.


Ik snap verder de keuze van gene committee ook wel. Gewoon zorgen dat je niet afhankelijk bent van grote software boeren om het voor je op te lossen maar gewoon zelf zorgen dat het weer goed werkt.


Helaas zorgt dit er wel voor dat er dus wildgroei komt in het termen gebruik in papers. Dat is best wel vervelend. Mijn afstudeeronderzoek toonde al aan dat die wildgroei aan terminologie (een onderzoeker mag bij “ontdekking” het gen en het eiwit een naam geven, maar het blijkt vaak toch geen nieuw gen/eiwit te zijn). Daardoor is geautomatiseerde herkenning en matching van de eiwitten en genen in teksten gewoon erg lastig Is behoorlijke filtering nodig om dit uiteindelijk goed te krijgen.
Excel is een rekenblad / spreadsheet software.

"automatische dataprocessing op duizenden rijen" => databank, andere software nodig, binnen Office heb je daar Access voor maar is héél veel software voor te vinden.

Het succes van Excel is tegelijk zijn probleem, Excel moet maar alles kunnen lijkt het en als ik mijn baas ermee confronteer dat Excel helemaal niet geschikt is dan volgt hij wel maar als hij het prijskaartje ziet van een alternatief is het antwoord dat krijg ik nooit verkocht. En dus genereer ik een csv van 500MB met veel moeite wat iemand dan opent met jawel, Excel. Toch is nagevraagd hoe die persoon daar vervolgens analyses op doet => splitsen het op in 10 Excel files en na de analyse klaar is, 2 uur wachten tot Excel het berekend heeft, per file te verstaan.

Mijn mening is dat Excel een multifunctionele tool is maar net doordat het zo multifunctioneel en instapvriendelijk moet zijn, eenmaal je serieuze dingen gaat doen valt die multifunctionele tool door de mand. Een kok kan zijn groenten snijden met een multi tool zwitser zakmes, sure, maar echt productief gaat dat niet worden. Waarom zou je een GPU nemen? CPU kan dat perfect ook doen, sure, maar echt productief gaat dat niet worden. The right tool for the job maar blijkbaar moet Excel de right tool for everything zijn, een onmogelijke opdracht als je het mij vraagt.
Anoniem: 192765 6 augustus 2020 15:44
Tip voor de volgende keer: Gewoon een apostrof ' ervoor zetten
Ik werk veel met wetenschappers om software voor ze te maken.
En er wordt veel gedaan met csv's en die worden dan in excel geopend, dingen mee gedaan en dan weer als csv verspreid of in andere software geladen.

En als ze dan elke keer moet herinneren om bij dat ene veldje een apostroph te zetten of kolom/row als tekst te zetten dan gaan er te veel fouten in sluipen.

Dus deze wijziging van de namen lijkt me dan makkelijker.
Volgens mij speelt dit probleem niet alleen bij wetenschappers. Er zijn genoeg analyses waar een stukje data onbruikbaar wordt omdat Excel zonodig automatisch een datum wil maken van velden.
- select all cells
- format
- text

Done.

Excel is in der daad vrij naar met datums.. ik moet vaak voor mijn werk berekeningen doen op datum+tijdstippen en duraties ed. en het is écht iets waar je even goed bij moet opletten met het converteren van input ("19:05") tot MS Datetime tot output ("19:05").

@SeenD Dat die mafkezen allemaal van en naar CSV lopen te werken is gewoon hun eigen stomme schuld dan? waarom werken ze allemaal met CSV bestanden? Omdat dat minimale overhead heeft?

Ik heb echt een schurft hekel aan CSV bestanden rondpompen. :P
Als excel dit soort dingen enkel als interpreter deed is het een oplossing, maar voer voor de lol maar eens in europese notatie een datum in en aanschouw hoe destructief de werking is in de standaard (us) instellingen.
man man man praat me er niet van!

Als ik ergens een hekel aan heb is het al die verschillende datumnoteringen!

Alles wat ik produceer is gewoon YYYY-MM-DD (HH:MM:SS) omdat dat mijns inziens het meest logisch over komt (groot naar klein). :+
En het is een ISO-norm, en het leidt nooit tot verwarring (anders dan 01-02-2020), en zorgt automatisch dat sorteren op naam ook sorteren op datum betekent.

En toch ben ik gevoeld de enige die in mijn omgeving consequent dit formaat gebruikt. Chinezen doen het gelukkig wel, maar waarschijnlijk omdat daar is ook voor de ISO norm al xxxx年yy月zz日 gebruikt werd.
Mja, het nederlandse Dag - Maand - Jaar kan ik ook nog wel begrijpen (klein naar groot)... maar het Amerikaanse Maand - Dag - Jaar kan ik écht met m'n kop niet bij.

En het probleem is omdat die Amerikanen dát gebruiken je NOOIT zeker weet wanneer je een datum lees welke notatie het nou is. 4 - 1 - 2020 kan 1 april zijn óf 4 januari... en dát is echt ENORM irritant. :+
Het is iig te redeneren waaróm wij die notatie gebruiken, bij de amerikanen is het een rommelboeltje en "doen ze het al járen zo" :p (middelorde, kleinste orde, grootste orde)
Maar je moet het wel weer naar een datum omzetten als je met twee data wilt rekenen (dagen verschil o.i.d)
CSV is gewoon het makkelijkste en meest compatible bestandsformaat wat er is.
In iedere programmeertaal kun je in 5 regels een csv bestand inlezen en wegschrijven, probeer dat maar eens met een xsl of xlsx.
Er zijn simpelweg geen andere formaten die zo makkelijk en zo wijdverspreide ondersteuning hebben in software...

Zelfde argument waarom .txt files (plain text) ook nog gewoon bestaan, terwijl er al bijna 20 jaar word documenten gemaakt worden...
Csv is 5 regels totdat je meer dan platte tekst wil bewaren. Zelfs het formaat van een simpele float is niet gestandaardiseerd. Punt of komma?
Niet done. Data is al kapot gemaakt door Excel in veel gevallen.
8127340918273049172034234 wordt omgezet naar 8.12734091827304E+24 notatie, de oorspronkelijke waarde krijg je niet terug.
Dat is een beperking voor alle software die met floating point getallen rekent; een afweging van opslagcapaciteit en rekensnelheid.

Excel rekent met een precisie van 15 significante cijfers. Indien je meer dan 15 significante cijfers nodig hebt is Excel niet het juiste gereedschap.

Een ander issue, dat ook niet uniek is voor Excel is het rekenen met getallen die repeterend zijn in binair:
=(4,1-4,2)+1
0,899999999999999

Dit geeft in bijv. Python ook niet het antwoord wat je op het eerste gezicht zou verwachten.
Iets met de hand er inzetten is ook niet het probleem.

Waar het om gaat zijn de automatische CSV bestanden waarin databases zitten van + 1000 velden. Een machine kan heel simpel die velden aanmaken maar kan daar niks speciaals mee doen. Daarom moet je ook vaak zelf de database als tabel aanmerken of er een draaitabel van maken. Een machine kan ook verder niks dan wat nummertjes in een CSV bestand zetten, meer niet.

De omzetting van velden gebeurd al als je een bestand omvormt naar een Excel bestand, Dus terug control-Z'en gaat ook niet zo makkelijk. En je kan natuurlijk de replace functie gebruiken, maar dan loop je weer de kans dat datums die ook daadwerkelijk datums MOETEN zijn ook vervangt (sws is de replace functie van Excel af te raden bij grote bestanden).

Dus dit zal wel de makkelijkste, goedkoopste, en veiligste oplossing zijn.
Nee, Excel is gewoon ruk met CSV. Er zitten allerlei quirks in die niet hadden gehoeven.
En de select all + format werkt bij jouw losse invoer misschien, maar niet als je 160MB aan interface data importeert. De data is dan al door Excel vernacheld.
En o wee als je een functie erop loslaat of je kopieert het op de verkeerde manier naar een andere sheet, want dan kun je van voren beginnen.
Mja ik weet er alles van.
Daarom werk ik persoonlijk liever met Access, doe ik alle berekeningen ed. in Access en exporteer ik enkel het resultaat naar Excel.

Hoewel ik natuurlijk snap dat men liever een CSV bestand op de mail zet dan een Access database uiteraard! :9
Hierdoor teveel fouten? Waarom zou je ze dan data willen laten manipuleren in Excel en niet gewoon in een database programma?
Omdat veel wetenschappers geen informatici of data-analysten zijn.
Tegenwoordig zit data analyse wel in de meeste wetenschappelijke opleidingen. SPSS, MS Acces en een beetje SQL hebben we op de opleiding gehad.

Helaas is de meeste machine database gebeuren nog steeds gebaseerd op Excel. En daar zit het grootste probleem. Een handmatige database met Excel zie je bij de nieuwere generatie wetenschappers amper meer. (of het moet heel simpel zijn).
Omdat veel wetenschappers geen informatici of data-analysten zijn.
True, so true. Ik bespeur dat vooral bij medici. Baanbrekende onderzoekers zijn vaak klunzen als het op ICT aankomt...
Excel is geen ontwikkelomgeving !
Ik zou eens een kijkje nemen naar miller, heerlijke (gratis) conversie tool ...
Tja of Categorie Text als Cell Format.

Oh @Scientists http://letmegooglethat.co...date+recognition+in+excel

[Reactie gewijzigd door rneeft op 22 juli 2024 20:20]

Helaas werkt dat niet bij import vanuit bijvoorbeeld een CSV file. Dan moet je door best wel wat hoepels springen. https://stackoverflow.com...tain-text-values-to-dates
Hier kan ik me wel erg in vinden, maar dit is niet per definitie een issue van Excel, maar ook een issue met hoe ene applicatie CSV exporteert. Alles wat numeriek is, maar geen datum is en/of niet als nummer berekent hoeft te worden (opsommen, delen, etc) kun je eigenlijk het beste als tekst laten exporteren naar CSV, maar niet elk programma gaat daar even handig mee om.

Wij werken veel met SAP en daar heb je vaker bij documentnummers dat deze bijvoorbeeld beginnen met één of meerdere nullen. Ja, in technische zin zijn dit cijfers, maar het documentnummer an sich hoeft niet berekend te worden, dus als je het in zijn geheel intact wilt laten, dan exporteer je die als Tekst, waardoor deze niet alleen een field delimiter krijgt, maar ook text qualifiers (1;"049111";123 ipv 1;049111;123) krijgt. Ja, dit wordt voor veel mensen dan al snel te technisch, en ik begrijp ook echt wel dat dat niet voor iedereen weggelegd is om zich daar zo in te verdiepen.

het issue in jouw voorbeeld gaat het specifiek om een 3 decennia oud issue welke je makkelijk kunt verhelpen door je CSV te importeren ipv rechtstreeks te openen... Maar dan moet je wel zelf bij de import de datatypes aangeven, en dan ben je weer terug bij "ik begrijp ook echt wel dat dat niet voor iedereen weggelegd is om zich daar zo in te verdiepen", maar het is wat het is :|
Als je database pakket tekstvelden gewoon exporteert met quotes (enkel of dubbel maakt niet uit, zolang je maar weet welke gebruikt wordt), kun je in Excel keurig aangeven welk karakter gebruikt wordt als text field delimiter. Dit kan bij zowel importeren als bij een "Text to columns" conversie.
Als jij een CSV regulier opent en hij herkent de standaard delimiter die voor jouw localization ingesteld is dan ben je voor je text to columns al 1 stap te ver. Excel herkent dan al de individuele velden en autoconvert die dan ook doodleuk al :(

Op het moment dat jouw localized delimiter een ";" is en het bestand ook echt comma separated is, dan krijg je die regels in enkele velden en kun je idd je text to columns doen :)

Hangt allemaal zo leuk af van je source, zou gewoon 1 standaard voor moeten komen :)
En daarom moet je dus binnen je bedrijf 1 localization gebruiken. Voor servers, clients en databases.
Dan ben je in een keer van al het geneuzel af.
Heb je BYOD users, zul je die moeten instrueren welke localization ze moeten instellen om zo weinig mogelijk problemen te hebben als het om werken met data gaat.

Ja, dit kan voor wat issues zorgen als je een internationaal bedrijf bent met landen die nogal chauvinistisch zijn ingesteld, maar als je bedrijf landsgrenzen overschrijdt, zul je gewoon een standaard moeten afspreken en je daar aan moeten houden om dit soort problemen te voorkomen.

Ik heb een hekel aan onnodige regeltjes en corporate-policies, maar dit is juist een hele goede policy en alles behalve onnodig, want het zorgt voor een uniforme beleving voor alle medewerkers door de gehele organisatie.
Oh, echt, ik ben het heel hard met je eens, maar als je idd werkt met koppig volk, dan gebeurt dat gewoon niet. Ik denk dat de meeste mensen die samenwerken met Amerikanen, Duitsers en Fransozen dit kunnen beamen, maar goed, ik maak me ook geen illusies dat Nederlanders niet koppig zouden zijn.

Als mensen het al niet eens kunnen worden tussen metric en imperial (afgezien van wetenschappelijke sectoren), dan zal die standaard mbt localization ook niet snel komen :)
Een hoepel die in mijn geval werkt (als het bestand niet te groot is) is een kleine formule.

=" ' " & A1 (spaties toegevoegd voor de leesbaarheid).

Bij grotere bestanden is dit alleen niet zo handig. Als ik met grote bestanden aan de gang ga dan gebruik ik MS access. Iedereen verguisd het terwijl het voor dergelijke operaties juist heel handig is. Bovendien heb ik niet de beschikking over andere programma's waarmee het zou kunnen. :)
Beetje off-topic, maar Access wordt vaak wel bestempeld als een slechte applicatie, terwijl het eigenlijk soms best goed kunt gebruiken als vrij geisoleerde tool. Ja, het is een file-based DB en heeft zijn limitaties, maar bij ons in de organisatie wordt het vaak gebruikt als een invul-tool waar mensen adhv formulieren hun gegevens in kunnen vullen. Vantevoren bepaal je je datatypes en dan heb je netjes alles geregistreerd zoals je het wilt hebben.

Integratie met SharePoint, Power BI en externe databases is ook goed verbeterd de afgelopen paar jaren, en hoewel het niet tegen een SharePoint/PowerApp, WebApp + DB opkan, heeft het toch best wel wat usecases.
Dit soort antwoorden zijn erg typerend voor ICT'ers, maar een beetje empathie naar gebruikers toe is soms ook handig. Als je met veel data bezig bent dan wil je niet elke keer hoeven nadenken om die apostrof erin te zetten (en als je met bijvoorbeeld een A begint, dan ook nog de spatie, want Á). Ook zullen ze vast wel datums (data) in excel zetten.
Excel is universeel, niet alleen wetenschappers, maar ook dataverwerkers en kantoorlui moeten vast iets met die gegevens doen.
Ik snap volledig waarom ze dit gedaan hebben, het is wellicht niet de beste oplossing, maar zeer praktisch.
Om dat veilig te maken moet je dan hard data typing verlangen. Eerste is tekst, dan is alles tekst. Keihard. Of totdat je een 'type break' of zo aangeeft. Maar ik zou zeggen: keihard.
En als je 'eronder' opnieuw wilt beginnen, zet dan het volgenden 'tabblad' eronder. Geen idee waarom dat perse op een andere pagina moet. MWaarom niet 1 tabel met namen, een andere tabel met prijzen, beide in eigen venster, of in een subvenster of zo. Eerste regel is altijd regel 1. En een kolom heeft een vast datatype. En e ris 1 rij boven met titel, en dat is een string.
En je refereert niet aan A2 of aan $A$2, maar aan prijzen:naam:1. Kan veel minder fout gaan.
En er is geen reden om dan datatypes te mixen in 1 kolom.
Klopt, computerwetenschappers. Maarja, "gestructureerd programmeren" zonder goto-statement was ook onhaalbaar.
Nu kom je daar niet mee weg.
Het gaat er helemaal niet om of het veel of weinig moeite is om te googlen, zelfs ik als "doorgewinterde systeembeheerder" vind het buitengewoon irritant als er bijvoorbeeld met het verwerken van rapportjes met userdata (in Excel) dingen gebeuren die ik niet verwacht (en achteraf prima te verklaren zijn, bijv datum ipv cijfers) met als gevolg dat ik uit mijn concentratieboog word gehaald. Soms moet ik ook wel eens iets googlen, en dat is helemaal niet erg, maar het kost erg veel tijd om er weer "in" te komen. Als je de héle dag data loopt te verwerken, of je het nou doet in Excel, notepad of R, dan kost het opzoeken van iets waar je je aan irriteert gewoon te veel tijd. dat hebben ze hier gemitigeerd door de naam aan te passen. Het is een botte-bijl oplossing maar zeker effectief.
Ik ben applicatiebeheerder, dus ik consumeer net zo goed als jij veel meer Excel dan ik ermee produceer. En toch heb ik het idee dat áls ik al ergens tegenaan loop het meestal niet meer dan 3 minuten kost om de oplossing te vinden.

Ik vraag me ook serieus af wat je nou eigenlijk van het pakket verwacht. Het enige wat ik me kan voorstellen is dat hij bij zo'n wijziging met een pop-up venster komt die je vraagt of je wel echt de automatische omzetting die net gedaan is wil toestaan, of een lijst met andere opties. Maar daar zou ik me weer dood aan irriteren, want dat is elke keer een extra handeling. Dan kan je die pop-up optioneel maken en dan is het gedrag weer niet voor iedereen hetzelfde(en dus lastiger te vinden via Google). Of hij kan de wijziging helemaal niet doen en dan wordt een andere groep weer niet blij.

Het is gewoon nooit goed. Spreadsheets zijn nou eenmaal geen Notepad. Worden ze dat wel, dan kan een deel van de doelgroep er gewoon helemaal niets meer mee. Neemt niet weg dat een 'Spreadsheet light' of zelfs een light mode voor sommigen best wat toe zou kunnen voegen.
En toch heb ik het idee dat áls ik al ergens tegenaan loop het meestal niet meer dan 3 minuten kost om de oplossing te vinden.
@StackMySwitchUp heeft het niet over zoektijd maar concentratieboog
It takes an average of about 25 minutes (23 minutes and 15 seconds, to be exact) to return to the original task after an interruption, according to Gloria Mark, who studies digital distraction at the University of California, Irvine.
http://blog.idonethis.com/distractions-at-work/
Ik vraag me ook serieus af wat je nou eigenlijk van het pakket verwacht.
Een vinkje per spreadsheet /tab blad 'allow /disable automatic formatting" ?
Je kan bij het aanmaken van een nieuw bestand al kiezen uit meerdere opmaak mogelijkheden, dus eentje die geen automatische opmaak doet zou mogelijk moeten zijn.
Wat 99 procent van mijn ergernis zou verhelpen is dat ze de invoer gewoon opslaan en enkel op punt van weergave/verwerking een interpretatie gaan doen.

Ze verneuken gewoon je input. En daarna is het niet meer terug te herleiden wat het was.
Op het moment dat je het celtype op datum zet, dan mag hij die kolom zo interpreteren, zet ik 'm op tekst, dan niet. Probleem is dat hij al bij voorbaat probeert na te denken voor je. Bij grotere data sets zie je niet altijd dat hi jiets verklooid heeft: vaak genoeg gehad dat ergens vanaf regel 15000 ineens iets scheef gaat.
Het gaat erom dat tijd geld kost en wetenschappers wel iets beters te doen hebben dan googlen waarom Excel weer moeilijk doet. Daarom kozen ze om de namen van de genen te veranderen, verhelpt een hoop toekomstig gezeik.
Erm, ja. Wetenschapper, geen Office expert. Je zou verstelt staan van hoe slecht veel wetenschappers met computers kunnen omgaan. Vooral biologen zijn er dramatisch slecht in.

Sowieso is Excel niet handig voor wetenschappelijke data, daar gebruikt men veel beter iets als R, Igor, Origin of SPSS voor, software waarbij je makkelijk de gewenste data-type en precisie kan bepalen. Maargoed, dat vereist weer meer computerkennis, en zie punt 1.
Dat is hetzelfde als dat ik tegen jouw zou zeggen om even eiwitten uit elkaar te halen door middel van een ammoniumsulfaat die je zelf moet bufferen.

Je hebt toch google/duckduckgo/ecosia/etc? Mooi dan hoef ik je niks uit te leggen, labjas aan, bril op en ik kom je wel halen als je klaar bent (of als het ammoniakgas alarm afgaat :P)
Het is niet zo dat wetenschappers niet kunnen uitvogelen hoe iets werkt. Zijn ze doorgaans vrij goed in (zelf uitvogelen hoe iets werkt n.a.v. beschikbare literatuur is een beetje een vakvereiste).

Er is simpelweg geen behoefte aan, of tijd voor. Excel werkt, dus gebruiken ze excel. Als een bepaalde naam moeilijk doet kunnen ze daar tijd aan spenderen om een goede oplossing te vinden, of ze veranderen de naam. Minder werk dan alle wetenschappers die met die data-set werken aanleren hoe ze om die limiet heen kunnen werken.

Wellicht ook nuttig om te onthouden dat zo'n naam in elke studie van dat gen voorkomt, en elke wetenschapper die daaraan werkt en excel gebruikt zal tegen dit probleem aanlopen. Dan is de naam maar aanpassen niet eens zo'n heel raar besluit.
Het zijn vaak vakidioten met weinig kennis of interesse betreffende computers, uitzonderingen daargelaten. Hoe foutmeldingen en storingen ontstaan mag je dan wél weer tot in de puntjes uitleggen...

Bron: Ik werk met ~100 PhD's in de biochemie.
Ligt er helemaal aan. Ik werk met 100den wetenschappers op zeer hoog niveau. En ze weten niet allemaal hoe Excel werkt.
Ik kan je zelfs zeggen: ik kan een wifi netwerk misschien hacken, een rpi installeren en weet ik niet wat meer. Heb ook cursussen Excel gehad maar dat was vroeger. Zet mij nu voor Excel neer en voor de 3* in het jaar dat ik het gebruik zitten we met een paar mensen te vogelen. En voor die 3 x ga ik geen cursus volgen. ;)
Nooit doen, er is niks zo erg als een bedrijf waar mensen menen dingen te kunnen in Excel, en hier vervolgens het bedrijf mee gaan "automatiseren". Beste is deïnstalleren van Excel :)
Nou blijkbaar kunnen ze niet zonder excel, dus dan is een cursus op zijn plaats..
Als je denkt niet zonder excel te kunnen echter, ben je waarschijnlijk alsnog het programma (ondanks de beste intenties) om de verkeerde redenen aan het kiezen. Dit is een lijnrecht praktijkvoorbeeld waar iemand de compléte inherente werking van Excel zou moeten kennen om fouten in de verwerking, ook maar potentieel, te kunnen voorkomen.

Die twee eigenschappen/design-choices staan nou eenmaal nogal haaks op elkaar; zonder gedegen instructie kunnen gebruiken tegenover énkel wanneer je het programma compléét van binnen en buiten kent kunnen waarborgen dat het programma niet "zomaar"/zelfstandig aan die data kán gaan sleutelen.

Dat is een beetje als belangrijke geluidsfragmenten opnemen op een cassettebandje met een willekeurig opnameapparaat omdat het zo gemakkelijk te bedienen is, met als resultaat amper verschil tussen het signaal en noisefloor en dan alsnog maar bidden dat met een aantal jaren techniek we de data alsnog ongemanipuleerd terug kunnen halen.. in plááts van het bijv op te nemen mét voldoende marge tot de noisefloor door mensen te instrueren hoe ze het recording-level kunnen waarborgen/aanpassen.
Oke maar dan is het programma excel gewoon niet goed. Stel he, dat er toch op 1 of andere manier een keer nog een mrt-20 komt te staan vanwege een functie calculatie ofzo. geen idee ik werk niet met excel.
Dan heb je toch alsnog hetzelfde probleem... verwacht je een uitkomst die niet klopt.

Een programma moet niet voor zichzelf denken. Prima dat het kan, maar zorg ervoor dat je het uit kunt zetten
Ja exact dat laatste moet kunnen anders is het dweilen met de kraan open :)
Beetje een raar ding om een punt van te maken.

Wat gebruik je als ICT'er op bijna dagelijkse basis buiten je ICT kennis? Laat staan dat dan ook nog eens vergelijkbaar is met hoe Excel gebruikt wordt door heel wat wetenschappers? Ik kan helemaal niets bedenken.
Natuurlijk heb je onder ICT-ers ook vakidioten die zich niet al te diep in andere vakgebieden (willen) interesseren.
De meeste mensen die heel erg goed zijn in iets zijn dat omdat ze zich niet te veel door andere dingen af laten leiden. 'Gereedschap' zoals Ecel moeten dan gewoon werken, zonder dat ze zich daar in moeten gaan verdiepen. En wanneer ze zich in Excel verdiepen is dat om een bepaalde exotische statistische functie te doorgronden waar de meeste Excel power-users nog nooit van hebben gehoord.
Je hebt het hier over databases, in tig verschillende systemen (zowel hard als software matig verschillend, is echt niet alleen maar excel of office365 waar de data in zit). Deze databases hebben soms enkele tienduizenden entries.. en das dan voor 1 specialisme.

Mijn vriendin is in een andere sector bezig binnen wetenschap, voor haar specialisme de database op te schonen. Is ze nu al 2-3 jaar mee bezig, en das niet omdat ze traag werkt.

Bij dergelijk formaat database, heb je ook dergelijk formaat aan user-entries.. iedereen werkt anders. Dus je kan niet even simpelweg alle cellen modificeren. Wie weet hoeveel data je daar potentieel elders in dezelfde database mee om zeep helpt, als je bij een sectie komt die door iemand anders is bewerkt. Daar kom je potentieel pas jaaaren later achter als je dat niet langer kunt terugdraaien of herstellen.


Nee.. entry aanpassen moet handmatig, per line item.

[Reactie gewijzigd door Xanaroth op 22 juli 2024 20:20]

Wat vooral aangeeft dat wetenschappers normale mensen zijn.
Wat vooral aangeeft dat wetenschappers normale mensen zijn.
Mwoah, sommige soms toch wel uitzonderlijk hoor: Einstein met zijn 7 zelfde pakken, 1 voor elke dag van de week omdat hij niet wilde nadenken welke kleren hij moest aantrekken. Zijn iets te grote hormonale driften... Ooit eens zelf een student scheikunde in een studenhuis meegemaakt: hij was heilig overtuigd dat je met sinaasappelsap en chocolade mousse, soms een neut, je genoeg energie en bouwstoffen binnenkreeg. dat was dan ook zijn dieet, hield hij geld over voor een hobby. Wij hadden daardoor een wc die vaak en lang bezet was.... Tig andere excentriciteiten, maar niet om hier te vermelden bij tweakers :)
Excel is een drama met importeren van data, alleen al het feit dat het afhankelijk is van regional settings. Al hele grote problemen gehad omdat bij mij de decimale punt een punt is, en elders een komma....
Sowieso is Excel niet handig voor wetenschappelijke data, daar gebruikt men veel beter iets als R, Igor, Origin of SPSS voor, software waarbij je makkelijk de gewenste data-type en precisie kan bepalen. Maargoed, dat vereist weer meer computerkennis, en zie punt 1.
Inderdaad ik heb hetzelfde gemerkt bij metaal -en materiaalkunde. Daar waar het veld softer wordt (Biologie, Chemie, Economie ...) wordt Excel regelmatig misbruikt. En Excel heeft een lange geschiedenis van precisie en afrondings fouten. Het is totaal niet de juiste tool voor (serieuze) wetenschap en economie.
Dat is ook ongeveer mijn ervaring. Ik ging van natuurkunde (enorme nerds, don't @ me) naar biologie, en hoewel veel biologen vaak degelijke software gebruiken voor de echte statistische analyse van hun data gebruiken ze nog erg vaak Excel om maar snel wat data in te plompen.

Vanuit die optiek is het ook wel handig om deze namen aan te passen, gegarandeert dat het anders nog regelmatig voor frustratie gaat zorgen bij de wetenschappers die er in de toekomst mee werken.
Mwoah, als kind van een bioloog, die me in de jaren ‘80 met computers heeft opgevoed, ben ik goed terecht gekomen.

Goed met computers omgaan =/= kantoorsoftware beheersen.

Genoeg mensen die rustig even wat arduino-elektronica in elkaar knutselen en programmeren, maar geen idee hebben hoe een draaitabel werkt.
Genoeg mensen die rustig even wat arduino-elektronica in elkaar knutselen en programmeren, maar geen idee hebben hoe een draaitabel werkt.
Ik voel me aangesproken
En dit heeft alles te maken met interesse.
Als je slim genoeg bent om
rustig even wat arduino-elektronica in elkaar knutselen en programmeren
Dan ben je ook slim genoeg om basis functionaliteiten van Excel te leren en te onthouden (zoals een draaitabel, verticaal zoeken, of de apostrof aan het begin van een waarde, zodat deze altijd als tekst zal worden gezien). Alleen vind je het leuker om met een arduino te spelen en die te programmeren, dus daar steek je je tijd in.

Is niks mis mee, maar als je voor je werk met Excel moet werken, dan is het wellicht verstandig als je de basisfunctionaliteiten van het programma kent en dat je er dus wat tijd aan besteedt.
Ligt er aan hoe. Stel jij werkt in de wetenschap en iemand vraagt om data en dat is in Excel nodig. Het is voor iemand anders. Heeft dat dan prioriteit? Voor die ander wel. Maar voor jou niet. Zo simpel is het vaak. Tuurlijk willen ze data vaak wel delen. Maar als jij 5 of 6 jaar in 3 a 4 jaar moet proppen zoals bij sommigen het geval is. Dan heb je je tijd hard nodig. Dan kun je het egoïstisch vinden. Maar uiteindelijk is het wel zo, dat elk werk voor een ander jouw tijd kost.
Ik vind het niet egoïstisch, maar ik vind het een verkeerde werkhouding.
Onafhankelijk van welk softwarepakket ook, als ik er mee moet werken, zal ik me in die software moeten verdiepen om de basis functionaliteiten in ieder geval te begrijpen en daarmee mijn eigen werk een stuk makkelijker te maken.
Natuurlijk hebben veel wetenschappers last van een beperkt budget en beperkte tijd, maar juist daarom zouden ze die basis functionaliteiten van dit soort software moeten begrijpen, zodat ze efficiënter hun werk kunnen doen.
Als je het nooit gebruikt omdat er wetenschappelijke software is die beter is. Maar iemand anders heeft het budget er niet voor en doet het in Excel en vraagt om data? Dat zou het zelfde zijn als dat een scheikundige info vraagt voor zijn scheikundige programma aan een bioloog en de bioloog even een studie scheikunde moet gaan volgen, dat programma installeren enz. Dat zou toch te idioot zijn?

Net zoals ik 3* in het jaar Avery labels met een opdruk met verschillende formaten moet printen. De macro's er zijn maar MS het met een nieuwe versie net even anders doet. Moet ik dan een 3 daagse cursus volgen voor iets wat 5 minuten werk moet zijn en met een andere versie weer overnieuw moet?
Wat voor jouw basisfunctionaliteit is is voor iemand anders iets wat ze nauwelijks gebruiken en dus meer specialistisch.
Voor de meeste gebruikers is Excel die ene hamer in de gereedschapskist van de doehetzelver, terwijl een vakman een kast vol hamers heeft, elk voor een specifieke taak.
Noem mij een corporate end-user-device waar geen Office op is geïnstalleerd.

Over je vergelijking:
Office is geen hamer, en ook geen gereedschapskist, het is een complete klusschuur met alle tools die er te bedenken zijn.

Excel is dan een gereedschapskist, waarbij je de basisfunctionaliteit van een hamer, schroevendraaier, zaag, beitel en boor toch op zijn minst moet kunnen begrijpen.
Eenvoudige rekenformules, vertikaal zoeken, cellen vergelijken, data als tekst definiëren, een draaitabel, of grafieken zijn echt gewoon basis functionaliteiten die je met een klein beetje inzet eenvoudig kunt begrijpen, zeker als je (als wetenschapper zijnde) over een gezond stel hersens en enig logisch inzicht beschikt.
Als ik dit soort dingen door middel van een 4 uur durende training aan 3 secretaresses kan uitleggen, moeten wetenschappers dit ook kunnen begrijpen.
Leuke vergelijking: ik ken 2 timmermannen en die moesten pas iets spijkeren met een hamer. Dat konden ze niet goed meer. Weet je waarom. Ze doen altijd alles met een spijkerpistool of schroeven het met een boormachine.

Waarom zou een wetenschapper spijkers gebruiken met een hamer als hij een pistool heeft wat het beter doet of een boormachine om te schroeven?
Ik ook! Heb zelfs "draaitabel" moeten Googlen xD
Natuurlijk, ze zijn er wel, maar voor elke handige bioloog die zelf met arduino's een skinner-doos in elkaar fixed zijn er een dozijn die moeite hebben om matlab te installeren.

Leuk voorbeeld: een groep moleculaire biologen in het lab naast ons had een paar jaar geleden een erg grote data-set die ze via het internet wilden kunnen doorzoeken. Dure servers voor gekocht, alles lekker aan de praat, maar na een tijdje verhuisde die data-set en stonden die servers ergens vergeten in een gang uit hun neus te vreten.

Of nouja, toch niet, toen IT erachter kwam dat een slimme hacker die servers had overgenomen en ze al maanden actief waren als botnet :+

... en sindsdien krijgen wij geen onbeperkt internet toegang meer :'(
.. een groep moleculaire biologen... een slimme hacker
Carrieremove van een bioloog ?
Betaalt vast beter :+
Helaas waar. Er is ook een beetje de houding dat als je eenmaal je diploma hebt, je wel weet hoe het moet. Hetzelfde zie je met statistiek: hoevaak er toch wel niet de verkeerde test wordt gedaan, of uberhaupt niet gekeken wordt of een test wel toegepast mag worden.. maarja, tenzij iemand anders grondig naar je data kijkt (die vaak niet eens beschikbaar is) komen we daar nooit achter.
Als wetenschapper zijnde wil ik best een paar uur besteden om allerhande naamgevingen om te zetten :D Ik heb wel eens gewerkt met een tabel codering die bijvoorbeeld 10E6 bevatte (plaat 10 kolom E rij 6) waar excel gewoon 10 * 10^6 van maakt, die konden bij inlezen wel omgezet worden naar 10Q6 om later in R weer terug gezet te worden naar 10E6... maar al dit soort omzettingen en handelingen maken de data wel foutgevoelig. (Deze naamgeving methode zal ik dan ook niet meer gebruiken in de toekomst) Aan de andere kant blijven we wel gewoon mensen en maken soms een foutje en daarom is het wel fijn dat deze namen zijn veranderd zodat we niet tegen excel in hoeven te werken.
Excel veranderd het niet; Excel toont het gewoon anders omdat het denkt slim te zijn, net zoals voorloopnullen en dergelijke.
Excel veranderd het wel. Het is onmogelijk om na het inlezen van 10E6 of 0E8 de teksten "10E6" of "0E8" terug te krijgen. En bij het inlezen van een CSV bestand is het niet te doen om van te voren aan te geven dat 1 kolom getallen bevat en een andere tekst. Die optie biedt excel niet eenvoudig.
En bij het inlezen van een CSV bestand is het niet te doen om van te voren aan te geven dat 1 kolom getallen bevat en een andere tekst. Die optie biedt excel niet eenvoudig.
Ehhh, dit wordt stap voor stap met je doorlopen bij het importeren/openen van een txt- of csv-bestand . Je moet de handelingen alleen wel netjes doen en niet direct bij de eerste mogelijkheid op voltooien klikken.
Dat ligt heel erg aan het CSV bestand. Sommige bestanden worden inderdaad via de text to collumn wizard geopend maar anderen worden in excel niet als platte tekst gezien en wel gewoon geopend. Dat hangt allemaal af van hoe het CSV bestand in elkaar gezet is. Er zijn apparaten die nette CSVs uitspugen maar ook die hele wazige CSV bestanden maken. Ikzelf heb al meerdere malen headers van CSVs zitten aanpassen omdat ze door de fabrikant verkeerd worden gemaakt.

Al dit soort dingen zijn nou niet persee een kerntaak van een wetenschapper, "we" kunnen het wel maar ik ben liever bezig met andere zaken :D
Een wetenschapper weet vaak het fijne van zijn veld (dit keer biologie) en niet hoe of wat Excel met data typen doet. Dat interesseert ze niet, het enige wat ze willen is een makkelijke universele tool om hun werk (beter/gemakkelijker) kunnen doen.
Domme wetenschappers die hun gereedschapskist en dus hun werk niet serieus nemen.

Je kan jezelf geen wetenschapper noemen als je laks en onwetend bent op het gebied van databeheer en datamanipulatie en zelfs de meest basale office taken niet uit kan voeren.
Zet eens een paar miljard apostrofen als je een CSV export eens vlug wil openen in Excel
Je hebt aardig wat RAM nodig.
Als je met miljarden cellen werkt, gebruik je sowieso geen Excel, want je kunt maar een miljoen regels gebruiken. Gebruik je wel Excel met een kleinere hoeveelheid data, dan boeit dat ene extra tekentje in sommige cellen ook niet, het is geen functie ozo, dus extra rekenkracht heb je niet echt nodig.

In theorie: Met 1 miljoen rows en 100 kolommen met daarin een apostrof kom je aan 100 miljoen. In UTF-8 encoding is een apostrof een byte, dus heb je 100MB extra nodig aan RAM.

[Reactie gewijzigd door i7x op 22 juli 2024 20:20]

Grappig, in mijn IT verleden vaak tegen datum (1890/1900) en kolom/rij limieten aangelopen (ooit max 16384). Nu te vaak collega's die geen verschil zien in tab, spatie, comma etc delimiters en die graag door elkaar, of in willekruige combinaties / veldnotaties gebruiken. Om het maar met Murphy te beschrijven: "Build a system even an idiot can use and nobody will use it"
Probleem is dat dit ook gebeurt bij automatisch inladen van gegevens, dus uit een CSV file bijvoorbeeld.

Nee dus; inladen van volgend bestand laat gewoon MARCH1 zien:
sep=,
xyz,abc
foo,MARCH1

[Reactie gewijzigd door AutCha op 22 juli 2024 20:20]

Komt dat niet doordat jouw Excel en/of Windows op Nederlandse datum format staat?
Ik merk dat zelf ook als ik bv '2 apr' type maakt ie er een datum van, maar van '2 mar' niet. '2 maa' weer wel.
Het maakt verschil of je iets typt of als csv-bestand invoert. Ik heb Excel hier niet bij de hand, dus details kan ik niet geven.
Ik zit wel voor Excel dus gelijk even getest... Een csv file met daarin "2 mar, 2 maa, 2 apr" gemaakt en geïmporteerd in Excel. Precies hetzelfde, de eerste waarde blijft tekst, de 2e en 3e worden een datum.

Net ook even in een tweede regel "MARCH1, MAART1, 1MAART" toegevoegd, alleen de derde wordt bij mij als datum herkend maar het is in Nederland dan ook niet gebruikelijk om de dag achter de maand te plakken wat die Amerikanen wel doen.
Dan heb je een heel ander probleem, want dan zijn in je CSV export de text qualifiers niet ingesteld voor dat veld. Dat heeft niets met Excel te maken.
Tip voor de volgende keer: Gewoon een apostrof ' ervoor zetten
Ik merk dat deze reactie wat irritatie bij me oproept. Onzin uitkramen in een fipo en daarmee scoren, beetje geenstijl gedrag. Wellicht is het een idee 'voor de volgende keer' om even goed na te denken voor je een oplossing aandraagt. Denk je serieus dat een groep wetenschappers een dergelijke wijziging doet als de oplossing zo eenvoudig is?

Wat is nu het probleem? Gennamen vormen de referentiepunten van duizenden online databases die gebruikt worden voor (o.a.) biologisch en biomedisch onderzoek. Denk hierbij aan het analyseren van sequencing data e.d. om bepaalde ziektes beter te leren begrijpen/behandelingen te ontwikkelen. Veel databases gebruiken verschillende formaten en exporteren naar verschillende formaten. Verschillende type data worden veelal aan elkaar geknoopt op basis van hun gennaam, en er zijn grof gezegd zo'n 20 duizend verschillende genen. Wil je daadwerkelijk aan alle beheerders van die databases gaan vragen of ze even in iedere tabel die ze hebben de gennamen aanpassen door er een apostrof voor te zetten? En wellicht dat ze daar ook het celtype voor moeten wijzigen alsmede de field separator? En áls je al die beheerder van die databases zo ver krijgt zou het toevoegen een een apostrof duizenden en duizenden programma's en pipelines stuk maken. Alles behalve een bruikbare oplossing dus. Om dit soort ellende te voorkomen zijn er referentiesets van gennamen (zoals de in het artikel beschreven HGNC) waar alle software en databases gebruik van maken én die om de zoveel tijd wordt geupdate. En die referentie set wordt nu geupdate. Best slim toch?

Vind ik het een mooie oplossing? Nee, maar is wel een praktische oplossing voor een werkelijk probleem. 'Samengevatte' resultaten in de vorm van een Excel bestand (dat veelal nog steeds uit 20.000 of meer regels bestaat) worden toch vaak gebruikt om gauw even iets uit te zoeken.

[Reactie gewijzigd door -Elmer- op 22 juli 2024 20:20]

"Denk je serieus dat een groep wetenschappers een dergelijke wijziging doet als de oplossing zo eenvoudig is?"

Yep. Zo werkt dat. Dit is omdat het emmers zijn, emmers eerste klas. Als je kantoorsoftware dit soort dingen uithaalt met je miljoenen kostende door de burger opgehoest gesubsidieerde onderzoeksdata, dan moet je niet de nomenclature van je vakgebied aanpassen maar jezelf achter de oren krabbelen of je niet eens een normaal programma voor databeheer en dataanalyse moet gaan gebruiken.
jezelf achter de oren krabbelen of je niet eens een normaal programma voor databeheer en dataanalyse moet gaan gebruiken.
Of dat je een persoon wel aan het toetsenbord wilt hebben: hier iets te veel met ingehuurde indiers te maken. Ze hebben geen verstand van IT, maar wel geleerd dat als je meer weet dan je collega, dat je dan ergens anders een baan kunt vinden voor een paar roepies meer, netto resultaat: ze helpen elkaar niet. Als je collega slimmer is dan voor jou, je baan op de tocht kan staan bij downsizing, kortom probeer die te ondergraven. Ook hebben ze geleerd als je maar lastig bent en roeptoetert dat dan iemand van onshore je wel helpt, kortom wij meer werk. Ze weten dan meer en zijn weg. Netto verhaal offshoring werkt alleen met gekwalificeerd personeel die weet wat een ipnummer is, hoe een netwerk werkt, hoe je ssh tiept, wat een OS is. Helaas wordt hier bij inhuur/inkoop niet op gestuurd....
Vind ik het een mooie oplossing? Nee, maar is wel een praktische oplossing voor een werkelijk probleem.
Nu heb je 'nog alleen maar' het probleem, dat in oude Excel bestanden de namen moeten worden aangepast.
Hoeveel werk is dat?
Het probleem is dat die ' ook in die CSV's staan waarin gewerkt wordt, dan moet alle volgende software die ' negeren.
Tip voor de volgende keer: Gewoon geen excel meer gebruiken voor dataprocessing, Excel disasters zijn legio (De foutieve uitkomst die leidde tot de desastreuze "Reinhardt Rogoff hypothese" is er maar 1 van maar wél een die de wereld triljarden aan euro maar ook aan menselijk leed heeft doen lijden)
Tip voor MS: als de bovenliggende cel tekst is, geeft dan bij de invoer van de huidige cel al een apostrof ' weer. Als die niet nodig is kan de gebruike rhem met 1 backspace wissen.
Zelfde principe toepassen bij csv-import. Eerste cel bepaalt datatype van kolom.
De bovenste cel is vaak de kolomkop. Die is bijna altijd tekst, dus dan zal het niet werken bij csv-import.
Significante verandering? Je zou dit zo kunnen programmeren dat met een simpele optie de gebruiker kan kiezen of Excel wel of niet automatisch termen converteert in datumwaarden. Dat lijkt me een koud kunstje.

Bewerk: Blijkbaar bestaat die optie al, dus die wetenschappers moeten zichzelf maar eens goed achter de oren krabben of ze zichzelf wel wetenschapper durven te noemen als ze niet even kunnen uitzoeken hoe ze gebruik moeten maken van Excel. PEBCAK gevalletje.

[Reactie gewijzigd door Lapjespoes op 22 juli 2024 20:20]

Je bedoeld de optie die al sinds jaar en dag in Excel zit? (minimaal vanaf Excel 95 weet ik het zeker)
(je kan cellen het opmaakprofiel 'Tekst' geven, waardoor de inhoud effectief niet geïnterpreteerd wordt, en dus nooit als datum/getal/formule/whatever wordt vertaald)
Je kent Microsoft nog niet zo lang, zeker?
Je kan bij cel eigenschappen gewoon zetten op "TEKST" en dan laat hij altijd zien wat je typt en veranderd het nergens in.

(Zelf net geprobeerd, Nederlandse versie veranderd MAART1 naar mrt-01 daarna celeigenschap op TEKST en het blijft staan op MAART1
Maar heb je dit zelf ingevuld of overgenomen/geïmporteerd vanuit CSV? Die tweede werkt volgens mij anders en gebruikt een tussenconversie als excel basis. Hierdoor verdwijnt de oorspronkelijke waarde die in het CSV bestand staat en houd je alleen de geïnterpreteerde versie. Ik heb helaas geen windows hier dus kan het niet checken, maar zover ik weet krijg je met deze methode dan een UNIX timestamp getalwaarde ipv de originele “MAART1”.

Excel interpreteert het namelijk eerst en dus moet je dit direct aangeven bij import.

Dan kan je zeggen importeer de boel opnieuw, maar dat is niet even zomaar gedaan. Deze mensen werken soms met CSV bestanden met miljoenen records. Als excel het überhaupt al openen kan heb je kans dat dit echt rustig een kwartier duurt.
Dat pas ik ook toe want in mijn geval met artikel codes bestaan puur uit nummer die Ook wel eens beginnen met 0 wordt de nul er afgehaald. Werkt leuk. Maar als de bron lange lijst die wordt gegenereerd vanuit andere source heb je paar dozijn invoer dat aangepast is en kan je dus na de cellen op tekst te zetten gaan corrigeren.

Ik vermoed dus dat deze lapmiddel niet werkt omdat het om lijst invoer gaat vanuit andere app.

Omdat hun zelf de probleem string kunnen aanpassen kunnen zij dit zo oplossen. Ik niet.
Ik genereer uit de source applicatie de lijst direct naar excel. Ik zou dus kunnen genereren naar bestand formaat waarbij je makkelijk met kolommen kan editen of kopieren. En exel bestand de cellen voorbereiden door op text te zetten in waarden in te plakken. Een lijst bij mij waar 12 invoer verkloot is corrigeren is te doen.
Gezien genen een zeer grote set is dat in geval van excel data genereren is cell op text zetten niet de oplossing. Dus denk niet dat het om per geen excel invoer gaat. Maar dat in set van 1000 of milioenen er verspreid genen vermeubeld zijn.
Je kan bij cel eigenschappen gewoon zetten op "TEKST" en dan laat hij altijd zien wat je typt en veranderd het nergens in.

(Zelf net geprobeerd, Nederlandse versie veranderd MAART1 naar mrt-01 daarna celeigenschap op TEKST en het blijft staan op MAART1
Maar dan is de reden weg om te 'zeuren' dat er iets gedaan moest worden.

Zoals vaker in dit soort issues, PEBCAK is echt de hoofdverdachte
Grappig dat je dan nog een edit moet doen, om je eigen onvolkomenheden te verdoezelen .... 16 uur later
Tja, telefoontjes plegen en tweakers.net gaan niet altijd samen :)
6 augustus 2020 15:47
Je kent Microsoft nog niet zo lang, zeker?
Ik heb begrepen dat de ondersteuning voor Unix-lijneindes voor Kladblok meerdere keren geprobeerd en teruggerold is voordat het definitief werd geïmplementeerd. Kladblok is natuurlijk eeuwenoude code, niet gewoon ‘import Gui.Widgets.TextEditField;, en dat gaat voor Excel wellicht ook op.
Oh man, daar heb ik toch m'n kop over zitten breken ergens in 1998. Ik gebruikte toen een X client op Windows en zat een ISDN dial on demand script in elkaar te jatten (met hulp van internet, zonder Google, daar had nog niemand van gehoord, uiteraard wel andere zoekmachines). En dat script wilde maar niet draaien. Tien keer gecontroleerd, alles klopte. Maar, ik deed dat dus in notepad en dropte dat via ftp naar de Linux bak toe. Op een gegeven moment ging ik het maar met de hand over zitten tikken. En toen werkte het wel. Nou breekt m'n klomp! Pas later kwam ik achter dat stomme cr en cr + lf. Ohhh.. Nu snapte ik het. :D
dos2unix doet exact dat: een cr/lf conversie. Bestaat al sinds 1989, initieel op Sun Solaris.
De datumherkenning van spreadsheets is sowieso ellende. Of 1/2 als half (of is dat =1/2?), 2 januari of 1 februari van het huidige naar wordt herkent is voor mij altijd een verassing. Het hangt vermoedelijk van je instellingen af maar al die wazigheid wil ik helemaal niet: waarom kan je niet gewoon van een veld aangeven of het een datum is en gebruiken we altijd dezelfde notatie? Bij die notatie zou je het jaartal ook gewoon altijd moeten opgeven. Als 5-5 automatisch 5 mei 2020 wordt dan zou 5 gewoon altijd de vijfde van de huidige maand moeten zijn: fantaseer alles er bij of niets!

[Reactie gewijzigd door 84hannes op 22 juli 2024 20:20]

Ik kreeg zelf regelmatig een excel bestandje van de collega’s in America- was ook geen pretje. Ze hebben daar immers eerst de maand en dan de dag....
Eerst maand en dan dag is natuurlijk de enige juiste volgorde aangezien wij een getallenstelsel hebben dat de meest significante waarde links zet. Dus: millennium eeuw decennium jaar -maand - dag (uur : minuut : seconde . milliseconde). Ik denk dat @The Zep Man dat ook bedoelt.
Ja maar ze doen mm-dd-yyyy of ben ik fout.
Nee, jij bent correct en zij zijn fout. :)
ja, alleen dat doen ze dus niet. Ze hebben alleen de dag en maand omgedraaid, de rest is hetzelfde.
Aan Excel kan je zelf ook ondersteuning voor ISO 8601 toevoegen. Een standaard die alle andere standaarden overbodig maakt. :+

Een bonus is dat het sorteren van datums een stuk simpeler maakt, omdat het numeriek/alfabetisch zonder verdere intelligentie kan.

[Reactie gewijzigd door The Zep Man op 22 juli 2024 20:20]

Excel zou dat moeten snappen (onderwater word het als een getal opgeslagen) zodra je de sheet opent word het aan de hand van de instellingen van je pc vertaald naar 06/08/2020 of 08-06-2020.

Overigens gebruiken ze in America gewoon dd-mm-yyyy notatie (bron: poster van Rowwen Hèze)
waarom kan je niet gewoon van een veld aangeven of het een datum is
Dat kan. Al minstens twintig jaar, misschien nog (veel?) langer.

[q]en gebruiken we altijd dezelfde notatie?
Dat Amerikanen hun datums raar opschrijven is niet de schuld van Microsoft.
Als 5-5 automatisch 5 mei 2020 wordt dan zou 5 gewoon altijd de vijfde van de huidige maand moeten zijn: fantaseer alles er bij of niets!
Ik neem aan dat je hier alleen je frustratie uit, maar prima begrijpt dat het onzin is?
Ik neem aan dat je hier alleen je frustratie uit, maar prima begrijpt dat het onzin is?
Nee, dat snap ik niet. Ik type regelmatig de datum van vandaag en ben iets minder vaak bezig met een historisch overzicht. In het eerste geval zou ik “” graag geëxpandeerd zien worden tot de exacte datum van vandaag, in het tweede geval moet ik zelf het jaartal meegeven. Ik snap dat “” expanderen tot de datum van vandaag problemen geeft, maar het expanderen van 12/8 naar 2020-12-08, terwijl 13/8 geëxpandeerd wordt tot 2020–08-13 levert ook problemen op maar dan problemen die veel meer tijd kosten om terug te vinden. Dat is net zoals Excel 1,000 als 1000 interpreteert terwijl 1,00 als 1 wordt geïnterpreteerd. Het lijkt een goed idee dat Excel raadt wat je wil maar het is een drama! Dus als mensen een datum willen invoeren, prima, maar dan doen ze ook maar gewoon de hele datum.
Ik las "dan zou 5 gewoon altijd de vijfde van de huidige maand moeten zijn" als "wanneer ik een losse '5' type, dan moet Excel daar een datum van maken: de vijfde van de huidige maand". Op die manier zou je nooit meer getallen van 1 tot en met 31 kunnen invullen, omdat die altijd omgezet zouden worden in datums.

Nu ik je extra reactie lees klikt het veel meer alsof je de "intelligentie" van Excel wilt beperken tot "probeer dd-mm te herkennen; als dat niet lukt, geef het op" in plaats van het huidige "probeer dd-mm te herkennen; als dat niet lukt, probeer dan mm-dd te herkennen; pas als dat niet lukt, geef het op". Dat klinkt wel als een realistische suggestie; excuses voor het misverstand.
Je hebt gelijk dat ik overdreef, maar je ziet nog mijn punt niet. Probeer yyyy-mm-dd te herkennen, hooguit. Niets anders. Want als ik zeg dat ik op 2 maart geboren ben dan snap jij dat dat minstens een decennium geleden moet zijn maar Excel maakt daar 2 maart 2020 van. Dat is gewoon fout!
Beter nog, als iets géén datumveld is wil ik niet dat Excel er aan gaat rommelen.
Ook leuk als je voetbaluitslagen in excel bijhoudt. :P
De code wijzigen is meestal niet zo'n grote klus. Alles wat daarna komt wel. En er is ongetwijfeld een grote backlog voor product development. Het ljikt me niet dat je dit feature boven aan in je prio-lijst zet.
Dat is wel een heel makkelijke reactie.
Gebruik je Excel als instrument in je specialisatie, of moet je specialist in Excel zijn om het als instrument te kunnen gebruiken?

PEBCAK is in de meeste gevallen toch een probleem van luie programmeurs de denken dat iedereen ICT-specialist is. (Op de echt domme uitzonderingen na waarin een muis het niet doet omdat deze niet ingeplugd is, etc.)
Nee niet. Excel wordt gebruikt om wat te kunnen zeggen over de data.

In het geval van genen, sequencing en andere eiwit gerelateerde dingen: hoevaak komt een gen voor in uniprot gelinkt aan eiwit X.

Kunnen we dat eiwit dan weer vinden in pubmed publicaties?

Hoe veel artikelen zijn dat en hoevaak per artikel komt het eiwit voort.

En dit kun je dan weer correleren met pubmed artikelen waarvan je weet dat een bepaalde compound genoemd wordt (chemische stof). Hierdoor krijg je enorme coocurrence matrices die enkele honderden MB’s in beslag kunnen nemen en het visualiseren daarvan kan in excel gedaan worden als eerste filteractie voor vervolg onderzoek.

Het gaat vaak om zulke ellendig grote hoeveelheden data dat je dit niet ff in een database schema propt. Hier moet je echt serieus geld tegenaan gooien ook ik hardware anders is het traag als dikke stront door een klein rietje. Is dus niet zo eenvoudig dat te doen terwijl een clientside CSV bewerking dan een stuk goedkoper is.
het weglaten van een voorloopnullen is net zo irritant! vooral als je met tabellen werkt met alleen cijfers, met daarin een voorloopnul :?
Dit. En honderd andere zaken waarin Excel vreselijk is.

Voor zo'n handig, alom bekend en nuttig programma is Excel zo koppig dat het elk bedrijf bakken met geld kost omdat er fouten door of in Excel gemaakt worden.
Het probleem is dat Excel zoveel problemen geeft voor mensen omdat het zo'n goed programma is. Ik heb zelf ook mijn problemen ermee, al was het maar met csv's die alleen ingelezen kunnen worden als je op Amerika staat (overigens ook iets, kunnen we alsjeblieft dat gewoon eens standaardizeren?). Maar we blijven Excel gebruiken, omdat het gewoon een verrekte handige tool is. Zelfs met zijn problemen is het nog steeds makkelijker dan veel alternatieven.
Het is vooral een ding dat overal geïnstalleerd is, en goed genoeg om 'dan maar' te gebruiken.
En voorzien van een prorgrammeertaal met netwerkinterfaces en weet ik wat allemaal, waardoor ie niet alleen malware kan draaien maar ook zulke complexe taken kan doen dat je er nooit meer vanaf komt.
Maar of het ook correct werkt zoals verwacht? Kan iemand het voor je auditen op kwaliteit? Ik denk het niet.
Dan moet je het op text zetten en niet op automatisch of getal. Immers 001 is gewoon 1, hoeveel nullen er ook voor staan.
Beperkte use case? Ik wordt regelmatig gek van Excel omdat Microsoft beter denkt te weten wat ik invoer dan ikzelf :-( Ik zou graag een optie zien om dat uit te zetten!
Zelfs IP adressen worden vaak in een getal omgezet (de punten worden gezien als de scheiding tussen duizendtallen - opgelost door locale te wijzigen).

[Reactie gewijzigd door v42.net op 22 juli 2024 20:20]

In de opties kun je de meeste automatische omvorm meuk uit zetten.
Of ctrl+a > celeigenschappen > tekst
Dat laatste werkt dus niet. Als je MARCH1 intikt/een csv inlaad met MARCH1 en het daarna pas als tekst format, krijg je de omgezette versie (datum als nummer, hier 36951) in tekst format, niet wat je origineel had ingevoerd
Door de opmaak te veranderen kun je geen tekst naar een getal omzetten of andersom. Altijd eerst de opmaak instellen, daarna pas waarden invoeren. Heb je het andersom gedaan, iets ten onrechte als tekst ingevoerd, dan kun je het vaak nog herstellen door de juiste opmaak in te stellen en de handeling tekst naar kolommen uit te voeren.
Ik mis nog steeds het naar mijn idee het toch heel normale yyyy-mm-dd datum formaat als optie.

En SOM() ipv SUM() waarom?

En hoe subtiel getallen met komma (ipv punt zoals in US) verkeerd worden verwerkt.

Oh en en dan nog de schijnveiligheid met die beveiliging voor document of macros.

En dan gebruik ik het maar zelden..
Omdat je je excel in het Nederlands hebt staan? :+
Dus als je de formules in een engelse vorm wilt hebben, moet je je hele Excel in het Engels zetten?
Ja. Gelukkig kun je tegenwoordig vrij language packs installeren ipv je Excel in een andere taal te hoeven kopen zoals lang gelee :)
yyyy-mm-dd kan je instellen bij celeigenschappen.

En voor formules heb je Excel translator.
Som: "getal dat ontstaat door optelling"
Sum is geen Nederlands woord.

Ben blij dat ons bedrijf ook mooi de Engelse Windows + Office gebruikt. Dat zoekt ook 100x sneller op internet als je ergens tegenaanloopt.
Word kan er ook een handje van hoor. Vooral als je voornaam met een A begint en je wilt netjes een zakelijke brief afsluiten. De volgende eerstvolgende regel (na enter) wordt dan automatisch een opsomming. 8)7

Met vriendelijke groet,

A. Jansen
B. Naam van bedrijf

[Reactie gewijzigd door wnwiigrtz op 22 juli 2024 20:20]

Dit kun je toch makkelijk oplossen. Zowel per veld als voor heel het blad.
Zet de cel eigenschap op tekst. En excel blijft er verder vanaf.
Niet bij mij als ik een waarde plak, dat het zou zou werken wil ik al jaren...

[Reactie gewijzigd door pookie79 op 22 juli 2024 20:20]

Dat werkt ook al jaren. Als je gewoon ctrl c, ctrl v doet dan kopieer je het format mee en wordt het idd een getal. Maar als je nu plakt door rechtermuisknop en dan alleen bij plakopties te kiezen voor values/waarde dan blijft excel dit wel gewoon als text zien ipv getal.
Niet bepaald wat ik bedoelde. Maar inderdaad alleen waarde werkt wel mits je vanuit excel zelf copieerd.
Interessant, de hoeveelheid reacties die ervoor pleiten om wetenschappers hun tijd te laten spenderen aan het stoeien met excel.
Ook boeiend om te zien hoeveel waarde er hier blijkbaar gehecht wordt aan de gen naam MARCH1 blijkbaar zien ze inderdaad liever mensen perongeluk een snel gemaakt foutje maken of hun workflow aanpassen dan dat ze deze naam veranderd zien worden in MARCHF1 :D
Maarja, aan de andere kant, waarom niet gewoon gebruik maken van een standaard workbook waarin macro's zitten die dit goed voor je kan importern EN nog eens een hoop extra functionaliteiten er in hebben zitten om je werk makkelijker uit te voeren.. Je kunt zo ongelooflijk veel met Excel, maar je moet wel weten hoe je het moet gebruiken, maar dat is IMHO eigenlijk met elke tool.
Ja dat is een simpele kosten baten analyse, je kunt je workflow helemaal optimaliseren en afhankelijk van hoe goed je dat wilt doen daar kun je daar veel tijd aan besteden. Dat kan handig zijn voor processen die veel herhaalt worden en daarvoor is het de moeite waard.

Er zijn ook processen die eenmalig plaatsvinden en daarvoor is dit soort optimalizatie eigenlijk alleen maar vergooide tijd. Het kan handig zijn om software door en door te kennen en te optimaliseren maar vaak is eenvoudige software met snelle functionaliteit voldoende en erg tijd besparend.

Het grote verschil van wetenschap met het werk in commerciële bedrijven is dat het vaak wat meer fluide is, je stelt een protocol op met apparaat x maar een jaar later is er apparaat y die data anders aanlevert. De ene keer werk je samen met bioinformaticus x die zaken zo aanlevert een dag later met moleculair bioloog y die zijn data volledig anders ordent etc etc. Daarom gebruikten wetenschappers vaak tools die wel flexibel zijn maar niet heel "netjes" zodat er plaats is voor vele usecases. Er is weinig standaardisatie.
Sorry, maar als wetenschapper die veel met data werkt dan is het kennen van excel toch echt wel erg fijn omdat het een generieke tool is waar je verdomd veel mee kunt op wetenschappelijk gebied. Je hoeft het helemaal niet eens 'door en door' te kennen.

Overigens als ik een csv dubbelklik in de verkenner dan opent excel die automatisch, maar doe ik dat vanuit excel zelf, dan krijg ik een wizard voor importeren voor mijn snuffert.. En bij mij bleef overigen MARCH1 gewoon MARCH1, in iedergeval in de engelse versie van Office 2010 die ik nog steeds gebruik (want de webbased versie is gewoon ruk en de downloadbare versie van office365 hebben wij geen licentie voor).

[Reactie gewijzigd door SuperDre op 22 juli 2024 20:20]

Ik ken wel wetenschappers die hele monte carlo simulaties schrijven in excel :P maar toch lopen te foeteren als er een autocorrectie of een rare omzetting plaatsvind waar ze niet om gevraagd hebben. Het is maar waar maar je prioriteit ligt. Het "kennen van excel" heeft vele vormen.

Misschien had ik het een "kosten, baten, interesse" analyse moeten noemen :D
Klopt, loop ook vaak te foeteren, maargoed, vaak genoeg doet die het ook goed. Is het zelfde als werken met Word, het duurt mij langer om te vechten tegen de automatische opmaak, dan om de teksten zelf te schrijven.
Rechtermuisknop op kolom, celeigenschappen, definiëren als tekst.

Fixed...
En dan staat er 36951 ipv MARCH1.
Klopt, op de achtergrond is elke datum in Excel een getal wat betekent "de datum die X dagen na het nulpunt (1970? geen idee) is". Heb je daarnaast nog een tijd staat, dan worden dit decimalen. Heel leuk...

In plaats daarvan definieer je eerst de cel/kolom/rij/sheet als tekst en vul je daarna pas je waarden in.
uhm, denk je werkelijk dat dat soort data handmatig ingetikt worden? Gaat veelal om gen-expresie of mutatie data of anders metadata over genen, die in bulk (het hele genoom) uit een apparaat komen, gedownload of uitgewisseld wordt. Het zijn veelal platte tekst files met tien- tot honderdduizenden rows.
En zoals al door anderen opgemerkt, als je een file met Excel opent gaat 'ie helaas 'helpen' ipv als default alles 'as-is' inladen.
Bij een .txt file via 'Open" krijg je nog wel een extra window waarin je kan aangeven wat elke kolom voor type data is. Maar er wordt meestal gelijk op 'Finish' geklikt waardoor genoemde problemen onstaan. En veel mensen slepen een txt file in Excel waardoor je de extra formatting window niet eens krijgt.
Je moet Excel ook niet als een database applicatie gebruiken, maar als een spreadsheet. Zie ook Matt Parker's boek: Humble Pi.
En deze video, die het ook over dit exacte fenomeen gaat https://www.youtube.com/watch?v=yb2zkxHDfUE :D
Apart... Dan kunnen we ook concluderen dat wetenschappers veel excel gebruiken. (denk ik :+ )

Op dit item kan niet meer gereageerd worden.