Google Sheets krijgt later dit jaar formulefunctie die data aanvult

Google heeft een nieuwe functie voor Sheets aangekondigd waarbij kunstmatige intelligentie wordt ingezet om het patroon tussen de data uit verschillende kolommen te detecteren. Aan de hand van een formule is het vervolgens mogelijk om data in een nieuwe kolom te laten aanvullen.

Deze functie, genaamd Sheets Smart Fill, komt ergens later dit jaar beschikbaar, schrijft Google. Deze ai-functie detecteert en leert het patroon tussen de data van twee kolommen. Als de gebruiker vervolgens op basis van de data in twee kolommen nieuwe data invoert in een derde kolom, kan Sheets Smart Fill het patroon herkennen en op basis van een voorgestelde formule de hele kolom vullen.

Google geeft het voorbeeld van een kolom in Sheets die volledig gevuld is met namen van personen. Als de gebruiker die vervolgens in tweeën wil splitsen, in de vorm van een aparte kolom voor de voornamen en een aparte kolom voor de achternamen, kan Sheets Smart Fill daarop inspringen. Zodra de gebruiker in een nieuwe kolom de eerste voornaam invoert, zal Sheets automatisch het patroon herkennen, de bijbehorende formule genereren en weergeven, en aan de hand hiervan de rest van de kolom vullen.

Er is ook andere nieuwe functie in de maak voor Sheets. Deze heet Smart Cleanup en is bedoeld om gebruikers te helpen snel flinke hoeveelheden data op te schonen, consistent weer te geven en beter te rangschikken. Zodra de gebruiker data importeert, zal Smart Cleanup in een zijpaneel suggesties doen ter verbetering, zoals het schrappen van dubbele entries. Ook is een kleine staafdiagram zichtbaar waar informatie over de geïmporteerde data is te zien, zoals een waarde die het vaakst voorkomt in een kolom. Volgens Google kan dat handig zijn om snel bepaalde afwijkingen op te sporen.

Google Sheets Smart FillGoogle Sheets Smart Fill

Door Joris Jansen

Redacteur

01-07-2020 • 08:21

38

Reacties (38)

38
37
19
1
0
13
Wijzig sortering
in excel kan dit al
heet Flash Fill
Het lijkt er op dat Excel inderdaad, na twee regels te hebben getypt, de rest van de regels automatisch aanvult, echter zet waardes in de kolom neer. Sheets lijkt er daarentegen een formule in te zetten, die daarmee later dynamisch toepasbaar is.
is idd geen formule en niet dynamisch
Als ik kijk naar de screenshot lijkt het toch wel verder te gaan dan gewoon flashfill.

De sheet bevat in de eerste kolom een voornaam en een achternaam, bij deze smart functie lijkt de ai te zien dat bij de eerste row enkel de voornaam gebruikt werd. De formule heeft nadien dus niet enkel de value gecombineerd maar ook een regular expression toegepast (substring geselecteerd)
Inderdaad, in het bron artikel zie je ook de formule verschijnen.
Die formule ziet er dan weer bijzonder naïef uit. Dat gaat voor elke realistische dataset (zelfs in amerika) niet werken.

Leuke demo op basis waar van ik dacht dat er wat "ai" achter zat. Maar die formule splitst gewoon op de 1e spatie. Welk percentage van de voornamen heeft een spatie?
Ik denk een vrij laag percentage eigenlijk. Heb gisteren toevallig exact dezelfde functie getypt om hetzelfde resultaat te bereiken.

Maar het is AI. Het is dus te verwachten dat hij naderhand snapt wat je wil als je namen met spaties hebt, en dan nog eens achternamen met spaties.
Nou ja, het wordt verkocht als AI. Waarschijnlijk worden gewoon 10 use cases herkend en met formules of RegEx ingevuld. AI is nogal een standaard term tegenwoordig.

Mijn telefoon leert hoe je de helderheid wilt hebben als je hem een paar keer hebt ingesteld. Vermoedelijk gewoon een least-squares-fit van de laatste 10 à 20 laatst ingestelde veranderingen afhankelijk van de herkende lichtsterke, maar door Samsung verkocht als "machine learning AI".
Dat is wel nogal een statement dat je maakt hier, zonder enige bronvermelding.
Inderdaad, ik heb niet al het gedrag zitten uitpluizen. Maar ik zie tegenwoordig te vaak zulke claims doe voor simpele zaken (zoals dit autofill) waar het niet nodig en ook niet prettig, want eventueel onvoorspelbaar, zou zijn.
In een tabel vult excel ook een ingevulde formule voor de hele kolom aan, niet alleen een waarde.
Hoe krijg je dat dan voor elkaar? Of bedoel je dat je een zelf ingevulde formule kan ‘doortrekken’? Want dat is niet waarover het hier gaat. Het speciale is dat in Sheets de formule door het systeem zelf wordt bedacht. Dat heb ik Excel nog niet zien doen.

[Reactie gewijzigd door Raka op 24 juli 2024 09:07]

jij geeft aan:
"Het lijkt er op dat Excel inderdaad, na twee regels te hebben getypt, de rest van de regels automatisch aanvult, echter zet waardes in de kolom neer. Sheets lijkt er daarentegen een formule in te zetten, die daarmee later dynamisch toepasbaar is."

Excel zal die mogelijkheid van 'dynamisch toepassen' misschien niet hebben, maar vult wel degelijk formules aan (mits binnen een aangemaakte tabel), daar reageerde ik op :)
Anoniem: 1322 @lighting_1 juli 2020 09:43
Dit werkt anders dan de Excel functie en is gebaseerd op de AI technology van Google. Ze gebruiken dezelfde techniek in "Smart Compose" van Gmail.
Hopelijk kan deze functie ook uit.En hopelijk staat ze standaard uit.
Natuurlijk is het handig dat als je een rijtje waardes verder naar beneden (of opzij) uit trekt, dat ze in een reëel ritme wordt aangevuld. En dat zo'n ritme niet altijd een oplopend nummer is en vooral bij het doortrekken van een hele tabel is het handig dat zo'n lijst het ritme van alle kolommen volgt.

Maar als het op basis van auto-complete of auto-correct of zo iets bij het intikken mee gaat fluiten en gaat verbeteren, dat zou het van mij alleen zeer beperkt mogen. Als ik zelf intik, dan doe ik dat bewust.

Wel zie ik deze functie als een basis van een spell-checker in een tabel. Daar kan ze wel goede diensten verrichten.

Dus ja, aardig zo'n functie. Maar alleen zeer bewust en beslist niet altijd automatisch.

Toegevoegd, voor het plaatje: Daar zou ik dus de volgende formule voorstellen:
=CONCATENATE("Hi ";REGEXEXTRACT(A2;"^[ ]*"))
de reguliere expressie hier is: het eerste woord (alles tot de eerste spatie) uit het veld A2. En door die formule door te trekken naar beneden, zal dat automatisch A3, A4 en zo worden.

[Reactie gewijzigd door beerse op 24 juli 2024 09:07]

het is en blijft een suggestie waar je kan kiezen om op te klikken of niet, het suggestie ballonetje lijkt zeker niet storend

[Reactie gewijzigd door sebastienbo op 24 juli 2024 09:07]

Kan op veel manieren, bijvoorbeeld eerst tekst->data of in excel
="Hi "&left(A1,1,search(A1," "))
Behalve dat je dan voornamen waar een spatie tussen staat splitst én je problemen gaat krijgen met tussenvoegsels en meerdere achternamen als je die ook gaat gebruiken. Regular expressions zijn leuk, maar voor geavanceerdere analyses een draak om mee te werken (dat eigenlijk sowieso voor het overgrote deel van de populatie wel, regular expressions zijn nou niet bepaald een wonder der leesbaarheid)
Toegegeven, het onderscheid tussen de voornaam, de tussenvoegsels en de achternaam is lastig, zeker bij het gebruik van meerdere achternamen en/of meerdere voornamen.

Zelf heb ik het als volgt gedefinieerd:
Een voornaam en een achternaam beginnen met een hoofdletter.
Een titel staat voor de voornaam en is herkenbaar aan 'geen hoofdletter' en/of een punt er achter.
Een voorvoegsel van een achternaam bevat geen hoofdletters.
Voorletters in plaats van voornamen zijn te herkennen aan een hoofdletter gevolgd door een punt.

Dat maakt de reguliere expressie best wel te doen. De uitdaging is vooral dubbele voornamen en dubbele achternamen als er geen voorvoegsel bij de (eerste) achternaam is.

En ja, je hebt gelijk, reguliere expressies zijn moeilijk terug te lezen. Vooral op platformen buiten de unix/linux omgeving omdat daar nogal eens eigen variaties worden gebruikt. Ze worden meestal als 'write-only' beschouwd.

[Reactie gewijzigd door beerse op 24 juli 2024 09:07]

Dan heb je al best een nette dataset als je daar mee wegkomt. Geen user input in elk geval!
Groetjes,

* Jeanne d'Arc (apart tussenvoegsel, of achternaam die niet met een hoofdletter begint)
* Peter R. De Vries (autocorrect D)
* WA van Oranje (geen punten tussen de initialen)
* Koen van 't Sant, MSc (tussenvoegsel met apostrof, en qua titel: ik gebruik liever ir., maar dan werkt het voorbeeld niet. Autocorrect maakt er ook nog eerst Ir. van, met hoofdletter dus :+)

Kortom: namen van mensen zijn gewoon niet geschikt voor automatische verwerking. :)

[Reactie gewijzigd door Reptile209 op 24 juli 2024 09:07]

Een aardige uitdaging. In de meeste gevallen gaat het overigens best wel goed, al is goed niet altijd wat je verwacht.

Jeanne d'Arc: Voldoet gewoon. d' is een afkorting van het voorvoegsel du of de. Het quootje moet je wel zien als woord-scheidingsteken, ook al staat er geen spate. In dat geval is de woord-scheiding na het quootje. De achternaam is Arc, daar sorteert ze op.

Peter R. De Vries. Dat is geheel volgens de spelling. De achternaam is hier "De Vries" met 2 woorden. In Nederland niet gebruikt maar in Vlaanderen heb ik ooit begrepen dat dit de aanduiding is dat Peter niet van adel is. Met de naam "Peter R. de Vries" zou hij van adel zijn. De sortering is in Vlaanderen voor "Peter R. De Vries" bij de D en niet bij de V. Denk aan de namen Vandenbroek en zo. Mocht het door autocorrect zijn, dan is die autocorrect mogelijk op een Vlaamse instelling maar meer waarschijnlijk op een niet Europese.

WA van Oranje. Dat is naar keuze te herkennen. Toegegeven, het is een lastige. Maar in de meeste gevallen gaat het goed als WA gewoon zoals het is wordt overgenomen.

Koen van 't Sant, MSc. Eerlijk is eerlijk, de titels er achter en met een leesteken heb ik nog niet in mijn systeem. Al gaat het opsplitsen van de voornaam en achternaam hier best wel redelijk. Het eerste woord met hoofdletter is de voornaam. De woorden zonder hoofdletter daar achteraan zijn de voorvoegsels van de achternaam. Het eerste woord na de voorvoegsels is de achternaam voor de sortering. In mijn automaat zou dat dan 'Sant, MSc' zijn. Dat komt dan wel redelijk in de buurt.
Overigens, hier staat het quootje voor de t en na de t een spatie. In dit geval is het quootje geen woord scheidingsteken: er staat al een spatie voor en een los quootje is niets. Het hoort bij de t, zoals de punt achter een letter hoort als het een afkorting is.
Over de titel ir. met een hoofdletter van de autocorrect: daar zou de autocorrect en de auto-caption beter op moeten samenwerken.

Natuurlijk het is maar een routine en je moet in de gaten houden waar het voor gebruikt wordt. Maar uiteindelijk is er wel een regeltje voor te vinden om het goed te doen. Bijvoorbeeld 'voornamen' die helemaal met hoofdletters geschreven zijn interpreteren als voorletters. Voor titels zou je kunnen overwegen om ze appart te herkennen. Voor voorvoegsels zou ik dat niet doen. er zijn voorvoegsels die in een andere situatie wel gewoon de achternaam zijn.

En ja, je bent uiteindelijk afhankelijk van hoe netjes het ingetikt wordt. Maar met deze betrekkelijk eenvoudige regels kom je een heel eind. Veel verder dan het keurslijf waar veel websites ons in dwingen. Dat is niet nodig.

[Reactie gewijzigd door beerse op 24 juli 2024 09:07]

Dat smart cleanup klinkt leuk maar als het aan je data zit kan je het alsnog niet 100% vertrouwen. Je hebt er niks aan als het resultaat van je sheet opeens anders is omdat Google vandaag besloten heeft dat een waarde opgeschoond moest worden.
Ik leid uit het artikel af dat het vooral gaat om suggesties. Als de suggestie is 'ontdubbelen op kolom A' dan neem ik aan dat dat hetzelfde is als wanneer je dat handmatig zou doen. Zoiets als de meest voorkomende waarde laten zien klinkt handig in ieder geval.
Anoniem: 1322 @lasharor1 juli 2020 09:40
Je gaat er van uit dat Sheets automatisch data gaat aanpassen. Dit zal natuurlijk nooit het geval zijn.
Ik denk dat je de feature niet helemaal begrijpt. Zie hier een voorbeeld van de functie, mogelijk is dat iets duidelijker. Uiteraard kun je ook gewoon naar het bron artikel gaan voor een betere (niet vertaalde) uitleg.
Hopelijk wordt het beter dan de voorspellende gave in Google Forms als je daar vragen in zet. En die ineens denkt dat je short answer alleen numeriek moet zijn, of zomaar moet veranderen in een multiple choice ding Dat is volgens Google ook gebaseerd op een of ander smart dingetje, maar wat je in de praktijk enkel tegenwerkt .
Mijn punt is, dat ik niet snel zou vertrouwen op zoiets als dit In het voorbeeld in het plaatje is het nog enigszins te doen (al zie ik ook wel weer manieren waarop dit fout gaat bij bepaalde buitenlandse namen)
Onder de streep moet je dus toch nog zelf controleren of het wel klopt. En dat is bij bijv forms meer werk dan het gewoon niet gebruiken Wat daar helaas geen optie is.

Maar ik ben benieuwd en laat me verrassen, misschien werkt dit wel erg goed
Gebruikt iemand hier liever Google sheets dan Excel? Ik zie de reden niet om het te gebruiken behalve dat het gratis is.
Ja, op mijn chromebook en het voldoet prima voor wat ik er mee doe. En het staat in de cloud en is dus overal beschikbaar. Gebruik eigenlijk alleen maar google programma's.
Naast gratis, is het qua functie vrijwel gelijk aan Excel, waarbij sommige zaken intuïtiever werken.
Als je zakelijk G Suite hebt lopen, gebruik je het bijvoorbeeld :)
Ik gebruik liever Sheets (en heb ook Excel). Sheets gooit mijn data minder vaak door elkaar als ik een CSV importeer die niet helemaal standaard is (zoals space-separated). Tevens is data delen en samenwerken veel eenvoudiger. Je ziet dit ook terug op het internet, van kickstarter tracking lijsten tot cryptocurrency rekenlijsten, als je data wilt delen is het veel simpeler en sneller.
Ik gebruik zelden Excel. Enkel Google spreadsheets. Op zich niets mis mee. Maar ik verwerk ook niet zoveel data, enkel eens om een csv aan te maken of aan te passen.
Ja hoor. Geef mij maar Google Sheets in plaats van Excel. Ik gebruik het onder andere om valutakoersen automatisch te verwerken en zo de juiste productprijzen te bepalen, maar ik gebruik het ook om bijvoorbeeld vertalingen automatisch door te voeren. Verder trek ik data uit externe bronnen ook in Google Spreadsheets en zo zijn er nog wel meer dingen die ik ermee kan doen.
Ik gebruik liever Sheets dan Excel. Koppeling met andere databronnen vind ik makkelijker werken. Ik wil ook makkelijker overal bij mijn sheets kunnen.

Interface vind ik ook wat intuïtiever werken :) minder rommelig vooral.


Ik ben bijvoorbeeld nu bezig met een sheet om mijn stroomverbruik bij te houden. Ik heb een form om snel de meterstand in te kunnen voeren, trek temperatuur/wind/neerslag data bij het KNMI vandaan (matig geïsoleerd huis met elektrische verwarming, dus weer is relevant) en haal data uit mijn agenda om bij te houden of ik thuis was of niet. Als ik twee weken geen update doorvoer geeft het scriptje wat meedraait een notificatie ter herinnering. Dat was met Excel toch een stuk lastiger geweest.

[Reactie gewijzigd door doltishDuke op 24 juli 2024 09:07]

Ik vind het vanwege cloud storage handiger. Ik kan dan ook op mijn telefoon bij het financiële overzicht. En voor simpele taken is er qua functionaliteit geen verschil met Excel (moeilijke dingen heb ik niet geprobeerd, maar daar ben ik bij Excel ook niet tevreden mee).
Gaaf, maar dan moet het goed werken. De suggesties die ik nu soms krijg slaan nergens op. Maar ik heb goede hoop dat dit het leven makkelijker maakt.
Machine learning is een subset van kunstmatige intelligentie.
https://en.m.wikipedia.org/wiki/Machine_learning
Om het door jou aangehaald artikel te quoten:
It is seen as a subset
Dus het *is* geen subset, het wordt *gezien* als een subset. M.a.w, je zet een mening neer alsof het een feit is.

Hoe dan ook, het is incorrect om machine learning te verwoorden als kunstmatige intelligentie. Het is nml totaal niet intelligent. ML is gewoon grote hoeveelheden data doorworstelen en obv die data iets met een bepaalde percentage vrijmoedigheid iets kunnen zeggen over andere data die erop lijkt.

De intelligentie zit dan... waar precies? Intelligentie is als je ML niet nodig hebt. Misscien kan AI het resultaat van ML zijn, maar je moet dan de dataset weg kunnen gooien. Of heb jij letterlijk ALLE bankstellen in je hoofd zitten die je ooit hebt gezien, alleen maar om een nieuw bankstel als zodanig te kunnen identificeren? Nee, want jij bent intelligent. Je bent geen primitief monster dat miljoenen plaatjes onthoudt.

Op dit item kan niet meer gereageerd worden.