YouTube test AI-gegenereerde samenvattingen voor video's

YouTube gaat experimenteren met AI-gegenereerde samenvattingen voor video's. Hiermee moeten gebruikers te weten kunnen komen waar een video over gaat.

Het experiment geldt voorlopig enkel voor een klein aantal Engelstalige video's en de samenvattingen zijn alleen zichtbaar voor een beperkt aantal gebruikers, schrijft YouTube. Een woordvoerder van het videoplatform zegt tegen Engadget dat het tijdens de testperiode gaat om tutorial-, winkel- en vlogvideo's die worden bekeken op mobiele apparaten. De videosamenvattingen moeten wereldwijd beschikbaar zijn en dus niet enkel voor Engelse gebruikers.

De AI-gegenereerde samenvattingen moeten verschijnen voordat gebruikers een video aanklikken, zodat ze een beter idee moeten krijgen van waar een video over gaat dan door enkel de titel en thumbnail te bekijken. Deze samenvattingen moeten de videobeschrijvingen, die door de videomakers worden geschreven, niet vervangen, benadrukt YouTube. Het is vooralsnog niet duidelijk hoe de functie er precies uit komt te zien. Ook noemt het platform niet of en wanneer de functie voor alle gebruikers beschikbaar komt.

Door Kevin Krikhaar

Redacteur

02-08-2023 • 08:37

71

Reacties (71)

71
70
26
1
0
42
Wijzig sortering
Zou een goede toevoeging zijn voor clickbait titels/thumbnails. Neem aan dat dit werkt op basis van een auto to text transcription en vervolgens een gegenereerde samenvatting.
Precies. En how to video's waarin een fix van 1 minuut wordt uitgesmeerd over 20 minuten. En verkapte 'influencer' videos met 0 inhoud.
Is met artikelen niet veel anders. Command line uitleg over 1 command.
3 regels text zou voldoen maar op een of andere manier zijn het talloze paragrafen.
Want.. de metric is 'Time spent on site' en die willen ze allemaal maximaliseren en daar slopen ze hun informatie voorziening mee. Een mening.. mileage may vary.
Klopt, maar op een website kan ik gewoon op CTRL+F drukken en zoeken op wat ik nodig heb. Een youtube video moet je eigenlijk helemaal doorkijken voordat je weet waar de belangrijke informatie zit.
Je kan tegenwoordig wel bij het scrubben zien welk gedeelte van de video het meest bekeken is. Dus daar zou ik beginnen met kijken. Dan heb je vaak het hoogtepunt van de video te pakken.
Klopt, dat gebruik ik daarom ook al best vaak, maar meestal zijn dat de punten waar de sponsor berichten eindigen.
bekijk de SpnsorBlock extensie voor youtube dan eens, dan zie je en waar een sponsorblock zit, en waar het meest geklikt wordt
Of tietuh. :P
Maar heel veel creators zetten het uit schijnbaar want ik zie ze niet overal. (Edit: De graph zie ik niet overal) Ook waar ik ze eerst wel zag op de grafiek zijn ze weg, (Die bultjes grafiek boven de progressbar toch?)

Het zijn altijd
- Dingen die interessant zijn
- Dingen die je wilt skippen

Ik gebruikte het om te ad skippen maar nu heb ik een plugin die dat -bij dat specifieke kanaal- hel goed doet :) Inclusief memes. Zijn meme-intros zijn altijd heel duf, 1 minuut lang. (Ook snap ik de meme vaak niet door allerlei vage *wooosh* -voor mij- referenties in de meme. Eerlijk is eerlijk. Dus daarom heb ik ook geen interesse in zijn meme intro videos.) Ik gok dat die adskipper diezelfde data gebruikt.

[Reactie gewijzigd door MrMonkE op 24 juli 2024 15:36]

Elke paragraaf kan een reclame blok tussen gestoken worden.
Vergeet niet dat elke paragraaf door 2 advertenties worden gescheiden. Hierdoor ben je aan het scrollen (pagina of video) en je vind het maar niet... hoe hebben we het internet zo kunnen laten verloederen.
Laat mij er buiten. Ik kom nog van een internet waar free gewoon free betekende. Geen fopperij met 'free download'. Ik had nog eens een ansichtkaart uit VS laten sturen 'for free'. De eerste vorm van datamining op internet denk ik maar daar had ik toen nog geen besef van. :)
Het verschil is dat ik in no-time door hele lappen kan scannen en zo heb gevonden waar ik naar zocht. Die waardeloze filmpjes met een hoop geblaat en reclame zijn van een andere orde. Alle videohits op zoektermen sla ik daarom consequent over.
Komt omdat als Youtube video's niet minimaal 10 minuten zijn er amper publiek op komt en dus ook aan niemand voorgesteld word

Het is vervelend, maar als je wilt dat jouw video bekeken wordt heb je weinig andere keuze
behalve shorts dan, die worden de hoge hemel in geboost door het algoritme
Aaargh, die shorts. Die ze dan ook gewoon nog tonen in de app op mijn Apple TV. Rot op met die onzin.
ik hoef ze ook niet te zien persoonlijk, maar ze zijn er wel, of je het nou leuk vind of niet
There's a plugin for that.
Enhancer voor YouTube. Of Blocktube.
Kun je alle shorts uitzetten.
Dat heb je te danken aan YT zelf ivm ads en bepaalde voorwaarden.
Wat dacht je van al die nutteloze "tutorial" video's wat beter was gegaan in 2 screenshots en 3 alinea's tekst waar nu complete video's van 18 minuten voor worden gemaakt, met een mega boring, niet doorlopende vertelstem. Afgrijselijk!
Soms heb ik al het gevoel dat het een of andere scraper met text-to-speech module is. Die allemaal van dat soort video's online plempt.
Klopt, zijn zelfs websites voor waarin je dit zelf gecombineerd met ai en wat sleutelwoorden in elkaar draait. Niet alleen tutorials, maar ook nieuws of wel onderwerp.

Thumbs down is echt slechtste beslissing van YT in jaren; dit soort bagger de bovenhand krijgt
Kom geregeld videos tegen met een herkenbare monotone AI stem die slechts een script voorleest.
De diverse Reddit en movie recap kanalen zijn vrijwel allemaal AI. Bij de Reddit zooi kan het volledig geautomatiseerd, die hebben vaak dezelfde clip van een of andere Minecraft parkour map eronder zitten. De movie recap kanalen (die helaas aan het verdwijnen zijn) hoeven alleen een script te schrijven en dan clips uit het filmpje erachter te plakken, maar dat zijn grotendeels buitenlandse kanalen (als in, niet-Engelse) die dus zo'n voice over niet zelf zouden kunnen doen.
Ik heb meer problemen met videos die een engelse titel hebben maar wel een volledig anderstalige video hebben. Vooral bij Indiërs is dit het geval.
Mee eens. Je ziet ook veel IT tutorials uit Aziatische landen die in heel slecht engels iets proberen uit te leggen. Kost zoveel energie om uberhaupt te begrijpen wat er gezegd wordt dat je van de stof zelf helemaal niks meer mee krijgt.
Ja precies, zo'n man uit India die in 12 minuten vertelt hoe je met 1 simpele regkey iets voor elkaar krijgt.... Tenenkrommend.
Laten we hopen dat dit helpt ;)
Zelf al groot fan van chatgpt dat je gewoon lekker beknopt een antwoord krijgt en je niet door 20 posts op 5 verschillende websites hoeft te zoeken naar een antwoord.
Ik heb nu een ad skipper. Die slaat alle reclame en intro's over.
Slaat ook -onbedoeld- memes over. GODDELIJK!
Sponsorblock voor Youtube.

Nu nog een die de video re-edit en een soort readers digest video voor je maakt.

[Reactie gewijzigd door MrMonkE op 24 juli 2024 15:36]

Ja, Sponsorblock voor Youtube.
-ik heb het ook even in de vorige post gezet-

[Reactie gewijzigd door MrMonkE op 24 juli 2024 15:36]

Zo gebruik ik op iOS (iPhone) de app uYou+ die een gekraakte YouTube app is, met hierin SponsorBlock en een ad block erin verwerkt. Heerlijk.
Techmensen zijn nu eenmaal geen voice over mensen die een ander publiek willen aanspreken, ieder zijn specialiteit
Het ergste is als ze dan een CLI gaan filmen van een 4K-scherm met font x16 :+
Haha ja verschrikkelijk. Dat is ook met websites zo. Antwoord op mijn vraag is twee zinnen, maar die worden verwerkt in een enorme lap tekst, met een eindeloze inleiding.
Ha ha ha, ja en nog erger als je dan zonder adblocker tussen elke alinea zo'n giga reclame component hebt zitten.
Zou een goede toevoeging zijn voor clickbait titels/thumbnails.
Je kan zelf ook hiermee beginnen. :)
Mja dat is een leuk visueel truukje, maar dat veranderd niks aan de titel. Zoals wie hier echt koning in is qua clickbait titels, LTT.

De thumbnail veranderen door een still uit de video zegt net zo weinig over de inhoud van de video.
Mja dat is een leuk visueel truukje, maar dat veranderd niks aan de titel.
Replaces thumbnails and modifies titles of videos on youtube.com and m.youtube.com
Ah dat zie ik niet in hun "before & after" afbeelding.
Vroeger kon je dat nog bepalen op basis van de ratio likes/dislikes maar aangezien dat is weggehaald zou dit een alternatief kunnen zijn om de waardeloze video's er tussenuit te filteren.
Gelukkig kun je dat nog steeds zien met de extension "Return YouTube Dislike"
Is dat het echte aantal dislikes of alleen de dislikes van mensen die die extensie gebruiken?
Echte. De info is gewoon beschikbaar in json data alleen wordt normaliter niet getoond.
Oh, mooi. Ik dacht dat zo'n plugin alleen maar een vertekend beeld zou geven, maar op deze manier is het dus wel van waarde. Dank!
Maar juist die clickbait dingen bevatten soms een reeks van korte filmpjes. Dat lost zo'n samenvatting ook niet op denk ik.
"Waarschuwing: het meisje in bikini in de thumbnail komt in het filmpje helemaal niet voor!"
Dit kan je zelf al doen met de VoxScript plugin van ChatGPT, werkt echt verbazingwekkend goed. VoxScript gebruikt de transcripts die Youtube al zelf automatisch genereert en vat die samen met GPT 4.

Heb het al een paar keer gebruikt om een aantal langere Youtube videos samen te vatten waar ik geen zin had om alles in detail te kijken (bijv. een lange lezing oid), maar wel de belangrijkste punten wilde weten.
Hoe weet je dat het verbazingwekkend goed was? Heb je ter vergelijk ook het complete verhaal gekeken? Wie weet heeft ie wel een paar heel belangrijke punten gemist...

Ik zal wel een ouwe lul zijn, maar ik heb 0,0 vertrouwen in het vermogen van een domme computer (wat een AI in essentie nog steeds is) om te bepalen wat een mens belangrijk vindt, of wat echt belangrijk is. Hij weet tenslotte niet wat ie aan het doen is. Het zal best aardig werken, maar kijk dan ook een keer het hele filmpje, maak zelf een samenvatting en leg dat naast het werk van de AI voordat je erop gaat vertrouwen.
Uit interesse: ben je ook zo kritisch naar machine vertaling (bv. Google Translate) toe? In se werkt het op een erg gelijkaardige manier. Het is ook maar een "AI".

[Reactie gewijzigd door BramVroy op 24 juli 2024 15:36]

Google Translate vertaalt in principe 1-op-1. Op zich werkt dat goed, alleen komen bijvoorbeeld uitdrukkingen uit de originele tekst vaak niet goed over.

Je krijgt dan een beetje het 'Louis-van-Gaal-effect': hij vertaalde ook altijd de Nederlandse uitdrukking letterlijk naar de taal die hij probeerde te spreken. Van 'steenkolenengels' naar 'stonecoalsenglish' of 'steinkohlendeutsch', bijvoorbeeld. Of 'better one bird in the hand, than ten in the sky'.

Vertaal je iets met Google Translate, dan moet je zelf altijd nog redigeren en nalopen of de essentie nog klopt. Dat betekent dat je eigen taalbeheersing ook meer dan voldoende moet zijn. Het scheelt wel een heleboel tijd ten opzichte van alles zelf moeten vertalen.
Precies. Even snel heen en weer laten vertalen om te kijken of het geen onzin is. Google Translate is heel erg goed hoor, daar niet van. Maar je wilt wel dat de boodschap overkomt. Het kan natuurlijk ook zijn dat de controlevertaling niet helemaal klopt, maar ik denk dat ik redelijk kan inschatten of wat er dan staat begrijpelijk is voor de persoon die alleen die taal spreekt. Ook al is het een beetje steenkolenturks.
Ja, vertaalde uitdrukkingen zijn geinig... "wanneer stront de ventilator raakt:.... :9
Die uitdrukking is in het Engels net zo hilarisch... :)
Dat is niet helemaal waar - een goede samenvatting betekent dat een inhoudelijk begrip nodig is om de niet belangrijke opmerkingen te scheiden van de echt belangrijke inhoud. Een vertaling dient de hele tekst om te zetten / te converteren. Dus een samenvatting is een lossy compressie algoritme en daarbij gaat dus altijd wat data verloren - maar welke data is dat? Als dat niet vastligt dan weet je dus niet wat je mist. Overigens kan een mens ook slechte samenvattingen maken natuurlijk - als deze de belangrijke punten niet kan onderscheiden - net zoals een AI.
Uiteraard zijn ze inhoudelijk verschillend, maar algoritmisch zijn ze enorm gelijkaardig. Summarization en translation liggen enorm dicht bij elkaar als je naar de technische kant gaat kijken. Text2text taken (ook bv. tekst simplification) zijn technisch enorm gelijkaardig. Het verschil zit 'em vaak eerder in de data. Daarom heb je ook al lange tijd (voor ChatGPT bestond) modellen die verschillende text generation taken in een model hebben zitten, zoals T5.

MT is ook ene pak genuanceerder dan wat je voorstelt, alsof er maar een juist antwoord is. MT is geen opgelost probleem. Hier ook moet een vertaler beslissen hoe een tekst vertaald moet worden voor het doelpubliek, en dat kan afhankelijk zijn van de cultuur, de taak, de economische verwachting, etc.
Ik controleer Google Translate altijd heel nauwkeurig. En ik merk dat het vaker niet dan wel klopt. Dus ja, tenzij je niet zo erg gebrand bent op een nauwkeurige vertaling, moet je die AI's inderdaad goed controleren. Ik maak voor onze VvE heel vaak briefjes met mededelingen in allerlei talen: Engels, Spaans, Turks en Arabisch. Engels kan ik natuurlijk zelf goed controleren. De anderen check ik door de vertaling terug te laten vertalen naar het Nederlands. En dan zie je soms gekke dingen. Je moet simpele zinnen gebruiken, anders weet je eigenlijk zeker dat het niet goed gaat. Nogmaals, en dat roep ik al jaren over AI: het blijft een domme computer die geen benul heeft waar ie mee bezig is. Dus als ie vuilniszak als salami vertaald bij wijze van spreke, heeft ie geen benul dat zoiets helemaal niet kan. Is even een zelf verzonnen onrealistisch voorbeeld, maar het gaat om het idee. Een AI heeft geen idee waar een lezing over gaat. Ik ben ervan overtuigd dat ie een heel indrukwekkende samenvatting kan maken, maar doe voor de gein het experiment: maak zelf een samenvatting en leg die naast die van de AI. Gewoon for fun. En kijk hoe goed is werkelijk is. Want ik kan ook een hele mooie samenvatting maken waarin ik enkele belangrijke punten mis. En als jij niet weet hoe goed ik ben in het maken van samenvattingen, vertrouw jij op mijn broddelwerk.

Volgens mij is het helemaal niet moeilijk wat ik zeg: vertrouw nooit blindelings op zo'n programma zonder dat je het gecontroleerd hebt. En als je daar te lui voor bent, loop je vanzelf een keer tegen de lamp.
Ja, ik wilde er net wat van zegggen. Je kunt het alleen testen met dingen die je van haver tot gort kent.
Misschien je eigen verslag, boek of thesis. Maar bij elke onbekende bron ben je overgeleverd aan de nukken en grillen van de AI en zijn meesters die bepaald hebben wat wel en niet goed is.
Ik heb het ook getest op videos waar ik de inhoud al van kende. Daarnaast is er een verschil tussen een globale samenvatting krijgen van een lange video met de hoofdpunten, en echt alle details. Verder is het ook zo dat als een mens een video samenvat je dingen te horen krijgt die die persoon belangrijk vond – als iemand anders het had samengevat had je ook weer andere dingen te horen gekregen.

Om de algemene punten ergens van mee te krijgen werkt het gewoon heel goed en bespaart het veel tijd. Wil je echt 100% zeker de details weten, kun je beter zelf de video kijken. Maar ik zou het vooral zelf eens uitproberen, dan kun je zien of het voor jouw use case goed genoeg is.
Misschien moet ik het anders zeggen: het hangt er vanaf wat je precies wilt. Ik zou zeggen dat als je student bent, aub: investeer een beetje tijd. Je wil toch graag iets leren denk ik dan. Dus luister naar het hele verhaal. Van samenvattingen kun je niets leren. Je wil dan juist de details horen en later de samenvattingen doornemen om de hoofdpunten nogmaals in je kop te krijgen. Maar het verhaal, ook al duurt het een uur, zit vol met nuttige info die je leert het verhaal beter te begrijpen. Ik zou het knap vinden als iemand een studie kan volgen op basis van samenvattingen. Eerlijk gezegd hoop ik niet dat mijn huisarts zo is afgesturdeerd. Hij kent dan alleen de ziektes uit samenvattingen. Ik denk dat je dan een hoop mist.

Dus ik ben niet tegen, maar gebruik het met verstand. Als je iets wil leren, investeer dan de tijd of laat het zitten. Dan wil je niet echt iets leren denk ik dan, maar alleen maar een papiertje halen zonder echte waarde.
Laatst toen ik een video wou samenvatten met een ChatGPT plugin kreeg ik de melding dat Nederlands niet ondersteund werd. Gebruikte jij het voor Nederlandse of Engelse video's?
Ik heb het alleen nog gebruikt op Engelstalige videos.
Dus uiteindelijk zijn we video weer "op papier" aan het samenvatten. Vind ik zelf wel prettig, wat als jongere oudere tweaker volg ik heel die trend niet van technische zaken uitleggen in een video terwijl een tekst met screenshots veel efficiënter is om te scannen naar wat je zocht. Wie weet gaan mensen toch nog weer meer lezen dankzij AI :z
Geinig ik deed zoiets vandaag met Apple WWDC videos: transcript naar ChatGPT kopieren en dan vragen of ie er een stapgewijze guide van kan maken.
Dat was de tekst in het begin van de video die ik afgelopen week steeds zag. Als ik de ondertiteling aanzet, dan krijg ik een blok met tekst te zien. Ik dacht dat een bug was die alle ondertitelingen achter elkaar zette ofzo.
Ik hoop dat ze ook de automatisch gegenereerde ondertiteling met een AI gaan verbeteren.
Is de titel van de video "Review: Samsung Neo QLED 55QN95B" dan maakt de ondertiteling er toch geregeld "Samsung Leo QLED 55QM95D" of iets dergelijks van. Of als die wel de juiste tekens herkent zet het random spaties tussen de tekens neer en een gebruikt willekeurig hoofdletters en kleine letters maar op een inconsistente manier door de hele video heen.

Geef een AI de gegenereerde ondertiteling + video titel + description en een ChatGPT/Bard maakt het een stuk consistenter.
Bij een hoop videos staat in de kop waar het over gaat. En er zijn ook vaak hoofdstukken waaraan je kunt zien waarover het segment gaat. Als het onduidelijk is waarover de video gaat dan zal het wel een warrige video zijn dus veel succes dan met daarvan een samenvatting maken. Ik denk dat dit nergens over gaat.

Wat ik vaker mis op Youtube is engelse ondertiteling bij moeilijk te verstaan engels en niet engelse videos..daar mogen ze van mij wel iets op verzinnen.
Ik zie de samenvatting van menig poeptuber al voor me.

" Ooh, vet, nog meer vet. Check dit en dat.OMG! OMG je moeder."
Om eerlijk te zijn kijk ik zelden naar omschrijvingen van video's en vaak alleen naar de titel wanneer ik iets specifieks zoek. Maar vaak zeggen ook omschrijvingen niet zoveel hoe een video daadwerkelijk is zeker al bij b.v. how to video's.

Op dit item kan niet meer gereageerd worden.