Adobe past opmaak van pdf's met Liquid Mode automatisch aan voor kleine schermen

Adobe voegt Liquid Mode toe aan zijn Acrobat Reader-app voor Android en iOS. De functie past de opmaak van pdf's automatisch aan voor kleinere schermen. Dat werkt volgens Adobe met kunstmatige intelligentie en machinelearning. Later komt de functie ook naar desktops.

Door de Liquid Mode-knop in te drukken past de app de weergave van pdf's aan, zodat die beter te bekijken zijn op kleine schermen. Tekst, afbeeldingen en tabellen worden opnieuw opgemaakt. De functie gebruikt het Adobe Sensei-platform voor neurale netwerken.

Volgens Adobe is Liquid Mode een zelflerende tool, die naarmate er meer gebruik van gemaakt wordt beter zal gaan werken. Er wordt machinelearning gebruikt om de verschillende onderdelen van pdf's te begrijpen, zoals koppen, paragrafen, plaatjes, lijsten en tabellen. De kunstmatige intelligentie probeert ook te begrijpen hoe die verschillende onderdelen gesorteerd moeten worden in de nieuwe weergave.

Het is ook mogelijk om voorkeuren aan te geven, om zo bijvoorbeeld de tekstgrootte en letterafstand te veranderen. Liquid Mode is beschikbaar in Acrobat Reader voor Android en iOS. De tool komt later ook naar de desktopversie en browsers, maar wanneer dat zal gebeuren, is nog niet bekend.

Door Julian Huijbregts

Nieuwsredacteur

25-09-2020 • 18:35

42

Reacties (42)

Sorteer op:

Weergave:

Was PDF niet juist bedoeld om het overal exact hetzelfde uit te laten zien? Ook als er een ander font of iets dergelijks gebruikt werd?

Edit:
The Portable Document Format is a file format developed by Adobe in 1993 to present documents, including text formatting and images, in a manner independent of application software, hardware, and operating systems.

[Reactie gewijzigd door StefanJanssen op 22 juli 2024 20:29]

Het klopt dat dat het grote voordeel is van PDF, maar ook gelijk het grote nadeel. In de wetenschappelijke wereld bijv.: PDFs zijn vaak gemaakt om er 'perfect' op papier uit te zien, en zijn zo makkelijk voor iedereen te printen. Wil je het ff lezen op je mobiel? Dan ben je vooral aan het klungelen met de juiste zoom en criss cross aan het scrollen (tekst is vaak in 2 kolommen op een pagina).

Deze aangekondigde liquid mode is puur aan de lezer kant. Je maakt PDFs dus als vanouds, maar de lezer kan iets in de originele weergave zien, of in een aangepaste 'reader mode' zoals ook veel browsers hebben voor webpagina's.

Helaas is de PDF standaard van zichzelf niet ideaal voor verschillende weergave modi, tekst herkennen gaat in de readers gaat via Optical Character Recognition (OCR) bijv.. Daarom dat ze dus ook AI + ML gebruiken.
Je maakt PDFs dus als vanouds, maar de lezer kan iets in de originele weergave zien, of in een aangepaste 'reader mode' zoals ook veel browsers hebben voor webpagina's.
Wat dus neerkomt op symptoombestrijding, we passen de lezer aan, in plaats van dat we een correct formaat gebruiken wat wel om meerdere devices goed te lezen is.
Toen ik het filmpje bekeek rees bij mij de vraag waarom je dat getoonde content in een PDF zou zetten in plaats van op een (responsive) webpagina.
Omdat layout op een (al dan niet responsive) webpagina het bij lange na niet haalt bij een goed opgemaakt document met bijvoorbeeld LaTeX.
Maar als die lay-out zo belangrijk is, dan wil je toch ook niet dat een reader deze aanpast? En zou lay-out niet onderschikt moeten zijn aan toegankelijkheid?
Er zijn al veel PDF’s in de omloop die waarschijnlijk niet in een ander formaat omgezet worden, daarvoor lijkt het me een fijne toevoeging.
PDF's die niet omgezet kunnen worden zullen ook niet werken met liquid mode...
PDF's die niet omgezet kunnen worden zullen ook niet werken met liquid mode...
Wat @ZpAz zei is "die waarschijnlijk niet in een ander formaat omgezet worden", niet dat het niet kan. Er zullen niet heel veel bedrijven en instanties zijn die veel uren (en dus geld) zullen investeren in rapporten omzetten naar HTML of een ander responsive format, als deze 1 - 10 views per maand krijgen.
Sommige moeten wel, omdat ze een archiefplicht hebben. Maar dan was een pdf vaak al voldoende....
Hetzelfde probleem speelt op e-readers die geen A4 formaat scherm hebben.
Klopt idd, volgende maand komt hopelijk mijn 10.3 inch (1872*1404 pixels) e-ink tablet eindelijk binnen. Dat is toch wel het minimum formaat waarmee A4 sized PDFs enigzins leesbaar zijn.
Remarkable? Hier ook ;)
Het klopt dat dat het grote voordeel is van PDF, maar ook gelijk het grote nadeel. In de wetenschappelijke wereld bijv.: PDFs zijn vaak gemaakt om er 'perfect' op papier uit te zien, en zijn zo makkelijk voor iedereen te printen. Wil je het ff lezen op je mobiel? Dan ben je vooral aan het klungelen met de juiste zoom en criss cross aan het scrollen (tekst is vaak in 2 kolommen op een pagina).
Op desktop kan ik voor vier soorten paginaweergave kiezen: single page, double page (twee naast elkaar, zoals in boeken en tijdschriften) en diezelfde twee, maar dan met alle pagina's onder elkaar zodat je van de ene meteen door kunt scrollen naar de volgende.

Zou het niet een veel betere oplossing zijn om een speciale "two column mode" te maken? Iets waarmee je, op het eind van de linker kolom, makkelijk naar het begin van de tweede kolom kunt springen? Doe er nog een beetje AI bij voor pagina-brede illustraties en je hebt een veel simpeler oplossing die het probleem net zo goed oplost (de demo video ziet eruit of liquid mode effectief weinig meer doet dan wat ik voorstel), zonder het hele idee achter PDF onderuit te halen.
Helaas is de PDF standaard van zichzelf niet ideaal voor verschillende weergave modi, tekst herkennen gaat in de readers gaat via Optical Character Recognition (OCR) bijv.. Daarom dat ze dus ook AI + ML gebruiken.
Er zijn inderdaad PDFs waarvoor dit geldt, maar dat is alleen zo voor ingescande documenten. Als je (ik noem maar een workflow) met InDesign een tijdschrift maakt en dat exporteert naar PDF, dan komt er geen enkele OCR aan te pas en is de platte tekst beschikbaar om perfect te copy-pasten. Ook als je met LaTeX een PDF-document maakt is dat het geval (al loop je daar wel het risico dat ligaturen fout kunnen gaan).
Dat 'column mode' lezen werkt dus niet zo lekker. Mede doordat er willekeurig afbeeldingen kunnen staan en je aan context en/of visuele cues moet herleiden of je column onder die afbeelding door gaat of niet etc. Onder andere daarom is dus AI/ML nodig.

I stand corrected in dat er text niet echt als text is opgeslagen in PDFs, dit verschilt idd per pdf en hangt onder andere af van hoe die gemaakt is. Mijn ervaring is echter dat copy pasten vaak verre vlekkeloos is, of het nou een pdf van een scan is of gegenereerd door software. Basale zaken als wanneer is iets echt een new line of een nieuwe paragraaf gaat vaak al fout in mijn ervaring. Zal deels ook komen omdat veel mensen niet weten hou je nou goed documenten in elkaar zet wat dat betreft.
Helaas is de PDF standaard van zichzelf niet ideaal voor verschillende weergave modi, tekst herkennen gaat in de readers gaat via Optical Character Recognition (OCR) bijv.. Daarom dat ze dus ook AI + ML gebruiken.
Nou dat ligt er dus heel erg aan hoe de PDF is opgebouwd. Het probleem met PDF binnen wetenschappelijke context is de beperkte characterset. Onder water is de tekst namelijk gewoon XML en kun je die prima eruit trekken. Het idee daarachter is dat een pdf als gestructureerde data uitleesbaar is en dat een spec compliant reader altijd de juiste output kan genereren.

Bij wetenschap gaat het echter fout als er characters worden gebruikt die buiten ascii liggen. Griekse characters zijn van die leuke gevallen. Die worden dan niet als tekst opgenomen maar als soort afbeelding/vector element.

Mega frustrerend als je met geconverteerde PDF’s eiwit of gen herkenning wil gaan doen, want die karakters zijn er dan ineens niet meer. ‘Beta’-galactosidase wordt dan gewoon “-galactosidase” nu valt dat wel te herleiden maar eiwiiten die het als achtervoegsel gebruiken kun je vergeten. En laat het nou vaak voorkomen dat er twee of meer uit een familie worden genoemd. Die kun je dan nooit meer geautomatiseerd linken.

Dan moet je dus met OCR aan de gang om echt alle data eruit te kunnen trekken. Anders kun je tabellen ook vergeten. Die komen er zo vaag uit rollen dat is niet grappig meer en kun je alleen met OCR nog een beetje fixen. Dat is ook de reden dat brailleregels ook OCR toepassen. Vet annoying. Dit heeft mij echt weken gekost tijdens afstuderen. Waar is die F’in ‘Beta’ gebleven??
Tip voor de volgende keer: Vraag een Word/latex manusscript, meestal wil men die wel geven (al is het soms lastiger de auteurs te bereiken bij ouder werk).
Was ook mijn eerste gedachte. Maar wat weegt meer? Vasthouden aan een oud idee, of gebruiksgemak?

Waarschijnlijk zal pdf ook altijd een "zoals het origineel is"-modus hebben, alleen komt er nu dus een "klein scherm"-modus bij wat ik alleen maar kan toejuichen.

Kan heel fijn zijn voor bijvoorbeeld tickets, handleidingen en menukaarten (ja ik heb het tegen jou, veel te lekker Indiaas restaurant met een kutwebsite en pdf-bestand als menukaart in lettertype Papyrus)
Maar wat weegt meer? Vasthouden aan een oud idee, of gebruiksgemak?
Ik probeer al jaren iedereen uit te leggen dat PDF een perfect formaat is... als je iets wilt printen. Voor iedere andere toepassing is het waardeloos. Een PDF-handleiding downloaden is een overblijfsel uit de jaren negentig toen apparaten nog een papieren handleiding hadden die als PDF naar de drukkerij werd gestuurd. De markt heeft twintig jaar de tijd gehad met een fatsoenlijk, schaalbaar alternatief te komen; dat is niet gebeurt. Dus ik weet niet of ik blij of verdrietig moet zijn dat Adobe PDF geschikt probeert te maken voor datgene waar het absoluut niet geschikt voor is. Laten we eerlijk zijn; er is geen alternatief formaat dat op alle fronten beter is. HTML bevat geen afbeeldingen (al zou base64 encoderen mogelijkheden bieden) en epub wordt heel beperkt ondersteund.
Een PDF-handleiding downloaden is een overblijfsel uit de jaren negentig toen apparaten nog een papieren handleiding hadden die als PDF naar de drukkerij werd gestuurd.
En toch hoop ik dat dat nog vele jaren bewaart blijft.
Er is niets zo ergerlijk als een handleiding die je niet kunt downloaden, en indien gewenst gewoon kunt printen.
Downloaden ben ik met je eens, dat moet blijven. Printen is een ander verhaal: vind jij een PDF op a5-formaat fijn printen? Als een nieuw formaat geschikt is om te reflowen moet het ook geschikt zijn om te printen op jouw favoriete papierformaat.

[Reactie gewijzigd door 84hannes op 22 juli 2024 20:29]

Ja, gaat prima. Mijn printer kan daar een keurig boekje van maken.
Prima, a5 lukt, maar snap je de vraag? Het is de maker van de PDF die bepaald op welk formaat jij kunt printen: als ze een a0-poster verkiezen kun jij thuis met plakband in de weer gaan omdat, en ik herhaal mezelf, PDF een fantastisch formaat is voor drukwerk maar ongeschikt voor waar het voor gebruikt wordt: online documenten.
Ik ben maar wat blij als iemand een document stuurt dat ik mag lezen en het is een PDF bestand ipv een DOC bestand :D
Maar dat is kwaad met duivels vergelijken :)
Maar serieus, helaas is anno 2020 PDF nog steeds het beste (na gewoon inline in e-mails), maar dat maakt het nog niet goed.
Je heb helemaal gelijk, pdf is niet meer waar het voo bedoeld was, sterker nog soms kun je ze gewoon niet eens zien, als je niet over de juiste apps beschikt.

Dit is een goed voorbeeld van hoe het dus niet moet, je verzint een standaard en gaat er net zo lang aan sleutelen tot het een gedocht wordt.

Maar eigenlijk heb ik zelf geen klagen over het inzien van pdf’s op een telefoon.
Nog steeds een stuk fijner lezen dan de meeste mobiele websites, tussen de teksten in chocoladeletters, lazy loading waardoor je niet normaal kunt scrollen en advertenties elke paar regels in.
Beetje eng dat ze machine learning gebruiken hiervoor, en dat we het meer moeten gebruiken om het beter te maken. Dat betekent dat ze dus jouw en mijn pdf’s gebruiken voor het verder trainen van hun systeem. Dat zie ik helemaal niet zitten. Pdf’s bevatten nogal eens gevoelige data. Daar heeft Adobe niets mee te maken.
Dan moeten die PDF's niet zo maar geladen kunnen worden.

Als jij een PDF online zet die gevoelige data bevat en die door een Adobe robot gelezen kan worden mag je Adobe niet de schuld geven. Dan ben je zelf niet in staat te snappen wat je wel en niet moet uploaden.
Online zet? Wie heeft het over online zetten?
Wellicht hebben we een ander idee van hoe Adobe aan de PDF's komt om mee te trainen. Jij lijkt uit te gaan van een soort spider die op het internet op zoek ik naar PDFjes, ik ga er van uit dat ze de PDFs gebruiken die gebruikers openen in hun apps. Welke aanname correct is weet ik niet, want dat staat niet in het artikel.
Ik heb het net even geprobeerd. Het werkt alleen als je je documenten in hun cloud zet. Wat mij betreft: vergeet het maar.
Niet perse, het kan ook betekenen dat ze een model trainen en elke keer als ze een significante verbetering gemaakt hebben dat model in een update stoppen. Dat trainen is waar al het werk in gaat zitten, slechts draaien om transformaties te maken is niet zo intensief.
Mijn vraag was met welke input ze dat model dan trainen?
Dat kunnen ze uiteraard met datasets doen die niet van de klanten zijn; bijv. publieke documenten of interne documenten van het bedrijf zelf.
Is dit niet een beetje de wereld op zijn kop zetten? Je begint met gestructureerd (Word of Latex) document met hoofdstukken, secties, sub-secties en andere structuren, die je vervolgens plat slaat met een print/export naar pdf, juist omdat een pdf zo zuiver is in het behouden van zijn vorm. Vervolgens ga je met AI weer zitten raden wat de verschillende lettertypen betekenen. Het zou veel zuiverder zijn om bij de bron die structuurinformatie goed in de pdf te stoppen, zodat men verderop in de keten niet hoeft te raden waarom iets nu bold gemaakt is.

Dergelijke formaattypen bestaan overigens al, dat is SGML (https://en.wikipedia.org/...neralized_Markup_Language), wat Adobe ook een tijd ondersteund heeft via FrameMaker. Maar dat is nooit echt populair geworden.

Ik moet ook zeggen dat ik niet echt een fan ben van dit soort trucs: in sommige documenten staan sommige dingen juist links of rechts op een pagina, zodat je bij het openslaan bijvoorbeeld een plaatje met zijn uitleg naast elkaar hebt staan. Juist in pdf zorg je er dus bewust voor (in Latex te forceren met \cleartoverso{} en \cleartorecto{}), maar dat gaat niet werken als de AI hiermee aan de haal gaat. Ik snap dat op een telefoon dit niet leesbaar is, maar misschien moet je dat soort dingen ook wel niet op een telefoon willen doen....
Deze post mag wat mij betreft aangetekend opgestuurd worden naar de mensen die dit project hebben opgezet binnen Adobe.

Fijn om SGML even te horen vallen :) De oplossing voor het probleem waar Adobe in 2020 mee zit ...bestaat al decennia in HTML. Deze actie staat lijnrecht tegenover de filosofie van wat PDF moet bereiken en de buzzword bingo om het met AI op te lossen voelt hopeloos geforceerd.
Liquid mode zit al een tijdje in de Android-client. Vind het zelf niet heel fijn werken, zeker niet dat het bijna standaard aan wordt gezet (althans, met ieder bestand dat ik open krijg ik een banner om liquid mode te gebruiken).
Het deed mij denken aan televisies die 2D naar 3D omzetten. Het werkt indrukwekkend goed in 90% van de gevallen, maar die 10% die verkeerd is, is reden om het in de praktijk nooit te gebruiken.
Nou ja, ik vind het (persoonlijk) een beetje een rommeltje. Tekst pakt hij inderdaad goed op, en ook het herkennen van de structuur van een document (compleet met automagisch gegenereerde TOC) gaat prima. Alleen krijg je door de keuze om tabellen niet om te vormen een soort continue switch tussen verticaal en horizontaal scrollen.
Ik snap de usecase weldegelijk, maar ik gebruik PDF vooral omdat ik er zeker van kan zijn dat het document overal hetzelfde wordt weergeven. Dat is vanaf nu niet meer het geval...
Hoe verschilt het van Reflow?
Als je het goed wilt doen moet je die knop niet op de client hebben maar bij het genereren van de PDF. De auteur/publisher bepaalt dan of er een mobiele of nog andersoortige alternatieve versies moeten worden gemaakt. Moet je weliswaar iets verzinnen om dit te kunnen embedden zonder dat legacy PDF-readers daar last van hebben, maar dat is niet onmogelijk.
Is het niet handiger om een EPUB of Mobi format te gebruiken voor lezen? En pdf gewoon voor drukwerk en printers gebruiken?

Pdf is al zo bloated aan het worden, je kan 3d viewers erin bouwen en real-time data er in proppen, animaties, forms. Het begint op een nieuwe flash plugin te lijken. Daar is al een geschikt medium voor websites...

Op dit item kan niet meer gereageerd worden.