Kunstig intelligens

Danske mediekoncerner blokerer for robotters datahøst

Berlingske Media og JP/Politikens Hus vil blokere for AI-robotternes adgang til deres medier, fordi medierne ikke får penge af virksomhederne bag robotterne

Det er slut med, at AI-robotter kan høste ophavsretsbeskyttet indhold fra danske nyhedsmedier uden at betale for det.

Brancheorganisationen Danske Medier anbefaler nu alle medier at skrive på deres hjemmesider, at de ikke tillader datahøst.

Dorthe Bjerregaard-Knudsen, COO og medlem af direktionen i JP/Politikens Hus, siger, at JP/Politikens Hus også følger Danske Mediers anbefaling.

”Det kommer til at stå på vores netmedier, inden loven træder i kraft,” siger hun.

”Jeg håber, at robotterne respekterer vores forbehold, vi kan jo ikke vide os sikre derpå, men vi sørger i hvert fald for at gøre opmærksom herpå, så der ikke er noget at være i tvivl om,” siger Dorthe Bjerregaard-Knudsen.

Koncernchef og udgiver i Berlingske Media, Anders Krab-Johansen, oplyser, at Berlingske Media også kommer til at følge Danske Mediers anbefaling.

”Vi skriver på vores fire mediers websites, at vores indhold er beskyttet af lov om ophavsret, herunder retten til at udnytte indholdet med henblik på tekst- og datamining.”

Ny lov træder i kraft

Baggrunden for aktionen er den nye lov om ophavsret, der snart træder i kraft.

Her havde Danske Medier håbet, at medierne ville få lov til at opkræve penge af techvirksomheder, der høster mediernes data.

Med licensen i hånden ville Danske Medier med en kollektiv aftale lave en afregning på vegne af alle medierne uden at blive anklaget for karteldannelse.

Men den mulighed indgår ikke i den nye lov. Det kommer først ind i en revideret version af loven senere.

”Vi har som minimum tabt et års forhandling med techgiganterne,” siger adm. direktør i Danske Medier Mads Brandstrup om udsættelsen.

Så i stedet for at kunne lave en aftale om afregning for datahøst får robotterne nu besked om at holde sig væk.

Baggrunden for, at Danske Medier ønsker at holde robotterne væk, er, at søgeresultater inden for en overskuelig fremtid forventes at blive AI-genererede artikler, og ikke bare links.

”Når det sker, skal vi sikre os, at der sker en fair betaling, uanset om det er noget, der har stået i Randers Amtsavis, Politiken eller DR.”

Ifølge Mads Brandstrup er der ikke tale om småpenge. Faktisk handler det om fremtidens forretningsmodel for medierne.

”Der bliver med god grund talt meget om mediestøtte og om at hjælpe de små medier. Men det her er måden, der skal tjenes penge på i fremtiden,” siger Mads Brandstrup.

Google efterlader spor

Argumentet fra techvirksomhederne og fra politisk hold har været, at det er en meget kompliceret operation at have en aftalelicens, og derfor er beslutningen udsat.

Techvirksomhederne erkender selv, at ophavsretsligt beskyttet materiale indgår, når robotter høster data, men de kan bare ikke sige hvor meget, forklarer Mads Brandstrup.

Faktisk er Googles AI-robot den eneste robot, som efterlader et spor.

Washington Post har lavet en algoritme, der viser, at indhold fra nyhedsmedierne er blandt de vigtigste kilder til viden, når Googles robot bliver ”klogere” ved at suge ny viden til sig.

Omfanget af høsten bliver målt i såkaldte ”tokens”, dvs. bidder af information.

For eksempel har Berlingske.dk leveret 6.400 tokens, Politiken.dk har leveret 3.400 tokens, mens tallet for DR.dk er 1.200 tokens.

(Du kan selv teste en hjemmeside ved at skrive navnet i søgestrengen)

2 Kommentarer

Jakob Albrecht
9. JUNI 2023
Hej Mikael
Tak for din kommentar. Vi har lagt et direkte link ind i artiklen nu, så det er nemmere at finde.
Mvh Jakob Albrecht, Journalisten
Mikael Andre Bidstrup Skotting
2. JUNI 2023
Vedr. "(Du kan selv teste en hjemmeside ved at skrive navnet i søgestrengen)"

Interessant artikel med søgetest på træningsdomæner, men det bør nævnes, at man skal rulle 2/3 ned på siden og finde rubrikken "The websites in Google’s C4 dataset" for at finde ovenstående. Det nemmeste er at søge på den nævnte rubrik på siden.