AI en journalistiek: enkele evoluties

Aan de hele AI-evolutie voor journalistiek en content zijn er toch enkele facetten die niet lekker zitten. Wij belichten twee ervan.

Ondergraaft Google de journalistiek?

Een artikel dat toch even doet schrikken. Dat Google uitgevers wil betalen voor hun content, om daarop zijn AI taalmodellen te trainen, dat heb je ongetwijfeld al gelezen. En dat lijkt logisch – alhoewel daar uiteraard vragen bij gesteld kunnen worden: worden de auteurs van die artikels ook vergoed, bijvoorbeeld?

Maar dat Google nu ook uitgevers gaat betalen om nieuwe generatieve tools te gebruiken om artikels te publiceren, dat lijkt ons toch iets de wenkbrauwen te fronsen. Dit initiatief zou kaderen in het Google News Initiative, een programma dat al van zes jaar geleden dateert. Hierbij stelt Google fondsen ter beschikking voor projecten rond mediageletterdheid, fact-checking tools, en andere bronnen voor redacties.

Volgens Adweek zou het gaan om een handvol kleinere uitgevers. Het project zou het voor hen gemakkelijker maken om content te verzamelen van verschillende bronnen en daar dan een samenvatting van te maken, tot een nieuw artikel te gieten.

Om hoeveel geld het gaat? Volgens Adweek “sommen met vijf cijfers”. In ruil zouden de uitgevers dan minstens 3 artikels per dag moeten publiceren die aldus gegenereerd werden, een wekelijkse nieuwsbrief en een maandelijkse marketingcampagne, et die tools.

Toch nog even dit: de uitgevers die deelnemen aan het programma zouden volgens de voorwaarden niet verplicht worden om te vermelden dat zij AI gebruiken. En de websites waarvan de content verzameld wordt, zouden ook niet verwittigd worden dat zij gebruikt worden om AI-content te laten schrijven door andere sites.
Eerlijk kan je het niet noemen… (Bron: Engadget)

Automattic zou data van WordPress en Tumblr blogs verschaffen aan OpenAI en Midjourney

Enerzijds heb je dus Google, dat uitgevers wil betalen om artikels te laten schrijven door AI. En anderzijds heb je websites, die bestaan dankzij de content die gebruikers op hun hosting zetten, en nu die content gaan verkopen aan AI-bedrijven om zo hun taalmodellen te trainen.

Concreet gaat het om Automattic, het moederbedrijf boven Tumblr en WordPress.com – en voor alle duidelijkheid: dit betreft niet mensen die een blog hebben op een zelf gehoste WordPress-website, want die blijven buiten schot.

Welnu, Automattic zou op het punt staan om een deal te sluiten om de postings op WordPress.com en Tumblr ter beschikking te stellen van OpenAI en Midjourney, zodat die hun taalmodellen daarop kunnen trainen. En dat stuit op verzet.

Niet alleen omdat Automattic zo geld verdient over de ruggen van bloggers en hun content, die niets van dat geld in hun richting zien komen. Maar ook omdat het gevaar bestaat dat ook privépostings in die data zullen zitten. Het is namelijk zo dat Automattic, toen het Tumblr overnam, de content van de jaren 2014 tot 2013 schraapte voor een data dump. Maar per ongeluk ook privépostings in die dump stak.

Automattic biedt wel een opt-out tool aan de bloggers aan, maar het is niet duidelijk of dat data die al gedeeld waren, ook retroactief verwijderd zullen worden.

Het is nu eenmaal zo dat door al die bloggers en websites aangemaakte “menselijke” content het nieuwe goud is voor het trainen van AI-modellen. Voor de bloggers zelf wordt het steeds duidelijker dat hun gegevens, hun data, dat goud zijn. En zij staan machteloos – hun postings worden gebruikt zonder hun toestemming, zonder respect voor hun privacy, en zonder financiële vergoeding. De ontevredenheid over deze gang van zaken neemt dus toe. (Bron: 404Media)

Over de auteur

Verwant

Geef commentaar