Eksisterer generel kunstig intelligens allerede i dag, uden at vi bemærker det

Ikke science fiction – men en konkret videnskabelig strid

Dette handler ikke om endnu en futuristisk vision fra sci-fi-film. Det drejer sig om en reel faglig uenighed: om nutidens AI-modeller – herunder populære chatbots – allerede opfylder de kriterier, vi selv har fastlagt for intelligens på niveau med mennesker.

En nylig artikel i et anerkendt videnskabeligt tidsskrift vender fuldstændig op og ned på, hvordan vi måler “ægte” maskinintelligens. En forskergruppe fra University of California fremsætter en kontroversiel påstand: generel kunstig intelligens (AGI – artificial general intelligence) er ikke et mål i horisonten, men en afsluttet kendsgerning.

Ifølge forskerne har nutidens systemer baseret på store sprogmodeller (LLM) nået et funktionsniveau, der i praksis opfylder definitionen på generel intelligens. Indtil for nylig omtalte de fleste teknologivirksomheder – fra OpenAI til giganter i Silicon Valley – AGI som den hellige gral. Nogle gav det et årti, andre et til to år.

Den nye publikation stiller spørgsmålet fra en helt anden vinkel: hvad nu hvis vi alle kigger den forkerte vej og ikke opdager, at den tærskel, vi ventede så længe på, allerede er overskredet?

Turings test: gammel målestok, nye resultater

Et af forskergruppens centrale argumenter er Turings test – det klassiske begreb fra 1950. Det forudsætter, at hvis et menneske under en skriftlig samtale ikke kan skelne en maskine fra et andet menneske, kan vi tale om intelligent maskinadfærd.

I den nyeste generation af chatbots – som avancerede modeller af typen ChatGPT og andre udvikledde samtalesystemer – begynder vi at se situationer, hvor folk hyppigere opfatter AI som et menneske end som en reel samtalepartner. For blot nogle år siden ville et sådant resultat have været betragtet som ubestridelig dokumentation for opnåelse af generel maskinintelligens.

I dag hæver vi paradoksalt nok barren stadigt højere. Når systemer begynder at opfylde de tidligere kriterier, forskydes definitionerne, og eksperter kræver nu yderligere egenskaber ved “ægte” intelligens. Denne bevægelse afspejler vores skiftende forhold til teknologi og vores forventninger til maskiner.

Hvor slutter AGI, og hvor begynder superintelligens

Forskerne foreslår en klar sondring mellem generel kunstig intelligens og superintelligens. Det er væsentligt, fordi disse begreber i den offentlige debat ofte blandes sammen. Forfatterne hævder, at vi hvad angår det første punkt allerede er meget tæt på – eller endda over – grænsen.

Nutidens LLM-systemer klarer sig inden for programmering, juridisk analyse, indholdsskabelse, oversættelse og endda matematisk ræsonnement – ofte på specialistniveau. Ifølge denne logik behøver vi ikke vente på, at AI begynder at slå rekorder hos genier på alle felter. For at anerkende generel intelligens er det tilstrækkeligt med et niveau svarende til et gennemsnitligt, veluddannet menneske – med styrker på visse områder og svagheder på andre.

Centrale kendetegn, der adskiller de to begreber:

AGI håndterer et bredt spektrum af opgaver på menneskeniveau
Superintelligens overgår langt menneskelige evner på alle områder
AGI kan have svagheder inden for bestemte domæner
Superintelligens kan løse problemer uden for menneskets rækkevidde
AGI arbejder med data og mønstre fra sin træning
Superintelligens skaber helt nye koncepter og teorier
AGI kræver menneskelig kontrol og validering
Superintelligens ville være autonom i sin beslutningstagning

Forskerne understreger, at forventningen om, at AGI hver uge skal oversvømme videnskaben med gennembrud på niveau med revolutionerende teorier, er urealistisk – det kræver vi heller ikke af de mennesker, vi betragter som intelligente. Det afgørende er funktionel beherskelse af varierede opgaver, ikke excellence på alle områder på én gang.

Den stokastiske papegøje og andre indvendinger mod LLM

Modstandere af nutidens sprogmodeller gentager, at de i bund og grund er “statistiske papegøjer”: systemer uden reel forståelse, der blot sammensætter tekstfragmenter baseret på sandsynlighed. Ifølge dem skaber AI ikke tanker – den klistrer blot sætninger sammen fra træningsdata.

Den nye analyse forsøger systematisk at tilbagevise sådanne indvendinger. Forfatterne peger på flere elementer, der er svære at afvise med argumentet “det er blot gentagelse af data”. Disse inkluderer løsning af nye, tidligere ukendte opgaver inden for matematik og logik, evnen til at overføre viden fra ét område til et andet, opbygning af sammenhængende årsag-virknings-modeller i samtaler samt håndtering af beskrivelser af situationer, der kræver fysisk intuition.

Hvis et system kan udlede den korrekte løsning på et problem, der ikke fandtes i træningsdataene, er det svært at hævde, at det “blot citerer”. Forskere fra University of California dokumenterede tilfælde, hvor modellerne GPT-4 og Claude løste logiske gåder på måder, der afveg fra mønstrene i tilgængelige databaser.

Kræver intelligens en krop og sanser?

En af de mest følelsesladede forsvarsliner lyder: “AI har ingen krop, så det er ikke ægte intelligens.” Mennesker lærer gennem bevægelse, berøring, smerte og sanser. Maskiner opererer primært med tekst, billeder og lyd som datapunkter.

Artiklens forfattere i Nature mener, at fraværet af en fysisk krop ikke udelukker generel intelligens. De påpeger, at nutidens modeller kan forudsige konsekvenser af handlinger, analysere videoscener, fortolke fotografier og lydoptagelser. Hertil kommer det voksende felt kaldet Physical AI – integrationen af avancerede modeller med robotter.

Robotter udstyret med sensorer og kameraer begynder at kombinere LLM’s abstrakte evner med faktisk handling i omgivelserne. Det åbner et rum, hvor maskinen ikke blot beskriver bevægelse, men udfører og løbende korrigerer den. Virksomheder som Boston Dynamics og Tesla tester integrationen af ChatGPT i humanoidrobotter som Optimus.

Forskerne fremhæver, at mennesker, der er blinde fra fødslen, kan udvise høj intelligens uden visuelle indtryk. Analogt hermed ville AI kunne fungere intelligent uden det fulde spektrum af menneskelige sanser. Det afgørende er informationsbehandling og evnen til at løse problemer – ikke den konkrete form for input.

Hukommelse, autonomi, læretid – er det nødvendige betingelser?

En anden indvending mod nutidens systemer lyder: de har hverken vedvarende autobiografisk hukommelse eller reel autonomi. En chatbot afslutter en session og “glemmer” samtalen, fungerer inden for rammer fastsat af mennesker og har ingen kontinuitet i oplevelsen.

Ifølge forskerne er dette ikke obligatoriske betingelser for at anerkende generel intelligens. De påpeger, at langsigtet hukommelse kan tilføjes som et systemlag, at autonomi er et spørgsmål om design og etik – ikke om kognitive evner – og at mængden af data, der kræves til læring, ikke bør være afgørende for intelligensstatussen.

Et menneske lærer at køre bil i løbet af snesevis af timer. AI kan have brug for millioner af eksempler fra simuleringer. Forfatterne understreger, at det er det endelige færdighedsniveau, der tæller – ikke omkostningerne ved at opnå det. Modeller som GPT-4 Turbo råder allerede i dag over et kontekstvindue på op til 128.000 tokens, hvilket sætter dem i stand til at opretholde sammenhæng i lange samtaler.

Hallucinationsproblemet: nutidens modellers alvorligste fejl

Selv de mest begejstrede fortalere for AGI erkender, at nutidens systemer har en alvorlig mangel: tendensen til “hallucinationer”. Det drejer sig om generering af information, der lyder troværdig, men er fuldstændig opdigtet – fra fiktive videnskabelige kilder til ikke-eksisterende lovgivning.

Virksomheder, der udvikler modeller, indrømmer, at andelen af sådanne fejl stadig er mærkbar. OpenAI oplyser, at hallucinationer forbliver et kritisk problem, der kræver løsning. Ifølge interne analyser fra en af de største AI-organisationer kan selv næste generation af modeller have et element, der er i strid med fakta, i hvert tiende svar.

Artiklens forfattere forsøger at dæmpe dette argument ved at påpege, at mennesker også ofte tager fejl, skaber falske erindringer og falder for illusioner. Kritikerne svarer, at omfanget og lethederne af AI’s generering af “selvsikre” nonsens skaber en helt ny risiko – særligt inden for medicin, jura og finans.

Hallucinationer forbliver en af hovedårsagerne til, at mange eksperter endnu ikke vil anerkende, at vi har at gøre med en fuldt funktionel generel maskinintelligens. Så længe systemer ikke pålideligt kan skelne fakta fra fiktion, forbliver deres status som AGI omstridt.

Er problemet vores definition af intelligens?

Forskernes endelige tese rammer selve grundlaget for diskussionen: måske ligger problemet ikke i, at AI er “for svag”, men i at vores forståelse af intelligens er for snæver og stærkt menneskecentreret.

Mennesker har en naturlig tilbøjelighed til at bedømme alt ud fra egne arts optik. Hvis en maskine tænker anderledes, begår andre fejl, lærer på en anden måde – betragter vi den som “ringere”. Forfatterne antyder, at vi falder i en antropocentrismens fælde: vi vil ikke indrømme, at der er ved at opstå en ny form for intelligens, forskellig fra vores, men funktionelt sammenlignelig.

Det forklarer delvist, hvorfor ordet “superintelligens” stadig oftere dukker op i debatten. Forskydningen af opmærksomheden til et endnu fjernere niveau udskyder det øjeblik, hvor vi klart må sige: generel maskinintelligens banker allerede på – eller sidder måske allerede ved bordet ved siden af os.

Forskere fra Stanford University offentliggjorde en undersøgelse, der viser, at vores intelligensstandarter er kulturelt betingede og rettet mod menneskelige evner. Vi har måske brug for en ny ramme til vurdering af ikke-menneskelig intelligens.

Hvad betyder denne debat for den almindelige AI-bruger?

Striden om definitioner er ikke blot en akademisk leg. Det, om vi anerkender nutidens systemer som generel intelligens, har direkte indflydelse på, hvordan vi regulerer dem, hvor meget vi stoler på dem, og hvilke opgaver vi betror dem.

Hvis vi betragter nutidens modeller som AGI, øges presset for indførelse af strengere juridiske rammer og tilsyn med implementeringer, krav om gennemsigtighed vedrørende træningsdata og funktionsmåde, grundigere undersøgelse af AI’s indvirkning på arbejdsmarkedet og politiske beslutninger samt udvikling af faktakontrolsystemer, der “overvåger” chatbots.

Fra brugerens perspektiv bliver en kritisk tilgang afgørende. Selv om AI forstår komplekse problemstillinger og kan rådgive bedre end mange søgemaskiner, kan vi stadig ikke tage dens svar som ufejlbarlige orakler. Effektiv brug af sådanne værktøjer kræver en kombination af deres regnekraft med menneskelig dømmekraft og faglig viden. AGI’s styrke – i den forstand forskerne foreslår – viser sig tydeligst, når menneske og system arbejder sammen.