Forside * Nyheder

OpenAIs nyeste AI-model er mere eftertænksom

-
(Foto: OpenAI/Jean-Pierre Dalbéra/CC BY 2.0)

Firmaet bag ChatGPT bevæger sig væk fra GPT-princippet med en ny og mere avanceret model, der er trænet til at tænke sig om, før den giver et svar.

Når vi mennesker laver en fejl, siger vi tit ”der var jeg vist lige lidt for hurtig”. Især, hvis vi rent faktisk har draget en konklusion eller har sagt noget, før vi har tænkt os tilstrækkeligt om. Men det er ikke kun os kødmaskiner, der ofte er under pres for at svare hurtigt og derfor laver fejl. Sådan er det også med AI’er.

De AI-chatbots, der så småt er ved at blive integreret i vores dagligdag, er netop lavet til hurtigt at automatisere en række computerprocesser baseret på forespørgsler i naturligt menneskesprog, og at levere et svar i samme sproglige form. Fordi det skal gå stærkt, og fordi fokus er på et godt sprog, ryger det faktuelle sig ofte en tur – og dermed også den praktiske anvendelighed.

Annonce:

Det er det sidste problem, OpenAI nu prøver at gøre noget ved. Selskabet, der lige nu fører i AI-kapløbet, når man måler på antallet af brugere, har annonceret sin nyeste model, o1. Her skal man lægge mærke til, at model-navnet ikke ligesom tidligere hedder noget med ”GPT”, sådan som f.eks. den nuværende model, GPT-4o.

GPT står for ”Generative Pre-trained Transformer” og det navn passer i lidt mindre grad til måden, den nye model fungerer på. Der er naturligvis stadig tale om maskinlærings-modeller, der er blevet trænet til at generere mere end klassificere (som ældre modeller gør), men det er måden o1 er trænet på, der gør en forskel.

Trænet til at tænke, ikke til at skrive

Som OpenAI beskriver det, er o1 i højere grad trænet til at ”tænke” i stedet for at fokusere på hurtigt at finde det mest sandsynlige af en række mulige svar, som brugeren gerne vil have. Modellen er derfor mindre ”færdigbagt”, når den kommer i brug, men bliver ligesom et menneskebarn bedre til sine opgaver gennem interaktion med den virkelige verden.

OpenAI skriver, at o1 yder bedre, jo mere reinforcement learning, den gennemgår. Det sidste er en af flere måder, maskinlæring foregår på. Reinforcement learning-princippet er baseret på B.F. Skinners adfærdspsykologi. Princippet er kendt fra de såkaldte ”Skinner boxes”, hvor en rotte ved at presse et håndtag ned kunne få en madpille rullet ind i boksen.

ChatGPT Plus-brugere kan nu prøve to versioner af o1 af (Foto: OpenAI)

Dette skete som regel første gang, når rotten kom til at aktivere mekanismen ved et uheld. Efterhånden lærte rotten dog, at det var håndtaget, der aktiverede maden, og dermed havde den gennemgået en indlæringsproces motiveret af belønning og forstærkning af en bestemt adfærd.

Reinforcement learning i maskinlæring foregår på samme måde, hvor modellen ”belønnes”, når den rammer rigtigt. Hvor OpenAIs GPT-modeller netop er ”Pre-trained”, lærer o1 altså i højere grad stadig, når den kommer i brug. Og derfor hedder den ikke noget med ”GPT”.

Tilgængelig nu

Det er også af denne grund, at o1 fungerer efter et princip, hvor den foretager en række ræsonnementer, som brugeren ikke kan se til at starte med. OpenAI kalder disse for ”hidden chains of thoughts”, altså skjulte tankerækker.

Idéen er, at o1 ligesom mennesker leverer bedre resultater ved komplicerede udfordringer, hvis den får lov at tænke sig om i fred. Og jo mere, den får lov til at gøre det sidste, jo bedre bliver den, skriver OpenAI. Det har også den fordel, at man senere kan gå tilbage og kigge i den (tidligere skjulte) tankerække for at se, hvad der fik o1 til at drage en bestemt konklusion. Men det tager altså noget længere tid, så o1 er langsommere end f.eks. GPT-4o.

Her kan du se, hvordan o1 på kort tid kan kode et lille spil.

Af samme grund er o1 ikke lige nu et godt alternativ til GPT-4o, hvis du skal have hjælp til at formulere en tekst eller gerne vil AI-generere et billede. For sådanne opgaver anbefaler OpenAI at man holder fast i tidligere modeller. Hvor o1 har en fordel Fordelene ved o1 er blandt andre matematiske og logiske opgaver og svar på komplekse spørgsmål.

OpenAIs tests viser således, at den er bedre til at skrive kode end tidligere modeller, og det er her, o1 forventes at kunne gøre en forskel på den korte bane. Løfterne om store produktivitetsfordele, som AI-baseret kodeproduktion skulle give, er endnu ikke blevet indfriet med de nuværende modeller. Men det kan o1 altså muligvis lave om på.

ChatGPT Plus-brugere kan allerede nu lege med o1 ved at vælge ”o1-preview” eller den lidt hurtigere ”o1-mini” som model i chatbotten. Disse er dog begrænset til hhv. 30 og 50 forespørgsler. OpenAI siger også, at de planlægger at rulle ”o1-mini” ud til gratisbrugere af ChatGPT på et tidspunkt.

Annonce:
Her på recordere.dk elsker vi en god dialog. Blot det holdes i en pæn tone, uden personhetz og indenfor emnet. Tak fordi du bidrager positivt. Kommentarer modereres.