De tre store AI-firmaer planlægger alle en snarlig lancering af AI-agenter, der kan klikke rundt på skærmen på dine vegne. Du kan prøve Anthropics nu.
Tilbage i januar var en af de mest fascinerende produkter, der kom ud i forbindelse med CES den lille, orange R1 fra firmaet Rabbit. R1 er AI-hardware, altså et slags interface, der bygger bro mellem en AI i skyen og den fysiske verden, du går rundt i. Det tillokkende løfte, som blev givet ved lanceringen var, at kaninen i den lille orange blok ville virke som AI-agent for dig.
Helt præcist skulle den kunne udføre en række opgaver, der ikke behøver være rigidt forprogrammeret (som i en macro), men som kan tilpasses forholdene. Dette skulle især kunne ske online, hvor den lille kanin-agent skulle kunne bestille varer og mad til levering, fjernstyre Spotify og andre streamingtjenester, med mere.
Dette skulle alt sammen kunne ske ved at Rabbits AI i skyen f.eks. logger ind på din foretrukne madleverandørs hjemmeside og lægger en bestilling ind akkurat, som du selv ville gøre det. Det har taget Rabbit noget længere end forventet at få det til at spille med websites, folk rent faktisk brugere, og mange R1’er ligger derfor og samler støv (inklusive på undertegnede skribents skrivebord).
Men nu kan det være, at Rabbit når at blive overhalet indenom af de tre store AI-firmaer, Google, Anthropic, og OpenAI. Sidstnævntes nyligt lancerede o1-model er første skridt i retning af egentlige AI-agenter, som firmaet forventer at sende på banen til næste år. Det sagde OpenAIs CEO, Sam Altman, i begyndelsen af oktober ved en udviklerkonference.
Claude overtager computeren
OpenAI har åbnet, hvad de kalder ”Assistants” for udviklerne, en slags platform, hvor folk kan udvikle ”assistenter”, der i den nuværende beta-periode har et begrænset antal handlemuligheder. Der lægges dog ikke skjul på, at det er disse assistenter, der på et tidspunkt skal blive til mere handledygtige agenter, der også kan tage beslutninger på dine vegne.
OpenAIs konkurrent, Anthropic (dem med ChatGPT-rivalen Claude), er en smule længere frem på agentfronten. For nogle dage siden annoncerede de en ny funktion til Claude, der kalder for ”Computer Use”. Som navnet antyder, kan Claude nu overtage mus og tastatur på din computer og f.eks. udfylde formularer på websider, som det demonstreres i videoen herunder.
We've built an API that allows Claude to perceive and interact with computer interfaces.
This API enables Claude to translate prompts into computer commands. Developers can use it to automate repetitive tasks, conduct testing and QA, and perform open-ended research. pic.twitter.com/eK0UCGEozm
— Anthropic (@AnthropicAI) October 22, 2024
Det giver naturligvis mulighed for automatisering af en række opgaver og har potentiale for både produktivitetsforøgelse og tidsbesparelse (og formentlig en ny type hackerangreb, vi endnu ikke har oplevet). Anthropic understreger, at der stadig er tale om et eksperiment, og at der kan forekomme fejl, så man skal være forsigtig med funktionen. Men den altså prøves af nu.
For nærmest at lukke oktober måned med at slutte ringen, rapporterer The Information nu, at den sidste af de tre store AI-firmaer, Google, også har et stort agent-projekt undervejs. Firmaet demonstrerede sin første, tidlige AI-agent helt tilbage i 2018 med Google Duplex, der kunne ringe op til frisører og restauranter på vegne af brugeren.
J.A.R.V.I.S. bliver til virkelighed (igen)
Men nu skriver The Information, at Google er i gang med at teste, hvad de kalder ”Project Jarvis”, som naturligvis er opkaldt efter Iron Man/Tony Starks kunstigt intelligente hjælper i Marvels Cinematiske Univers (Mark Zuckerberg gjorde det for nogle år tilbage til sit årlige, personlige projekt at bygge en AI ind i sit hus, der også blev kaldt Jarvis).
Ifølge The Information er det planen at Project Jarvis f.eks. skal kunne ”indsamle informationer og researche emner, købe varer, eller booke en flyrejse” ved at interagere med websites. Det virker kun med Googles egen Chrome-browser for nuværende, og lige nu er der ”få sekunder mellem hver handling” ifølge de kilder, The Information har talt med.
Når Google får skruet op for Project Jarvis’ tempo, skulle den altså (ligesom Claude, R1 og OpenAIs assistenter) kunne ”automatisere daglige hverdagsopgaver, der sker på nettet”. I Project Jarvis’ tilfælde sker det naturligvis via en kommende udgave af Googles Gemini-model og dennes evne til at fortolke billeder.
Agenten skulle, ligesom Claude også gør det, arbejde med screenshots, der giver den de informationer, den skal bruge, før den skrider til handling. Denne nyhedshistorie er både skrevet og blevet lagt op på Rec.dk af et menneske, men ved denne tid næste år har vi måske sat en AI til at gøre den sidste, kedelige del af arbejdet…