Salutări și bine te-am găsit la o nouă ediție de Robotache, de data asta cu un format ceva mai lung și mai insightful 🤩
În newsletter-ul de azi vorbim despre lansarea mult așteptată a Operator, noua versiune a Gemini, dar și despre Daily Listen - un podcast personalizat AI.
Sper să-ți placă noul format și, ca de obicei, lasă-mi orice fel de feedback printr-un reply. Le citesc pe toate!
🕓 Timp de citire: 3 minute, 23 secunde
🌐 OpenAI a lansat Operator
După multe luni de hype, în sfârșit avem un agent AI disponibil la scală largă. Mă rog, nu noi, ci americanii, și doar utilizatorii Pro.
Operator ăsta e ceva mai special deoarece e capabil să navigheze singur pe internet și să rezolve task-urile pe care le primește. Poate să facă asta folosind noul model CUA (Computer Using Agent). Adică, practic, e antrenat să folosească computerul ca un om - uitându-se la ecran și folosind mouse-ul și tastatura.
Și n-are nevoie de API, pentru că la fiecare acțiune, CUA face un screenshot prin care identifică elementele pe care le poate „clickui” și ce are de făcut mai departe.
OpenAI a postat, la lansare, un videoclip pe X în care Operator este folosit în timp real. Are 24 de minute și îl poți urmări apăsând aici, dar i-am făcut și eu un mic rezumat:
- task-urile pe care le-a primit Operator sunt: să facă o rezervare la un restaurant, să comande niște alimente dintr-o listă de cumpărături, să cumpere bilete la un meci de baschet, să caute o menajeră și să comande pizza. Ultimele 3 task-uri le-a rezolvat în paralel.
- după ce îi trimiți task-ul, acesta reconfirmă și se apucă de treabă. Din momentul ăla, tu poți vedea în stânga pașii pe care îi urmează și în dreapta website-ul pe care îl accesează.
- Operator poate opri acțiunile atunci când are nevoie de ajutor. Spre exemplu, în video acesta a avut task să facă o rezervare la ora 19:00, însă nu mai erau locuri disponibile la acea oră, așa că s-a oprit și a oferit alte variante de ore.
- înainte să îi trimiți task-ul, vei selecta o aplicație dintr-o listă predefinită (de exemplu - dacă vrei să comanzi mâncare, selectezi DoorDash). Dacă nu selectezi aplicația, Operator va căuta de capu' lui pe Google.
- Momentan e disponibil doar în USA și doar pentru utilizatorii Pro, însă OpenAI are în plan și ca utilizatorii Plus să-l folosească. Also, băieții au mai menționat că au mai mulți agenți pe care vor să-i lanseze în viitorul apropiat.
Amu, dacă suntem sinceri, Operator nu e prea folositor în momentul de față. E super mișto modelul și cum funcționează, dar în stadiul în care e nu prea te ajută să eficientizezi treaba.
Totuși, poate fi și entertaining. Un exemplu bun ar fi acest flăcău de pe X care a folosit Operator ca să achiziționeze și să livreze de pe Facebook Marketplace o bancă pentru împins la piept. E un thread destul de interesant 😂
Sau acest redditor care a încercat cu ajutorul Operator să facă rost de o listă de 50 de influenceri pentru platforma lui.
Cum am spus - not that great, dar suntem pe drumul cel bun.
🌟 Google a lansat Gemini 2.0 Flash Thinking
Google tocmai a lansat un nou model experimental AI gratuit, pe care îl poate încerca oricine.
De ce e mișto?
- are o fereastră de context de 1 milion de tokeni, care îi permite să proceseze de 5 ori mai mult text decât modelele OpenAI
- poți să-i vezi procesul de gândire din spate, adică la ce se gândește înainte să-ți răspundă
- a obținut scoruri record la testele etalon AIME (matematică), GPQA Diamond (științe) și MMMU (raționament multimodal)
Îți recomand să-i dai o șansă să vezi cum e, deoarece răspunsurile sunt destul de diferite față de obișnuitul ChatGPT. În general sunt mai lungi, chiar și atunci când nu ar trebui să fie, dar te poți juca cu el.
Deci, dacă vrei să-l încerci și tu, intră aici.
🎧 Tot Google a lansat Daily Listen
Google încearcă un nou experiment ca să ne mai eficientizeze viața: un fel de podcast personalizat generat de inteligența artificială care te ține la curent cu lucrurile care te interesează.
Funcționează pe baza informațiilor pe care Google le tot adună din interacțiunile tale cu Discover și Search. Deci, e ca și cum ai asculta știrile zilnice într-un podcast de 5 minute.
Pare o funcție destul de folositoare pentru cei care preferă să consume content în format audio. Totuși, din păcate, momentan e doar disponibilă în SUA.
Poți citi aici mai multe despre Daily Listen.
🧠 Interesante
📱 A fost lansată varianta web pentru chatbot-ul Grok, precum și aplicația de telefon (încă nu sunt disponibile la noi)
🎥 Un agent AI specializat în marketing, numit Astral
💬 Cele mai folosite cuvinte de către ChatGPT
📰 Un site de știri creat cu AI care dă note evenimentelor în funcție de relevanță
♟️ Un tip a făcut niște ochelari care îi sugerează mișcările cele mai bune într-un meci de șah
😂 Meme-ul săptămânii
Știi că ai o săptămână bună atunci când ai 2 meme-uri pregătite pentru secțiunea „Meme-ul săptămânii” 😎
- Operatorul are nevoie de ajutor. S-a simțit puțin ca „tati, poți să-mi deschizi borcanul, te rog? 🥺👉👈”
2. DeepSeek, varianta chineză a ChatGPT, a fost pus să aleagă un număr random între 1 și 10.000. Mai jos aveți procesul de gândire din spatele alegerii numărului, care dovedește clar că chatboții ăștia deja au trecut testul Turing 😂
🙏 Share?
Dacă ai ajuns să citești asta, înseamnă că ești cool.
Știi ce fac oamenii cool? Îi ajută și pe ceilalți să fie cool.
Deci, dacă ți-a plăcut newsletter-ul ăsta, ajută-ți prietenii să fie cool și spune-le de Robotache, ca să se aboneze și ei.
Trimite-le link-ul ăsta, dă-le forward la acest email, trimite-le un porumbel mesager. Nici nu contează cum.
Ideea e că, cu cât newsletter-ul crește mai mult, cu atât mă motivează mai tare să creez conținut din ce în ce mai bun.
Momentan suntem la 711 abonați (postez toate numerele pe blogul personal). Hai să vedem la câți ajungem până la newsletter-ul de săptămâna viitoare!
Merci mult și îți urez o sâmbătă minunată în continuare! 😌