Scott Wu iz Cognitiona kaže da agenti za kodiranje umjetne inteligencije ne bi trebali zamijeniti ljude ↗
Scott Wu iz Cognitiona usprotivio se ideji da je Devin izgrađen kako bi u potpunosti zamijenio programere. Pomalo nezgodan stav, s obzirom na to da tvrtka također tvrdi da Devin samostalno piše velik dio vlastitog koda.
Njegovo je formuliranje više "prijatelj za umjetnu inteligenciju koji programira" nego "posao ti je pojeo laptop goblin". Ipak, napetost je teško promašiti - bolji agenti, manje izgovora za napuhane inženjerske timove... ili barem tako glasi argument.
Ovaj AI startup će vam besplatno čistiti dom kako bi obučio buduće robote ↗
Shift nudi besplatno čišćenje doma, s jednom praktičnom i pomalo uznemirujućom kvakom: čistači nose "čarobni šešir" opremljen kamerom kako bi tvrtka mogla prikupljati podatke za obuku robota.
Ponuda je jednostavna - vi dobijete čist stan, oni snimku kućanskih poslova. Možda uredna pogodba.
Shift kaže da zamagljuje osjetljive detalje i anonimizira snimke, ali šire pitanje i dalje stoji kao čarapa ispod kauča: koliko su ljudi spremni žrtvovati privatnosti doma za udobnost?
Anthropic objavljuje Claude Opus 4.8 ↗
Anthropic je predstavio Claude Opus 4.8 s nadogradnjama u kodiranju, agentskim tijekovima rada, zaključivanju i profesionalnom radu. Najveća prednost je pouzdanost - manje nepotvrđenih tvrdnji, bolje korištenje alata i više samoprovjere.
Claude Code također dobiva dinamične tijekove rada, omogućujući modelu planiranje, pokretanje paralelnih podakata, provjeru izlaza i izvještavanje. To zvuči suhoparno dok ne shvatite da je to u osnovi upravljanje projektima u trench mantilu.
Cijene ostaju podijeljene između standardnog i brzog načina rada, pri čemu se Anthropic više oslanja na kontrolu napora kako bi korisnici mogli kompromisno birati između brzine, kvalitete i potrošnje tokena.
Foxconn ima ogromno povjerenje u zamah rasta zahvaljujući umjetnoj inteligenciji, kaže predsjednik ↗
Predsjednik Foxconna rekao je da potražnja za umjetnom inteligencijom mijenja uobičajeni sezonski ritam tvrtke. Stari pad dobavljača sredinom godine? Očito se više ne ponaša normalno.
Razlog su gigantske investicije u umjetnu inteligenciju od strane cloud giganata, što Foxconn vidi kao vlastitu tržišnu priliku. To je hardverska strana AI buma, manje sjajna od chatbotova, ali upravo tamo gdje novac odjekuje.
Foxconn je već glavni proizvođač Nvidia servera, tako da je njegov optimizam u osnovi provjera temperature u utrci za AI infrastrukturu.
Zajednički priručnik za pouzdane evaluacije trećih strana ↗
OpenAI je objavio smjernice o evaluacijama umjetne inteligencije od strane trećih strana, tvrdeći da testovi trebaju jasnije detalje o tome što je evaluirano, kako je testirano i što rezultati mogu dokazati.
Ključna poanta je iznenađujuće praktična: evaluacije granične umjetne inteligencije ne mogu biti samo nagađanja u obliku ljestvice najboljih rezultata. Evaluatori moraju objasniti testirani sustav, upute, zaštitne mjere, provjere valjanosti i gdje tvrdnje prestaju.
To je važno jer kako modeli postaju sve više agentni, plitki testovi mogu učiniti da sustavi izgledaju sigurnije ili jače nego što jesu. Mala količina papirologije, velike posljedice.
Često postavljana pitanja
Jesu li agenti za AI kodiranje poput Devina namijenjeni zamjeni programera?
Scott Wu definira agente za kodiranje umjetne inteligencije kao partnere u kodiranju, a ne kao potpune zamjene za ljudske programere. Međutim, članak ukazuje na napetost: Devin je također opisan kao autor velikog dijela Cognitionovog koda. U praktičnom smislu, zaključak je da ovi alati mogu smanjiti neke rutinske inženjerske poslove, a istovremeno ovisiti o ljudima za prosudbu, smjernice i odgovornost.
Zašto Shift nudi besplatno čišćenje doma za podatke o AI treningu?
Shift nudi besplatno čišćenje doma jer želi podatke o kućanskim poslovima iz fizičkog svijeta kako bi obučio buduće robote. Čistači nose "čarobni šešir" opremljen kamerom dok rade, stvarajući snimke koje mogu pomoći AI sustavima da razumiju kućanske zadatke. Razmjena je jasna: kupci dobivaju čist dom, dok tvrtka dobiva podatke iz privatnih životnih prostora.
Kako Shift postupa s privatnošću prilikom prikupljanja snimaka čišćenja doma?
U članku se navodi da Shift tvrdi da zamagljuje osjetljive detalje i anonimizira snimke. To može smanjiti neke rizike za privatnost, ali ne uklanja širu zabrinutost zbog snimanja unutar domova. Za korisnike je središnje pitanje isplati li se praktičnost besplatnog čišćenja tolikom razinom prikupljanja podataka.
Što je novo u Claude Opusu 4.8?
Claude Opus 4.8 opisan je kao poboljšanje kodiranja, agentskih tijekova rada, zaključivanja i profesionalnog rada. Ažuriranje se usredotočuje na pouzdanost, uključujući manje nepotvrđenih tvrdnji, jače korištenje alata i više samoprovjere. Claude Code također dobiva dinamičke tijekove rada, gdje model može planirati, pokretati paralelne podagente, provjeravati izlaze i izvještavati o rezultatima.
Zašto je Foxconnov optimizam oko procvata umjetne inteligencije važan?
Foxconnovo samopouzdanje je važno jer odražava hardversku stranu procvata umjetne inteligencije. Predsjednik uprave tvrtke rekao je da potražnja za umjetnom inteligencijom mijenja svoj uobičajeni sezonski obrazac, a potrošnja infrastrukturnih projekata divova u oblaku stvara veliku tržišnu priliku. Budući da je Foxconn već glavni proizvođač Nvidia servera, njegovi komentari služe kao snažan signal za potražnju za umjetnom inteligencijom.
Što OpenAI kaže da procjene umjetne inteligencije trećih strana čine pouzdanima?
OpenAI tvrdi da evaluacije umjetne inteligencije trebaju jasnija objašnjenja o tome koji je sustav testiran, kako je testiran i što rezultati stvarno pokazuju. To uključuje detalje o uputama, zaštitnim mjerama, provjerama valjanosti i ograničenjima bilo kakvih tvrdnji. To je posebno važno za agentske modele, gdje plitki testovi mogu učiniti sustave sigurnijima ili sposobnijima nego što jesu.