Google Genie – turinys
Kas yra Google Genie?
Google Genie (https://sites.google.com/view/genie-2024/) yra pagrindinis pasaulio modelis, sukurtas DeepMind. Tai generatyvus AI modelis, apmokytas daugiau nei 30 000 valandų viešai prieinamo 2D platforminių žaidimų vaizdo medžiagos. Jo pagrindinė savybė yra gebėjimas generuoti visiškai interaktyvias, žaidžiamas aplinkas tiesiai iš vienos nuotraukos, nuotraukų ir net ranka pieštų eskizų.

Šaltinis: Genie: Generatyvios interaktyvios aplinkos (https://arxiv.org/abs/2402.15391)
Kaip tai įmanoma? Genie naudoja nesupervizuotą mokymosi techniką, kad įgytų gebėjimą tiksliai valdyti aplinką remiantis tik vaizdo medžiaga. Žmogaus veiksmų žymėjimas nėra būtinas. Naudodamas specialų veiksmų kodavimo modulį, jis fiksuoja subtilius pokyčius tarp nuoseklių vaizdo kadrų ir juos priskiria vidinėms judėjimo reprezentacijoms, tokioms kaip šuolis ar sukimas į kairę. Dinamikos modelis tada generuoja kitą kadrą sekoje remdamasis koduotais veiksmais.
Kaip rezultatas, Genie gali kurti visiškai valdomas, interaktyvias žaidimų aplinkas iš bet kokių vizualinių duomenų. Kiekvienas žaidėjo judesys generuoja naują, unikalų kadrą realiu laiku, sukuriant sklandžią, žaidžiamą sesiją. Tai tikrai didelė inovacija, leidžianti mums kurti visą interaktyvią pasaulį iš vaizdų ar teksto.
Kodėl Genie yra novatoriškas?
Genie inovacija slypi kelių pagrindinių elementų derinyje viename modelyje:
- generatyvūs vaizdo modeliai, tokie kaip Phenaki (https://phenaki.video/), TECO (https://wilson1yan.github.io/teco/) arba maskvit (https://arxiv.org/abs/2206.11894), kurie gali prognozuoti būsimus sekoje esančius kadrus remiantis įvesties kadrais ir tekstu, tačiau nesuteikia aktyvios kontrolės galimybių,
- pasaulio modeliai, kurie orientuojasi į būsimų aplinkos būsenų prognozavimą remiantis agento veiksmais, tačiau reikalauja žmonių pateiktų duomenų,
- nesupervizuotas mokymasis, leidžiantis Genie mokytis tiek aplinkos dinamikos, tiek veiksmų erdvės tik iš žalių vaizdo duomenų, be žmogaus veiksmų etikečių.
Nors kiekviena iš šių sričių buvo tiriama anksčiau, Genie yra pirmasis modelis, kuris jas sujungia, kad išmoktų valdomas aplinkas tiesiai iš vaizdo medžiagos. Šis precedento neturintis požiūris į modelių mokymą be žmogaus priežiūros yra pagrindinė Genie inovacija. Tai atveria duris naudoti didžiulį vaizdo kiekį, prieinamą internete, kaip mokymo šaltinį AI modeliams, ir pašalina kliūtis, susijusias su ribotu etiketėmis pažymėtų duomenų prieinamumu.
Generatyvių vaizdo modelių, pasaulio modelių ir nesupervizuoto mokymosi derinys viename sprendime reiškia esminį pažangą dirbtinio intelekto plėtroje. Genie demonstruoja, kad pažangūs AI sistemos gali mokytis sudėtingų elgsenų ir aplinkų tiesiai iš struktūrizuotų duomenų, be rankinio žymėjimo. Tai yra svarbus žingsnis link tikro dirbtinio bendro intelekto (AGI) pasiekimo.

Šaltinis: Google Genie (https://sites.google.com/view/genie-2024/)
Galimi Google Genie taikymai
Google Genie galimybės toli gražu neapsiriboja vaizdo žaidimų generavimu. Šis novatoriškas AI modelis gali rasti taikymą daugelyje sričių:
- įrankis animatoriams – tiesiog įkelkite vaizdą, eskizą ar trumpą teksto aprašymą, ir Genie sukurs nuoseklią animaciją,
- neribotas mokymo šaltinis AI agentams – su gebėjimu generalizuoti visiškai naujose srityse, Genie siūlo begalinį iššūkių baseiną, kuriame ateities AI sistemos gali mokytis. Įvairovės trūkumas mokymo aplinkose iki šiol buvo viena iš pagrindinių kliūčių kuriant bendrus AI agentus,
- fizinės simuliacijos robotikai – tyrimai parodė, kad Genie sugeba ne tik valdyti virtualius robotus, bet ir realizuoti deformuojamų objektų fizines savybes. Tai gali turėti didžiulį poveikį robotikos ir fizinių simuliacijų plėtrai,
- taikymai kūrybinėse industrijose – Genie gali palengvinti interaktyvių meno instaliacijų, virtualių parodų ar filmų kūrimą. Tiesiog įkelkite eskizą, ir modelis sukurs visiškai valdomą 3D pasaulį, paruoštą tyrinėjimui.
Tačiau šios technologijos galimi iššūkiai ir apribojimai neturėtų būti ignoruojami. Dabartiniame plėtros etape Genie geriausiai veikia siauriose srityse, tokiose kaip 2D platforminiai žaidimai. Išplėtimas į sudėtingesnes 3D aplinkas reikalauja papildomų tyrimų ir optimizavimo. Be to, kyla rizika, kad ši technologija gali būti piktnaudžiaujama kuriant žalingą ar pavojingą turinį. Todėl labai svarbu sukurti tvirtą etinį ir teisinį pagrindą, kuris reguliuotų tokių AI modelių plėtrą ir naudojimą.

Šaltinis: Google Genie (https://sites.google.com/view/genie-2024/)
Santrauka
Leidžiant kurti visiškai interaktyvias aplinkas tiesiai iš vizualinių duomenų, be poreikio rankiniu būdu žymėti veiksmus, Google Genie atstovauja tikram proveržiui generatyviame dirbtiniame intelekte. Šis pagrindinis pasaulio modelis suteikia galimybę išreikšti vaizdus žaidžiamų virtualių realybių forma, kurias gali tyrinėti ir valdyti žmogus ar AI agentas.
Genie potencialas yra milžiniškas – nuo įrankių žaidimų kūrėjams, iki neriboto mokymo duomenų šaltinio AI, iki fizinių simuliacijų robotikai. Tai taip pat svarbus žingsnis link AGI. Kai tokie modeliai kaip Genie toliau vystosi, riba tarp realaus ir virtualaus pasaulio tampa vis labiau skysta.

Jei jums patinka mūsų turinys, prisijunkite prie mūsų užimtų bičių bendruomenės Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Robert Whitney
JavaScript ekspertas ir instruktorius, kuris moko IT skyrius. Jo pagrindinis tikslas yra padidinti komandos produktyvumą, mokant kitus, kaip efektyviai bendradarbiauti programuojant.
AI in business:
- 6 nuostabūs ChatGTP papildiniai, kurie palengvins jūsų gyvenimą
- Naujų verslo galimybių naršymas su ChatGPT-4
- 3 nuostabūs AI rašytojai, kuriuos privalote išbandyti šiandien
- Sintetiniai aktoriai. 3 geriausi AI vaizdo generatoriai
- Kokios yra mano verslo idėjos silpnybės? Idėjų generavimo sesija su ChatGPT
- Naudojant ChatGPT versle
- Naujos paslaugos ir produktai, veikiantys su dirbtiniu intelektu
- Automatizuoti socialinių tinklų įrašai
- Socialinių tinklų įrašų planavimas. Kaip gali padėti dirbtinis intelektas?
- Dirbtinio intelekto vaidmuo verslo sprendimų priėmime
- Verslo NLP šiandien ir rytoj
- Dirbtinio intelekto pagalba veikiantys tekstiniai pokalbių robotai
- Dirbtinio intelekto taikymas versle - apžvalga
- Dirbtinio intelekto grėsmės ir galimybės versle (2 dalis)
- Dirbtinio intelekto grėsmės ir galimybės versle (1 dalis)
- Koks yra dirbtinio intelekto ateitis pagal McKinsey Global Institute?
- Dirbtinis intelektas versle - Įvadas
- Kas yra NLP, arba natūralios kalbos apdorojimas versle
- „Google Translate“ vs „DeepL“. 5 mašininio vertimo taikymo būdai verslui
- Automatinis dokumentų apdorojimas
- Balsobotų veikla ir verslo programos
- Virtualaus asistento technologija, arba kaip kalbėti su dirbtiniu intelektu?
- Kas yra verslo intelektas?
- Kaip dirbtinis intelektas gali padėti BPM?
- Šiandienos ir rytojaus kūrybinė dirbtinė intelektas
- Dirbtinis intelektas turinio valdyme
- Tyrinėjant dirbtinio intelekto galią muzikos kūrime
- 3 naudingi AI grafikos dizaino įrankiai. Generatyvi AI versle
- Dirbtinis intelektas ir socialinė žiniasklaida – ką jie sako apie mus?
- Ar dirbtinis intelektas pakeis verslo analitikus?
- AI įrankiai vadovui
- Ateities darbo rinka ir artėjančios profesijos
- RPA ir API skaitmeninėje įmonėje
- Naujos sąveikos. Kaip dirbtinis intelektas keičia mūsų prietaisų valdymo būdą?
- Multimodalinė dirbtinio intelekto technologija ir jos taikymas versle
- Dirbtinis intelektas ir aplinka. 3 AI sprendimai, padedantys jums sukurti tvarų verslą
- AI turinio detektoriai. Ar jie verti?
- ChatGPT vs Bard vs Bing. Kuris AI pokalbių robotas pirmauja lenktynėse?
- Ar chatbot AI yra konkurentas „Google“ paieškai?
- Efektyvūs ChatGPT užklausimai žmogiškųjų išteklių ir atrankos srityje
- Paskatų inžinerija. Ką daro paskatų inžinierius?
- Dirbtinis intelektas ir kas dar? Pagrindinės technologijų tendencijos verslui 2024 metais
- Dirbtinis intelektas ir verslo etika. Kodėl turėtumėte investuoti į etinius sprendimus
- Meta AI. Ką turėtumėte žinoti apie „Facebook“ ir „Instagram“ dirbtinio intelekto palaikomas funkcijas?
- Dirbtinio intelekto reguliavimas. Ką turite žinoti kaip verslininkas?
- 5 nauji dirbtinio intelekto naudojimo būdai versle
- AI produktai ir projektai - kuo jie skiriasi nuo kitų?
- Dirbtinis intelektas kaip ekspertas jūsų komandoje
- AI komanda vs. vaidmenų pasiskirstymas
- Kaip pasirinkti karjeros sritį dirbtiniame intelekte?
- Dirbtinis intelektas žmogiškųjų išteklių srityje: Kaip automatizuota atranka veikia žmogiškųjų išteklių valdymą ir komandos vystymąsi
- Dirbtinio intelekto pagalba automatizuota procesų valdymas. Nuo ko pradėti?
- 6 įdomiausi AI įrankiai 2023 metais
- Kokia yra įmonės dirbtinio intelekto brandos analizė?
- Dirbtinis intelektas B2B personalizavimui
- ChatGPT naudojimo atvejai. 18 pavyzdžių, kaip 2024 metais patobulinti savo verslą su ChatGPT
- AI maketų generatorius. 4 geriausi įrankiai
- Mikro mokymasis. Greitas būdas įgyti naujų įgūdžių
- Įdomiausi dirbtinio intelekto taikymai įmonėse 2024 metais
- Kokie iššūkiai kyla dirbtinio intelekto projektui?
- Aukščiausios 8 AI priemonės verslui 2024 metais
- Dirbtinis intelektas CRM. Ką dirbtinis intelektas keičia CRM įrankiuose?
- ES AI įstatymas. Kaip Europa reguliuoja dirbtinio intelekto naudojimą
- Top 7 AI svetainių kūrėjai
- Be kodo įrankiai ir dirbtinio intelekto inovacijos
- Kiek dirbtinio intelekto naudojimas padidina jūsų komandos produktyvumą?
- Kaip naudoti ChatGTP rinkos tyrimams?
- Kaip išplėsti savo AI rinkodaros kampanijos pasiekiamumą?
- Dirbtinis intelektas transporto ir logistikos srityje
- Kokias verslo problemas gali išspręsti dirbtinis intelektas?
- Kaip pritaikyti dirbtinio intelekto sprendimą verslo problemai?
- Dirbtinis intelektas žiniasklaidoje
- Dirbtinis intelektas bankininkystėje ir finansuose. Stripe, Monzo ir Grab
- Dirbtinis intelektas kelionių pramonėje
- Kaip dirbtinis intelektas skatina naujų technologijų atsiradimą
- Dirbtinis intelektas elektroninėje prekyboje. Pasaulinių lyderių apžvalga
- Top 4 AI vaizdų kūrimo įrankiai
- Top 5 AI įrankiai duomenų analizei
- Dirbtinio intelekto revoliucija socialiniuose tinkluose
- Ar visada verta pridėti dirbtinį intelektą prie produkto kūrimo proceso?
- 6 didžiausi verslo nesėkmės atvejai, kuriuos sukėlė dirbtinis intelektas
- AI strategija jūsų įmonėje - kaip ją sukurti?
- Geriausi AI kursai – 6 nuostabūs rekomendacijos
- Socialinių tinklų stebėjimo optimizavimas naudojant dirbtinį intelektą
- IoT + AI, arba kaip sumažinti energijos sąnaudas įmonėje
- Dirbtinis intelektas logistikoje. 5 geriausi įrankiai
- GPT parduotuvė – įdomiausių GPT verslui apžvalga
- LLM, GPT, RAG... Ką reiškia dirbtinio intelekto akronimai?
- AI robotai – verslo ateitis ar dabartis?
- Kokia yra dirbtinio intelekto įgyvendinimo kaina įmonėje?
- Ką daro dirbtinio intelekto specialistai?
- Kaip dirbtinis intelektas gali padėti laisvai samdomo darbuotojo karjeroje?
- Darbo automatizavimas ir produktyvumo didinimas. Gidas dirbantiems laisvai su dirbtiniu intelektu
- Dirbtinis intelektas startuoliams – geriausi įrankiai
- Svetainės kūrimas su dirbtiniu intelektu
- Vienuolika laboratorijų ir kas dar? Perspektyviausi dirbtinio intelekto startuoliai
- OpenAI, Midjourney, Anthropic, Hugging Face. Kas yra kas dirbtinio intelekto pasaulyje?
- Sintetiniai duomenys ir jų svarba jūsų verslo plėtrai
- Populiariausi AI paieškos varikliai. Kur ieškoti AI įrankių?
- Vaizdo AI. Naujausi AI vaizdo generatoriai
- Dirbtinis intelektas vadovams. Kaip dirbtinis intelektas gali palengvinti jūsų darbą
- Kas naujo „Google Gemini“? Viskas, ką reikia žinoti
- Dirbtinis intelektas Lenkijoje. Įmonės, susitikimai ir konferencijos
- AI kalendorius. Kaip optimizuoti savo laiką įmonėje?
- Dirbtinis intelektas ir darbo ateitis. Kaip paruošti savo verslą pokyčiams?
- AI balso klonavimas verslui. Kaip sukurti asmeninius balso pranešimus naudojant dirbtinį intelektą?
- "Mes visi esame kūrėjai". Kaip piliečių kūrėjai gali padėti jūsų įmonei?
- Faktų tikrinimas ir AI haliucinacijos
- Dirbtinis intelektas atrankoje – žingsnis po žingsnio rengiant atrankos medžiagą
- Sora. Kaip realistiški vaizdo įrašai iš OpenAI pakeis verslą?
- Midjourney v6. Inovacijos dirbtinio intelekto vaizdų generavime
- Dirbtinis intelektas mažose ir vidutinėse įmonėse. Kaip mažos ir vidutinės įmonės gali konkuruoti su milžinais, naudodamos dirbtinį intelektą?
- Kaip dirbtinis intelektas keičia influencerių rinkodarą?
- Ar dirbtinis intelektas iš tikrųjų kelia grėsmę programuotojams? Devin ir Microsoft AutoDev
- Geriausi AI pokalbių robotai elektroninei prekybai. Platformos
- AI pokalbiai robotai e. prekybai. Atvejų analizės
- Kaip būti informuotam apie tai, kas vyksta dirbtinio intelekto pasaulyje?
- AI prisijaukinimas. Kaip žengti pirmuosius žingsnius taikant AI savo versle?
- Suklupimas, Bing Copilot ar You.com? Palyginimas su AI paieškos varikliais
- Dirbtinio intelekto ekspertai Lenkijoje
- ReALM. Revoliucinis kalbos modelis iš Apple?
- „Google Genie“ — generatyvinis dirbtinio intelekto modelis, kuris kuria visiškai interaktyvias pasaulius iš vaizdų
- Automatizacija ar papildymas? Du požiūriai į dirbtinį intelektą įmonėje
- LLMOps, arba kaip efektyviai valdyti kalbos modelius organizacijoje
- AI vaizdo generavimas. Nauji horizontai vaizdo turinio gamyboje verslui
- Geriausi AI transkripcijos įrankiai. Kaip paversti ilgas įrašus į glaustus santraukas?
- Sentimentų analizė su dirbtiniu intelektu. Kaip tai padeda skatinti pokyčius versle?
- Dirbtinio intelekto vaidmuo turinio moderavime