Kas yra Google Genie?

Google Genie (https://sites.google.com/view/genie-2024/) yra pagrindinis pasaulio modelis, sukurtas DeepMind. Tai generatyvus AI modelis, apmokytas daugiau nei 30 000 valandų viešai prieinamo 2D platforminių žaidimų vaizdo medžiagos. Jo pagrindinė savybė yra gebėjimas generuoti visiškai interaktyvias, žaidžiamas aplinkas tiesiai iš vienos nuotraukos, nuotraukų ir net ranka pieštų eskizų.

Google Genie

Šaltinis: Genie: Generatyvios interaktyvios aplinkos (https://arxiv.org/abs/2402.15391)

Kaip tai įmanoma? Genie naudoja nesupervizuotą mokymosi techniką, kad įgytų gebėjimą tiksliai valdyti aplinką remiantis tik vaizdo medžiaga. Žmogaus veiksmų žymėjimas nėra būtinas. Naudodamas specialų veiksmų kodavimo modulį, jis fiksuoja subtilius pokyčius tarp nuoseklių vaizdo kadrų ir juos priskiria vidinėms judėjimo reprezentacijoms, tokioms kaip šuolis ar sukimas į kairę. Dinamikos modelis tada generuoja kitą kadrą sekoje remdamasis koduotais veiksmais.

Kaip rezultatas, Genie gali kurti visiškai valdomas, interaktyvias žaidimų aplinkas iš bet kokių vizualinių duomenų. Kiekvienas žaidėjo judesys generuoja naują, unikalų kadrą realiu laiku, sukuriant sklandžią, žaidžiamą sesiją. Tai tikrai didelė inovacija, leidžianti mums kurti visą interaktyvią pasaulį iš vaizdų ar teksto.

Kodėl Genie yra novatoriškas?

Genie inovacija slypi kelių pagrindinių elementų derinyje viename modelyje:

  • generatyvūs vaizdo modeliai, tokie kaip Phenaki (https://phenaki.video/), TECO (https://wilson1yan.github.io/teco/) arba maskvit (https://arxiv.org/abs/2206.11894), kurie gali prognozuoti būsimus sekoje esančius kadrus remiantis įvesties kadrais ir tekstu, tačiau nesuteikia aktyvios kontrolės galimybių,
  • pasaulio modeliai, kurie orientuojasi į būsimų aplinkos būsenų prognozavimą remiantis agento veiksmais, tačiau reikalauja žmonių pateiktų duomenų,
  • nesupervizuotas mokymasis, leidžiantis Genie mokytis tiek aplinkos dinamikos, tiek veiksmų erdvės tik iš žalių vaizdo duomenų, be žmogaus veiksmų etikečių.

Nors kiekviena iš šių sričių buvo tiriama anksčiau, Genie yra pirmasis modelis, kuris jas sujungia, kad išmoktų valdomas aplinkas tiesiai iš vaizdo medžiagos. Šis precedento neturintis požiūris į modelių mokymą be žmogaus priežiūros yra pagrindinė Genie inovacija. Tai atveria duris naudoti didžiulį vaizdo kiekį, prieinamą internete, kaip mokymo šaltinį AI modeliams, ir pašalina kliūtis, susijusias su ribotu etiketėmis pažymėtų duomenų prieinamumu.

Generatyvių vaizdo modelių, pasaulio modelių ir nesupervizuoto mokymosi derinys viename sprendime reiškia esminį pažangą dirbtinio intelekto plėtroje. Genie demonstruoja, kad pažangūs AI sistemos gali mokytis sudėtingų elgsenų ir aplinkų tiesiai iš struktūrizuotų duomenų, be rankinio žymėjimo. Tai yra svarbus žingsnis link tikro dirbtinio bendro intelekto (AGI) pasiekimo.

Google Genie

Šaltinis: Google Genie (https://sites.google.com/view/genie-2024/)

Galimi Google Genie taikymai

Google Genie galimybės toli gražu neapsiriboja vaizdo žaidimų generavimu. Šis novatoriškas AI modelis gali rasti taikymą daugelyje sričių:

  • įrankis animatoriams – tiesiog įkelkite vaizdą, eskizą ar trumpą teksto aprašymą, ir Genie sukurs nuoseklią animaciją,
  • neribotas mokymo šaltinis AI agentams – su gebėjimu generalizuoti visiškai naujose srityse, Genie siūlo begalinį iššūkių baseiną, kuriame ateities AI sistemos gali mokytis. Įvairovės trūkumas mokymo aplinkose iki šiol buvo viena iš pagrindinių kliūčių kuriant bendrus AI agentus,
  • fizinės simuliacijos robotikai – tyrimai parodė, kad Genie sugeba ne tik valdyti virtualius robotus, bet ir realizuoti deformuojamų objektų fizines savybes. Tai gali turėti didžiulį poveikį robotikos ir fizinių simuliacijų plėtrai,
  • taikymai kūrybinėse industrijose – Genie gali palengvinti interaktyvių meno instaliacijų, virtualių parodų ar filmų kūrimą. Tiesiog įkelkite eskizą, ir modelis sukurs visiškai valdomą 3D pasaulį, paruoštą tyrinėjimui.

Tačiau šios technologijos galimi iššūkiai ir apribojimai neturėtų būti ignoruojami. Dabartiniame plėtros etape Genie geriausiai veikia siauriose srityse, tokiose kaip 2D platforminiai žaidimai. Išplėtimas į sudėtingesnes 3D aplinkas reikalauja papildomų tyrimų ir optimizavimo. Be to, kyla rizika, kad ši technologija gali būti piktnaudžiaujama kuriant žalingą ar pavojingą turinį. Todėl labai svarbu sukurti tvirtą etinį ir teisinį pagrindą, kuris reguliuotų tokių AI modelių plėtrą ir naudojimą.

Google Genie

Šaltinis: Google Genie (https://sites.google.com/view/genie-2024/)

Santrauka

Leidžiant kurti visiškai interaktyvias aplinkas tiesiai iš vizualinių duomenų, be poreikio rankiniu būdu žymėti veiksmus, Google Genie atstovauja tikram proveržiui generatyviame dirbtiniame intelekte. Šis pagrindinis pasaulio modelis suteikia galimybę išreikšti vaizdus žaidžiamų virtualių realybių forma, kurias gali tyrinėti ir valdyti žmogus ar AI agentas.

Genie potencialas yra milžiniškas – nuo įrankių žaidimų kūrėjams, iki neriboto mokymo duomenų šaltinio AI, iki fizinių simuliacijų robotikai. Tai taip pat svarbus žingsnis link AGI. Kai tokie modeliai kaip Genie toliau vystosi, riba tarp realaus ir virtualaus pasaulio tampa vis labiau skysta.

Google Genie

Jei jums patinka mūsų turinys, prisijunkite prie mūsų užimtų bičių bendruomenės Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript ekspertas ir instruktorius, kuris moko IT skyrius. Jo pagrindinis tikslas yra padidinti komandos produktyvumą, mokant kitus, kaip efektyviai bendradarbiauti programuojant.

View all posts →

AI in business:

  1. 6 nuostabūs ChatGTP papildiniai, kurie palengvins jūsų gyvenimą
  2. Naujų verslo galimybių naršymas su ChatGPT-4
  3. 3 nuostabūs AI rašytojai, kuriuos privalote išbandyti šiandien
  4. Sintetiniai aktoriai. 3 geriausi AI vaizdo generatoriai
  5. Kokios yra mano verslo idėjos silpnybės? Idėjų generavimo sesija su ChatGPT
  6. Naudojant ChatGPT versle
  7. Naujos paslaugos ir produktai, veikiantys su dirbtiniu intelektu
  8. Automatizuoti socialinių tinklų įrašai
  9. Socialinių tinklų įrašų planavimas. Kaip gali padėti dirbtinis intelektas?
  10. Dirbtinio intelekto vaidmuo verslo sprendimų priėmime
  11. Verslo NLP šiandien ir rytoj
  12. Dirbtinio intelekto pagalba veikiantys tekstiniai pokalbių robotai
  13. Dirbtinio intelekto taikymas versle - apžvalga
  14. Dirbtinio intelekto grėsmės ir galimybės versle (2 dalis)
  15. Dirbtinio intelekto grėsmės ir galimybės versle (1 dalis)
  16. Koks yra dirbtinio intelekto ateitis pagal McKinsey Global Institute?
  17. Dirbtinis intelektas versle - Įvadas
  18. Kas yra NLP, arba natūralios kalbos apdorojimas versle
  19. „Google Translate“ vs „DeepL“. 5 mašininio vertimo taikymo būdai verslui
  20. Automatinis dokumentų apdorojimas
  21. Balsobotų veikla ir verslo programos
  22. Virtualaus asistento technologija, arba kaip kalbėti su dirbtiniu intelektu?
  23. Kas yra verslo intelektas?
  24. Kaip dirbtinis intelektas gali padėti BPM?
  25. Šiandienos ir rytojaus kūrybinė dirbtinė intelektas
  26. Dirbtinis intelektas turinio valdyme
  27. Tyrinėjant dirbtinio intelekto galią muzikos kūrime
  28. 3 naudingi AI grafikos dizaino įrankiai. Generatyvi AI versle
  29. Dirbtinis intelektas ir socialinė žiniasklaida – ką jie sako apie mus?
  30. Ar dirbtinis intelektas pakeis verslo analitikus?
  31. AI įrankiai vadovui
  32. Ateities darbo rinka ir artėjančios profesijos
  33. RPA ir API skaitmeninėje įmonėje
  34. Naujos sąveikos. Kaip dirbtinis intelektas keičia mūsų prietaisų valdymo būdą?
  35. Multimodalinė dirbtinio intelekto technologija ir jos taikymas versle
  36. Dirbtinis intelektas ir aplinka. 3 AI sprendimai, padedantys jums sukurti tvarų verslą
  37. AI turinio detektoriai. Ar jie verti?
  38. ChatGPT vs Bard vs Bing. Kuris AI pokalbių robotas pirmauja lenktynėse?
  39. Ar chatbot AI yra konkurentas „Google“ paieškai?
  40. Efektyvūs ChatGPT užklausimai žmogiškųjų išteklių ir atrankos srityje
  41. Paskatų inžinerija. Ką daro paskatų inžinierius?
  42. Dirbtinis intelektas ir kas dar? Pagrindinės technologijų tendencijos verslui 2024 metais
  43. Dirbtinis intelektas ir verslo etika. Kodėl turėtumėte investuoti į etinius sprendimus
  44. Meta AI. Ką turėtumėte žinoti apie „Facebook“ ir „Instagram“ dirbtinio intelekto palaikomas funkcijas?
  45. Dirbtinio intelekto reguliavimas. Ką turite žinoti kaip verslininkas?
  46. 5 nauji dirbtinio intelekto naudojimo būdai versle
  47. AI produktai ir projektai - kuo jie skiriasi nuo kitų?
  48. Dirbtinis intelektas kaip ekspertas jūsų komandoje
  49. AI komanda vs. vaidmenų pasiskirstymas
  50. Kaip pasirinkti karjeros sritį dirbtiniame intelekte?
  51. Dirbtinis intelektas žmogiškųjų išteklių srityje: Kaip automatizuota atranka veikia žmogiškųjų išteklių valdymą ir komandos vystymąsi
  52. Dirbtinio intelekto pagalba automatizuota procesų valdymas. Nuo ko pradėti?
  53. 6 įdomiausi AI įrankiai 2023 metais
  54. Kokia yra įmonės dirbtinio intelekto brandos analizė?
  55. Dirbtinis intelektas B2B personalizavimui
  56. ChatGPT naudojimo atvejai. 18 pavyzdžių, kaip 2024 metais patobulinti savo verslą su ChatGPT
  57. AI maketų generatorius. 4 geriausi įrankiai
  58. Mikro mokymasis. Greitas būdas įgyti naujų įgūdžių
  59. Įdomiausi dirbtinio intelekto taikymai įmonėse 2024 metais
  60. Kokie iššūkiai kyla dirbtinio intelekto projektui?
  61. Aukščiausios 8 AI priemonės verslui 2024 metais
  62. Dirbtinis intelektas CRM. Ką dirbtinis intelektas keičia CRM įrankiuose?
  63. ES AI įstatymas. Kaip Europa reguliuoja dirbtinio intelekto naudojimą
  64. Top 7 AI svetainių kūrėjai
  65. Be kodo įrankiai ir dirbtinio intelekto inovacijos
  66. Kiek dirbtinio intelekto naudojimas padidina jūsų komandos produktyvumą?
  67. Kaip naudoti ChatGTP rinkos tyrimams?
  68. Kaip išplėsti savo AI rinkodaros kampanijos pasiekiamumą?
  69. Dirbtinis intelektas transporto ir logistikos srityje
  70. Kokias verslo problemas gali išspręsti dirbtinis intelektas?
  71. Kaip pritaikyti dirbtinio intelekto sprendimą verslo problemai?
  72. Dirbtinis intelektas žiniasklaidoje
  73. Dirbtinis intelektas bankininkystėje ir finansuose. Stripe, Monzo ir Grab
  74. Dirbtinis intelektas kelionių pramonėje
  75. Kaip dirbtinis intelektas skatina naujų technologijų atsiradimą
  76. Dirbtinis intelektas elektroninėje prekyboje. Pasaulinių lyderių apžvalga
  77. Top 4 AI vaizdų kūrimo įrankiai
  78. Top 5 AI įrankiai duomenų analizei
  79. Dirbtinio intelekto revoliucija socialiniuose tinkluose
  80. Ar visada verta pridėti dirbtinį intelektą prie produkto kūrimo proceso?
  81. 6 didžiausi verslo nesėkmės atvejai, kuriuos sukėlė dirbtinis intelektas
  82. AI strategija jūsų įmonėje - kaip ją sukurti?
  83. Geriausi AI kursai – 6 nuostabūs rekomendacijos
  84. Socialinių tinklų stebėjimo optimizavimas naudojant dirbtinį intelektą
  85. IoT + AI, arba kaip sumažinti energijos sąnaudas įmonėje
  86. Dirbtinis intelektas logistikoje. 5 geriausi įrankiai
  87. GPT parduotuvė – įdomiausių GPT verslui apžvalga
  88. LLM, GPT, RAG... Ką reiškia dirbtinio intelekto akronimai?
  89. AI robotai – verslo ateitis ar dabartis?
  90. Kokia yra dirbtinio intelekto įgyvendinimo kaina įmonėje?
  91. Ką daro dirbtinio intelekto specialistai?
  92. Kaip dirbtinis intelektas gali padėti laisvai samdomo darbuotojo karjeroje?
  93. Darbo automatizavimas ir produktyvumo didinimas. Gidas dirbantiems laisvai su dirbtiniu intelektu
  94. Dirbtinis intelektas startuoliams – geriausi įrankiai
  95. Svetainės kūrimas su dirbtiniu intelektu
  96. Vienuolika laboratorijų ir kas dar? Perspektyviausi dirbtinio intelekto startuoliai
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Kas yra kas dirbtinio intelekto pasaulyje?
  98. Sintetiniai duomenys ir jų svarba jūsų verslo plėtrai
  99. Populiariausi AI paieškos varikliai. Kur ieškoti AI įrankių?
  100. Vaizdo AI. Naujausi AI vaizdo generatoriai
  101. Dirbtinis intelektas vadovams. Kaip dirbtinis intelektas gali palengvinti jūsų darbą
  102. Kas naujo „Google Gemini“? Viskas, ką reikia žinoti
  103. Dirbtinis intelektas Lenkijoje. Įmonės, susitikimai ir konferencijos
  104. AI kalendorius. Kaip optimizuoti savo laiką įmonėje?
  105. Dirbtinis intelektas ir darbo ateitis. Kaip paruošti savo verslą pokyčiams?
  106. AI balso klonavimas verslui. Kaip sukurti asmeninius balso pranešimus naudojant dirbtinį intelektą?
  107. "Mes visi esame kūrėjai". Kaip piliečių kūrėjai gali padėti jūsų įmonei?
  108. Faktų tikrinimas ir AI haliucinacijos
  109. Dirbtinis intelektas atrankoje – žingsnis po žingsnio rengiant atrankos medžiagą
  110. Sora. Kaip realistiški vaizdo įrašai iš OpenAI pakeis verslą?
  111. Midjourney v6. Inovacijos dirbtinio intelekto vaizdų generavime
  112. Dirbtinis intelektas mažose ir vidutinėse įmonėse. Kaip mažos ir vidutinės įmonės gali konkuruoti su milžinais, naudodamos dirbtinį intelektą?
  113. Kaip dirbtinis intelektas keičia influencerių rinkodarą?
  114. Ar dirbtinis intelektas iš tikrųjų kelia grėsmę programuotojams? Devin ir Microsoft AutoDev
  115. Geriausi AI pokalbių robotai elektroninei prekybai. Platformos
  116. AI pokalbiai robotai e. prekybai. Atvejų analizės
  117. Kaip būti informuotam apie tai, kas vyksta dirbtinio intelekto pasaulyje?
  118. AI prisijaukinimas. Kaip žengti pirmuosius žingsnius taikant AI savo versle?
  119. Suklupimas, Bing Copilot ar You.com? Palyginimas su AI paieškos varikliais
  120. Dirbtinio intelekto ekspertai Lenkijoje
  121. ReALM. Revoliucinis kalbos modelis iš Apple?
  122. „Google Genie“ — generatyvinis dirbtinio intelekto modelis, kuris kuria visiškai interaktyvias pasaulius iš vaizdų
  123. Automatizacija ar papildymas? Du požiūriai į dirbtinį intelektą įmonėje
  124. LLMOps, arba kaip efektyviai valdyti kalbos modelius organizacijoje
  125. AI vaizdo generavimas. Nauji horizontai vaizdo turinio gamyboje verslui
  126. Geriausi AI transkripcijos įrankiai. Kaip paversti ilgas įrašus į glaustus santraukas?
  127. Sentimentų analizė su dirbtiniu intelektu. Kaip tai padeda skatinti pokyčius versle?
  128. Dirbtinio intelekto vaidmuo turinio moderavime