Kas yra ReALM?

ReALM reiškia “Nuorodų sprendimas kaip kalbos modeliavimas”, tai novatoriškas sprendimas, sukurtas „Apple“ tyrėjų. Tai naujas kalbos modelis (Didelis kalbos modelis, LLM), kuris traktuoja nuorodų atpažinimo problemą kaip užduotį kalbos modeliavimo srityje.

ReALM efektyviai paverčia įvairių tipų kontekstą į tekstinę reprezentaciją, kurią vėliau apdoroja kaip kalbos užduotį. Tai gali apimti:

  • pokalbiai – tokie kaip tekstiniai pranešimai, balso komandos asistentui ar el. laiškai,
  • elementai ekrane – pavyzdžiui, nuotraukos, kalendorius, oro prognozės widgetas ar programos ir procesai, veikiantys fone.

Kuo ReALM skiriasi nuo kitų nuorodų atpažinimo modelių? Pirmiausia, požiūris – vietoj to, kad remtųsi vaizdų apdorojimu, ReALM veikia teksto srityje. Tai daro jį daug lengvesnį ir efektyvesnį, kas turėtų leisti jam veikti tiesiogiai mobiliuosiuose įrenginiuose, išlaikant vartotojų privatumą.

Kuo ReALM geresnis už GPT-4?

„Apple“ tyrimų komanda palygino ReALM su galingiausiais kalbos modeliais, esančiais rinkoje šiandien – GPT-3.5 ir GPT-4 iš „OpenAI“. Rezultatai buvo įspūdingi. Nuorodų atpažinimo užduotyse mažiausias ReALM variantas pasiekė tikslumą, lygų GPT-4! Didesni ReALM modeliai netgi pranoko GPT-4 atpažindami nuorodas į elementus, rodomus ekrane (http://arxiv.org/abs/2403.20329).

Ką paaiškina šis pranašumas? Pirmiausia, ReALM puikiai veikia su srities specifiniais užklausimais, tokiais kaip tie, kurie susiję su išmaniaisiais namų prietaisais. Tai yra todėl, kad ReALM demonstruoja gilesnį konteksto supratimą, tikslindamas modelį srities specifiniams duomenims.

Be to, skirtingai nuo GPT-4, kuris daugiausia mokosi iš realių objektų vaizdų, ReALM puikiai atpažįsta tekstinius elementus ir programų vartotojo sąsajos komponentus. Ir būtent sąsajos supratimas yra kritiškai svarbus sklandžiam balso asistentų bendravimui su šiandien naudojamomis programomis.

ReALM

Šaltinis: DALL·E 3, užklausa: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Ar tai tikroviškų intelektualių asistentų eros pradžia?

Iš tiesų, ReALM integracija su Siri galėtų atverti visai naują skyrių žmogaus ir kompiuterio sąveikoje. Su ReALM, Siri galės suprasti komandas, kurios apima nuorodas į elementus, rodomus išmaniojo telefono ekrane, taip pat procesus ir programas, veikiančias fone. Bet kada ši galimybė bus prieinama vartotojams? Tai dar nežinoma.

Mes likome su spekuliacijomis, remdamiesi modelio techninėmis galimybėmis. Taigi, kaip galėtų veikti ReALM varoma Siri? Pavyzdžiui, jei naršote verslo sąrašų svetainėje ir matote įmonę, kuria domitės, galėtumėte tiesiog pasakyti Siri: “Paskambinkite šiai įmonei”, o asistentas – naudodamas ReALM konteksto analizei – suras nurodytos įmonės telefono numerį ir inicijuos skambutį. Jums net nereikės tiksliai paaiškinti, kurią įmonę turite omenyje.

A tai tik pradžia ReALM galimybių. Komandos, tokios kaip „Paleisk paskutinę grojaraštį“, leistų intuityviai valdyti multimedijos programas ir išmaniuosius namų prietaisus. ReALM taip pat galėtų leisti Siri suprasti pokalbių kontekstą ir komandų istoriją, kad asistentas reaguotų atitinkamai į ankstesnius vartotojo prašymus. Tai žingsnis link intelektualių agentų, priartinantis mus ne tiek prie dirbtinio intelekto, kuris supranta mūsų užklausas, kiek prie tokio, kuris sugeba vykdyti komandas.

Ir tai tik pradžia, ką ReALM gali padaryti. Komandos, tokios kaip “paleisk paskutinę grojaraštį”, leistų intuityviai valdyti multimedijos programas ir išmaniuosius namų prietaisus. ReALM taip pat galėtų leisti Siri suprasti pokalbių kontekstą ir komandų istoriją, kad asistentas reaguotų atitinkamai į ankstesnius vartotojo prašymus. Tai žingsnis link intelektualių agentų, priartinantis mus ne tiek prie dirbtinio intelekto, kuris supranta mūsų užklausas, kiek prie tokio, kuris sugeba vykdyti komandas.

Deja, „Android“ įrenginių vartotojai turės palaukti. Šiuo metu nėra informacijos apie „Google“ planus pridėti „Gemini“ galimybes prie „Google Assistant“. „Google Gemini“ programa „Android“ įrenginiams buvo sukurta (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), tačiau ji dar nėra prieinama už JAV ribų.

ReALM

Šaltinis: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Santrauka

ReALM yra „Apple“ novatoriškas požiūris į konteksto atpažinimo problemos sprendimą balso asistentams. Vietoj to, kad remtųsi vaizdų apdorojimu, šis kalbos modelis paverčia skirtingus kontekstų tipus į tekstinę reprezentaciją, kurią vėliau apdoroja kalbos užduotyje. Šis požiūris užtikrina ne tik didelį atpažinimo tikslumą, bet ir galimybę veikti mobiliuosiuose įrenginiuose, išlaikant vartotojų privatumą.

Leidimas Siri pasiekti ReALM gali suteikti natūralesnes ir kontekstines balso sąveikas, svarbus žingsnis link tikrų intelektualių asistentų. Su ReALM, Siri galės iš karto reaguoti į komandas, susijusias su ekrano elementais, programomis ir fono procesais. Vienas dalykas yra aiškus – kontekstinio suvokimo gerinimas asistentuose yra raktas į tikrų intelektualių ir natūralių balso sąveikų kūrimą, o ReALM neabejotinai yra svarbus žingsnis šia linkme.

ReALM

Jei jums patinka mūsų turinys, prisijunkite prie mūsų užimtų bičių bendruomenės Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript ekspertas ir instruktorius, kuris moko IT skyrius. Jo pagrindinis tikslas yra padidinti komandos produktyvumą, mokant kitus, kaip efektyviai bendradarbiauti programuojant.

View all posts →

AI in business:

  1. 6 nuostabūs ChatGTP papildiniai, kurie palengvins jūsų gyvenimą
  2. Naujų verslo galimybių naršymas su ChatGPT-4
  3. 3 nuostabūs AI rašytojai, kuriuos privalote išbandyti šiandien
  4. Sintetiniai aktoriai. 3 geriausi AI vaizdo generatoriai
  5. Kokios yra mano verslo idėjos silpnybės? Idėjų generavimo sesija su ChatGPT
  6. Naudojant ChatGPT versle
  7. Naujos paslaugos ir produktai, veikiantys su dirbtiniu intelektu
  8. Automatizuoti socialinių tinklų įrašai
  9. Socialinių tinklų įrašų planavimas. Kaip gali padėti dirbtinis intelektas?
  10. Dirbtinio intelekto vaidmuo verslo sprendimų priėmime
  11. Verslo NLP šiandien ir rytoj
  12. Dirbtinio intelekto pagalba veikiantys tekstiniai pokalbių robotai
  13. Dirbtinio intelekto taikymas versle - apžvalga
  14. Dirbtinio intelekto grėsmės ir galimybės versle (2 dalis)
  15. Dirbtinio intelekto grėsmės ir galimybės versle (1 dalis)
  16. Koks yra dirbtinio intelekto ateitis pagal McKinsey Global Institute?
  17. Dirbtinis intelektas versle - Įvadas
  18. Kas yra NLP, arba natūralios kalbos apdorojimas versle
  19. „Google Translate“ vs „DeepL“. 5 mašininio vertimo taikymo būdai verslui
  20. Automatinis dokumentų apdorojimas
  21. Balsobotų veikla ir verslo programos
  22. Virtualaus asistento technologija, arba kaip kalbėti su dirbtiniu intelektu?
  23. Kas yra verslo intelektas?
  24. Kaip dirbtinis intelektas gali padėti BPM?
  25. Šiandienos ir rytojaus kūrybinė dirbtinė intelektas
  26. Dirbtinis intelektas turinio valdyme
  27. Tyrinėjant dirbtinio intelekto galią muzikos kūrime
  28. 3 naudingi AI grafikos dizaino įrankiai. Generatyvi AI versle
  29. Dirbtinis intelektas ir socialinė žiniasklaida – ką jie sako apie mus?
  30. Ar dirbtinis intelektas pakeis verslo analitikus?
  31. AI įrankiai vadovui
  32. Ateities darbo rinka ir artėjančios profesijos
  33. RPA ir API skaitmeninėje įmonėje
  34. Naujos sąveikos. Kaip dirbtinis intelektas keičia mūsų prietaisų valdymo būdą?
  35. Multimodalinė dirbtinio intelekto technologija ir jos taikymas versle
  36. Dirbtinis intelektas ir aplinka. 3 AI sprendimai, padedantys jums sukurti tvarų verslą
  37. AI turinio detektoriai. Ar jie verti?
  38. ChatGPT vs Bard vs Bing. Kuris AI pokalbių robotas pirmauja lenktynėse?
  39. Ar chatbot AI yra konkurentas „Google“ paieškai?
  40. Efektyvūs ChatGPT užklausimai žmogiškųjų išteklių ir atrankos srityje
  41. Paskatų inžinerija. Ką daro paskatų inžinierius?
  42. Dirbtinis intelektas ir kas dar? Pagrindinės technologijų tendencijos verslui 2024 metais
  43. Dirbtinis intelektas ir verslo etika. Kodėl turėtumėte investuoti į etinius sprendimus
  44. Meta AI. Ką turėtumėte žinoti apie „Facebook“ ir „Instagram“ dirbtinio intelekto palaikomas funkcijas?
  45. Dirbtinio intelekto reguliavimas. Ką turite žinoti kaip verslininkas?
  46. 5 nauji dirbtinio intelekto naudojimo būdai versle
  47. AI produktai ir projektai - kuo jie skiriasi nuo kitų?
  48. Dirbtinis intelektas kaip ekspertas jūsų komandoje
  49. AI komanda vs. vaidmenų pasiskirstymas
  50. Kaip pasirinkti karjeros sritį dirbtiniame intelekte?
  51. Dirbtinis intelektas žmogiškųjų išteklių srityje: Kaip automatizuota atranka veikia žmogiškųjų išteklių valdymą ir komandos vystymąsi
  52. Dirbtinio intelekto pagalba automatizuota procesų valdymas. Nuo ko pradėti?
  53. 6 įdomiausi AI įrankiai 2023 metais
  54. Kokia yra įmonės dirbtinio intelekto brandos analizė?
  55. Dirbtinis intelektas B2B personalizavimui
  56. ChatGPT naudojimo atvejai. 18 pavyzdžių, kaip 2024 metais patobulinti savo verslą su ChatGPT
  57. AI maketų generatorius. 4 geriausi įrankiai
  58. Mikro mokymasis. Greitas būdas įgyti naujų įgūdžių
  59. Įdomiausi dirbtinio intelekto taikymai įmonėse 2024 metais
  60. Kokie iššūkiai kyla dirbtinio intelekto projektui?
  61. Aukščiausios 8 AI priemonės verslui 2024 metais
  62. Dirbtinis intelektas CRM. Ką dirbtinis intelektas keičia CRM įrankiuose?
  63. ES AI įstatymas. Kaip Europa reguliuoja dirbtinio intelekto naudojimą
  64. Top 7 AI svetainių kūrėjai
  65. Be kodo įrankiai ir dirbtinio intelekto inovacijos
  66. Kiek dirbtinio intelekto naudojimas padidina jūsų komandos produktyvumą?
  67. Kaip naudoti ChatGTP rinkos tyrimams?
  68. Kaip išplėsti savo AI rinkodaros kampanijos pasiekiamumą?
  69. Dirbtinis intelektas transporto ir logistikos srityje
  70. Kokias verslo problemas gali išspręsti dirbtinis intelektas?
  71. Kaip pritaikyti dirbtinio intelekto sprendimą verslo problemai?
  72. Dirbtinis intelektas žiniasklaidoje
  73. Dirbtinis intelektas bankininkystėje ir finansuose. Stripe, Monzo ir Grab
  74. Dirbtinis intelektas kelionių pramonėje
  75. Kaip dirbtinis intelektas skatina naujų technologijų atsiradimą
  76. Dirbtinis intelektas elektroninėje prekyboje. Pasaulinių lyderių apžvalga
  77. Top 4 AI vaizdų kūrimo įrankiai
  78. Top 5 AI įrankiai duomenų analizei
  79. Dirbtinio intelekto revoliucija socialiniuose tinkluose
  80. Ar visada verta pridėti dirbtinį intelektą prie produkto kūrimo proceso?
  81. 6 didžiausi verslo nesėkmės atvejai, kuriuos sukėlė dirbtinis intelektas
  82. AI strategija jūsų įmonėje - kaip ją sukurti?
  83. Geriausi AI kursai – 6 nuostabūs rekomendacijos
  84. Socialinių tinklų stebėjimo optimizavimas naudojant dirbtinį intelektą
  85. IoT + AI, arba kaip sumažinti energijos sąnaudas įmonėje
  86. Dirbtinis intelektas logistikoje. 5 geriausi įrankiai
  87. GPT parduotuvė – įdomiausių GPT verslui apžvalga
  88. LLM, GPT, RAG... Ką reiškia dirbtinio intelekto akronimai?
  89. AI robotai – verslo ateitis ar dabartis?
  90. Kokia yra dirbtinio intelekto įgyvendinimo kaina įmonėje?
  91. Ką daro dirbtinio intelekto specialistai?
  92. Kaip dirbtinis intelektas gali padėti laisvai samdomo darbuotojo karjeroje?
  93. Darbo automatizavimas ir produktyvumo didinimas. Gidas dirbantiems laisvai su dirbtiniu intelektu
  94. Dirbtinis intelektas startuoliams – geriausi įrankiai
  95. Svetainės kūrimas su dirbtiniu intelektu
  96. Vienuolika laboratorijų ir kas dar? Perspektyviausi dirbtinio intelekto startuoliai
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Kas yra kas dirbtinio intelekto pasaulyje?
  98. Sintetiniai duomenys ir jų svarba jūsų verslo plėtrai
  99. Populiariausi AI paieškos varikliai. Kur ieškoti AI įrankių?
  100. Vaizdo AI. Naujausi AI vaizdo generatoriai
  101. Dirbtinis intelektas vadovams. Kaip dirbtinis intelektas gali palengvinti jūsų darbą
  102. Kas naujo „Google Gemini“? Viskas, ką reikia žinoti
  103. Dirbtinis intelektas Lenkijoje. Įmonės, susitikimai ir konferencijos
  104. AI kalendorius. Kaip optimizuoti savo laiką įmonėje?
  105. Dirbtinis intelektas ir darbo ateitis. Kaip paruošti savo verslą pokyčiams?
  106. AI balso klonavimas verslui. Kaip sukurti asmeninius balso pranešimus naudojant dirbtinį intelektą?
  107. "Mes visi esame kūrėjai". Kaip piliečių kūrėjai gali padėti jūsų įmonei?
  108. Faktų tikrinimas ir AI haliucinacijos
  109. Dirbtinis intelektas atrankoje – žingsnis po žingsnio rengiant atrankos medžiagą
  110. Sora. Kaip realistiški vaizdo įrašai iš OpenAI pakeis verslą?
  111. Midjourney v6. Inovacijos dirbtinio intelekto vaizdų generavime
  112. Dirbtinis intelektas mažose ir vidutinėse įmonėse. Kaip mažos ir vidutinės įmonės gali konkuruoti su milžinais, naudodamos dirbtinį intelektą?
  113. Kaip dirbtinis intelektas keičia influencerių rinkodarą?
  114. Ar dirbtinis intelektas iš tikrųjų kelia grėsmę programuotojams? Devin ir Microsoft AutoDev
  115. Geriausi AI pokalbių robotai elektroninei prekybai. Platformos
  116. AI pokalbiai robotai e. prekybai. Atvejų analizės
  117. Kaip būti informuotam apie tai, kas vyksta dirbtinio intelekto pasaulyje?
  118. AI prisijaukinimas. Kaip žengti pirmuosius žingsnius taikant AI savo versle?
  119. Suklupimas, Bing Copilot ar You.com? Palyginimas su AI paieškos varikliais
  120. Dirbtinio intelekto ekspertai Lenkijoje
  121. ReALM. Revoliucinis kalbos modelis iš Apple?
  122. „Google Genie“ — generatyvinis dirbtinio intelekto modelis, kuris kuria visiškai interaktyvias pasaulius iš vaizdų
  123. Automatizacija ar papildymas? Du požiūriai į dirbtinį intelektą įmonėje
  124. LLMOps, arba kaip efektyviai valdyti kalbos modelius organizacijoje
  125. AI vaizdo generavimas. Nauji horizontai vaizdo turinio gamyboje verslui
  126. Geriausi AI transkripcijos įrankiai. Kaip paversti ilgas įrašus į glaustus santraukas?
  127. Sentimentų analizė su dirbtiniu intelektu. Kaip tai padeda skatinti pokyčius versle?
  128. Dirbtinio intelekto vaidmuo turinio moderavime