ReALM – turinys
Kas yra ReALM?
ReALM reiškia “Nuorodų sprendimas kaip kalbos modeliavimas”, tai novatoriškas sprendimas, sukurtas „Apple“ tyrėjų. Tai naujas kalbos modelis (Didelis kalbos modelis, LLM), kuris traktuoja nuorodų atpažinimo problemą kaip užduotį kalbos modeliavimo srityje.
ReALM efektyviai paverčia įvairių tipų kontekstą į tekstinę reprezentaciją, kurią vėliau apdoroja kaip kalbos užduotį. Tai gali apimti:
- pokalbiai – tokie kaip tekstiniai pranešimai, balso komandos asistentui ar el. laiškai,
- elementai ekrane – pavyzdžiui, nuotraukos, kalendorius, oro prognozės widgetas ar programos ir procesai, veikiantys fone.
Kuo ReALM skiriasi nuo kitų nuorodų atpažinimo modelių? Pirmiausia, požiūris – vietoj to, kad remtųsi vaizdų apdorojimu, ReALM veikia teksto srityje. Tai daro jį daug lengvesnį ir efektyvesnį, kas turėtų leisti jam veikti tiesiogiai mobiliuosiuose įrenginiuose, išlaikant vartotojų privatumą.
Kuo ReALM geresnis už GPT-4?
„Apple“ tyrimų komanda palygino ReALM su galingiausiais kalbos modeliais, esančiais rinkoje šiandien – GPT-3.5 ir GPT-4 iš „OpenAI“. Rezultatai buvo įspūdingi. Nuorodų atpažinimo užduotyse mažiausias ReALM variantas pasiekė tikslumą, lygų GPT-4! Didesni ReALM modeliai netgi pranoko GPT-4 atpažindami nuorodas į elementus, rodomus ekrane (http://arxiv.org/abs/2403.20329).
Ką paaiškina šis pranašumas? Pirmiausia, ReALM puikiai veikia su srities specifiniais užklausimais, tokiais kaip tie, kurie susiję su išmaniaisiais namų prietaisais. Tai yra todėl, kad ReALM demonstruoja gilesnį konteksto supratimą, tikslindamas modelį srities specifiniams duomenims.
Be to, skirtingai nuo GPT-4, kuris daugiausia mokosi iš realių objektų vaizdų, ReALM puikiai atpažįsta tekstinius elementus ir programų vartotojo sąsajos komponentus. Ir būtent sąsajos supratimas yra kritiškai svarbus sklandžiam balso asistentų bendravimui su šiandien naudojamomis programomis.

Šaltinis: DALL·E 3, užklausa: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Ar tai tikroviškų intelektualių asistentų eros pradžia?
Iš tiesų, ReALM integracija su Siri galėtų atverti visai naują skyrių žmogaus ir kompiuterio sąveikoje. Su ReALM, Siri galės suprasti komandas, kurios apima nuorodas į elementus, rodomus išmaniojo telefono ekrane, taip pat procesus ir programas, veikiančias fone. Bet kada ši galimybė bus prieinama vartotojams? Tai dar nežinoma.
Mes likome su spekuliacijomis, remdamiesi modelio techninėmis galimybėmis. Taigi, kaip galėtų veikti ReALM varoma Siri? Pavyzdžiui, jei naršote verslo sąrašų svetainėje ir matote įmonę, kuria domitės, galėtumėte tiesiog pasakyti Siri: “Paskambinkite šiai įmonei”, o asistentas – naudodamas ReALM konteksto analizei – suras nurodytos įmonės telefono numerį ir inicijuos skambutį. Jums net nereikės tiksliai paaiškinti, kurią įmonę turite omenyje.
A tai tik pradžia ReALM galimybių. Komandos, tokios kaip „Paleisk paskutinę grojaraštį“, leistų intuityviai valdyti multimedijos programas ir išmaniuosius namų prietaisus. ReALM taip pat galėtų leisti Siri suprasti pokalbių kontekstą ir komandų istoriją, kad asistentas reaguotų atitinkamai į ankstesnius vartotojo prašymus. Tai žingsnis link intelektualių agentų, priartinantis mus ne tiek prie dirbtinio intelekto, kuris supranta mūsų užklausas, kiek prie tokio, kuris sugeba vykdyti komandas.
Ir tai tik pradžia, ką ReALM gali padaryti. Komandos, tokios kaip “paleisk paskutinę grojaraštį”, leistų intuityviai valdyti multimedijos programas ir išmaniuosius namų prietaisus. ReALM taip pat galėtų leisti Siri suprasti pokalbių kontekstą ir komandų istoriją, kad asistentas reaguotų atitinkamai į ankstesnius vartotojo prašymus. Tai žingsnis link intelektualių agentų, priartinantis mus ne tiek prie dirbtinio intelekto, kuris supranta mūsų užklausas, kiek prie tokio, kuris sugeba vykdyti komandas.
Deja, „Android“ įrenginių vartotojai turės palaukti. Šiuo metu nėra informacijos apie „Google“ planus pridėti „Gemini“ galimybes prie „Google Assistant“. „Google Gemini“ programa „Android“ įrenginiams buvo sukurta (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), tačiau ji dar nėra prieinama už JAV ribų.

Šaltinis: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Santrauka
ReALM yra „Apple“ novatoriškas požiūris į konteksto atpažinimo problemos sprendimą balso asistentams. Vietoj to, kad remtųsi vaizdų apdorojimu, šis kalbos modelis paverčia skirtingus kontekstų tipus į tekstinę reprezentaciją, kurią vėliau apdoroja kalbos užduotyje. Šis požiūris užtikrina ne tik didelį atpažinimo tikslumą, bet ir galimybę veikti mobiliuosiuose įrenginiuose, išlaikant vartotojų privatumą.
Leidimas Siri pasiekti ReALM gali suteikti natūralesnes ir kontekstines balso sąveikas, svarbus žingsnis link tikrų intelektualių asistentų. Su ReALM, Siri galės iš karto reaguoti į komandas, susijusias su ekrano elementais, programomis ir fono procesais. Vienas dalykas yra aiškus – kontekstinio suvokimo gerinimas asistentuose yra raktas į tikrų intelektualių ir natūralių balso sąveikų kūrimą, o ReALM neabejotinai yra svarbus žingsnis šia linkme.

Jei jums patinka mūsų turinys, prisijunkite prie mūsų užimtų bičių bendruomenės Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Robert Whitney
JavaScript ekspertas ir instruktorius, kuris moko IT skyrius. Jo pagrindinis tikslas yra padidinti komandos produktyvumą, mokant kitus, kaip efektyviai bendradarbiauti programuojant.
AI in business:
- 6 nuostabūs ChatGTP papildiniai, kurie palengvins jūsų gyvenimą
- Naujų verslo galimybių naršymas su ChatGPT-4
- 3 nuostabūs AI rašytojai, kuriuos privalote išbandyti šiandien
- Sintetiniai aktoriai. 3 geriausi AI vaizdo generatoriai
- Kokios yra mano verslo idėjos silpnybės? Idėjų generavimo sesija su ChatGPT
- Naudojant ChatGPT versle
- Naujos paslaugos ir produktai, veikiantys su dirbtiniu intelektu
- Automatizuoti socialinių tinklų įrašai
- Socialinių tinklų įrašų planavimas. Kaip gali padėti dirbtinis intelektas?
- Dirbtinio intelekto vaidmuo verslo sprendimų priėmime
- Verslo NLP šiandien ir rytoj
- Dirbtinio intelekto pagalba veikiantys tekstiniai pokalbių robotai
- Dirbtinio intelekto taikymas versle - apžvalga
- Dirbtinio intelekto grėsmės ir galimybės versle (2 dalis)
- Dirbtinio intelekto grėsmės ir galimybės versle (1 dalis)
- Koks yra dirbtinio intelekto ateitis pagal McKinsey Global Institute?
- Dirbtinis intelektas versle - Įvadas
- Kas yra NLP, arba natūralios kalbos apdorojimas versle
- „Google Translate“ vs „DeepL“. 5 mašininio vertimo taikymo būdai verslui
- Automatinis dokumentų apdorojimas
- Balsobotų veikla ir verslo programos
- Virtualaus asistento technologija, arba kaip kalbėti su dirbtiniu intelektu?
- Kas yra verslo intelektas?
- Kaip dirbtinis intelektas gali padėti BPM?
- Šiandienos ir rytojaus kūrybinė dirbtinė intelektas
- Dirbtinis intelektas turinio valdyme
- Tyrinėjant dirbtinio intelekto galią muzikos kūrime
- 3 naudingi AI grafikos dizaino įrankiai. Generatyvi AI versle
- Dirbtinis intelektas ir socialinė žiniasklaida – ką jie sako apie mus?
- Ar dirbtinis intelektas pakeis verslo analitikus?
- AI įrankiai vadovui
- Ateities darbo rinka ir artėjančios profesijos
- RPA ir API skaitmeninėje įmonėje
- Naujos sąveikos. Kaip dirbtinis intelektas keičia mūsų prietaisų valdymo būdą?
- Multimodalinė dirbtinio intelekto technologija ir jos taikymas versle
- Dirbtinis intelektas ir aplinka. 3 AI sprendimai, padedantys jums sukurti tvarų verslą
- AI turinio detektoriai. Ar jie verti?
- ChatGPT vs Bard vs Bing. Kuris AI pokalbių robotas pirmauja lenktynėse?
- Ar chatbot AI yra konkurentas „Google“ paieškai?
- Efektyvūs ChatGPT užklausimai žmogiškųjų išteklių ir atrankos srityje
- Paskatų inžinerija. Ką daro paskatų inžinierius?
- Dirbtinis intelektas ir kas dar? Pagrindinės technologijų tendencijos verslui 2024 metais
- Dirbtinis intelektas ir verslo etika. Kodėl turėtumėte investuoti į etinius sprendimus
- Meta AI. Ką turėtumėte žinoti apie „Facebook“ ir „Instagram“ dirbtinio intelekto palaikomas funkcijas?
- Dirbtinio intelekto reguliavimas. Ką turite žinoti kaip verslininkas?
- 5 nauji dirbtinio intelekto naudojimo būdai versle
- AI produktai ir projektai - kuo jie skiriasi nuo kitų?
- Dirbtinis intelektas kaip ekspertas jūsų komandoje
- AI komanda vs. vaidmenų pasiskirstymas
- Kaip pasirinkti karjeros sritį dirbtiniame intelekte?
- Dirbtinis intelektas žmogiškųjų išteklių srityje: Kaip automatizuota atranka veikia žmogiškųjų išteklių valdymą ir komandos vystymąsi
- Dirbtinio intelekto pagalba automatizuota procesų valdymas. Nuo ko pradėti?
- 6 įdomiausi AI įrankiai 2023 metais
- Kokia yra įmonės dirbtinio intelekto brandos analizė?
- Dirbtinis intelektas B2B personalizavimui
- ChatGPT naudojimo atvejai. 18 pavyzdžių, kaip 2024 metais patobulinti savo verslą su ChatGPT
- AI maketų generatorius. 4 geriausi įrankiai
- Mikro mokymasis. Greitas būdas įgyti naujų įgūdžių
- Įdomiausi dirbtinio intelekto taikymai įmonėse 2024 metais
- Kokie iššūkiai kyla dirbtinio intelekto projektui?
- Aukščiausios 8 AI priemonės verslui 2024 metais
- Dirbtinis intelektas CRM. Ką dirbtinis intelektas keičia CRM įrankiuose?
- ES AI įstatymas. Kaip Europa reguliuoja dirbtinio intelekto naudojimą
- Top 7 AI svetainių kūrėjai
- Be kodo įrankiai ir dirbtinio intelekto inovacijos
- Kiek dirbtinio intelekto naudojimas padidina jūsų komandos produktyvumą?
- Kaip naudoti ChatGTP rinkos tyrimams?
- Kaip išplėsti savo AI rinkodaros kampanijos pasiekiamumą?
- Dirbtinis intelektas transporto ir logistikos srityje
- Kokias verslo problemas gali išspręsti dirbtinis intelektas?
- Kaip pritaikyti dirbtinio intelekto sprendimą verslo problemai?
- Dirbtinis intelektas žiniasklaidoje
- Dirbtinis intelektas bankininkystėje ir finansuose. Stripe, Monzo ir Grab
- Dirbtinis intelektas kelionių pramonėje
- Kaip dirbtinis intelektas skatina naujų technologijų atsiradimą
- Dirbtinis intelektas elektroninėje prekyboje. Pasaulinių lyderių apžvalga
- Top 4 AI vaizdų kūrimo įrankiai
- Top 5 AI įrankiai duomenų analizei
- Dirbtinio intelekto revoliucija socialiniuose tinkluose
- Ar visada verta pridėti dirbtinį intelektą prie produkto kūrimo proceso?
- 6 didžiausi verslo nesėkmės atvejai, kuriuos sukėlė dirbtinis intelektas
- AI strategija jūsų įmonėje - kaip ją sukurti?
- Geriausi AI kursai – 6 nuostabūs rekomendacijos
- Socialinių tinklų stebėjimo optimizavimas naudojant dirbtinį intelektą
- IoT + AI, arba kaip sumažinti energijos sąnaudas įmonėje
- Dirbtinis intelektas logistikoje. 5 geriausi įrankiai
- GPT parduotuvė – įdomiausių GPT verslui apžvalga
- LLM, GPT, RAG... Ką reiškia dirbtinio intelekto akronimai?
- AI robotai – verslo ateitis ar dabartis?
- Kokia yra dirbtinio intelekto įgyvendinimo kaina įmonėje?
- Ką daro dirbtinio intelekto specialistai?
- Kaip dirbtinis intelektas gali padėti laisvai samdomo darbuotojo karjeroje?
- Darbo automatizavimas ir produktyvumo didinimas. Gidas dirbantiems laisvai su dirbtiniu intelektu
- Dirbtinis intelektas startuoliams – geriausi įrankiai
- Svetainės kūrimas su dirbtiniu intelektu
- Vienuolika laboratorijų ir kas dar? Perspektyviausi dirbtinio intelekto startuoliai
- OpenAI, Midjourney, Anthropic, Hugging Face. Kas yra kas dirbtinio intelekto pasaulyje?
- Sintetiniai duomenys ir jų svarba jūsų verslo plėtrai
- Populiariausi AI paieškos varikliai. Kur ieškoti AI įrankių?
- Vaizdo AI. Naujausi AI vaizdo generatoriai
- Dirbtinis intelektas vadovams. Kaip dirbtinis intelektas gali palengvinti jūsų darbą
- Kas naujo „Google Gemini“? Viskas, ką reikia žinoti
- Dirbtinis intelektas Lenkijoje. Įmonės, susitikimai ir konferencijos
- AI kalendorius. Kaip optimizuoti savo laiką įmonėje?
- Dirbtinis intelektas ir darbo ateitis. Kaip paruošti savo verslą pokyčiams?
- AI balso klonavimas verslui. Kaip sukurti asmeninius balso pranešimus naudojant dirbtinį intelektą?
- "Mes visi esame kūrėjai". Kaip piliečių kūrėjai gali padėti jūsų įmonei?
- Faktų tikrinimas ir AI haliucinacijos
- Dirbtinis intelektas atrankoje – žingsnis po žingsnio rengiant atrankos medžiagą
- Sora. Kaip realistiški vaizdo įrašai iš OpenAI pakeis verslą?
- Midjourney v6. Inovacijos dirbtinio intelekto vaizdų generavime
- Dirbtinis intelektas mažose ir vidutinėse įmonėse. Kaip mažos ir vidutinės įmonės gali konkuruoti su milžinais, naudodamos dirbtinį intelektą?
- Kaip dirbtinis intelektas keičia influencerių rinkodarą?
- Ar dirbtinis intelektas iš tikrųjų kelia grėsmę programuotojams? Devin ir Microsoft AutoDev
- Geriausi AI pokalbių robotai elektroninei prekybai. Platformos
- AI pokalbiai robotai e. prekybai. Atvejų analizės
- Kaip būti informuotam apie tai, kas vyksta dirbtinio intelekto pasaulyje?
- AI prisijaukinimas. Kaip žengti pirmuosius žingsnius taikant AI savo versle?
- Suklupimas, Bing Copilot ar You.com? Palyginimas su AI paieškos varikliais
- Dirbtinio intelekto ekspertai Lenkijoje
- ReALM. Revoliucinis kalbos modelis iš Apple?
- „Google Genie“ — generatyvinis dirbtinio intelekto modelis, kuris kuria visiškai interaktyvias pasaulius iš vaizdų
- Automatizacija ar papildymas? Du požiūriai į dirbtinį intelektą įmonėje
- LLMOps, arba kaip efektyviai valdyti kalbos modelius organizacijoje
- AI vaizdo generavimas. Nauji horizontai vaizdo turinio gamyboje verslui
- Geriausi AI transkripcijos įrankiai. Kaip paversti ilgas įrašus į glaustus santraukas?
- Sentimentų analizė su dirbtiniu intelektu. Kaip tai padeda skatinti pokyčius versle?
- Dirbtinio intelekto vaidmuo turinio moderavime