Ključni izsledki
- Nova skupina razvijalcev gradi odprtokodne modele AI.
- Skupina uporablja obsežne modele jezikovnega usposabljanja, ki jih bo objavila pod odprtimi licencami.
- Odprtokodni AI bi lahko pripomogel k temu, da bi bila moč nove tehnologije, ki bi lahko spremenila igro, manj nagnjena k pristranskosti in napakam.
Velika podjetja (AI) veliko raziskujejo umetno inteligenco, a ena spletna skupina želi demokratizirati proces.
EleutherAI je nedavno ustanovljen kolektiv prostovoljnih raziskovalcev, inženirjev in razvijalcev, ki se osredotoča na raziskave odprtokodne umetne inteligence. Organizacija uporablja kodne baze GPT-Neo in GPT-NeoX za usposabljanje masivnih jezikovnih modelov, ki jih namerava izdati pod odprtimi licencami.
»Odprtokodni podatki koristijo raziskovalcem, ker imajo znanstveniki več brezplačnih virov, ki jih lahko uporabijo za usposabljanje modelov in dokončanje raziskav,« je za Lifewire v intervjuju po elektronski pošti povedal Edward Cui, izvršni direktor podjetja AI Graviti. Njegovo podjetje ni vključeno v EueutherAI. "Vemo, da je veliko projektov umetne inteligence zadržalo splošno pomanjkanje visokokakovostnih podatkov iz dejanskih primerov uporabe, zato je ključnega pomena, da s pomočjo sodelujoče skupnosti vzpostavimo smernice, ki zagotavljajo kakovost podatkov."
To je pot
Začetki EleutherAI so bili skromni. Lansko leto je neodvisni raziskovalec umetne inteligence po imenu Connor Leahy objavil naslednje sporočilo na strežniku Discord: "Hej, fantje, dovolite [SIC] OpenAI-ju za svoj denar kot v dobrih starih časih."
In tako je nastala skupina. Zdaj ima na stotine sodelavcev, ki svojo kodo objavljajo v spletnem repozitoriju programske opreme GitHub.
Prizadevanja za odprtokodno umetno inteligenco niso nova. Pravzaprav sta Airbnbjeva platforma za upravljanje poteka dela Airflow in Lyftov mehanizem za odkrivanje podatkov rezultat uporabe odprtokodnih orodij, ki podatkovnim ekipam omogočajo boljše delo s podatki, je poudaril Ali Rehman, vodja projektov pri podjetju za programsko opremo CloudiTwins v elektronskem intervjuju za Lifewire..
"Tako kot je odprtokodna revolucija privedla do preobrazbe razvoja programske opreme, je tudi vodila razvoj in demokratizacijo podatkovne znanosti in umetne inteligence," je dejal Rehman. "Odprta koda je postala ključnega pomena za rešitve podatkovne znanosti v podjetjih, saj večina podatkovnih znanstvenikov uporablja odprtokodna orodja."
Odpiranje vrat
Razvoj odprtokodne umetne inteligence bi lahko pripomogel k temu, da bi bila moč nove tehnologije, ki bi lahko spremenila igre, manj nagnjena k pristranskosti in napakam, trdijo nekateri opazovalci.
Raziskave umetne inteligence zdaj potekajo predvsem na prostem, saj skoraj vsa podjetja, raziskovalni laboratoriji in univerze svoje rezultate takoj predstavijo v znanstvenih publikacijah, je za Lifewire v elektronskem intervjuju povedal Kush Varshney, raziskovalec umetne inteligence pri IBM.
"Ta odprta skupnost je bistvenega pomena, saj zagotavlja izboljšane ravni zavor in ravnovesij, ki zagotavljajo, da se umetna inteligenca raziskuje, ustvarja, uvaja in uporablja odgovorno," je dodal Varshney. "To je še posebej kritično v situacijah, ko lahko ti sistemi vplivajo na življenja naših najbolj ranljivih članov družbe. Ta odprtost ne velja samo za splošno strojno učenje in algoritme globokega učenja, ampak tudi za elemente zaupanja vredne umetne inteligence."
Rehman je dejal, da je ena od kritičnih razlik med lastniško in odprtokodno programsko opremo prilagodljivost in prilagajanje. Lastniške raziskave AI bodo imele težave z varnostjo, posodobitvami in optimizacijami.
"To je zato, ker odprtokodni pristop, ki temelji na skupnosti, pridobi dragocen prispevek tisočih strokovnjakov iz industrije, ki prepoznajo potencialne varnostne ranljivosti, ki se nato hitreje odpravijo," je dodal Rehman."Soglasje skupnosti pomeni, da je kakovost zagotovljena in nove priložnosti lažje prepoznane."
Druga težava je, da lastniške raziskave umetne inteligence ne bodo interoperabilne, kar pomeni, da ne bodo mogle delovati z različnimi formati podatkov in bodo verjetno imele zaklepanje prodajalca, kar podjetjem preprečuje testiranje in preizkušanje programske opreme, preden se zavežejo k rešitvi, Rehman je rekel.
Ampak ni nujno, da je vsak vidik raziskav umetne inteligence odprtokoden, je v intervjuju za Lifewire po elektronski pošti povedal Chris Kent, izvršni direktor podjetja Reveal Surgical za medicinsko umetno inteligenco. "Pomembno je zaščititi gospodarske spodbude, ki poganjajo komercialni razvoj ključnih aplikacij umetne inteligence," je dejal.
Vendar raziskave umetne inteligence potrebujejo robustno odprtokodno komponento, je dejal Kent. Dodal je, da odprtokodni sistem gradi zaupanje in uporablja nize podatkov, ki niso ali ne bi smeli biti pod nadzorom posameznih institucij ali podjetij.
"Odprtokodni pristop je najboljši način za prepoznavanje in kompenzacijo osnovne pristranskosti, ki lahko obstaja v sklopih usposabljanja, in bo vodil do bolj celovitih, kreativnih in zanesljivih aplikacij umetne inteligence," je dejal Kent.