Végre van egy definíciónk a nyílt forráskódú mesterséges intelligenciára


A kutatók hosszú ideje nem értenek egyet abban, hogy mi minősül nyílt forráskódú mesterséges intelligenciának. Egy befolyásos csoport most felajánlott egy választ.

A nyílt forráskódú mesterséges intelligencia már szinte mindenhol jelen van. A probléma az, hogy senki sem ért egyet azzal, hogy mit is jelent ez valójában. Most végre lehet, hogy van rá válaszunk. Az Open Source Initiative (OSI), a nyílt forráskódúvá minősülés önjelölt döntőbírája, közzétett egy új definíciót, amellyel remélhetőleg segíteni tudja a törvényhozókat az MI kockázatoktól védő szabályozások kidolgozásában. Bár az OSI sokat közölt már arról, hogy mi minősül nyílt forráskódú technológiának más területeken, ez az első kísérlete annak meghatározására, hogy mit jelent a kifejezés az MI modellek esetében.

A szervezet egy 70 fős csoportot kért fel a munkadefiníció kidolgozására, amelyben kutatók, ügyvédek, politikai döntéshozók és aktivisták, valamint olyan nagy tech cégek, mint a Meta, a Google és az Amazon képviselői vettek részt. A csoport szerint egy nyílt forráskódú MI rendszert bármilyen célra fel lehet használni engedélykérés nélkül, és a kutatóknak képesnek kell lenniük a rendszer elemeinek vizsgálatára és a rendszer működésének tanulmányozására. Lehetőségnek kell lennie továbbá a rendszer módosítására bármilyen célból – beleértve a kimenetének megváltoztatását is – és megoszthatóvá kell tenni mások számára, módosításokkal vagy anélkül, bármilyen célra. Ezenkívül a szabvány megpróbálja meghatározni egy adott modell képzési adatainak, forráskódjának és súlyainak átláthatósági szintjét.

A nyílt forráskódú szabvány korábbi hiánya problémát jelentett. Bár tudjuk, hogy az OpenAI és az Anthropic döntése, hogy modelljeiket, adatkészleteiket és algoritmusokat titokban tartják, zárt forráskódúvá teszi az MI-jüket, néhány szakértő azt állítja, hogy a Meta és a Google szabadon hozzáférhető modelljei, amelyeket bárki megvizsgálhat és alkalmazhat, nem igazán nyílt forráskódúak, mivel a licenc korlátozza, hogy a felhasználók mit tehetnek a modellekkel, és mert a tanítóadataikat nem teszik közzé. A Metát, a Google-t és az OpenAI-t megkeresték, hogy reagáljanak az új definícióra, de annak kiadása előtt nem válaszoltak. „A vállalatok hajlamosak visszaélni a kifejezéssel, amikor modelljeiket népszerűsítik” – mondja Avijit Ghosh, a Hugging Face alkalmazott politikai kutatója, ami egy platform az MI modellek építéséhez és megosztásához. A modellek nyílt forráskódúként való leírása miatt azokat megbízhatóbbnak is tarthatják, még akkor is, ha a kutatók nem képesek önállóan megvizsgálni, hogy valóban nyílt forráskódúak-e.

Ayah Bdeir, a Mozilla főtanácsadója és az OSI folyamatának résztvevője szerint a nyílt forráskódú definíció bizonyos részeinél viszonylag könnyen megegyezésre jutottak, beleértve a modellsúlyok (azok a paraméterek, amelyek segítenek meghatározni, hogyan generál egy MI modell egy kimenetet) feltárásának szükségességét. A tanácskozások más részei vitatottabbak voltak, különösen az a kérdés, hogy mennyire nyilvánosak legyenek a tanítóadatok. A tanítóadatok származásának átláthatóságának hiánya számtalan perhez vezetett a nagy MI vállalatok ellen, a nagy nyelvi modellek gyártóitól, mint az OpenAI a zenei generátorokig, mint a Suno, amelyek nem közölnek sokat tanítóadat készleteikről, csak annyit mondanak, hogy „nyilvánosan hozzáférhető információkat” tartalmaznak.

Válaszul erre néhány szószóló azt mondja, hogy a nyílt forráskódú modelleknek minden tanítóadatukat közzé kellene tenniük, egy olyan szabvány alapján, amelyet Bdeir szerint nehéz lenne betartatni a szerzői jogok és az adattulajdonlás kérdései miatt. Végül az új definíció azt követeli, hogy a nyílt forráskódú modellek adjanak információt a képzési adatokról annyiban, hogy „egy hozzáértő személy képes legyen létrehozni egy lényegében azonos rendszert azonos vagy hasonló adatok felhasználásával”.

Ez nem általános követelmény minden képzési adatkészlet megosztására, de továbbmegy, mint amit sok saját tulajdonú modell, vagy akár látszólag nyílt forráskódú modell ma tesz. Ez egy kompromisszum. „Az ideológiailag tiszta aranystandardra való ragaszkodás, amelyet valójában senki sem fog hatékonyan teljesíteni, visszaüt” – mondja Bdeir. Hozzáteszi, hogy az OSI tervez valamilyen betartatási mechanizmust, amely jelzi azokat a modelleket, amelyeket nyílt forráskódúként írnak le, de nem felelnek meg a definíciónak. Tervezi továbbá annak a listájának közzétételét is, amelyek megfelelnek az új definíciónak. Bár egyik sem erősített meg, a Bdeir által az MIT Technology Review-nak említett néhány modell, amelyek várhatóan a listára kerülnek, viszonylag kisebb nevek, beleértve az Eleuther által fejlesztett Pythiát, az Ai2 által fejlesztett OLMo-t és az LLM360 nyílt forráskódú csoport által fejlesztett modelleket.


Eredeti cikk: We finally have a definition for open-source AI


A cikk a Wolters Kluwer Hungary Kft. termékeire/szolgáltatásaira vonatkozó reklámot tartalmaz.


Kapcsolódó cikkek

2024. október 28.

Európai precedenst teremthet a német bíróság, amely kimondta, hogy nem törvénysértő a képgeneráló mesterséges intelligenciák adatkezelése

Egy német bíróság visszautasította a nagyméretű képi adatkészleteket szolgáltató, nonprofit LAION (Large-scale AI Open Network) elleni szerzői jogok megsértése miatt beadott keresetet. Az adatkészleteket olyan képgeneráló modellek használják, mint a Midjourney, a Stable Diffusion és mások, rajtuk gyakorolnak. A szolgáltató tevékenysége a jogi védelem alatt álló tudományos kutatások kategóriába tartozik – mondta ki a verdikt.