A Meta új mesterséges intelligenciája tudja ellenőrizni saját és más MI-k munkáját
A Meta új mesterségesintelligencia-modelleket tett közzé, köztük az MI-fejlesztéshez kevesebb emberi jelenlétet megvalósítani hivatott „önmagától gondolkodó értékelőt.”
Az eszközt augusztusban mutatták be, tanulmányban részletesen elemezték hogyan alapul ugyanarra a „gondolatlánc” technikára, mint az OpenAI nemrég kiadott o1 modelljei. Így megbízhatóbban képes megítélni MI-k válaszait.
A technikával összetett problémákat kisebb logikai lépésekre szed szét, és úgy tűnik, például olyan területeken, mint a tudomány, a kódolás és a matematika, javul a válaszok pontossága.
A kiértékelő gyakoroltatásához kizárólag MI által generált adatokat használtak, azaz már ezen a szinten kihagyták a humán inputot. Az MI-k tevékenységét pontosan megítélő MI lépés az autonóm MI-ágensek irányába. Ezek az entitások saját hibáikból tanulnak.
Az új ágensek digitális asszisztensként elég intelligensek lehetnek sokféle feladat emberi beavatkozás nélküli kivitelezéséhez. Az önmagukat javító modellekkel kevésbé vagy egyáltalán nem lesz szükség drága és gyakran nem hatékony folyamatokra, mint az emberi visszacsatolásos megerősítéses tanulás, amely nem működik humán input nélkül.
A humán címkézőknek (az ő inputjukra van szükség) speciális ismeretekre van szükségük adatok pontos címkézéséhez, komplex matematikai feladatokra és lekérdezésekre adott válaszok hitelesítéséhez.
A Meta kutatói reménykednek, hogy az MI egyre inkább „szuperhumánná” válik, pontosabban ítéli meg saját munkáját, és ezzel már jobban teljesít, mint az átlagember. Az „autodidaktaság” és az önértékelés nagyon fontos képességek az emberrel azonos szintű általános mesterséges intelligencia (AGI) eléréséhez.
Más vállalatok, köztük a Google és az Anthropic szintén írtak anyagokat az MI-visszacsatolás alapú megerősítéses tanulásról (RLAIF, Reinforcement Learning from AI Feedback), nyilvános használatra viszont nem tettek közzé modellt.
0 Hozzászólás:
Legyél te az első hozzászóló!
Hozzászólás írásához be kell jelentkezni: