Az Apple OpenELM modellje képes lesz az eszközökön futni, nem a felhőben

2024. április 26. by Bíró Gábor

Az Apple bemutatta az OpenELM (Open-source Efficient Language Models) névre keresztelt új nyílt forráskódú nagyméretű nyelvi modellsorozatát. Ezeket a modelleket arra tervezték, hogy helyileg működjenek az eszközökön. Ez drasztikus változást jelent a hagyományos, felhőalapú szerverfeldolgozásra való támaszkodáshoz képest. A fejlesztés az Apple tágabb stratégiájának része, hogy fejlettebb mesterséges intelligencia képességeket integráljon közvetlenül az eszközeibe, ezzel javítva az adatvédelmet és a feldolgozási sebességet.

Az OpenELM áttekintése

Az OpenELM modellek rétegenkénti skálázási módszert alkalmaznak, amely hatékonyan osztja el a paramétereket a transzformer modell egyes rétegein belül a precizitás növelése érdekében. Vegyünk például egy körülbelül egymilliárd paraméteres költségkeretet: az OpenELM 2,36%-os javulást mutatott a precizitás terén az OLMo elődmodellhez képest, miközben fele annyi előtanítási tokenre volt szüksége. Ez a megközelítés nem egyszerűen csak a teljesítményt javítja, de csökkenti az eszközök számítási terhelését is, ami nagyon fontos ahhoz, hogy MI alkalmazásokat lehessen futtatni közvetlenül fogyasztói hardvereken.

Jellemzők és képességek

Az OpenELM projekt számos olyan kulcsfontosságú elemet tartalmaz, ami megkülönbözteti az előző MI modellektől:

  • Nyílt forráskódú elérhetőség: Az Apple elérhetővé teszi az OpenELM-et a Hugging Face Hub-on, így a fejlesztők és kutatók hozzáférhetnek annak fejlesztéséhez és hozzájárulhatnak ahhoz.
  • Átfogó képzési keretrendszer: A hagyományos modellektől eltérően, melyek csak modellsúlyokat és következtető kódot biztosítanak, az OpenELM tartalmazza a publikusan hozzáférhető adatkészleteken való tanítás és kiértékelés teljes keretrendszerét. Ez magában foglalja a tanulási naplókat, a számos ellenőrzőpontot, és az előtanítási konfigurációkat.
  • Fokozott adatvédelem és sebesség: Az eszközökön való helyi futással az OpenELM kiküszöböli a felhőszerverekre irányuló adattovábbítást, így javítja a felhasználók adatvédelmét. Azonkívül a helyi feldolgozás csökkenti a válaszidőt, ez pedig gyorsabb reakciót tesz lehetővé az MI-vezérelt funkciók használatakor.

Integráció az iOS-szel és kilátások a jövőben

Az Apple azt tervezi, hogy az OpenELM-et beépíti a hamarosan megjelenő iOS 18 kiadásba, mely várhatóan számos új MI-funkciót fog bevezetni. Az OpenELM integrációja nagy valószínűséggel különféle eszközökön futó MI funkciókat fog működtetni, potenciálisan beleértve a Siri vagy más MI-alkalmazások fejlettebb változatait.

Összességében az OpenELM modellek megjelenése jelentős előrelépést jelent az eszközökön futó MI technológiák fejlődésében. A nyílt forráskódú együttműködésre és a hatékonyságra, valamint az adatvédelemre helyezett hangsúllyal az Apple előkelő helyzetet foglal el az MI következő generációjának mobil és más fogyasztói eszközökön futó alkalmazásai terén.