A DeepSeek is úgy vette be az internetet, mint a Dubai csoki
A DeepSeek bálnája nagy hullámokat keltett maga körül a tech világában. A cég legújabb megjelenése, a DeepSeek-R1 egy nyílt forráskódú nyelvi modell, amely jobb teljesítményt nyújt, mint más vezető modellek, például az OpenAI GPT-4, a Meta Llama és a Google Gemini.
Habár a kínai AI modellt fejlesztő vállalat 2023-ban jött létre, az már 2024 folyamán megelőzte a nagyobb kínai AI vállalatokat, ugyanis a DeepSeek fejlesztése kevesebb tőkét igényelt, így hamar piaci előnyhöz jutott az olcsóbb áraival, mint a konkurens vállalatok. Ez azonban nem minden, hiszen teljesítményével is lekörözi a korábbi modelleket. Ennek oka, hogy új megközelítéssel álltak a nagyméretű nyelvi modellek (LLM) érvelési képességeinek fejlesztéséhez kizárólag megerősítő tanulási (RL) technikák alkalmazásával, ami azt jelenti, hogy az AI képes autonóm módon fejleszteni saját problémamegoldó képességét.
A Liang Wenfeng nevéhez köthető DeepSeek több kérdést is felvet az AI jövőjét illetően, a legfontosabbakat összefoglaltuk!
Az AI modellek esetében Kína megelőzi Amerikát?
A CNN kiemelte, hogy Liang Wenfeng maga nyilatkozott úgy tavaly nyáron a 36Kr-nek adott interjújában, hogy „Gyakran mondjuk, hogy Kína és az Egyesült Államok között egy-két év különbség van, de a valódi különbség az eredetiség és az utánzás között van. Ha ez nem változik, akkor Kína mindig is követő lesz”.
Ez megragadja azt az ambíciót, amit az is tükröz, hogy cégébe csak belföldről vesz fel friss diplomás dolgozókat, akiket az egyes munkavállalók erősségeire összpontosítva foglalkoztat. Ahogy az Wechat platformjukon olvasható, célként azt határozták meg maguk előtt, hogy feltárják az általános mesterséges intelligencia lényegét (AGI), akár csak az amerikai vállalatok. A DeepSeek általi „fenyegetettséget” a letöltésekben is lehetett érzékelni, nem sok idő kellett ahhoz, hogy az Amerikai Egyesült Államokban az egyik napról a másikra ez legyen a legtöbbet letöltött app, hiszen nem csak a létrehozása volt kevésbé költséges, de ezáltal a használata is olcsóbb a felhasználók számára.
A szabadalmaztatott technológiájú OpenAI-val szemben, a DeepSeek nyílt forráskódú és ingyenes, ezzel is hátráltatva a meglévő vállalatok bevételi modelljét. A CNN szerint ez mindenképpen tettre készteti az amerikai AI tech cégeket, ahogy erre a híres tech-befektető Marc Andreessen is utal, a helyzetet a mesterséges intelligencia „Szputnyik pillanatának” nevezve. Donald Trump hivatalba lépésekor eleve egy tervvel támogatását mutatta az iparág felé, ami egyre nagyobb relevanciát kaphat mindezek fényében.
Ennek ellenére a Forbes-nak azt nyilatkozta Yann LeCun, a Meta vezető mesterséges intelligencia kutatója, hogy ez nem Kína előnyét jelenti az USA-val szemben, hanem azt, hogy „A nyílt forráskódú modellek felülmúlják a szabadalmaztatott modelleket”, emellett kiemeli, hogy a nyílt forráskóddal közzétett DeepSeek-ből mindenki porfitálhat majd.
Mit szól ehhez Európa? Milyen adatvédelmi kérdések merülnek fel?
A Politico összefoglalta pár európai uniós képviselő és szóvivő kijelentéseit, amelyekben a következő gondolatok fogalmazódnak meg: az AI-hoz való hozzáférés már nem a tech-óriások privilégiuma, Európának is lehetősége nyílik érdemben belépni/felzárkózni a területen, tehát a mesterséges intelligencia versenye közel sincs a végéhez. Azonban emellett felmerültek olyan vélemények is, amelyek az adatok védelme miatt fejezik ki aggódásukat, mint hogy a kínai szerverek miért tárolják a billentyűleütésmintákat vagy hogy ezek a modellek befolyásoló hatással bírnak-e a gondolkodásmódunkra, a keresésekre adott válaszok megválogatásával.
A WIRED összefoglalása szerint a DeepSeek felhasználóinak tudatában kell lennie azzal, hogy a felhasználáshoz szükséges, illetve a későbbiekben megadott adatok kínai szervereken kerülnek tárolásra. Visszatérő gondolat az ilyen hirtelen nagy népszerűségre szert tevő innovációknál, hogy ha nem pénzzel, akkor mivel fizet érte a felhasználó, amire ott van ez a nem titkolt válasz a felhasználási feltételek között. Az adatvédelmi szabályzat kitér arra is, (ahogy az más AI modellek esetében is hasonlóan van,) hogy „Gyűjthetjük az Ön szöveges vagy hangbevitelét, promptját, feltöltött fájljait, visszajelzéseit, csevegési előzményeit vagy egyéb tartalmakat, amelyeket a modellünk és szolgáltatásaink számára nyújt”.
Azonban egy sajátossága is van a DeepSeek-nek, mint például, hogy vannak olyan Kínával kapcsolatos tabu témák, amelyekre nem válaszol, ami tehát azt jelenti, hogy bizonyos mértékben cenzúrázva van.
Mindezek fényében a DeepSeek kiemelkedő sajátosságaira a TechTarget mutat rá, miszerint újításai közé tartozik a megerősítéses tanulási folyamata, az ösztönzőrendszer szerinti tanulási modellje, az ún. disztilláció, ami jelentős képességbeli tömörítést jelent, valamint a kibontakozó viselkedési hálózata, ami a természetes gondolkodási minták innovációját jelenti.
Amennyiben szeretnéd, hogy vállalkozásodon belül is hasznosíthasd az olyan automatizációkat, mint a Chatbot, akkor fordulj hozzánk bizalommal!
Források:
https://medium.com/@mayadakhatib/deepseek-r1-a-short-summary-73b6b8ced9cf
https://edition.cnn.com/2025/01/28/china/china-deepseek-ai-success-tech-intl-hnk/index.html
https://www.politico.eu/article/europe-ai-scene-hope-china-deepseek-ai-model-r1-success/
https://www.wired.com/story/deepseek-ai-china-privacy-data/
https://www.techtarget.com/whatis/feature/DeepSeek-explained-Everything-you-need-to-know
0 Hozzászólás:
Legyél te az első hozzászóló!
Hozzászólás írásához be kell jelentkezni: