Data Scientist Képzés - Időpontok és jelentkezés
Első oktatási nap: 2025. október 28.
Első oktatási nap: 2025. október 31.
Zártcsoportos képzésre jelentkezem
Jelentkezés időpont nélkül
Ezeket a kedvezményeket veheted igénybe jelentkezéskor:
20% Adattudós Kedvezmény
Dolgozz adatokkal úgy, ahogy a profik csinálják!
Elemezz Pythonban, írj lekérdezést SQL-ben és modellezz gépi tanulással. Megmutatjuk, hogyan rendszerezd, vizualizáld és automatizáld az adataidat – valós üzleti példákon keresztül. Felépíted az első működő adatmodelledet, amivel már döntéseket tudsz támogatni. A képzés végére magabiztosan mozogsz majd a data analyst és a data science világában. Nálunk nemcsak tanulsz, hanem adatot értelmezel, rendszerezel és döntéseket támogatsz.
Ma már teljes az egyetértés abban, hogy az adatok hatalmas értéket jelentenek a vállalatok számára. Neked szól ez a képzés, ha olyan adatvezérelt területen dolgozol vagy dolgoznál, akár data analyst vagy data scientist munkakörben, ahol a döntések, stratégiák és működési folyamatok alapja a folyamatos adatgyűjtés és -elemzés. Akár kezdőként, programozói és data analyst háttér nélkül is bátran belevághatsz tanfolyamunkba.
Adatokkal foglalkozó elemzők, üzleti intelligencia szakértők és mérnökök számára egyaránt hasznos, ha szeretnének elmélyedni a modern adatkezelésben és gépi tanulásban.
A képzésen az alapoktól indulunk, így nem gond, ha előtte még sosem kódoltál.
Ha van egy kis programozási ismereted és matekból erős voltál, gyorsabban fogsz haladni – de ez nem feltétel a képzés sikeres elvégzéséhez.
LEHETŐSÉGEd Van RÉSZLETFIZETÉSRE is!
Tudjuk, hogy egy ekkora összeget nem könnyű kigazdálkodni, ugyanakkor már erre is van megoldás: 3 egyenlő, kamatmentes részletben is tudod törleszteni a tandíjat!
Magánszemélyként a 799 500 Ft + Áfa tandíj a neked járó 20% Adattudós kedvezménnyel: 639 600 Ft +ÁFA, ezt 3 részletben tudod kiegyenlíteni, ami 3 x 213 200 Ft +Áfa összeget jelent.
Az első részletet a Data Scientist képzés indulásáig, a fennmaradó 2 részletet pedig a képzés 4 hónapja alatt kell befizetned. Céges jelentkezés esetén szintén van lehetőség a részletfizetési konstrukcióra, a képzés teljes díjára.
Data analyst vagy data scientist?
Egy data analyst (adatelemző) fő feladata, hogy adatokat gyűjtsön, feldolgozzon, elemezzen, az eredményekből pedig érthető, hasznos következtetéseket vonjon le és vizualizálja azokat. Egy data scientist (adattudós) ezen az úton továbbmegy és nemcsak elemzi az adatokat, hanem modelleket, előrejelzéseket és automatizált megoldásokat is épít az adatok alapján. Képzésünkön a data analyst területekkel kezdünk, de a data scientist feladataival is részletesen foglalkozunk.
Miért lettek az adatok még fontosabbak a mesterséges intelligencia használatának elterjedésével?
Az adatkezelés a mesterséges intelligencia (MI) egyik alapköve, mert az MI rendszerek csak annyira jók, amennyire jók az adataik. A gépi tanulási algoritmusok a rendezett, egységes formátumú adatokkal tudnak hatékonyan dolgozni. A pontatlan, hiányos vagy zajos adatok hibás gépi tanuláshoz vezetnek. Az MI fejlesztés során az adatokat csoportosítani, aggregálni, szűrni kell, valamint szét kell választani tréning, validációs és teszt adatkészletekre. Az MI modelleket folyamatosan frissíteni kell aktuális, releváns adatokkal.
Képzésünkön megtanulsz adatokat kezelni, tisztítani, elemezni és modellezni – lépésről lépésre, valós példákon.
Python, SQL, pandas és NumPy használatával különböző adatforrásokat dolgozol fel. Megmutatjuk, hogyan készíts adatvizualizációkat, végezz statisztikai elemzéseket, és hogyan indítsd el az első gépi tanulási modelljeidet.
Nem hagyunk magadra az elmélettel sem: a szükséges statisztikai és valószínűségszámítási alapokat is elsajátítod – annyira, amennyire a gyakorlat megköveteli.
A tananyag moduláris, így fokozatosan építkezhetsz. Mini projekteken keresztül dolgozol, és a cél végig az, hogy valós munkakörnyezetben is hasznosítható tudásod legyen.
A képzés végére képes leszel:
Pythonnal adatokat betölteni, tisztítani és elemezni
SQL nyelven lekérdezni, szűrni és rendszerezni relációs adatokat
Különböző adatforrásokat kezelni: CSV, Excel, JSON, XML, Parquet
Megismered az adatokkal kapcsolatos feladatokhoz nagyon hasznos és népszerű nyelvnek, az R nyelvnek az alapjait
Zajos, hiányos adatokat előkészíteni gépi tanuláshoz
Egyszerűbb ML-modelleket építeni és tesztelni (pl. klasszifikáció, regresszió)
Vizualizálni az eredményeket matplotlib-vel, plotly-val, dashboardon
Alap szinten használni Linux parancsokat és automatizálni adatfolyamatokat
Átlátni az adatkezelés jogi és etikai kérdéseit
Végigcsinálni egy mini data science projektet az adatgyűjtéstől a modellezésig
Képzési napok
Kétféle ütemezés közül is választhatsz! Hetente két alkalommal, kedden és csütörtökön 17:00–20:15 között, vagy hetente egyszer, péntekenként 9:00-tól 16:30-ig. A képzés mindkét esetben 4 hónapig tart. Az esti képzésünk kizárólag online formában elérhető, míg a pénteki ütemezés esetén tantermünkben, személyes oktatáson is részt vehetsz.

- Minden alkalom rögzítésre kerül – Így nem maradsz le semmiről!
- 30 nap korlátlan visszanézés – A képzés zárását követően 30 napig eléred a felvételeket.
- Rugalmas időbeosztás – Akkor tanulsz, amikor neked jó.
- Bármilyen eszközön elérhető felvételek – Laptop, tablet vagy telefon, bárhol, bármikor visszanézheted!
- Visszatekerés és újranézés – Ismételd meg a nehezebb részeket könnyedén!
- Hatékonyabb tudáselsajátítás – Többszöri ismétléssel mélyül a tudás.
- Jegyzeteléshez ideális – Ne csak hallgasd, jegyzetelj is!
Ha magánszemélyként veszel részt Akadémiai képzéseinken, mint például ez a Data Scientist tanfolyam, akkor a szakmai felkészítés mellett karriertámogató csomagot is biztosítunk számodra! Ezzel a rugalmas és személyre szabott lehetőséggel minden támogatást megadunk, hogy felkészülten indulj el a pályán. Amennyiben aktuális partneri lehetőségeink között van számodra releváns pozíció, örömmel segítünk a profilodnak és elvárásaidnak megfelelő állásokra való pályáztatásban is.
Partnereinktől érkező céges résztvevők számára ezt a szolgáltatást nem tudjuk nyújtani, de ha IT pozíciót kínálóként érdeklődsz végzőseink felől, várjuk megkeresésedet az akademia@masterfield.hu címen!
A képzés tematikája:
1. PYTHON PROGRAMOZÁSI ALAPOK
Python programozáshoz használt fontosabb eszközök, környezet összeállítása. Python nyelv szintaktikája, egyszerű és összetett adattípusai. Vezérlési szerkezetek használata. Moduláris programozás, függvények és modulok használata. Hibakezelés és kivételkezelés alapjai.
2. PYTHON ADATFELDOLGOZÁSI LEHETŐSÉGEI
Adatkezelés pandas könyvtárral: vektorizálás, wrangling, rendezések, szűrések, aggregálások. Adatok csoportosítása, ablakok definiálása, idősorok feldolgozása. Vektorok és mátrixok kezelése numpy könyvtárral.
3. SQL NYELVI ALAPOK
Relációs adatbázisok felépítése. SQL nyelv szintaktikai alapok. Lekérdezések készítése: szűrések, rendezések, aggregálások, csoportosítások. Ismétlődések kiszűrése, rekordok sorszámozása. Táblák összekapcsolása. Halmazelméleti alapok, Venn-diagram. Unió, metszet és különbség halmazműveletek használata. Analitikus függvények. SQL adatbázisok elérése Pythonból.
4. NOSQL ALAPOK, BIGDATA RENDSZEREK
NoSQL adatbázisok felépítése. Legfontosabb különbségek a relációs adatbázisokhoz képest. MongoDB adatbáziskezelő alapok.
5. EGYÉB ADATFORRÁSOK FELDOLGOZÁSA
Excel fájlok, CSV szövegfájlok, JSON formátum, XML alapok, a Parquet formátum. Speciális adatforrások feldolgozása Pythonból.
6. PARANCSOR HASZNÁLATA ÉS AUTOMATIZÁLÁSI ALAPISMERETEK
Parancssor használata Windowsban és Linuxban. Bash szkript alapok. Fájlkezelés és szövegfeldolgozás. Feladatok ütemezett végrehajtása.
7. ADATOK ÖSSZEGYŰJTÉSE ÉS TISZTÍTÁSA
ETL folyamat lépései: adatok kinyerése (Extract), transzformációja (Transform) és betöltése (Load). Transzformációs módszerek. Hiányzó, hibás és többszörös adatok kezelése. Automatizálási lehetőségek. Anonimizálás, érzékeny adatok megváltoztatása vagy eltávolítása.
8. MATEMATIKAI ÉS STATISZTIKAI HÁTTÉR ÉS EZEK GYAKORLATI ALKALMAZÁSA
A statisztika alapfogalmai, leíró és következtetési statisztika. Statisztikai középérték mutatók és jelentőségük (átlag típusok, medián, módusz stb.). Szóródási mutatók (terjedelem, szórás, variancia stb.), kiugró értékek azonosítása (outlier). Korreláció és kovariancia fogalma és vizsgálata.
Eloszlások jelentősége az adatelemzésben, eloszlások fajtái (egyenletes, binomiális, normális, poisson stb.), csúcsossági és ferdeségi mutatók, a centrális határeloszlás-tétel.
Mintavétel folyamata és fajtái, a sokaság fogalma, becslések, konfidenciahatárok, hipotézisvizsgálat (nullhipotézis és alternatív hipotézis, szignifikanciaszint, P-érték).
Bevezetés a valószínűségszámításba, jelentősége az adatelemzésben (alapfogalmak, Bayes-tétele, várható érték).
Hibalehetőségek statisztikai eljárásokban.
Python és R nyelvi eszközök az algoritmusok megvalósítására.
9. GÉPI TANULÁS, ADATOK FELHASZNÁLÁSA AZ AI TERÜLETÉN
Tanításhoz és teszteléshez használt adatok. Felügyelt és felügyelet nélküli tanulás, megerősítéses gépi tanulás, mélytanulás. Overfitting és underfitting fogalma.
Lineáris, többszörös lineáris és logisztikus regresszió. Klasszifikáció, klaszteranalízis, besorolás feladata és az erre használható algoritmusok. Döntési fák, véletlen erdők. Korrelációvizsgálat. Idősoros adatok feldolgozása, mintázatok és összefüggések felismerése.
Modellek kiértékelésnek módjai, "jóság" ellenőrzése, keresztvalidáció (érzékenység, specifikusság, precizitás, pontosság, AUC, ROC, error-mátrix).
Neurális hálók és nagy nyelvi modellek (LLM) alapjai. Gépi tanulási technikák alkalmazása Pythonban (Scikit-learn, TensorFlow) és R nyelven.
10. ADATVIZUALIZÁCIÓ
Vizualizáció típusok és technikák, speciális diagram típusok. Diagramok készítése matplotlib Python könyvtárral. Adatvizualizáció Jupyter notebookban. További vizualizációs lehetőségek, dashboard készítése (bokeh, plotly).
11. JOGI HÁTTÉR
Adatok felhasználhatóságának lehetőségei, érzékeny adatok meghatározása, jogi szabályozás.
Dutkay Kata nagyon jó pedagógus, hatalmas tudással és türelemmel. Nagyon örültem, hogy részt vehettem az Excel tanfolyamon, és a jövőben szándékomban áll más tanfolyamon is részt venni.
Héliot Aranka