DESCRIERE
În cadrul acestui curs veți programa în Python, folosind cele mai populare instrumente și librării de Data Science și veți învăța cum să-l utilizați pentru analize statistice avansate, pre-procesare și transformare a datelor, dezvoltarea vizualizărilor de date și dezvoltarea de modele predictive pentru a rezolva o varietate de probleme.
Cursul are exerciții practice pentru fiecare modul (cu aplicabilitate directă în domeniul bancar), deci nu numai că veți învăța teoria, dar veți aborda și partea practică în construirea propriilor modele, pe care le puteți utiliza în continuare ca puncte de plecare în construirea propriilor proiecte.
De asemenea, veți învăța cum să îmbunătățiți modelele dezvoltate prin algoritmii de învățare automată, prin aprofundarea conceptelor de bias ridicat (underfitting), dispersie ridicată (overfitting), validarea comparativă (cross-validation) și modul în care hiperparametrii ar putea îmbunătăți performanța modelelor (hyper-parameter tuning).
GRUPUL ŢINTĂ
Specialiști din departamentele: Data Science, Advanced Analytics, IT, Risk, Statistica, Cercetare, Analiză de date, MIS, Business Intelligence etc.
Pre-rechizite:
- Familiaritatea cu conceptele de Inteligență Artificială și Machine Learning sau participarea la cursul Introducere in Inteligenta Artificiala si Machine Learning
- Posibilitatea de a accesa Google Colab: https://colab.research.google.com/ (necesită acces firewall și existența unui cont de Google personal)
- Este recomandabilă cunoașterea unui limbaj de programare și familiaritatea cu conceptele statistice de bază
TEMATICA
Ziua 1 – Principalele concepte și analiza datelor
Principalele concepte de învățare automată
Introducere în principalele instrumente și tehnici de Data Science
Preprocesarea datelor
Analiza datelor cu Pandas
Instrumente de vizualizare și raportare a datelor
Tehnici de manipulare și transformare a datelor
Tehnici de tratare a valorilor lipsă
Tratamentul valorilor extreme
Tratamentul categoriilor rare
Multiple tehnici pentru tratamentul variabilelor categorice
Tehnici de procesare și transformare a datelor necesare pentru principalele grupuri de algoritmi de învățare automată
Selecția variabilelor de intrare
Importanța reducerii spațiului dimensional pentru modelare
Aplicarea metodelor de filtrare (elemente de bază, corelație, măsuri statistice)
Aplicarea metodelor încorporate (lasso, random forrest, etc.)
Aplicarea metodelor agnostice (RFE)
Ziua 2 – Modele de clasificare si regresie
Modele de clasificare
Tipuri de modele utilizate:
- Regresia logistică
- KMeans
- Support Vector Classifier
- Decision Tree
- Ensemble Methods (Random Forrest, XGBoost, LightGBM)
Overfitting si validare comparativă
Tehnici de optimizare a hiperparametrilor folosind Scikit-learn
Exercițiu practic: prezicerea riscului de nerambursare al unui client bancar
Modele de regresie
Tipuri de modele utilizate:
- Regresie liniară
- Support Vector Regressor
- Decision Tree Regressor
- Ensemble Methods (Random Forrest, XGBoost, LightGBM)
Overfitting și validare comparativă
Tehnici de optimizare a hiperparametrilor folosind Scikit-learn
Exercițiu practic: prezicerea prețurilor locuințelor
Selectarea și validarea modelelor
Evaluarea erorilor
Evaluare modelelor folosind validarea comparativă
Exercițiu practic: selectați modelul cel mai performant
Explicarea modelelor de Inteligență Artificială
Grafice de dependență
Analiza importanței variabilelor de intrare prin permutări
Exercițiu practic: interpretarea unui model de clasificare
LECTORI
Nedelcu Alin Mihai și Cosmin Cojocaru au o experiență practică de peste 8 ani în domeniul Inteligenței Artificiale și algoritmilor de Machine Learning.
Ei au înființat competența de Advanced Analytics în interiorul Raiffeisen Bank, atât ca set-up organizațional, dar și din punct de vedere strategie, guvernanță și adopție a tehnologiilor necesare. Cei doi au activat ca Lead Mentori în cadrul Raiffeisen Bank Elevator Lab 2020: Advanced Analytics track și susțin regulat cursuri de Inteligență Artificială și Machine Learning.
Nedelcu Alin Mihai– conduce departamentul de Advanced Analytics din cadrul Raiffeisen Bank, formator autorizat, cu experiență bancară de peste 15 ani, specializat în modele de Machine Learning pentru zone ca Early Warning Systems, Anti-Money Laundering, Markets si Risc.
Alin reprezintă comunitatea de Advanced Analytics din Raiffeisen România.
Cosmin Cojocaru – Data Science Product Manager în cadrul Deutsche Bank, formator autorizat, cu experiență bancară de peste 16 ani, specializat în modele de Machine Learning și Natural Language Processing pentru zone ca Risc, Corporate, Operațiuni și Eficientizare Procese.
Cosmin a avut un rol important în adopția tehnologiilor de cloud pentru Machine Learning în Raiffeisen România și conduce streamul de Data Science Learning & Development din Deutsche Bank la nivel global.
PERIOADA DE DESFĂŞURARE
10 – 11 octombrie 2024, orele 9:00 – 17:00.
Înscrierea la curs se face prin completarea fişei de înscriere. O puteţi descărca de aici şi, după ce o completaţi, o puteţi transmite responsabilului de curs, pe e-mail.
Cursul se va organiza ONLINE, pe platforma ZOOM. Pentru detalii click aici.
La finalul cursului, participanții vor primi un certificat, emis de IBR (sub egida membrilor fondatori: Banca Națională a României și Asociația Română a Băncilor), cu 14 credite de dezvoltare profesională continuă (CPDs).
Pentru tariful cursului şi alte detalii vă rugăm să ne contactaţi telefonic sau prin e-mail.
PERSOANĂ DE CONTACT
ROXANA IVAN
Tel. mobil: 0748.886.839, e-mail: roxana.ivan@ibr-rbi.ro