Descripción

Ingénieur Généraliste spécialisé en Data Engineer/Science et titulaire d'un Master 1 en Mathématiques Fondamentales, je me positionne comme un expert de l'industrialisation des systèmes Data et IA. Ma passion est de transformer des problèmes complexes en solutions robustes, performantes et exploitables en production.

Je suis Freelance/Consultant, disponible pour des missions stratégiques autour de la modernisation de la Data Stack, du MLOps, de l'Analytics Engineering et de l'intégration de l'IA Générative.

J’ai participé à plusieurs projets significatifs :

Axio Conseils : pipeline de prédiction de sinistres auto, intégration via Streamlit, déploiement Docker et CI/CD.

EHDI Technologies : détection de fraude bancaire, intégration via API Flask et gestion PostgreSQL.

Generali France : optimisation de pipelines ETL et automatisation d’extractions de contrats pour l’équipe Data & Actuariat.

Je me suis récemment certifié sur dbt, renforçant mon expertise en modélisation et transformation de données. J’ai également développé un LLM Vanna SQL pour l’interprétation de requêtes et publié un tutoriel complet sur dbt. Mon portfolio illustre mes réalisations en PySpark, CI/CD et automatisation.

Compétences clés :

Data Engineering : ETL, Spark, AWS(bases), dbt, CI/CD avec GitHub Actions.

Automation & QA : pre-commit, Makefile, pytest, pyproject.toml, pre-config.yml..

Bases de données : SQL, BigQuery, Oracle, MySQL, PostgreSQL.

Machine Learning : régression, classification, prédiction.

Langages : Python, R, PySpark.

Backend & API : Flask REST-API, Streamlit

IA Générative : LLM avec Vanna SQL

Visualisation : Streamlit, Plotly, dashboards interactifs.

Ce que je propose :

Analyse et valorisation de vos données.

Mise en place de pipelines reproductibles et auditables.

Développement de modèles ML adaptés à vos besoins métiers.

Automatisation et documentation exhaustive pour garantir qualité et fiabilité.

Ámbito de especialización en el sector

Idiomas

Francés
Competencia profesional completa
Inglés
Competencia profesional básica
Wólof
Bilingüe o nativo

Preferencias de lugar de trabajo

Acepta trabajo presencial

Ermont (hasta 50 km), Paris (hasta 50 km), Paris 10e Arrondissement (hasta 50 km)

Banque de Dakar
Data Engineer Confirmé
BANCA & SEGUROS
abril de 2022 - febrero de 2026 (3 años y 10 meses)
Conception et maintien de pipelines PySpark/SQL (ingestion → transformation → tables exploitables) pour usages BI/analytics.
• Optimisation des traitements (réduction temps de run, gestion volumétrie) : filtres, partitionnement, tuning Spark.
• Data quality : contrôles (complétude, cohérence), jeux de tests automatisés, traçabilité et standardisation des jobs.
• Collaboration équipes BI/IT : clarification besoins, adaptation des modèles, livraison itérative.

Stack : Python, PySpark, SQL, PostgreSQL/Oracle, Hadoop (HDFS), Docker, Git, CI/CD, pytest
PySpark Python SQL PostgreSQL Hadoop
AxioConseils
Data Engineer / ML Engineer
AGENCIAS DE SUBCONTRATACIÓN
marzo de 2021 - abril de 2022 (1 año y 1 mes)
Paris, Francia
Conception et réalisation d'un POC visant à anticiper et prédire les risques de sinistres automobiles
La mise en place des processus permettant de bien démarrer le projet
Prétraitement des données et développement de modèles de prédiction de sinistres (LightGBM), atteignant un F1-score de 0.9
Containerisation avec Docker et déploiement d'API via Streamlit + PostgreSQL
Environnement : Python, Pandas, Scikit-learn, Streamlit, Docker, PostgreSQL,
Git, Makefile, pre-commit
Scikit-learn Streamlit Docker PostgreSQL Pandas
eHDI Technologies
Data Engineer
AGENCIAS DE SUBCONTRATACIÓN
enero de 2020 - febrero de 2021 (1 año y 1 mes)
Paris, Francia
Cartographie des sources de données et des flux pour un énergéticien européen
Analyse de la qualité des données (complétude, cohérence, doublons) et définition de KPIs de data quality.
Élaboration d’une feuille de route d’amélioration alignée avec la trajectoire cible data & analytics (architecture, gouvernance).
Environnement : Python , Pandas, PostgreSQL/Oracle, Git
PostgreSQL Git Pandas Oracle

Consulta todas las experiencias de Souleymane

Frank

AXIO CONSEILS

Revisado el 10/10/2021

Sé el primero en recomendar a Souleymane

Ayuda a este freelance a destacar compartiendo tu experiencia.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Registrarse para verlos

Inégnieur Généraliste spécalisé en système d'informations - Parcours Data Science
IMT- ATLANTIQUE
2019
Le filière data science forme les futurs ingénieurs de l'IA sur les concepts et techniques indipensables pour bien mener un projet en data. J'avait le choix de 5 formations qui sont: - Machine Learning et Statistiques( Principes et Fondamentaux des algos, Méthode d'optimisation, tests d'hypothéses, etc...) - Business Intelligence (TALEND, TABLEAU) - Data Mining (EDA python, CRISP-DM) - Computer Vision avec Open-CV ( Tracking objects, Etude avané de l'image) - Deep Learning (MLP, Carte de koenan)

Coursera_Certificat_Machine_Learning
Coursera
2018
https://www.coursera.org/account/accomplishments/verify/VDKDKHNKLV86
Machine learning Python Matlab
Les Fondamentaux du Big Data
Fun-Mooc
2019
Big Data

Las certificaciones de Souleymane sólo están disponibles para los miembros de Malt

Souleymane Sow

Data Engineer | Python | PySpark| SQL| Docker| DBT

Acerca de Souleymane

Experiencia

Reseñas

5,0

Calidad

5,0

Fecha límite

5,0

Comunicación

5,0

Frank

Recomendaciones

Estos perfiles de freelance también coinciden con tus criterios

Formación

Certificados

Conjunto de habilidades profesionales

Categorías