Tu trouveras ci dessous les sujets de stage que nous proposons sur la thématique Data Science et IA. Tu peux choisir le sujet de ton choix et nous communiquer le numéro correspondant du sujet sélectionné lors de l'entretien.
- 2 Intégration et utilisation des open source et langages R et Python
Ce stage consistera à proposer des solutions d’intégration de logiciels open sources data science dans notre plateforme et à identifier les meilleurs moyens de communiquer les données et les traitements entre les deux mondes.
Votre mission englobe également le développement et l'entraînement de modèles de détection de la fraude, en recourant à des frameworks de pointe tels que TensorFlow ou PyTorch. L'évaluation de ces modèles repose sur des métriques rigoureuses, telles que la précision, le rappel et le F1-score, afin d'assurer des performances optimales.
L'optimisation occupe une place centrale dans notre démarche. Nous visons à exploiter des techniques d'optimisation spécifiquement conçues pour les GPUs, accélérant ainsi le processus d'entraînement et d'inférence, améliorant l'efficacité globale de nos solutions.
Ce stage nécessite une connaissance minimale des langages utilisés en Data Science (python, R, Spark, etc.) et une compréhension des mécanismes d’échanges entre process indépendants. Les développements pourront se faire en C++ ou Java.
- 3 Apprentissage sur des données censurées
Dans notre quête pour renforcer nos systèmes anti-fraude, nous nous confrontons à des défis passionnants. L'un d'eux réside dans la nécessité de traiter des données tronquées, car les fraudeurs se heurtent à des obstacles dans leurs tentatives.
Si vous êtes avide d'innovation, ce stage offre une opportunité unique. Vous serez immergé dans le monde captivant de la lutte contre la fraude bancaire, où vous étudierez et implémenterez des méthodes pour gérer ces données censurées dans notre logiciel. Concevez des solutions qui repoussent les limites et adaptent ces techniques pour détecter la fraude.
Votre aventure comprendra une exploration approfondie de la recherche existante, la création de prototypes innovants et l'application de ces méthodes à partir de données transactionnelles converties en signaux.
À vous de relever ce défi excitant et de tracer votre voie vers l'excellence technologique !
- 4 Élagage d’arbres sur données déséquilibrées
Les arbres sont des techniques incontournables de classification. Nous constatons leur très grande force sur des sujets variés. Toutefois ils peuvent être sujet à de l’overfitting. Un moyen de le contourner et d’élaguer les arbres pour trouver des modèles plus robustes.
Le but du stage est d’étudier et d’implémenter une ou plusieurs méthodes d’élagage d’arbres sur des données déséquilibrées dans notre logiciel de Data Science et de l’adapter à la détection de la fraude bancaire.
Ce sujet comprend un travail de recherche bibliographique afin d’être à l’état de l’art de cette discipline, la mise en prototype de cette technique et l’application de cette méthode sur la problématique de la lutte contre la fraude bancaire à partir de données transactionnelles.