Bandeau du Laboratoire d'Informatique & Systèmes (LIS)

DANA : Data Mining at scale

Mots clés

Analyse de mégadonnées (Big Data Analytics), données spatio-temporelles, fouille de données structurées ou non structurées, analyse de concepts formels, séries temporelles

Responsable / Co-responsable

Mohamed QUAFAFOU / Alain CASALI

Membres

BOUKENZE BASMA Enseignant/Chercheur
Mme BOUKENZE BASMA
Enseignant/Chercheur
basma.boukenze@lis-lab.fr
Saint-Jérôme, POLYTECH GII
CASALI Alain Enseignant/Chercheur
M. CASALI Alain
Enseignant/Chercheur
alain.casali@lis-lab.fr
Saint-Jérôme, POLYTECH GII
DURAND Nicolas Enseignant/Chercheur
M. DURAND Nicolas
Enseignant/Chercheur
nicolas.durand@lis-lab.fr
04.91.82.86.79 / 04 91 05 60 55
Saint-Jérôme, POLYTECH GII
FLOUVAT FREDERIC Enseignant/Chercheur
M. FLOUVAT FREDERIC
Enseignant/Chercheur
frederic.flouvat@univ-amu.fr
https://flouvat.github.io/
Luminy, AMU TPR2 ET GRAND HALL
JOUINI Rim Enseignant/Chercheur
M. JOUINI Rim
Enseignant/Chercheur
rim.jouini@lis-lab.fr
Saint-Jérôme, POLYTECH GII
LAKHAL Lotfi Enseignant/Chercheur
M. LAKHAL Lotfi
Enseignant/Chercheur
lotfi.lakhal@lis-lab.fr
Saint-Jérôme, POLYTECH GII
LAURENT BURLE GUILLAUME Doctorant
MARTIN-NEVOT Mickael Doctorant
M. MARTIN-NEVOT Mickael
Doctorant
mickael.martin-nevot@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL
NEDJAR Sebastien Enseignant/Chercheur
M. NEDJAR Sebastien
Enseignant/Chercheur
sebastien.nedjar@lis-lab.fr
Saint-Jérôme, POLYTECH GII
PHANLUONG Viet Enseignant/Chercheur
M. PHANLUONG Viet
Enseignant/Chercheur
viet.phanluong@lis-lab.fr
Saint-Jérôme, POLYTECH GII
QUAFAFOU Mohamed Enseignant/Chercheur
M. QUAFAFOU Mohamed
Enseignant/Chercheur
mohamed.quafafou@lis-lab.fr
04 91 05 60 55
Saint-Jérôme, POLYTECH GII
ZOUAOUI zakaria Doctorant
M. ZOUAOUI zakaria
Doctorant
zakaria.zouaoui@lis-lab.fr
Saint-Jérôme, POLYTECH GII

Objectif scientifique

Les objectifs scientifiques de l’équipe DANA portent sur les aspects théoriques et pratiques de l’analyse de mégadonnées. De nos jours, cette problématique représente un enjeu majeur au niveau scientifique, économique et sociétal. Dans ce contexte, nous proposerons des méthodes et des algorithmes en se focalisant plus particulièrement sur les points suivants :

Motifs et Modèles thématiques probabilistes : D’une part, les motifs représentent des relations entre items dont la cooccurrence est observée de façon significative. D’autre part, les modèles thématiques permettent d’expliciter des distributions de probabilités (thèmes) rendant les données observées probables.

Analyse de Concepts Formels (ACF) et Approximation : les algorithmes classiques de construction et de recherche dans les treillis de concepts sont inopérants ou bien leurs performances se dégradent de façon significative lorsqu’ils sont appliqués sur des mégadonnées. Ce problème est un challenge auquel s’attaque l’équipe DANA.

Analyse de données spatio-temporelles : Cette problématique est à la fois cruciale et d’actualité à laquelle toutes les grandes conférences importantes de notre communauté (rang A*-KDD, ECML/PKDD, ICDM, IJCAI) réservent une session dédiée aux données spatiales et /ou temporelles.

Publications de l’équipe

voir les publications