DANA : Data Mining at scale

Mots clés

Analyse de mégadonnées (Big Data Analytics), données spatio-temporelles, fouille de données structurées ou non structurées, analyse de concepts formels, séries temporelles

 

Responsable / Co-Responsable

Mohamed QUAFAFOU / Alain CASALI

 

 

Membres permanents

CASALI AlainMaitre de Conférences
Courriel : alain.casali@lis-lab.fr
Telephone : 0442939048
CICCHETTI RosineProfesseur des Universités
Courriel : rosine.cicchetti@lis-lab.fr
Telephone : 0442939031
DURAND NicolasMaitre de Conférences
Courriel : nicolas.durand@lis-lab.fr
Telephone : 0491828679
LAKHAL LotfiProfesseur des Universités
Courriel : lotfi.lakhal@lis-lab.fr
Telephone : 0442939043
NEDJAR SébastienMaitre de Conférences
Courriel : sebastien.nedjar@lis-lab.fr
Telephone : 0486090486
Page personnelle : https://pageperso.lis-lab.fr/sebastien.nedjar/
PHANLUONG VietMaitre de Conférences
Courriel : viet.phanluong@lis-lab.fr
Page personnelle : https://pageperso.lis-lab.fr/viet.phanluong/
QUAFAFOU MohamedProfesseur des Universités
Courriel : mohamed.quafafou@lis-lab.fr
Telephone : 0491056055

 

Doctorants

ALMUHISEN FedaATER
Courriel : feda.almuhisen@lis-lab.fr
Page personnelle : http://feda-almuhisen.com/fr/
BENDELLA MeryemDoctorant
Courriel : meryem.bendella@lis-lab.fr
Page personnelle : https://pageperso.lis-lab.fr/meryem.bendella/
MARTIN-NEVOT MickaëlDoctorant
Courriel : mickael.martin-nevot@lis-lab.fr
Telephone : 0442939043
RAHARJO AgusDoctorant
Courriel : agus-budi.raharjo@lis-lab.fr

 

Autres membres

 

Objectif scientifique

Les objectifs scientifiques de l’équipe DANA portent sur les aspects théoriques et pratiques de l’analyse de mégadonnées. De nos jours, cette problématique représente un enjeu majeur au niveau scientifique, économique et sociétal. Dans ce contexte, nous proposerons des méthodes et des algorithmes en se focalisant plus particulièrement sur les points suivants :

Motifs et Modèles thématiques probabilistes : D’une part, les motifs représentent des relations entre items dont la cooccurrence est observée de façon significative. D’autre part, les modèles thématiques permettent d’expliciter des distributions de probabilités (thèmes) rendant les données observées probables.

Analyse de Concepts Formels (ACF) et Approximation : les algorithmes classiques de construction et de recherche dans les treillis de concepts sont inopérants ou bien leurs performances se dégradent de façon significative lorsqu’ils sont appliqués sur des mégadonnées. Ce problème est un challenge auquel s’attaque l’équipe DANA.

Analyse de données spatio-temporelles : Cette problématique est à la fois cruciale et d’actualité à laquelle toutes les grandes conférences importantes de notre communauté (rang A*-KDD, ECML/PKDD, ICDM, IJCAI) réservent une session dédiée aux données spatiales et /ou temporelles.

 

Publications récentes de l’équipe



6 documents

Article dans une revue

  • Feda Almuhisen, Nicolas Durand, Mohamed Quafafou. Detecting behavior types of moving object trajectories. International Journal of Data Science and Analytics, Springer Verlag, 2018, 5 (2-3), pp.169-187. ⟨10.1007/s41060-017-0076-8⟩. ⟨hal-01693308⟩

Communication dans un congrès

  • Meryem Bendella, Mohamed Quafafou. Expansion de requêtes à base de motifs et de Word Embeddings pour améliorer la recherche de microblogs. COnférence en Recherche d'Informations et Applications - CORIA 2019, 16th French Information Retrieval Conference, Mar 2019, Lyon, France. ⟨hal-02090899⟩
  • Feda Almuhisen, Nicolas Durand, Mohamed Quafafou. Sequential Formal Concepts over Time for Trajectory Analysis. IEEE/WIC/ACM International Conference on Web Intelligence (WI 2018), Dec 2018, Santiago, Chile. ⟨hal-01952227⟩
  • Meryem Bendella, Quafafou Mohamed. Classification probabiliste des Tweets Suspects. 25 èmes Rencontres de la Société Francophone de Classification, Sep 2018, Paris, France. ⟨hal-02091005⟩
  • Feda Almuhisen, Nicolas Durand, Leonardo Brenner, Quafafou Mohamed. Prédiction de l'état du trafic routier basée sur les motifs et les chaînes de Markov. 25èmes Rencontres de la Société Francophone de Classification (SFC 2018), Sep 2018, Paris, France. ⟨hal-01858562⟩
  • Meryem Bendella, Feda Almuhisen, Mohamed Quafafou. Geo-FUZZ: Fuzzy-based algorithm for suspicious geo-tagged tweets detection. 2018 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), Jul 2018, Rio de Janeiro, Brazil. ⟨10.1109/FUZZ-IEEE.2018.8491533⟩. ⟨hal-01916832⟩