رسالة جامعية

Chaînes de traitement pour la détection de concepts dans le contexte de l'analyse conceptuelle philosophique basée sur des données textuelles

التفاصيل البيبلوغرافية
العنوان: Chaînes de traitement pour la détection de concepts dans le contexte de l'analyse conceptuelle philosophique basée sur des données textuelles
المؤلفون: Chartrand, Louis
الملخص: Dans les dernières années, l'analyse conceptuelle en philosophie a pris un tournant empirique, notamment avec l'essor de la philosophie expérimentale et, plus localement, de la Lecture et analyse conceptuelle de texte assistée par ordinateur (LACTAO), ouvrant ici la porte au développement d'un type d'analyse conceptuelle basée sur l'étude des corpus de données textuelles. Cependant, certains défis techniques viennent encore freiner l'essor de ce type de méthode. En particulier, l'heuristique couramment employée pour détecter la présence d'un concept dans le texte, l'heuristique du mot-clé, tend à exclure systématiquement certains contextes où le concept est employé implicitement, et à inclure des contextes où le ou les mots que l'on associe habituellement à un concept sont employés dans un sens très différent. La présente thèse attaque ce problème en deux étapes, qui sont présentées dans trois articles. Dans une première étape, on discute les notions principales de cette question - ANALYSE CONCEPTUELLE et CONCEPT - afin d'interpréter le problème de la détection de la présence du concept dans le texte. Un portrait du type d'analyse conceptuelle philosophique susceptible de prendre en compte des données empiriques est avancé, et sur la base de celui-ci, on énonce un problème pour le concept de CONCEPT. Une solution est alors proposée en puisant dans la téléosémantique de Millikan ( 1984), et on montre comment son application permet à la fois de faire un protocole d'annotation pour la détection de la présence du concept dans le texte, et de proposer des avenues d'automatisation pour la même tâche. Dans une deuxième étape, des chaînes de traitement exploitant des modèles topiques sont conçues et sont évaluées. Pour l'évaluation de celles-ci, un protocole d'annotation est conçu et soumis à des participant-es. Deux ensembles de chaînes de traitement sont ensuite testées, l'un reposant sur l'allocation de Dirichlet latente (LDA) de Blei et al. (2003) et l'autre reposant sur le Latent Concept Topic Model de Hu et Tsujii (2016). Les résultats des chaînes de traitement des deux ensembles s'avèrent mieux corrélées avec les jugements humains que l'heuristique du mot-clé, mais les meilleurs résultats viennent de chaînes construites à partir de la LCTM, dont certaines sont également plus flexibles dans la formulation du concept ciblé qu'elles permettent. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : philosophie expérimentale, analyse conceptuelle, LACTAO, modèle topique, enrobages de mots, sémantique distributionnelle
URL: http://archipel.uqam.ca/13386/1/D3636.pdfTest
قاعدة البيانات: OpenDissertations