UE524 - PLAD – Analyse textuelle en sociologie et sociologie historique


Lieu et planning


  • Bâtiment EHESS-Condorcet
    EHESS, 2 cours des humanités 93300 Aubervilliers
    Salle C267
    1er semestre / hebdomadaire, lundi 16:30-18:30
    du 23 octobre 2023 au 5 février 2024

    Pas de séance les 18 décembre 2023 et 8 janvier 2024


Description


Dernière modification : 3 juillet 2023 14:17

Type d'UE
Enseignements fondamentaux de master
Disciplines
Méthodes et techniques des sciences sociales, Sociologie
Page web
-
Langues
français
Mots-clés
Méthodes et techniques des sciences sociales Méthodes quantitatives Textes
Aires culturelles
-
Intervenant·e·s

Ce séminaire de pratique des logiciels d’analyse des données porte sur le traitement quantitatif de matériaux textuels en sociologie et sociologie historique : réponses libres à un questionnaire, archives, pages internet, transcriptions, articles de presse ou tout autre corpus documentaire.

Le logiciel libre Iramuteq, interface de R, permet l’exploration d’une grande masse de textes tout comme sa description formelle, à l’aide notamment de la classification hiérarchique descendante, de l’analyse factorielle des correspondances et de l’analyse des similitudes. Il permet de définir des « classes lexicales », de représenter leur opposition ou leur rapprochement, et d’en dégager les facteurs. Il sera au centre du séminaire, mais d'autres outils, comme la plateforme Cortext reposant sur l’analyse de réseau, seront également abordés.

Les premières séances présenteront des exemples de travaux utilisant l’analyse textuelle et offriront un aperçu des différentes possibilités. Nous aborderons ensuite les opérations techniques et les choix nécessaires à la constitution d’un corpus : détermination du périmètre, recueil et nettoyage de données variées, sélection des variables et traitements lexicaux préalables. Nous détaillerons les problèmes pratiques qui se posent en fonction de la nature des matériaux recueillis et de leur quantité : passage d’un format audio au format texte, reconnaissance de caractères sur des documents numérisés, webscraping, nettoyage ou traduction automatique de textes, etc. Nous présenterons ensuite la prise en main d’Iramuteq puis de Cortext ainsi que l’interprétation des résultats produits. La dernière partie de l’atelier sera dédiée aux travaux des étudiante.s, sur la base de corpus en rapport avec leur recherche.

Aucune connaissance technique préalable n’est requise. Ce séminaire de pratique des logiciels d'analyse des données est réservé en premier lieu aux étudiant·es du M2 Sociologie.

Programme détaillé à venir.


Master


  • Méthodologie – Sociologie – M2/S3
    Suivi et validation – semestriel hebdomadaire = 6 ECTS
    MCC – contrôle continu

Renseignements


Contacts additionnels
-
Informations pratiques
-
Direction de travaux des étudiants

sur contact préalable par courriel.

Réception des candidats

sur contact préalable par courriel.

Pré-requis

aucun.

Dernière modification : 3 juillet 2023 14:17

Type d'UE
Enseignements fondamentaux de master
Disciplines
Méthodes et techniques des sciences sociales, Sociologie
Page web
-
Langues
français
Mots-clés
Méthodes et techniques des sciences sociales Méthodes quantitatives Textes
Aires culturelles
-
Intervenant·e·s

Ce séminaire de pratique des logiciels d’analyse des données porte sur le traitement quantitatif de matériaux textuels en sociologie et sociologie historique : réponses libres à un questionnaire, archives, pages internet, transcriptions, articles de presse ou tout autre corpus documentaire.

Le logiciel libre Iramuteq, interface de R, permet l’exploration d’une grande masse de textes tout comme sa description formelle, à l’aide notamment de la classification hiérarchique descendante, de l’analyse factorielle des correspondances et de l’analyse des similitudes. Il permet de définir des « classes lexicales », de représenter leur opposition ou leur rapprochement, et d’en dégager les facteurs. Il sera au centre du séminaire, mais d'autres outils, comme la plateforme Cortext reposant sur l’analyse de réseau, seront également abordés.

Les premières séances présenteront des exemples de travaux utilisant l’analyse textuelle et offriront un aperçu des différentes possibilités. Nous aborderons ensuite les opérations techniques et les choix nécessaires à la constitution d’un corpus : détermination du périmètre, recueil et nettoyage de données variées, sélection des variables et traitements lexicaux préalables. Nous détaillerons les problèmes pratiques qui se posent en fonction de la nature des matériaux recueillis et de leur quantité : passage d’un format audio au format texte, reconnaissance de caractères sur des documents numérisés, webscraping, nettoyage ou traduction automatique de textes, etc. Nous présenterons ensuite la prise en main d’Iramuteq puis de Cortext ainsi que l’interprétation des résultats produits. La dernière partie de l’atelier sera dédiée aux travaux des étudiante.s, sur la base de corpus en rapport avec leur recherche.

Aucune connaissance technique préalable n’est requise. Ce séminaire de pratique des logiciels d'analyse des données est réservé en premier lieu aux étudiant·es du M2 Sociologie.

Programme détaillé à venir.

  • Méthodologie – Sociologie – M2/S3
    Suivi et validation – semestriel hebdomadaire = 6 ECTS
    MCC – contrôle continu
Contacts additionnels
-
Informations pratiques
-
Direction de travaux des étudiants

sur contact préalable par courriel.

Réception des candidats

sur contact préalable par courriel.

Pré-requis

aucun.

  • Bâtiment EHESS-Condorcet
    EHESS, 2 cours des humanités 93300 Aubervilliers
    Salle C267
    1er semestre / hebdomadaire, lundi 16:30-18:30
    du 23 octobre 2023 au 5 février 2024

    Pas de séance les 18 décembre 2023 et 8 janvier 2024