Attention, les informations que vous consultez actuellement ne sont pas celles de l'année universitaire en cours. Consulter l'année universitaire 2023-2024.

UE535 - PLAD – Analyse textuelle en sociologie et sociologie historique


Lieu et planning


Planning en cours de validation.


Description


Dernière modification : 11 mai 2024 20:12

Type d'UE
Enseignements fondamentaux de master
Disciplines
Sociologie
Page web
-
Langues
français
Mots-clés
Analyse de discours Humanités numériques Méthodes et techniques des sciences sociales Méthodes quantitatives Textes
Aires culturelles
-
Intervenant·e·s

Ce séminaire de pratique des logiciels d’analyse des données porte sur le traitement quantitatif de matériaux textuels en sociologie et sociologie historique : réponses libres à un questionnaire, archives, pages internet, transcriptions, articles de presse ou tout autre corpus documentaire.

Les méthodes abordées permettront  l’exploration d’une grande masse de textes tout comme sa description formelle, à l’aide notamment de la classification hiérarchique descendante, de l’analyse factorielle des correspondances et de l’analyse des similitudes.

Les premières séances présenteront des exemples de travaux utilisant l’analyse textuelle et offriront un aperçu des différentes possibilités, de l'histoire des méthodes et des logiciels. Nous aborderons ensuite les opérations techniques et les choix nécessaires à la constitution d’un corpus : détermination du périmètre, recueil et nettoyage de données variées, sélection des variables et traitements lexicaux préalables. Nous détaillerons les problèmes pratiques qui se posent en fonction de la nature des matériaux recueillis et de leur quantité : passage d’un format audio au format texte, reconnaissance de caractères sur des documents numérisés, webscraping, nettoyage ou traduction automatique de textes, etc. Nous présenterons ensuite la prise en main de différents logiciels ansi que l’interprétation des résultats produits.

Nous commencerons par un logiciel à l'interface graphique, Iramuteq, permettant de reproduire un méthode classique de l'analyse textuelle. Nous verrons ensuite comment reproduire les analyses directement sous R et mettre en oeuvre des méthodes plus poussées, notamment avec les paquets Quanteda et Tidytext. Enfin, nous terminerons le séminaire en présentant la plateforme Cortext, inspirée quant à elle par l'analyse des réseaux.

Aucune connaissance technique préalable n’est requise. La prise en main sous R sera progressivement détaillée. Ce séminaire de pratique des logiciels d'analyse des données est réservé en premier lieu aux étudiant·es du M2 Sociologie.

Le programme détaillé n'est pas disponible.


Master


  • Méthodologie – Sociologie – M2/S3
    Suivi et validation – semestriel hebdomadaire = 6 ECTS
    MCC – contrôle continu

Renseignements


Contacts additionnels
-
Informations pratiques
-
Direction de travaux des étudiants

sur contact préalable par courriel.

Réception des candidats

sur contact préalable par courriel.

Pré-requis

Aucun (un ordinateur portable est conseillé)

Dernière modification : 11 mai 2024 20:12

Type d'UE
Enseignements fondamentaux de master
Disciplines
Sociologie
Page web
-
Langues
français
Mots-clés
Analyse de discours Humanités numériques Méthodes et techniques des sciences sociales Méthodes quantitatives Textes
Aires culturelles
-
Intervenant·e·s

Ce séminaire de pratique des logiciels d’analyse des données porte sur le traitement quantitatif de matériaux textuels en sociologie et sociologie historique : réponses libres à un questionnaire, archives, pages internet, transcriptions, articles de presse ou tout autre corpus documentaire.

Les méthodes abordées permettront  l’exploration d’une grande masse de textes tout comme sa description formelle, à l’aide notamment de la classification hiérarchique descendante, de l’analyse factorielle des correspondances et de l’analyse des similitudes.

Les premières séances présenteront des exemples de travaux utilisant l’analyse textuelle et offriront un aperçu des différentes possibilités, de l'histoire des méthodes et des logiciels. Nous aborderons ensuite les opérations techniques et les choix nécessaires à la constitution d’un corpus : détermination du périmètre, recueil et nettoyage de données variées, sélection des variables et traitements lexicaux préalables. Nous détaillerons les problèmes pratiques qui se posent en fonction de la nature des matériaux recueillis et de leur quantité : passage d’un format audio au format texte, reconnaissance de caractères sur des documents numérisés, webscraping, nettoyage ou traduction automatique de textes, etc. Nous présenterons ensuite la prise en main de différents logiciels ansi que l’interprétation des résultats produits.

Nous commencerons par un logiciel à l'interface graphique, Iramuteq, permettant de reproduire un méthode classique de l'analyse textuelle. Nous verrons ensuite comment reproduire les analyses directement sous R et mettre en oeuvre des méthodes plus poussées, notamment avec les paquets Quanteda et Tidytext. Enfin, nous terminerons le séminaire en présentant la plateforme Cortext, inspirée quant à elle par l'analyse des réseaux.

Aucune connaissance technique préalable n’est requise. La prise en main sous R sera progressivement détaillée. Ce séminaire de pratique des logiciels d'analyse des données est réservé en premier lieu aux étudiant·es du M2 Sociologie.

Le programme détaillé n'est pas disponible.

  • Méthodologie – Sociologie – M2/S3
    Suivi et validation – semestriel hebdomadaire = 6 ECTS
    MCC – contrôle continu
Contacts additionnels
-
Informations pratiques
-
Direction de travaux des étudiants

sur contact préalable par courriel.

Réception des candidats

sur contact préalable par courriel.

Pré-requis

Aucun (un ordinateur portable est conseillé)

Planning en cours de validation.