UE535 - PLAD – Analyse textuelle en sociologie et sociologie historique
Lieu et planning
Attention !
Vous ne pourrez pas accéder à ce séminaire sans avoir préalablement déposé une demande via le lien suivant
(une demande est nécessaire pour chaque séminaire auquel vous souhaitez participer, merci de déposer la demande au plus tard 72 heures avant le début de la première séance) :
https://participations.ehess.fr/demandes/__nouvelle__?seminaire=535.
-
Bâtiment EHESS-Condorcet
EHESS, 2 cours des humanités 93300 Aubervilliers
Salle C267
1er semestre / hebdomadaire, lundi 16:30-18:30
du 14 octobre 2024 au 3 février 2025
Nombre de séances : 12
Description
Dernière modification : 21 octobre 2024 17:38
- Type d'UE
- Enseignements fondamentaux de master
- Disciplines
- Sociologie
- Page web
- -
- Langues
- français
- Mots-clés
- Analyse de discours Humanités numériques Méthodes et techniques des sciences sociales Méthodes quantitatives Textes
- Aires culturelles
- -
Intervenant·e·s
- Thomas Depecker [référent·e] chargé de recherche, INRAE
Ce séminaire de pratique des logiciels d’analyse des données porte sur le traitement quantitatif de matériaux textuels en sociologie et sociologie historique : réponses libres à un questionnaire, archives, pages internet, transcriptions, articles de presse ou tout autre corpus documentaire.
Les méthodes abordées permettront l’exploration d’une grande masse de textes tout comme sa description formelle, à l’aide notamment de la classification hiérarchique descendante, de l’analyse factorielle des correspondances et de l’analyse des similitudes.
Les premières séances présenteront des exemples de travaux utilisant l’analyse textuelle et offriront un aperçu des différentes possibilités, de l'histoire des méthodes et des logiciels. Nous aborderons ensuite les opérations techniques et les choix nécessaires à la constitution d’un corpus : détermination du périmètre, recueil et nettoyage de données variées, sélection des variables et traitements lexicaux préalables. Nous détaillerons les problèmes pratiques qui se posent en fonction de la nature des matériaux recueillis et de leur quantité : passage d’un format audio au format texte, reconnaissance de caractères sur des documents numérisés, webscraping, nettoyage ou traduction automatique de textes, etc. Nous présenterons ensuite la prise en main de différents logiciels ansi que l’interprétation des résultats produits.
Nous commencerons par un logiciel à l'interface graphique, Iramuteq, permettant de reproduire un méthode classique de l'analyse textuelle. Nous verrons ensuite comment reproduire les analyses directement sous R et mettre en oeuvre des méthodes plus poussées, notamment avec les paquets Quanteda et Tidytext. Enfin, nous terminerons le séminaire en présentant la plateforme Cortext, inspirée quant à elle par l'analyse des réseaux.
Aucune connaissance technique préalable n’est requise. La prise en main sous R sera progressivement détaillée. Ce séminaire de pratique des logiciels d'analyse des données est réservé en premier lieu aux étudiant·es du M2 Sociologie.
Le programme détaillé n'est pas disponible.
Master
-
Méthodologie
– Sociologie
– M2/S3
Suivi et validation – semestriel hebdomadaire = 6 ECTS
MCC – contrôle continu
Renseignements
- Contacts additionnels
- -
- Informations pratiques
- -
- Direction de travaux des étudiants
sur contact préalable par courriel.
- Réception des candidats
sur contact préalable par courriel.
- Pré-requis
Aucun (un ordinateur portable est conseillé)
Dernière modification : 21 octobre 2024 17:38
- Type d'UE
- Enseignements fondamentaux de master
- Disciplines
- Sociologie
- Page web
- -
- Langues
- français
- Mots-clés
- Analyse de discours Humanités numériques Méthodes et techniques des sciences sociales Méthodes quantitatives Textes
- Aires culturelles
- -
Intervenant·e·s
- Thomas Depecker [référent·e] chargé de recherche, INRAE
Ce séminaire de pratique des logiciels d’analyse des données porte sur le traitement quantitatif de matériaux textuels en sociologie et sociologie historique : réponses libres à un questionnaire, archives, pages internet, transcriptions, articles de presse ou tout autre corpus documentaire.
Les méthodes abordées permettront l’exploration d’une grande masse de textes tout comme sa description formelle, à l’aide notamment de la classification hiérarchique descendante, de l’analyse factorielle des correspondances et de l’analyse des similitudes.
Les premières séances présenteront des exemples de travaux utilisant l’analyse textuelle et offriront un aperçu des différentes possibilités, de l'histoire des méthodes et des logiciels. Nous aborderons ensuite les opérations techniques et les choix nécessaires à la constitution d’un corpus : détermination du périmètre, recueil et nettoyage de données variées, sélection des variables et traitements lexicaux préalables. Nous détaillerons les problèmes pratiques qui se posent en fonction de la nature des matériaux recueillis et de leur quantité : passage d’un format audio au format texte, reconnaissance de caractères sur des documents numérisés, webscraping, nettoyage ou traduction automatique de textes, etc. Nous présenterons ensuite la prise en main de différents logiciels ansi que l’interprétation des résultats produits.
Nous commencerons par un logiciel à l'interface graphique, Iramuteq, permettant de reproduire un méthode classique de l'analyse textuelle. Nous verrons ensuite comment reproduire les analyses directement sous R et mettre en oeuvre des méthodes plus poussées, notamment avec les paquets Quanteda et Tidytext. Enfin, nous terminerons le séminaire en présentant la plateforme Cortext, inspirée quant à elle par l'analyse des réseaux.
Aucune connaissance technique préalable n’est requise. La prise en main sous R sera progressivement détaillée. Ce séminaire de pratique des logiciels d'analyse des données est réservé en premier lieu aux étudiant·es du M2 Sociologie.
Le programme détaillé n'est pas disponible.
-
Méthodologie
– Sociologie
– M2/S3
Suivi et validation – semestriel hebdomadaire = 6 ECTS
MCC – contrôle continu
- Contacts additionnels
- -
- Informations pratiques
- -
- Direction de travaux des étudiants
sur contact préalable par courriel.
- Réception des candidats
sur contact préalable par courriel.
- Pré-requis
Aucun (un ordinateur portable est conseillé)
Attention !
Vous ne pourrez pas accéder à ce séminaire sans avoir préalablement déposé une demande via le lien suivant
(une demande est nécessaire pour chaque séminaire auquel vous souhaitez participer, merci de déposer la demande au plus tard 72 heures avant le début de la première séance) :
https://participations.ehess.fr/demandes/__nouvelle__?seminaire=535.
-
Bâtiment EHESS-Condorcet
EHESS, 2 cours des humanités 93300 Aubervilliers
Salle C267
1er semestre / hebdomadaire, lundi 16:30-18:30
du 14 octobre 2024 au 3 février 2025
Nombre de séances : 12