Attention, les informations que vous consultez actuellement ne sont pas celles de l'année en cours. Consulter l'année universitaire 2022-2023.

UE384 - Des statistiques à l'intelligence artificielle. Approche historique et pratique du numérique, application en médecine légale


Lieu et planning


  • 105 bd Raspail
    105 bd Raspail 75006 Paris

    mercredi 9 décembre 2020, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 13 janvier 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 10 février 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 10 mars 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 14 avril 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 12 mai 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)


Description


Dernière modification : 7 avril 2021 17:38

Type d'UE
Séminaires DR/CR
Disciplines
Méthodes et techniques des sciences sociales, Sociologie
Page web
-
Langues
français
Mots-clés
Histoire des sciences et des techniques Humanités numériques Informatique et sciences sociales Intelligence artificielle Médecine Numérique Santé
Aires culturelles
-
Intervenant·e·s
  • Thomas Lefèvre [référent·e]   maître de conférences, Université Sorbonne Paris Nord / Institut de recherche interdisciplinaire sur les enjeux sociaux (IRIS)
  • Philippe Terral   maître de conférences, Université Toulouse III-Paul Sabatier

Ce séminaire propose d'aborder des éléments de l'évolution de la quantification au travers ses emplois sociohistoriques et les outils associés, des registres de recensement et de mortalité jusque l'intelligence artificielle. Le principe du séminaire repose sur deux temps par séance : la matinée est consacrée à l'étude d'un texte historique situant un aspect spécifique de la quantification, mis en perspective avec les représentations et usages de l'époque actuelle ; l'après-midi est consacrée à la manipulation des outils et des concepts vus le matin, sur une base de données de documents de médecine légale, grâce à un outil destiné aux non experts.

Principes et buts du séminaire

  • Grandes notions derrière le numérique : histoire, aspects sociaux, principes techniques et leurs conséquences
  • Avoir des références (articles, livres…)
  • Étudier par différents aspects du numérique et de l’IA un corpus de textes médicaux réels (médecine légale) : appliquer un principe, en faire l’analyse critique

Une séance : commentaire d’un ou deux textes préparés en amont (notés) ; expositions d’un principe du numérique/IA ; applications à la base ORFéAD.

1re séance : introduction. Présentation de la thématique et de la plateforme de formation et d'analyses

2e séance : la quantification et la statistique ; enregistrer et dénombrer

3e séance : visualisation des données massives ; analyse des controverses, scientométrie

4e séance : cause et corrélation ; autour des biais en IA

5e séance : segmentation et idéaux types ; autour de l’interprétabilité des algorithmes

6e séance : enjeux autour des algorithmes prédictifs ; le micro tasking


Master


  • Séminaires de recherche – Savoirs en sociétés-Santé, médecine et questions sociales – M1/S1-S2-M2/S3-S4
    Suivi et validation – annuel mensuelle = 6 ECTS
    MCC – synthèse finale courte (5 pages), exposé oral
  • Séminaires de recherche – Sciences sociales-Pratiques de l'interdisciplinarité en sciences sociales – M1/S1-S2-M2/S3-S4
    Suivi et validation – annuel mensuelle = 6 ECTS
    MCC – synthèse finale courte (5 pages), exposé oral
  • Séminaires de recherche – Sciences sociales-Quantifier en sciences sociales – M1/S1-S2-M2/S3-S4
    Suivi et validation – annuel mensuelle = 6 ECTS
    MCC – synthèse finale courte (5 pages), exposé oral

Renseignements


Contacts additionnels
lefevre.thomas@gmail.com estelle.girard@ehess.fr
Informations pratiques

Le séminaire est ouvert aux étudiants des masters associés, mais également à tout autre étudiant de l'École ou extérieur, sur inscription préalable auprès de T. Lefèvre ou E. Girard. Il donne lieu à validation soit de 3 ECTS pour les étudiants suivant 3 des 6 séances, soit à 6 ECTS pour les étudiants suivant l'ensemble des séances.

Direction de travaux des étudiants
-
Réception des candidats

Contacter Thomas Lefèvre. Dates et horaires selon calendrier à venir, au cas par cas.

Pré-requis

Le séminaire ne s'adresse pas aux experts en statistiques ou en techniques du machine learning / intelligence artificielle.

Il s'adresse avant tout aux personnes désireuses d'aborder la thématique du numérique (quantification, algorithmes) via un abord socio historique, et une initiation aux techniques clés (des statistiques à l'IA) avec un outil adapté aux non initiés. La curiosité et la motivation pour la thématique sont donc les pré-requis principaux.

Le séminaire s'adresse également aux internes ou médecins légistes, ou tout autre personne intéressée par l'utilisation des données médicales en médecine légale, selon plusieurs approches.

Le séminaire participe des enseignements autour du PRI IA et SHS de l'Ecole ; il a déjà été un passage intéressant pour les étudiants désireux de poursuivre en thèse sur le thème de l'IA.


Compte rendu


Le séminaire a pu regrouper des participants d’horizons disciplinaires et de niveaux de formation différents comme complémentaires : médecins et sociologues, en master ou en doctorat. La méthode de travail mise en place a été hautement participative et interactive, permettant une co-construction de l’enseignement et de la réflexion autour du numérique au sens large : depuis le recours à la catégorisation et à la quantification, en particulier par les organismes publics, jusqu’à l’étude des rouages concrets de l’IA et de ses méthodes. Des binômes étaient créés, associant systématiquement médecin et sociologue, pour un regard croisé. Chaque séance a permis de présenter un aspect en lien avec la thématique annoncée – par exemple, l’analyse critique et le commentaire de textes de Desrosières dans le cadre de la séance sur la quantification et la statistique. Cette approche a permis d’ancrer systématiquement les propos dans des productions scientifiques de référence et historiques, pour aussitôt les transposer dans le contexte contemporain et en analyser les expressions actuelles. Chaque binôme présentait de la sorte son analyse, à l’attention des autres participants, qui avaient alors pour rôle de questionner l’interprétation des exposants ; les rôles s’inversant ensuite. Le responsable de l’enseignement pouvait ainsi orienter les discussions, revenir sur des aspects soulignés ou au contraire moins remarqués par les participants, et enfin synthétiser avec eux les éléments principaux et remarquables de la séance.

Ceci étant, ces travaux, même ancrés dans des références scientifiques et contextualisées par des exemples actuels, ce qui permettaient de discuter de la pertinence des concepts proposés par ces références, leur évolution éventuelle à la lumière des exemples proposés, ne suffisent pas à s’affranchir d’une certaine abstraction propre au débat. Aussi, nous avons eu recours à des données réelles, c’est-à-dire, que l’on a pu expliquer les différents processus mais aussi les grilles de lecture, de présentation qui ont amené à la mise à disposition de données issues de consultations médicolégales. Il a ainsi pu être discuté, de bout en bout, les contextes de production de la donnée, la place du numérique dans ces contextes de production : depuis la rencontre entre une personne et un médecin, le motif de cette rencontre, le déroulé de cette rencontre singulière, la production d’un document très particulier qu’est le certificat médical… jusqu’à l’analyse des algorithmes permettant d’extraire des données, de les structurer, mais aussi d’évaluer une certaine forme de qualité des données produites et présentées à l’analyse du chercheur. Les participants ont pu utiliser une plateforme d’analyse de données destinée aux non-experts en statistique ou IA, afin d’approcher tant les données, que les manières de les présenter ou d’en restituer des informations dérivées. La plateforme permettait de suivre une trajectoire historique là encore en termes de quantification, de numérisation et d’utilisation de traitements statistiques et mathématiques : nous sommes partis de la discussion des indicateurs classiques que sont les moyennes, médianes, proportions… pour arriver à la manipulation d’algorithmes de machine/structure learning, tels que les réseaux bayésiens, ou encore d’algorithmes dits « prédictifs ».

Chaque séance était donc préparée en avance par les binômes, donnant lieu à la production d’un texte équivalent à une dizaine de pages rédigées ou semi rédigées par séance. La participation et l’implication des étudiants ont été excellentes et tout à fait stimulantes pour l’ensemble du groupe. Un projet d’ouvrage collectif, basé sur les interventions des binômes à chaque séance, est en cours.

Publications

-

Dernière modification : 7 avril 2021 17:38

Type d'UE
Séminaires DR/CR
Disciplines
Méthodes et techniques des sciences sociales, Sociologie
Page web
-
Langues
français
Mots-clés
Histoire des sciences et des techniques Humanités numériques Informatique et sciences sociales Intelligence artificielle Médecine Numérique Santé
Aires culturelles
-
Intervenant·e·s
  • Thomas Lefèvre [référent·e]   maître de conférences, Université Sorbonne Paris Nord / Institut de recherche interdisciplinaire sur les enjeux sociaux (IRIS)
  • Philippe Terral   maître de conférences, Université Toulouse III-Paul Sabatier

Ce séminaire propose d'aborder des éléments de l'évolution de la quantification au travers ses emplois sociohistoriques et les outils associés, des registres de recensement et de mortalité jusque l'intelligence artificielle. Le principe du séminaire repose sur deux temps par séance : la matinée est consacrée à l'étude d'un texte historique situant un aspect spécifique de la quantification, mis en perspective avec les représentations et usages de l'époque actuelle ; l'après-midi est consacrée à la manipulation des outils et des concepts vus le matin, sur une base de données de documents de médecine légale, grâce à un outil destiné aux non experts.

Principes et buts du séminaire

  • Grandes notions derrière le numérique : histoire, aspects sociaux, principes techniques et leurs conséquences
  • Avoir des références (articles, livres…)
  • Étudier par différents aspects du numérique et de l’IA un corpus de textes médicaux réels (médecine légale) : appliquer un principe, en faire l’analyse critique

Une séance : commentaire d’un ou deux textes préparés en amont (notés) ; expositions d’un principe du numérique/IA ; applications à la base ORFéAD.

1re séance : introduction. Présentation de la thématique et de la plateforme de formation et d'analyses

2e séance : la quantification et la statistique ; enregistrer et dénombrer

3e séance : visualisation des données massives ; analyse des controverses, scientométrie

4e séance : cause et corrélation ; autour des biais en IA

5e séance : segmentation et idéaux types ; autour de l’interprétabilité des algorithmes

6e séance : enjeux autour des algorithmes prédictifs ; le micro tasking

  • Séminaires de recherche – Savoirs en sociétés-Santé, médecine et questions sociales – M1/S1-S2-M2/S3-S4
    Suivi et validation – annuel mensuelle = 6 ECTS
    MCC – synthèse finale courte (5 pages), exposé oral
  • Séminaires de recherche – Sciences sociales-Pratiques de l'interdisciplinarité en sciences sociales – M1/S1-S2-M2/S3-S4
    Suivi et validation – annuel mensuelle = 6 ECTS
    MCC – synthèse finale courte (5 pages), exposé oral
  • Séminaires de recherche – Sciences sociales-Quantifier en sciences sociales – M1/S1-S2-M2/S3-S4
    Suivi et validation – annuel mensuelle = 6 ECTS
    MCC – synthèse finale courte (5 pages), exposé oral
Contacts additionnels
lefevre.thomas@gmail.com estelle.girard@ehess.fr
Informations pratiques

Le séminaire est ouvert aux étudiants des masters associés, mais également à tout autre étudiant de l'École ou extérieur, sur inscription préalable auprès de T. Lefèvre ou E. Girard. Il donne lieu à validation soit de 3 ECTS pour les étudiants suivant 3 des 6 séances, soit à 6 ECTS pour les étudiants suivant l'ensemble des séances.

Direction de travaux des étudiants
-
Réception des candidats

Contacter Thomas Lefèvre. Dates et horaires selon calendrier à venir, au cas par cas.

Pré-requis

Le séminaire ne s'adresse pas aux experts en statistiques ou en techniques du machine learning / intelligence artificielle.

Il s'adresse avant tout aux personnes désireuses d'aborder la thématique du numérique (quantification, algorithmes) via un abord socio historique, et une initiation aux techniques clés (des statistiques à l'IA) avec un outil adapté aux non initiés. La curiosité et la motivation pour la thématique sont donc les pré-requis principaux.

Le séminaire s'adresse également aux internes ou médecins légistes, ou tout autre personne intéressée par l'utilisation des données médicales en médecine légale, selon plusieurs approches.

Le séminaire participe des enseignements autour du PRI IA et SHS de l'Ecole ; il a déjà été un passage intéressant pour les étudiants désireux de poursuivre en thèse sur le thème de l'IA.

  • 105 bd Raspail
    105 bd Raspail 75006 Paris

    mercredi 9 décembre 2020, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 13 janvier 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 10 février 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 10 mars 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 14 avril 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)
    mercredi 12 mai 2021, 10:00-12:30 (salle 6) et 14:00-16:30 (salle 9)

Le séminaire a pu regrouper des participants d’horizons disciplinaires et de niveaux de formation différents comme complémentaires : médecins et sociologues, en master ou en doctorat. La méthode de travail mise en place a été hautement participative et interactive, permettant une co-construction de l’enseignement et de la réflexion autour du numérique au sens large : depuis le recours à la catégorisation et à la quantification, en particulier par les organismes publics, jusqu’à l’étude des rouages concrets de l’IA et de ses méthodes. Des binômes étaient créés, associant systématiquement médecin et sociologue, pour un regard croisé. Chaque séance a permis de présenter un aspect en lien avec la thématique annoncée – par exemple, l’analyse critique et le commentaire de textes de Desrosières dans le cadre de la séance sur la quantification et la statistique. Cette approche a permis d’ancrer systématiquement les propos dans des productions scientifiques de référence et historiques, pour aussitôt les transposer dans le contexte contemporain et en analyser les expressions actuelles. Chaque binôme présentait de la sorte son analyse, à l’attention des autres participants, qui avaient alors pour rôle de questionner l’interprétation des exposants ; les rôles s’inversant ensuite. Le responsable de l’enseignement pouvait ainsi orienter les discussions, revenir sur des aspects soulignés ou au contraire moins remarqués par les participants, et enfin synthétiser avec eux les éléments principaux et remarquables de la séance.

Ceci étant, ces travaux, même ancrés dans des références scientifiques et contextualisées par des exemples actuels, ce qui permettaient de discuter de la pertinence des concepts proposés par ces références, leur évolution éventuelle à la lumière des exemples proposés, ne suffisent pas à s’affranchir d’une certaine abstraction propre au débat. Aussi, nous avons eu recours à des données réelles, c’est-à-dire, que l’on a pu expliquer les différents processus mais aussi les grilles de lecture, de présentation qui ont amené à la mise à disposition de données issues de consultations médicolégales. Il a ainsi pu être discuté, de bout en bout, les contextes de production de la donnée, la place du numérique dans ces contextes de production : depuis la rencontre entre une personne et un médecin, le motif de cette rencontre, le déroulé de cette rencontre singulière, la production d’un document très particulier qu’est le certificat médical… jusqu’à l’analyse des algorithmes permettant d’extraire des données, de les structurer, mais aussi d’évaluer une certaine forme de qualité des données produites et présentées à l’analyse du chercheur. Les participants ont pu utiliser une plateforme d’analyse de données destinée aux non-experts en statistique ou IA, afin d’approcher tant les données, que les manières de les présenter ou d’en restituer des informations dérivées. La plateforme permettait de suivre une trajectoire historique là encore en termes de quantification, de numérisation et d’utilisation de traitements statistiques et mathématiques : nous sommes partis de la discussion des indicateurs classiques que sont les moyennes, médianes, proportions… pour arriver à la manipulation d’algorithmes de machine/structure learning, tels que les réseaux bayésiens, ou encore d’algorithmes dits « prédictifs ».

Chaque séance était donc préparée en avance par les binômes, donnant lieu à la production d’un texte équivalent à une dizaine de pages rédigées ou semi rédigées par séance. La participation et l’implication des étudiants ont été excellentes et tout à fait stimulantes pour l’ensemble du groupe. Un projet d’ouvrage collectif, basé sur les interventions des binômes à chaque séance, est en cours.

Publications

-