Analyser un corpus Sonal (1/5) - les bases du système d'analyse

Ce tutoriel aborde les conditions préalables pour analyser efficacement ses entretiens avec Sonal, fait le point sur les différents angles d’analyse possibles et se termine par la présentation du système de filtrage, commun à toutes les approches.

Conditions optimales pour l’analyse d’un corpus Sonal

Pour pouvoir tirer profit de la complémentarité des approches proposées par Sonal, il est préférable d’avoir un corpus complet.
Par cela il faut entendre deux choses :

  • Des entretiens encodés thématiquement.

Il faut avoir utilisé l’encodage thématique lors de la retranscription. Cela veut dire ne pas avoir créé un seul extrait de la longueur de l’entretien, mais avoir découpé progressivement des passages dans la bande, en les qualifiant à l’aide de la grille thématique que vous aurez définie.

  • Un corpus contenant les informations clés au sujet des locuteurs

Cela implique d’avoir utilisé la base de données, en créant des variables susceptibles d’intervenir comme éléments distinctifs dans la comparaison des différents entretiens. Par exemple, si vous pensez que le sexe est une caractéristique importante pour éclairer les discours de vos répondants, ajoutez cette variable dans la base de données et renseignez la pour tous; de même avec l’âge et ainsi de suite avec tout ce qui vous semblera potentiellement éclairant, dans la limite de 99 variables. Bien sûr, vous n’êtes pas obligés de vous retrouver dans cette approche, très proche de ce que proposent les logiciels statistiques en matière d’analyse des réponses aux questions ouvertes. Cependant, il me semble toujours préférable de stocker un maximum d’informations au sujet des entretiens, quoi que l’on espère en tirer par la suite.

Base de données Sonal

 

Choisir (ou pas) un angle d’approche des données

Sonal vous propose d’analyser votre corpus de trois (ou quatre) façons. Ces approches peuvent être utilisées en parallèle, tout au long de la construction du corpus.

  •  La première méthode, l’approche qualitative, consistera à trier les extraits retranscrits en fonction de leur thématique, du type d’entretien dont ils sont issus, pour isoler une collection d’extraits que l’on pourra relire et/ou réécouter pour analyse. On pourra aussi trier à l’intérieur des extraits ceux qui contiennent une forme particulière. C’est la fonction de synthèse, à laquelle sera consacré le second tutoriel de la série.
  • La seconde manière, intrinsèquement quantitative, consiste à étudier le vocabulaire utilisé dans les différents extraits, en analysant le vocabulaire spécifique des différents types de locuteurs sur les différents thèmes. On peut ainsi contraster le vocabulaire utilisé en fonction des grilles d’analyses renseignées dans la base de données et dans la liste des thématiques. C’est l’analyse lexicométrique, à laquelle sera consacré le troisième tutoriel.
  • La troisième approche consiste en l’analyse des temps de parole. De par le découpage de la bande lors de la thématisation, il est possible de calculer le temps passé sur les différents thèmes par les différents ( types de) locuteurs. Même si cet outil permet surtout une approche réflexive des matériaux, il peut présenter un certain intérêt. C’est l’analyse chronométrique, qui sera présentée dans le quatrième tutoriel.
  • Enfin, en prévision: l’analyse débitmétrique, qui consistera à compter le nombre de mots par minutes, en se basant sur le rapport entre la durée des extraits et le nombre de mots qu’ils contiennent. Les accélérations, les ralentissements, peuvent faire l’objet d’une analyse, même si l’essentiel reste sans doute à inventer en la matière. Ce sera l’objet du cinquième et dernier tutoriel.

Toutes les analyses proposées par Sonal reposent sur un même principe de filtrage visant à faire ressortir des contrastes. On va systématiquement isoler des sous parties du corpus pour les étudier, soit qualitativement, soit quantitativement, en les comparant au reste du corpus. Cette méthode de filtrage repose sur plusieurs critères combinables, qui fonctionnent tous d’une manière similaire.

 

Comprendre la logique du système de filtrage

On peut voir un corpus encodé dans Sonal comme une sorte de « base de données qualitative » composée d’une collection d’extraits à la fois sonores et textuels. Ces extraits sont représentés par des “briques” de couleurs collées sur la bande et qui valent à la représentation synthétique du corpusle qualificatif de “mur” :

Exemple de corpus Sonal

Toutes les fonctions d’analyse de Sonal reposent sur un principe de filtrage commun : elles supposent un filtrage qui repose sur l’activation ou la désactivation des extraits en fonction des différentes caractéristiques qui leur sont rattachées.

Chaque extrait possède des caractéristiques qui lui sont propres :

•    des coordonnées temporelles spécifiques (les extraits ne se superposent pas)
•    une chaîne de caractères (texte) correspondant à la retranscription

Et d’autres, qu’il partage avec d’autres extraits :
•    une thématique, qui définit notamment sa couleur
•    un entretien, duquel il est issu, et qui lui confère des caractéristiques renseignées dans la base de données.
Dans Sonal, un extrait c’est donc 1) une durée de bande, 2) du texte, 3) une thématique et 4)  des caractéristiques tirées de la base de données où sont enregistrées des informations sur l’entretien duquel est issu l’extrait. C’est sur la base de ces différents attributs que les extraits vont être activés ou non.

Représentation schématique de la "base de données qualitatives"

La première question est donc de savoir comment on active et comment on désactive les extraits.
Il y a trois approches possibles et complémentaires pour activer ou désactiver les extraits :
•    On peut choisir de ne garder actives que certaines thématiques
•    On peut choisir de ne garder actifs que certains entretiens en les choisissant individuellement
•    On peut choisir de ne garder actifs que certains types d’entretiens, en se basant sur les caractéristiques de la base de données.
D’un point de vue graphique, Sonal offre une représentation très intuitive des filtrages puisque les analyses portent sur les extraits “allumés” repérables dans le “mur” du corpus.

Corpus filtré (certaines thématiques et certains entretiens sont désactivés)

Filtrer par thématique

Pour allumer ou éteindre une thématique, un clic gauche sur la thématique considérée dans le volet thématique à gauche de la page suffira. Pour ne garder que cette thématique, utilisez un clic droit. Pour rallumer ou éteindre toutes les thématiques, cliquez sur le bouton on/off situé en haut à gauche du volet thématique. Dans la page de corpus, les extraits dont la thématique a été désactivée disparaissent.

Filtrer par entretien

Les entretiens s’allument et s’éteignent individuellement en cliquant sur le bouton on/off situé à l’extrême gauche de la ligne de l’entretien dans le corpus. Là aussi, le clic droit revient à isoler l’entretien en question et le bouton on/off situé en haut du volet consacré aux entretiens permet l’activation/désactivation collective des entretiens. Un entretien désactivé reste visible mais ses extraits sont grisés.

Filtrer par variables

Le filtrage par variables revient au même que le filtrage par entretien mais procède de manière collective. Au lieu d’activer ou de désactiver les entretiens individuellement, vous pouvez le faire au regard de leurs caractéristiques. Cette fonction passe par l’affichage du tri à plat, qui va vous donner la composition de votre corpus pour les différentes variables.

Après avoir déplié les variables, le clic gauche vous permettra d’allumer ou d’éteindre les entretiens. Attention, ici, le clic droit vous permettra de modifier l’intitulé de la modalité. Le bouton on/off situé en haut du volet vous permettra de remettre le filtrage à zéro.

Filtrage des entretiens en fonction de leurs attributs

En cumulant ou non les caractéristiques de filtrage, vous pourrez donc très facilement sélectionner une collection d’extraits que vous pourrez soumettre à l’une des approches proposées par le logiciel, à commencer par la plus simple, l’analyse thématique.