You are on page 1of 12

Great Expectations

mthodes quali-quantitative et
analyse des rseaux sociaux
Tommaso Venturini

Les ennuis de la richesse


Depuis quelques annes, les sciences sociales se retrouvent dans une situation
tout fait nouvelle. Relativement jeunes et encore prcairement tablies, ces sciences
taient loin de se doter des normes machines donnes des sciences naturelles.
Contrairement aux physiciens jonglant avec des milliards de particules dans leurs
acclrateurs ou aux biologistes cultivant des millions de microbes sous leurs
microscopes, les sociologues ne pouvaient suivre que quelques centaines dtres
humains et taient condamns deviner la forme des phnomnes collectifs par ces
aperus partiels.
Face cette difficult, les sciences sociales avaient introduit dans leur monde
une distinction qui sadaptait fort bien leur manque de donnes. En distinguant
micro-interactions et macro-structures, les sociologues staient creuses deux niches
confortables. Dun ct, les qualitativistes pouvaient sintresser la vie intime des
communauts locales, quils dessinaient comme bien spcifiques et bien dlimites.
De lautre, les quantitativistes pouvaient esquisser les grandes tendances globales
sans se proccuper des dtails (Creswell, 2002). Bien sr, tout le monde savait que la
distinction tait fictive (Latour, 2005) et que la plupart des phnomnes collectifs se
passent entre ces deux niveaux (Giddens, 1986). Et pourtant, faute de donnes qui
leurs auraient permis de retracer comment des milliers dinteractions locales
sassemblent pour former des structures globales, les sociologues se sont installs
dans leurs niches micro ou macro.
Dans les dix dernires annes, tout cela a t bouscul par larrive des mdias
numriques. Les mdias numriques ont une caractristique intressante : toutes les
interactions qui les traversent y laissent des traces et ces traces peuvent tre
facilement enregistres, conserves et retransmises. La traabilit des mdias
numriques a des consquences capitales, non seulement pour la vie prive des
individus, mais aussi pour les sciences sociales (Lazer et al., 2009). Au fur et mesure
que le numrique infiltre les socits modernes, la vie collective devient de plus en
plus traable (Mitchell, 2009). Jour aprs jour, de nouveaux rservoirs de donnes
numriques sont rendus accessibles aux chercheurs: les archives publiques et prives
sont avales par la mmoire des ordinateurs, les transactions conomiques migrent
en ligne, les rseaux sociaux senracinent dans le web. La mdiation numrique
stale comme un immense papier-carbone offrant aux sciences sociales plus de
donnes quelles nen ont jamais rv (Rogers, 2009).
Soudainement, les sciences sociales se retrouvent confrontes autant de
donnes que les sciences naturelles, mais avec une diffrence cruciale : les sciences
sociales nont rien fait pour le mriter. Elles nont pas construit leurs radiotlescopes,

leurs microscopes lectroniques, leurs squenceurs. Les donnes numriques que les
sciences sociales commencent explorer ont t recueillies pour des finalits autres
que la recherche scientifique. Il sagit, au contraire, dinformations rcoltes pour des
besoins de marketing (comme dans le cas des cartes de fidlit ou des cartes
bancaires), de surveillance (comme dans le cas des dplacements ariens),
doptimisation techniques (comme dans le cas des rseaux de tlcommunication) ou
tout simplement parce que leur cot est marginal (comme dans le cas de logs des
serveurs Internet). En tout cas, il sagit de donnes doccasion, quinvestissent les
sciences sociales sans que les chercheurs ne puissent matriser leur production et
surtout sans que les chercheurs puissent sy prparer. La situation des sciences
sociales ressemble celle de certains pays ruraux pousss une brusque
industrialisation par les pressions de lconomie internationale. Nes dans une
poque de pnurie, les sciences sociales accdent lge de labondance trop vite et
sans prparation.
Au mdialab de Sciences Po, nous sommes coutumier du fait davoir trop de
donnes. Pas un jour ne passe sans que quelquun de notre quipe ne tombe sur une
nouvelle base de donnes en ligne : hier celle de lOCDE (stats.oecd.org), aujourdhui
celle de Twitter (an.kaist.ac.kr/traces/WWW2010.html). Pas un jour sans quun de
nos partenaires ne nous propose de partager la rflexion sur leurs donnes : lAgence
France Presse, IPSOS, Exalead, Linkfluence. Pas un jour sans quun chercheur de
Sciences Po ne demande notre aide pour archiver les matriaux dune enqute
qualitative, traiter les donnes dune ngociation internationale, analyser les milliers
de pages publies par les institutions qui soccupent de sant, de scurit, de
migration... Face une telle abondance, on se sent comme des voleurs qui, ayant
pntrs dans le coffre-fort dune banque, ralisent quils nont pas les forces pour
transporter leur butin.
Les donnes sont l, disponibles et copieuses comme elles ne lont jamais t,
mais cela nimplique pas que le travail des chercheurs soit plus facile. Les donnes
sont l, mais avant de les exploiter il faut se poser et leur poser toutes sortes de
questions. Si la banque mondiale met en ligne ses donnes statistiques
(data.worldbank.org), encore faut-il chercher savoir comment ces donnes ont t
constitues et saisir les raisons de leur divulgation. Si American Online publie par
erreur
vingt
millions
de
requtes

son
moteur
de
recherche
(en.wikipedia.org/wiki/AOL_search_data_scandal), il faut se demander si
lutilisation de ces donnes est thiquement correcte (Ess C. and AoIR ethics working
committee, 2002). Si Wikipedia met disposition une API pour tlcharger tous ses
articles (avec lhistoire complte de leur rdaction) (mediawiki.org/wiki/API), il faut
rflchir sur le statut pistmique des traces de cette entreprise collective (Viegas,
Wattenberg, Kriss, & Van Ham, 2007).
Les donnes sont l, mais il faut savoir les extraire, les nettoyer, les indexer, les
prparer lanalyse. Il faut, en dautres termes, les constituer en corpus. Le fait que
de plus en plus de donnes soient disponibles grce la traabilit du numrique ne

signifie pas quelles soient plus faciles traiter. En ce sens on peut dire que les
donnes ne sont jamais donnes, elles sont toujours construites par le travail des
chercheurs. Pour utiliser les mots de Bruno Latour : Dcidment, on ne devrait
jamais parler de "donnes" mais toujours d'"obtenues" (Latour, 1993). Pour tre
exact, ce que les mdias numriques offrent aux sciences sociales ne sont pas des
donnes, mais des traces. Ces traces permettent dobtenir normment dinformations
sur les phnomnes collectifs, mais au prix dtre transformes en donnes par les
chercheurs qui les recueillent.
Enfin et surtout, les donnes sont l, mais il faut disposer doutils danalyse la
hauteur de leur abondance et pour cela les sciences sociales sont encore largement
dmunies. Face aux nouvelles donnes numriques les mthodes traditionnelles se
rvlent compltement inadquates. Dveloppes dans une poque de pnurie, ni les
mthodes quantitatives, ni les mthodes qualitatives ne semblent capables de grer
(et digrer) ce dluge de traces numriques.

Les mthodes quali-quantitatives


En renversant sur les chercheurs une quantit sans prcdents de traces, les
mdias numriques s'imposent la rflexion sociologique. Aucun sociologue ne peut
ignorer que
a. De plus en plus de phnomnes sociaux se passent dsormais primairement
sur les rseaux numriques (par ex. l o les bases des donnes
bibliographiques ont remplac les catalogues papier, les bibliothques
peuvent tracer non seulement l'emprunt des livres, mais aussi leur recherche).
b. Mme les phnomnes qui ne se passent pas primairement sur les rseaux
numriques y laissent souvent des traces (par ex. toutes les fois que nous
achetons un billet d'avions avec une carte frquent flyers ou que nous
utilisons un systme de tlpage sur une autoroute, nos dplacements
physiques deviennent numriquement traables).
c. Les initiatives pour numriser les traces recueillies sur des mdias nonnumriques se multiplient (ce qui permet, par ex, Google de nous offrir une
volumtrie de l'utilisation littraire de n'importe quel mot partir du 1800 et
jusqu' aujourd'hui - ngrams.googlelabs.com, Michel et al., 2010).
Pourtant, si aucun sociologue ne peut ignorer les mdias numriques, aucune
des pratiques classiques de nos disciplines nos prparent la gestion de ce nouveau
type de donnes. Comment faire face aux nouvelles traces? Comment le transformer
en donnes ? Comment traiter sociologiquement les rseaux lectroniques ?
Imaginons, par exemple, que nous nous intressons au succs ou la faillite des
campagnes de vaccination. On sait que la campagne de vaccination contre la grippe
H1N1 a eu des rsultats trs diffrents selon les pays (Lagarde & Door, 2010). Alors
que dans les pays scandinaves une large partie de la population sest soumise la
vaccination (64,5% en Sude, 45% en Norvge), les taux de lEurope continentale sont
beaucoup plus bas (10% en Allemagne, 6,6% en Belgique, 8,5% en France). La plupart

des observateurs attribuent cette disparit de rsultats aux diffrentes dispositions


des opinions publiques l'gard des indications des autorits mdicales nationales
(Keck, 2010). Mais comment investiguer cette hypothse ?
Jusqu il y a quelques annes, les sociologues navaient que deux possibilits :
administrer un questionnaire un chantillon des populations concernes ou
recueillir les discours de quelques individus particulirement intressants. Aucune
de ces mthodes nest exempte de difficults. Le dsavantage de la premire mthode
est que, afin de toucher un chantillon suffisamment large, il faut se contenter dun
questionnaire trs simple, inadapt au caractre htrogne et phmre de lopinion
publique. Le dsavantage de la seconde mthode est que, afin dobserver les
interactions dans le temps et avec le dtail ncessaire, il faut se contenter de suivre un
nombre trs limit dindividus, sans aucune garantie de leur reprsentativit. Jusqu
il y a quelques annes, il fallait choisir : peu dinformations sur beaucoup dacteurs
ou beaucoup dinformations sur peu dacteurs ? Tertium non datur.
Aujourdhui, les chercheurs nont pas besoin de se poser la question. Grce aux
traces numriques, ils peuvent observer dans les dtails les interactions dune vaste
population dindividus. On peut par exemple recueillir sur le web toutes les
conversations autour de la vaccination H1N1. Ou encore on peut sadresser un des
nombreux services commerciaux offrant ce type de veille. Ici, par exemple, lexcellent
service offert par la socit Linkfluence, un des partenaires du mdialab de Sciences
Po :

Fig 1. Exploration des billets des blogs franais mentionnant le mot H1N1 et le mot vaccine ou vaccination
(source linkfluence.net 19/08/10).

Larchive de Linkfluence recueille et sauvegarde tous les flux RSS des sites les
plus influents de la blogosphre (plus de 14.000 sites pour les tats Unis, 11.000 sites
pour la France, 6.000 pour lAngleterre et lAllemagne, 5.000 pour lItalie, 3.000 pour
le Pays Bas) et permet de chercher tous les billets mentionnant un ou plusieurs
mots-cls sur une priode dun an. Grce cette archive, on a donc disposition la

(quasi) intgralit du dbat en ligne sur un sujet donn. Mais comment exploiter cette
masse de donnes ?
Ni les mthodes quantitatives ni les mthodes qualitatives ne semblent capables
de profiter pleinement de labondance de ces nouvelles traces numriques. Avec les
mthodes quantitatives on pourrait faire merger quelques tendances globales :
dmontrer, par exemple, quil y a corrlation entre les taux de vaccination et le dbat
public sur le web autour des risques de la maladie ou du vaccin. Toutefois,
lagrgation statistique rend difficile de revenir aux verbatim pour interroger le sens
des corrlations observes. Inversement, les mthodes qualitatives pourraient nous
aider identifier les arguments pour et contre la vaccination dans un chantillon de
billets, mais sans aucune garantie de pouvoir gnraliser les rsultats.
Pour mener bien notre exploration du dbat public autour de la vaccination
H1N1, on doit imaginer une nouvelle approche : une mthodologie qualiquantitative capable de runir les avantages des deux types de mthodes. Tant que
les chercheurs ne disposent pas dune nouvelle gnration de mthodes capable de
combler la discontinuit entre micro et macro, les sciences sociales seront incapables
de profiter de labondance des traces numriques. Dvelopper ce nouveau type de
mthodes, permettant de dpasser la distinction micro/macro et de retracer
comment les phnomnes globaux sont construits par la coordination dune
multiplicit dactions locales, telle est prcisment lambition du mdialab de
Sciences Po.
Admettons, mais quoi ressemble une mthode quali-quantitative ? Pour
illustrer le potentiel dinnovation de cette dmarche, revenons notre exemple du
dbat autour de la vaccination H1N1. Comme on la vu, le succs des ces campagnes
de vaccination contre la grippe est trs variable et semble dpendre dinteractions
complexes entre les indications des autorits mdicales et les ractions de lopinion
publique. Lanalyse des discours sur le web peut tre trs utile pour interprter ces
ractions collectives, condition toutefois de mettre en place un dispositif de
recherche capable de lier lexploration des tendances globales lobservation
dtaille des interactions remarquables. Dans le cas des vaccinations contre les
pandmies grippales, une mthode quali-quantitative pourrait se composer des
tapes suivantes :
1. Combiner les donnes sur ladhsion aux campagnes de vaccination avec les
traces des discussions en ligne sur le vaccin H1N1.
o Dsagrger les deux sries de donnes et les projeter sur la mme chelle
spatio-temporelle.
o Comparer les deux sries de donnes en affichant sur le mme graphe le taux
de vaccination et la volumtrie des discours mentionnant le mot vaccin .
2. Zoomer sur lanalyse dun chantillon non-alatoire des discours web.
o Identifier les points critiques : les temps et lieux o les discours web et
ladhsion aux campagnes de vaccination semblent tre le plus lis.

o Identifier les discours particulirement visibles dans les points critiques et


suivre leur diffusion et transformation dans la blogosphre.
3. Gnraliser les intuitions venant de lanalyse de lchantillon choisi.
o Proposer une interprtation des dynamiques influant sur ladhsion la
vaccination bases sur les phnomnes observs dans les points critiques.
o Traduire l'interprtation propose en indicateurs mathmatiques qui
puissent tre calculs pour le corpus entier.
4. Valider (ou invalider) la solidit et lintrt des indicateurs construits
o Calculer les indicateurs construits pour le corpus entier pour valuer leur
gnricit.
o Employer les indicateurs construits pour identifier dautres points critiques
o les indicateurs ne sappliquent pas ou sappliquent particulirement bien.
La procdure dcrite, videmment, ressemble moins une squence qu' une
boucle, puisque les rsultats de la dernire phase peuvent (et mme doivent) relancer
un nouveau cycle de zooming-in et zooming-out. Lexemple que nous avons donn
illustre bien la particularit des mthodes quali-quantitatives : loscillation incessante
entre agrgation et dsagrgation qui efface toute distinction entre micro et macro. Il
nest pas difficile dimaginer des mthodes de ce type pour beaucoup dautres
phnomnes sociaux et, grce la traabilit numrique, les donnes ne manquent
pas. Toutefois, pour que ce genre dapproche puisse effectivement entrer dans les
pratiques des sciences sociales, il faudrait disposer doutils conceptuels,
mathmatiques et informatiques aussi solides et standards que ceux des mthodes
traditionnelles. Pour le moment, nous en sommes encore loin : la plupart des
mthodes quali-quantitatives restent des efforts isols et lis des cas dtude et des
questions de recherche spcifiques. Cependant il y a au moins une approche qui
semble correspondre aux ambitions dune sociologie quali-quantitative. Il sagit de
lanalyse de rseaux, une approche qui a rapidement colonise plusieurs disciplines
dont les sciences sociales.

Rseaux, graphes, cartes, interfaces


Bien que les bases mathmatiques de lanalyse des rseaux existent depuis la
clbre promenade dEuler sur les ponts de Knigsberg (Solutio problematis ad
geometriam situs pertinentis, 1736), ce nest qu'avec les sociogrammes de Jacob L.
Moreno (Moreno, 1934) que lanalyse de rseaux entre dans lquipement des
sciences sociales. Depuis quelques annes, cette approche a connu une diffusion
vertigineuse grce deux dveloppements parallles :
1. La mise au point dune srie des techniques mathmatiques permettant
danalyser des rseaux aussi complexes que ceux quon observe dans les
phnomnes collectifs (Newman, Barabasi, & Watts, 2006).
2. La disponibilit croissante de logiciels (parfois gratuits et open source) pour
lanalyse et la visualisation des graphes come Pajek, Ucinet, Gephi (Combe,
Largeron, & Egyed-Zsigmond, 2010).

Grce ces deux dveloppements, les sciences sociales commencent finalement


disposer doutils conceptuels et techniques capables de grer la masse croissante de
traces numriques. Cest donc vers les rseaux que sadresse une partie des espoirs
de dvelopper des mthodes quali-quantitatives et aussi la plupart des recherches
conduites au mdialab de Sciences Po. Les techniques d'analyse de rseaux, bien sr,
ne sont pas les seules techniques quali-quantitative possibles et encore moins le seul
moyen dexploiter les traces numriques. Pour le moment, elles reprsentent
nanmoins le jeu doutils le plus abouti disposition des nouvelles sciences sociales.
Cest pour cette raison que nous leur ddions le reste de cet article.
Les rseaux sont des objets hybrides qui rassemblent les avantages des graphes,
des cartes et des interfaces. En tant que graphes, les rseaux ont lavantage de
focaliser lattention des chercheurs sur le phnomne lmentaire de la vie collective :
lassociation et la dissociation des acteurs sociaux. Dans ce sens, lanalyse des rseaux
ralise linvite de la Thorie de lActeur-Reseau refonder la sociologie comme
science des associations (Latour, 2005). Au lieu de prendre pour acquise lexistence
des groupes, des institutions, des structures sociales, lanalyse de rseau ne postule
que lexistence dacteurs (nuds ou sommets) et leur capacit sattacher ou se
dtacher (arcs ou artes).

Fig 2. Le rseau des ponts de Knigsberg dans la reprsentation originale dEuler et dans linterface de Gephi.

La distinction entre micro et macro nexiste pas dans le monde des graphes,
puisque les phnomnes globaux sont insparables des connexions locales. Les
proprits globales dun rseau n'mergent pas de la somme des associations locales
(au sens de la thorie des systmes), tout simplement parce que les associations dun
graphe ne sadditionnent pas. Considrez, par exemple la plus simple des proprits
dun graphe son diamtre. Dfini comme la plus longue des distances entre deux
nuds, le diamtre dun graphe na aucune existence autonome de ses arcs. Il peut
suffire de changer un de ces arcs pour que le diamtre soit doubl ou rduit de
moiti. Bien sr cela dpend de quel arc on modifie. La modification de chaque
nud ou de chaque arc peut avoir un effet diffrent sur la forme du graphe et,
pourtant, cela ne dpend que de son profil de connectivit. Un nud dans un graphe

nest dfini que par ses relations et une relation nest dfinie que par les nuds
quelle connecte. Dans un graphe, il ny a pas de macro-structures, ni de micro
interactions, mais seulement une organisation la fois locale et globale.
Plus important encore, les graphes permettent une conomie conceptuelle.
Ntant forms que de nuds et darcs, les graphes ont permis le dveloppement
dune puissante mathmatique discrte. Grce la formalisation de ses techniques,
lanalyse de graphes peut sappliquer une multitude de phnomnes diffrents :
des dynamiques sociales aux rseaux biologiques, des ractions chimiques aux forces
physiques (Barabsi, 2003). Cela a encourag le dveloppement dun espace de
collaboration multidisciplinaire, en favorisant lchange des algorithmes, des
logiciels et des pratiques danalyse1.
De plus, les rseaux (et particulirement les rseaux sociaux) ne sont pas que
des graphes, ils sont aussi des cartes. En tant que cartes, les rseaux hritent de deux
notions essentielles de la tradition gographique : la notion de proximit et la notion
de limite. Bien sr, ces deux notions sont profondment redfinies par lanalyse de
rseaux. la diffrence des cartes gographiques, les graphes ne sont pas des
projections sur un fond de carte prdtermin. Dans un rseau, la position dun
nud nest pas dfinie par des coordonnes spatiales. Cest au contraire lespace
mme du graphe qui est dfini par les relations quil contient. Nanmoins, afin de
maximiser la lisibilit et minimiser les croisements des arcs, la plupart des logiciels
de visualisation de graphes sont conus pour rapprocher les nuds connects et
loigner les nuds non-connects. Les algorithmes de spatialisation fonctionnent en
attribuant une force de rpulsion aux nuds (chacun deux tend se distancer le
plus possible des autres) et une force dattraction aux arcs (qui, comme des
lastiques, rapprochent les nuds quelles connectent).
Le rsultat est que, dans un graphe spatialis, deux nuds sont proches sils
sont directement lis ou sils ont un profil de connexion semblable (ils sont connects
aux mmes nuds sans forcement tre connects entre eux). La proximit dans un
graphe spatialis nest donc pas dpourvue dinformation. Comme dans une carte
gographique, la contigut spatiale indique souvent dautres types de proximit (la
facilit de passer dun nud lautre, lappartenance au mme regroupement, une
certaine air de famille).
De la mme manire, il est possible didentifier des frontires dans un rseau.
Souvent, les espaces dessins par les rseaux prsentent une densit variable : les
nuds ne sont pas distribus dune faon homogne dans lespace, mais rassembls
dans des rgions densment connectes spares par des rgions moins densment
connectes. On appelle clusters, les regroupements des nuds qui sont plus
connects entre eux que vers lextrieur. Les clusters peuvent tre identifis par des
algorithmes mathmatiques (comme le calcul de la modularit) et leurs frontires
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
1!Aux!Etats*Unis!le!travail!de!construction!de!cet!espace!de!partage!!t!men!surtout!par!la!
Network!Science!Collaborative!Technology!Alliance!(NS!CTA),!http://www.ns*cta.org.!

sont gnralement visibles dans un graphe bien spatialis.


Le fait que la proximit des nuds soit signifiante et quil soit possible
dobserver les limites des clusters permet de lire les rseaux comme des cartes et de
leur appliquer une partie des conventions dinterprtation de la gographie. Par
exemple, on retrouve dans les rseaux tous les lments qui constituent, selon Kevin
Lynch, limage de la cit : les voies, les limites, es quartiers, les nuds, les points de
repres (Lynch, 1960). Les rseaux ne montrent que des connexions et, pourtant, ils
dessinent des territoires, bien que des territoires de type nouveau (Boullier, 2009). La
fascination que les rseaux exercent sur les chercheurs mane aussi de la possibilit
de les explorer comme on explore des cartes gographiques. Avant les rseaux, on
pouvait dcrire les groupes sociaux. Avec les rseaux, on a un moyen pour les
montrer. Bien sr il sagit dune reprsentation aussi artificielle et conventionnelle
quune description textuelle et pourtant la possibilit de donner une reprsentation
graphique des phnomnes sociaux ouvre des possibilits nouvelles pour leur
analyse (Ghitalla, 2009).
Enfin, les rseaux quon dessine avec les logiciels danalyse de rseaux peuvent
aussi servir dinterface de navigation dans les donnes. tant des structures logiques
relativement simples accompagnes dune mathmatique trs puissante, les rseaux
se prtent particulirement bien un traitement informatique. Depuis quelques
annes, les solutions numriques pour la visualisation et lanalyse des rseaux se
multiplient sous toutes les formes et toutes les licences, tout en devenant de plus en
plus performantes et faciles utiliser. Les logiciels pour lexploration des graphes
sont aujourdhui si avancs quils permettent non seulement de spatialiser
rapidement des rseaux de dizaines de milliers de nuds, mais aussi de les
manipuler en temps rel. Avec ces logiciels, le travail de zooming-in et zooming-out qui
caractrise les mthodes quali-quantitatives devient facile et instantan. Et le zoom ce
nest quune des multiples possibilits dinteragir avec les graphes offertes par ces
logiciels.
Un logiciel gratuit et open source comme Gephi (gephi.org) permet, par
exemple, de grer de graphes de tout type (simples, orients, pondrs) et de toute
dimension. Il offre des dizaines dalgorithmes de spatialisation et permet facilement
den rajouter de nouveaux. Il permet de changer la taille et la couleur des nuds et
des arcs manuellement ou sur la base dune multitude de variables. Il facilite la
cration de requtes complexes pour filtrer les graphes. Il permet de grouper ou
dgrouper les nuds en un clic. Il calcule tous les indicateurs de base de la
mathmatique des graphes et permet de les utiliser comme paramtres de la
visualisation. Enfin, il exporte les rsultats des analyses en plusieurs formats
statiques et dynamiques (Bastian, Heymann, & Jacomy, 2009).
La possibilit de modifier des centaines de paramtres en un clic et dobserver
en temps rel leurs consquences sur la forme des rseaux fait des logiciels de
manipulation de graphes des outils idaux pour lanalyse exploratoire des donnes
(Tukey, 1977). Bien sr, la plupart des analyses offertes par ces logiciels pourraient
tre faites la main ou avec des outils traditionnels, mais laisance offerte par des

logiciels comme Gephi est impressionnante. Aucun des outils de sciences sociales
classiques ne permet dagrger et dsagrger avec une telle fluidit. Clic : milliers
dacteurs et de relations apparaissent sur lcran. Clic : la position des acteurs est
rarrange selon leur profil de connectivit. Clic : les positions cruciales prennent le
devant de la scne. Clic : linterface zoome sur un seul acteur et ses relations. Click :
lacteur est remis dans le cluster qui le contient. Clic : les acteurs sont colors sur la
base des groupes auxquels ils appartiennent. Clic : la scne zoome sur les dtails dun
cluster.
Dsagrger les donnes dune enqute quantitative classique, bien sr, a
toujours t possible, mais il fallait passer des rsultats de lenqute au tableau des
donnes, du tableau aux questionnaires, des questionnaires aux notes de
linvestigateur, des notes aux entretiens. galement, agrger les rsultats dune ou
plusieurs enqutes qualitatives a toujours t possible, mais il fallait passer des
entretiens aux transcriptions, des transcriptions une grille de codage unique, de la
grille au tableau de donnes, du tableau aux indicateurs statistiques. Les approches
quali-quantitatives nont jamais t impossibles. Tout simplement, il fallait trop de
temps pour les mettre en place.
Grce labondance de traces numriques et la souplesse des rseaux, on
dispose des donnes et des outils ncessaires pour observer le tissu social dans toute
son extension et, dans le mme temps, de suivre chacun des fils qui le constituent.
Pour la premire fois dans lhistoire des sciences sociales, les chercheurs ne sont plus
obligs de choisir entre lampleur et la finesse de leurs analyses, mais peuvent
poursuivre les deux simultanment. La promesse des mthodes quali-quantitatives
semble enfin la porte des sciences sociales.
Tout en clbrant les avantages des rseaux comme graphes, cartes et interfaces
dexploration de la complexit sociale, nous ne voulons pas cacher leurs
inconvnients. Le plus srieux de ces inconvnients est la difficult que lanalyse de
rseaux rencontre encore dans lexploration de la dynamique des phnomnes
sociaux. Ni la mathmatique de graphes, ni la smiotique de cartes nont t
dveloppes pour traiter les phnomnes volutifs. Par consquent, la plupart des
outils pour la manipulation de rseaux grent encore relativement mal la variable
temps, obligeant les chercheurs dcouper les phnomnes quils tudient dans
une srie de clichs successifs. Bien que cette technique puisse suffire pour tudier les
transformations plus simples, elle se rvle souvent inadquate pour explorer les
dynamiques complexes qui caractrisent la vie collective.
Des extensions de la thorie de graphes ont t proposes pour surmonter cette
difficult (par exemple, les rseaux de Petri), mais dans la plupart des cas on se limite
lanalyse de la circulation dlments mobiles lintrieur dun rseau statique,
sans se demander comment cette circulation peut rtroagir sur lorganisation des
connexions. Par exemple, on tudie la diffusion des discours dans la blogosphre,
comme on tudie la transmission des informations sur Internet (routing), sans
sapercevoir quil sagit, en effet, de deux phnomnes compltement diffrents. L

o les paquets TCP-IP se dplacent sur un rseau de connexions relativement stables


(et encore !), la circulation des discours dfinit larticulation mme de la blogosphre
(Leskovec, Kleinberg, & Faloutsos, 2005). En sparant les flux de connexions, on ne
fait que reproduire la distinction entre une structure relativement stable et les
interactions qui la traversent : prcisment la distinction micro/macro que les
rseaux promettent de dpasser.
A cause de ces difficults, les rseaux, tout en tant des instruments
extraordinaires dexploration, restent encore inefficaces en tant quoutils de
narration. Lexploration, lanalyse, le dploiement ne sont quune partie de la
recherche scientifique. Lautre partie est leffort de description et reprsentation qui
passe par le rcit dune histoire. Cette fonction est particulirement importante pour
les sciences sociales qui ne peuvent pas se limiter modliser leurs sujets dtudes,
mais doivent aussi donner du sens leurs models en les intgrant dans une
narration crdible. Pour cela les rseaux restent encore relativement inutiles. Dans la
situation actuelle, personne ne sait comment raconter une histoire avec un rseau.
Pour le moment, le mieux quon puisse faire avec les rseaux cest daccompagner ou
illustrer le rcit dune histoire textuelle. Le langage graphique des rseaux reste
encore trop primitif pour assumer des fonctions narratives. La plupart des logiciels
se limitent proposer quelques lments hrits de la smiotique photographique ou
cinmatographique (le zoom, le cadrage, les mouvements de camera) (Metz, 1990)
sans vraiment rflchir a leur signification dans le monde des rseaux. Cela limite
encore fortement lutilisation des rseaux dans les sciences sociales. Pour maintenir
leur promesse, autre que des graphes, des cartes et des interfaces les rseaux doivent
devenir aussi des outils de narration. Le chantier des rseaux est ouvert et, malgr les
grandes esprances que les graphes ouvrent aux sciences sociales, la route vers les
mthodes quali-quantitatives reste encore longue.

Bibliographie
Barabsi, A.-L. (2003). Linked: how everything is connected to everything else and what it means for
... (p. 294). Plume. Retrieved from
http://books.google.com/books?id=rydKGwfs3UAC&pgis=1.
Bastian, M., Heymann, S., & Jacomy, M. (2009). Gephi: An open source software for
exploring and manipulating networks. International AAAI Conference on Weblogs and
Social Media (pp. 361-362). Retrieved from
http://www.aaai.org/ocs/index.php/ICWSM/09/paper/download/154/1009.
Boullier, D. (2009). Au-del des territoires numriques en dix theses. In F. Rowe (Ed.), Socits
de la connaissance et prospective. Hommes, organisations et territoires. Nantes: Lemna.
Combe, D., Largeron, C., & Egyed-Zsigmond, E. (2010). A comparative study of social
network analysis tools. Social Networks, 2, 1-12. Retrieved from http://hal.archivesouvertes.fr/hal-00531447/.
Creswell, J. W. (2002). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches
(2nd Edition) (p. 246). Sage Publications, Inc. Retrieved from
http://www.amazon.com/Research-Design-Qualitative-QuantitativeApproaches/dp/0761924426.

Ess C. and AoIR ethics working committee. (2002). Ethical decision-making and Internet
research. Recommendations from the AOIR ethics working committee. Retrieved from
www.aoir.org/reports/ethics.pdf.
Ghitalla, F. (2009). La Toile Europenne Parcours autour dune cartographie thmatique
de documents web consacrs au thme de lEurope et ses acteurs sur le web
francophone. Communication & langages, 2008(158), 61. doi: 10.4074/S0336150008004067.
Giddens, A. (1986). The Constitution of Society: Outline of the Theory of Structuration (p. 417).
University of California Press. Retrieved from http://www.amazon.com/ConstitutionSociety-Outline-Theory-Structuration/dp/0520057287.
Keck, F. (2010). Un monde grippe (Flammarion.). Paris, France.
Michel, J.-B., Shen, Y. K., Aiden, A. P., Veres, A., Gray, M. K., Pickett, J. P., et al. (2010).
Quantitative Analysis of Culture Using Millions of Digitized Books. Science, 331(6014),
176-182.
Lagarde, J.-C., & Door, J.-P., et al. (2010). Rapport fait au nom de la Commission d enqute sur la
manire dont a t programme, explique et gre la campagne de vaccination contre la grippe A
(H1N1).
Latour, B. (1993). Le topofil de Boa Vista ou la rfrence scientifiquemontage photophilosophique. Raison Pratique, 4, 187216. Retrieved from
http://scholar.google.com/scholar?hl=en&btnG=Search&q=intitle:Le+topofil+de+Boa
+Vista+ou+la+rfrence+scientifiquemontage+photo-philosophique#0.
Latour, B. (2005). Reassembling the Social (Oxford Uni.). Oxford.
Lazer, D., Pentland, A., Adamic, L., Aral, S., Barabasi, A.-L., Brewer, D., et al. (2009).
Computational social science. Science (New York, N.Y.), 323(5915), 721-3. doi:
10.1126/science.1167742.
Leskovec, J., Kleinberg, J., & Faloutsos, C. (2005). Graphs over time: densification laws,
shrinking diameters and possible explanations. Proceedings of the eleventh ACM SIGKDD
international conference on Knowledge discovery in data mining (p. 177187). New York,
New York, USA: ACM. doi: 10.1145/1081870.1081893.
Lynch, K. (1960). The image of the city. Cambridge Mass.: MIT Press. Retrieved from
http://books.google.com/books?hl=it&lr=&id=_phRPWsSpAgC&pgis=1.
Metz, C. (1990). Film Language: A Semiotics of the Cinema (p. 286). University Of Chicago Press.
Retrieved from http://www.amazon.com/Film-Language-Semiotics-ChristianMetz/dp/0226521303.
Mitchell, T. M. (2009). Mining our reality. Science (New York, N.Y.), 326(5960), 1644-5. doi:
10.1126/science.1174459.
Moreno, J. (1934). Who Shall Survive? (Nervous an.). Washington, DC.
Newman, M., Barabasi, A.-L., & Watts, D. J. (2006). The Structure and Dynamics of Networks:
(Princeton Studies in Complexity) (p. 624). Princeton University Press. Retrieved from
http://www.amazon.com/Structure-Dynamics-Networks-PrincetonComplexity/dp/0691113572.
Rogers, R. (2009). The End of the Virtual: Digital Methods (p. 36). Amsterdam University Press.
Retrieved from http://books.google.com/books?id=ZHFis5sEAicC&pgis=1.
Tukey, J. W. (1977). Exploratory Data Analysis. Reading: Addison-Wesley.
Viegas, F. B., Wattenberg, M., Kriss, J., & Van Ham, F. (2007). Talk before you type:
Coordination in Wikipedia. System Sciences, 2007. HICSS 2007. 40th Annual Hawaii
International Conference on (p. 78). IEEE. Retrieved from
http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4076527.

You might also like