Le
parcours aux US de Raphaël Guilleminot, design manager au sein d’Enigma.io,
startup new-yorkaise opérant dans l’open data
Il évoque pour nous sa perception très particulière de l’open data,
la genèse d’Enigma, leurs travaux dans l’open data, la création de valeur dans
la donnée publique, son parcours de designer, la Silicon Alley et l’importance
toute particulière de la composante design produit aux US.
Interview 360° !
Echange
avec Matthias FILLE, conseiller IT / TMT à la CCI de Paris
Raphaël, je te
laisse te présenter en quelques mots
Je suis né en France mais y ai très peu vécu.
J’ai effectué mon parcours dans le design industriel et interactif
successivement au Canada, au Japon en Suède. Donc à vrai dire, je n’ai jamais
travaillé en France. Puis, j’ai rencontré l’un des « futurs »
co-fondateurs[1]
d’Enimga.io au lycée en France. Quant à l’autre co-fondateur, Marc Da Costa,
j’ai fait sa connaissance à Columbia.
A l’époque où je les ai rencontrés, ils
avaient commencé le concept et le prototypage d’Enigma.io. De surcroît, ils
étaient intéressés à intégrer une expertise et une composante de design. C’est
là que j’ai intégré l’équipe d’Enigma.io en phase très embryonnaire du projet.
Comment a émergé le concept d’Enigma ?
L’idée d’Enigma leur est venue en
parcourant l’article d’une personne qui avait découvert avant tous les
analystes politiques, qu’à la surprise générale, Sarah Palin serait nommée en colistière
de John Mc Cain à l’élection présidentielle de 2008. Pour cela, il avait
consolidé et croisé des data sets publics (donc à la portée de tous) d’enregistrement
de possession d’avions, de donateurs républicains. Il avait par la suite établi
des corrélations d’appartenance ou d’influence entre eux. Cette personne s’est
ainsi rendu compte avant tout le monde que ces derniers affluaient simultanément
vers Wasilla, en Alaska, (fief de Sarah Palin). Ainsi, cet exemple
symptomatique souligne l’ambition et la proposition de valeur d’Enigma à vouloir
démystifier l’open data (qui est à ce jour trop énigmatique et « indigeste »),
en créant de l’usage, de la valeur et de la contextualisation à partir de ces
données publiques.
Comment se présente la solution ?
Nous proposons une
plate-forme de recherche, de découverte et d’approvisionnement de données
publiques fournies par le gouvernement, des entreprises privées et autres
organisations que nous jugeons pertinentes. Notre outil permet de trouver des faits et des liens cachés à travers des sources de
données disparates et cloisonnées. L’intelligence de notre plate-forme est de
vous fournir la data et de l’intelligence à laquelle vous n’étiez pas « prédisposé ».
Par exemple, sur un sujet qui vous intéresse, nous ne nous cantonnons pas à
vous fournir les data directement liés au sujet. Nous vous approvisionnons
également avec les datas qui ont un impact sur votre sujet d’étude mais auquel
vous n’aviez pensé ou pas découvert la corrélation et l’impact d’influence. Nous
sommes ainsi très positionnés sur les données qualitatives et la
contextualisation. Notre solution est en mesure de s’appuyer par exemple sur des
réseaux d’entité, des réseaux de filiales, de connexions contractuelles ou
d’influence entre opérateurs. La contextualisation est la philosophie de l’open
data chez Enigma.
A quel problème de l’open data Enigma cherche-t-il à répondre ?
Le problème inhérent aux données
publiques est qu’elles sont publiées par le gouvernement américain, des
services décentralisés ou des agences marketing de manière indépendante et
atomisée. Du coup, il est complexe de centraliser ces données et de déterminer
son usage et son intérêt. Par ailleurs, les données publiques navigant sur
Internet ne sont pas facilement identifiables et unifiées en tant que telles
puisque disséminées. En soi, les données publiques n’ont pas beaucoup de
valeur. C’est justement là que nous intervenons en tant que levier de création
de valeur à partir de ces données.
Comment allez-vous crawler ces données ?
Nous collectons les données de
différente manière. La première est d’implémenter des crawlers[2]
adossés à des domaines et portails gouvernementaux d’open data dédiés pour
aller chercher et indexer les données mises à disposition. Deuxièmes, lorsqu’il
s’agit de cibles et d’agences très particulières, qui nous intéressent, sur des
thématiques affinées, nous allons chercher nous-mêmes la donnée. Et avec le
volet coercitif pour les agences de se conformer au Freedom of Information Act[3],
nous avons la possibilité d’effectuer des requêtes auprès d’agences
gouvernementales pour obtenir de nouvelles sources de données. Elles ont ainsi
le devoir de libérer la donnée. Elles n’ont en revanche pas d’exigence de délai
et peuvent demander des coûts de publication auprès des demandeurs. Elles
peuvent ainsi nous publier sous n’importe quel format ! Donc, on se heurte
aussi à une bureaucratie assez lourde sur ce deuxième mode opératoire.
Troisièmement, notre méta moteur se charge de regrouper des données disséminées
sur internet difficilement identifiables et consolidables.
A quelle clientèle Enigma s’adresse-t-il ? Quels industries et
verticaux en particulier ?
Nous collaborons avec de grosses
entités de consulting, de crédit, d’assurance, de banques et hedge funds. Ils cherchent à étoffer leurs
analyses, élaborer de nouveaux indicateurs connexes, améliorer leurs leviers
décisionnels, faire de nouvelles projections avec des modèles plus élaborés via
de nouveaux jeux de données. Par exemple, des banques auront recours à nos
services pour améliorer leurs algorithmes qui déterminent la solvabilité de
leurs clients. Cette partie « gros clients » nous demandent
particulièrement d’efforts étant donné que nous sommes partie prenante dans la
recherche des datas. Par ailleurs, nous avons une autre catégorie de clientèle
professionnelle qui, elle, souscrit à un abonnement pour avoir accès à notre
plate-forme d’outil de recherche de la donnée et de représentation.
De
surcroît, notre API[4]
fournit une infrastructure dédiée et accessible aux développeurs et
professionnels. Ils peuvent ainsi intégrer nos corpus de data en temps réel à
grande échelle afin d’étoffer leurs applications tierces, services analytiques
et tableaux de bord.
Je me souviens que le Président Obama « himself » (et oui !)
avait retweeté vos travaux d’open data sur le shutdown[5] en Octobre 2013 (pour
mettre la pression sur le vote du budget et montrer l’ampleur de l’inertie).
Sur quels autres types de projets travaillez-vous actuellement ?
Ouais, on était assez fiers de cela !
Nous
avons récemment travaillé sur un projet d’import-export avec les douanes américaines
qui recensent l’ensemble des containers et leurs contenus partant et arrivant
aux Etats-Unis. Chaque semaine, ils nous envoient un CD de jeux de données (on
a d’ailleurs dû se racheter un lecteur CD pour l’occasion !). On peut par
exemple déterminer le nombre de nouvelles Lamborghini sur le sol américain. Et
à partir de là extrapoler très simplement sur l’évolution de la consommation
intérieure ou l’évolution du nombre de millionnaires aux Etats-Unis par
exemple, avec toujours en sus notre savoir-faire d’enrichissement et
contextualisation.
Vous venez de lever à nouveau des fonds. Quels changements et
orientations structurels cela va-t-il apporter ?
Nous avons en effet levé fin Janvier 2014 (en
série A) 4,5 M$ auprès de Comcast Ventures avec des participations d’American
Express Ventures, Crosslink Capital et New York Times Company. Toutes ces
participations reflètent la transversalité des applications d’Enigma
(transparence, journalisme, banque, …). Pour rappel, nous avions également levé
1,1 M$ auparavant en seed funding début 2013. Par ailleurs, nous allons
prochainement annoncer que l’accès à notre plate-forme et recherche de données
sera gratuit ! C’est quelque chose que nous avions en tête dès le départ
dans notre milestone.
Mais l’intégrer dès le départ aurait été trop couteux.
Cela marque un tournant majeur dans notre stratégie et la montée en puissance
de notre projet. L’idée derrière cela est de
démocratiser notre plate-forme, de démontrer notre scalabilité et proposer
davantage de services premium et d’outils analytiques. Ainsi, la
combinatoire de ces deux éléments va nous permettre d’adresser de gros clients
et poursuivre nos travaux sur les réseaux d’entités en web sémantique. Car je
le répète, c’est notre philosophie de l’open data !
Comment compares-tu l’écosystème de l’open data entre la France et
les Etats-Unis ?
Tout d’abord, je salue le travail
qu’entreprend Henri Verdier[6]
à Etalab. C'est un mec extra.
Je trouve que son agence fait un travail remarquable pour libérer et
inciter les pouvoirs publics et les ministères à libérer la donnée. Il a donné
à Etalab un vrai second souffle. Car pour opérer dans l’open data, il est
inconcevable et impossible pour une entreprise privée d’inciter les pouvoirs
publics à libérer la donnée sans le travail d’évangélisation et de
sensibilisation d’une agence comme d’Etalab. Pour faire émerger un écosystème
vertueux de l’open data, il faut que la dynamique soit insufflée au niveau des
pouvoirs publics, ce que fait remarquablement bien Etalab. Aux Etats-Unis, le
mouvement s’est accéléré sous la bannière du Freedom of Information Act et de
l’Open Government Initative[7]
de l’Administration Obama. Le Freedom of Information Act relève d’un volet
législatif qui stimule certes l’open data, mais qui dépasse plus largement ce
périmètre. Cela découle de la culture historique de la transparence aux
Etats-Unis, et cela même auprès d’opérateurs privés. Aux
Etats-Unis, la libéralisation des données publiques est un axe central. Cette
conjonction permet de faire émerger un écosystème et une économie autour des
applications et des usages. Aussi, la France est très stricte sur
l’anonymisation et la mention de noms privés adossés aux jeux de données. A
contrario, je pourrais vous dire très facilement, via le Gouvernement de New
York, de combien de propriétés immobilières Robert de Niro dispose à New York.
En tant que designer d’Enigma, quel regard croisé transatlantique
portes-tu sur le design interactif quand on connait la primauté du marketing et
du design aux Etats-Unis dans la composante produit ?
Les français sont bons en design. Et plus particulièrement
en graphisme ce qui n’est pas tout à fait la même chose. Ainsi, je pense que
trop de talents français se prédestinent vers le design industriel ou le graphisme,
par exemple dans le domaine publicitaire et industriel. Il manque à la France une
culture plus prononcée de l’interaction design[8],
qui est une discipline très imprégnée et très enseignée aux Etats-Unis. En
effet, j’estime que le plus gros obstacle à la compréhension et à la
démocratisation des données, par le public, est lié à la difficulté à faire
ressortir des cas d’usages et d’applications.
Ainsi, le design interactif a
émergé car nous étions jusqu’ici limités par les possibilités techniques très
réduites de l’infographie et de la visualisation classique. Par exemple, on ne
pouvait mettre en relief qu’un seul sujet d’étude. Or, le design interactif
permet justement de rendre les outils de recherche accessibles et d’offrir un
cadre de contextualisation.
De France, nous avons l’impression que la Silicon Alley[9] prend sa revanche
sur la Californie en ce qui concerne l’entrepreneuriat numérique. Ton sentiment ?
En effet, New York explose actuellement au
regard du nombre de startup. La Silicon Alley est un écosystème très vivifiant.
Par rapport à la Californie, j’estime que les business model des start up de
New York sont dans une certaine mesure, peut-être moins nombreux, mais plus « sérieux »
et réalisables. Par ailleurs, les startup de New York sont positionnées, pour
la très grande majorité, sur le créneau du B2B a contrario de la Silicon Valley.
Elles sont également très portées sur le design interactif. On peut expliquer
cet aspect par l’historique de l’industrie de la publication et des médias de
New York. De surcroît, les Venture Capital locaux sont « moins »
spéculatifs et préfèrent se positionner sur des business model plus
« sérieux » par comparaison avec la Silicon Valley
Pour conclure, peux-tu me souligner quelques startup que tu
apprécies?
Niveau français, j’appréciais beaucoup
Everpix[10]
(soutenu par Index Ventures) que je considérais comme le meilleur service de
stockage de photos dans le cloud via n’importe quel terminal. Mais, ils ont
malheureusement du stopper leur activité fin 2013 faute de financements
suffisants. Everpix n’a pas eu le temps d’atteindre sa masse critique
monétisable. Côté américains, je suis admiratif de Zendesk[11]
(qui n’est plus une startup et fondé par des danois je crois !) au regard
de l’excellence du niveau produit qu’ils ont atteint. Même chose pour GitHub[12],
qui a réussi à rendre accessible à tout à chacun la publication de codes et la
construction d’applications (par essence très compliqué).
Merci à toi Raphaël, à 1 de ces 4 sur NYC !
Pour en
savoir plus :
[1] Hicham Oudghiri
[2] Robots d’indexation
conçus pour collecter des ressources
[3] Le Freedom of
Information Act est une loi américaine de 1966. Fondée sur le principe de la
liberté d'information, elle oblige les agences fédérales à transmettre leurs
documents, à quiconque en fait la demande
[4] Une Interface de
programmation (API) est un protocole de communication temps réel par lequel un
logiciel offre des services à d’autres logiciels comme la mise à disposition et
l’actualisation de données en temps réel
[5] Mésentente
parlementaire sur le budget 2014 qui a entraîné durant quelques semaines l’arrêt
du financement des agences gouvernementales
[6] Henri Verdier,
co-fondateur de MFG Labs (racheté depuis Havas) et ancien Président du pôle de Compétitivité Digital
est depuis Janvier 2013, Directeur d’Etalab (service du Premier ministre
français, chargé de créer un « portail unique interministériel des données
publiques » françaises)
[7] Cette « initiative »
vise à créer un niveau sans précédent de transparence et d'ouverture du
gouvernement dans la tendance de l'open source governance et de l’open data,
pour permettre à tout citoyen et entreprise intéressés de contribuer à créer
les contenus de la politique
[9] La
Silicon Alley est un pendant de la Silicon Valley, située en plein cœur de
Manhattan. Elle est une technopole concentrant des startup spécialisées dans
Internet, les médias, l'édition, la publicité
[10] Everpix a été créé en août 2011 par deux français, Pierre-Olivier
Latour, ancien de chez Apple et fondateur de Quartz Composer, et Kevin
Quennesson
[11] Zendesk propose aux entreprises les outils nécessaires
leur permettant d'établir un service de support auprès de leurs utilisateurs
[12] GitHub est un service
web d'hébergement et de gestion de développement de logiciels, utilisant le
programme Git