jeudi 3 avril 2014

Raphaël Guilleminot, design manager au sein d’Enigma.io, startup de NYC de l’open data

Le parcours aux US de Raphaël Guilleminot, design manager au sein d’Enigma.io, startup new-yorkaise opérant dans l’open data 


Il évoque pour nous sa perception très particulière de l’open data, la genèse d’Enigma, leurs travaux dans l’open data, la création de valeur dans la donnée publique, son parcours de designer, la Silicon Alley et l’importance toute particulière de la composante design produit aux US.

Interview 360° !

Echange avec Matthias FILLE, conseiller IT / TMT à la CCI de Paris


Raphaël, je te laisse te présenter en quelques mots
Je suis né en France mais y ai très peu vécu. J’ai effectué mon parcours dans le design industriel et interactif successivement au Canada, au Japon en Suède. Donc à vrai dire, je n’ai jamais travaillé en France. Puis, j’ai rencontré l’un des « futurs » co-fondateurs[1] d’Enimga.io au lycée en France. Quant à l’autre co-fondateur, Marc Da Costa, j’ai fait sa connaissance à Columbia.
A l’époque où je les ai rencontrés, ils avaient commencé le concept et le prototypage d’Enigma.io. De surcroît, ils étaient intéressés à intégrer une expertise et une composante de design. C’est là que j’ai intégré l’équipe d’Enigma.io en phase très embryonnaire du projet.

Comment a émergé le concept d’Enigma ?
L’idée d’Enigma leur est venue en parcourant l’article d’une personne qui avait découvert avant tous les analystes politiques, qu’à la surprise générale, Sarah Palin serait nommée en colistière de John Mc Cain à l’élection présidentielle de 2008. Pour cela, il avait consolidé et croisé des data sets publics (donc à la portée de tous) d’enregistrement de possession d’avions, de donateurs républicains. Il avait par la suite établi des corrélations d’appartenance ou d’influence entre eux. Cette personne s’est ainsi rendu compte avant tout le monde que ces derniers affluaient simultanément vers Wasilla, en Alaska, (fief de Sarah Palin). Ainsi, cet exemple symptomatique souligne l’ambition et la proposition de valeur d’Enigma à vouloir démystifier l’open data (qui est à ce jour trop énigmatique et « indigeste »), en créant de l’usage, de la valeur et de la contextualisation à partir de ces données publiques.

Comment se présente la solution ?
Nous proposons une plate-forme de recherche, de découverte et d’approvisionnement de données publiques fournies par le gouvernement, des entreprises privées et autres organisations que nous jugeons pertinentes. Notre outil permet de trouver des faits et des liens cachés à travers des sources de données disparates et cloisonnées. L’intelligence de notre plate-forme est de vous fournir la data et de l’intelligence à laquelle vous n’étiez pas « prédisposé ».
Par exemple, sur un sujet qui vous intéresse, nous ne nous cantonnons pas à vous fournir les data directement liés au sujet. Nous vous approvisionnons également avec les datas qui ont un impact sur votre sujet d’étude mais auquel vous n’aviez pensé ou pas découvert la corrélation et l’impact d’influence. Nous sommes ainsi très positionnés sur les données qualitatives et la contextualisation. Notre solution est en mesure de s’appuyer par exemple sur des réseaux d’entité, des réseaux de filiales, de connexions contractuelles ou d’influence entre opérateurs. La contextualisation est la philosophie de l’open data chez Enigma.

A quel problème de l’open data Enigma cherche-t-il à répondre ?
Le problème inhérent aux données publiques est qu’elles sont publiées par le gouvernement américain, des services décentralisés ou des agences marketing de manière indépendante et atomisée. Du coup, il est complexe de centraliser ces données et de déterminer son usage et son intérêt. Par ailleurs, les données publiques navigant sur Internet ne sont pas facilement identifiables et unifiées en tant que telles puisque disséminées. En soi, les données publiques n’ont pas beaucoup de valeur. C’est justement là que nous intervenons en tant que levier de création de valeur à partir de ces données.

Comment allez-vous crawler ces données ?
Nous collectons les données de différente manière. La première est d’implémenter des crawlers[2] adossés à des domaines et portails gouvernementaux d’open data dédiés pour aller chercher et indexer les données mises à disposition. Deuxièmes, lorsqu’il s’agit de cibles et d’agences très particulières, qui nous intéressent, sur des thématiques affinées, nous allons chercher nous-mêmes la donnée. Et avec le volet coercitif pour les agences de se conformer au Freedom of Information Act[3], nous avons la possibilité d’effectuer des requêtes auprès d’agences gouvernementales pour obtenir de nouvelles sources de données. Elles ont ainsi le devoir de libérer la donnée. Elles n’ont en revanche pas d’exigence de délai et peuvent demander des coûts de publication auprès des demandeurs. Elles peuvent ainsi nous publier sous n’importe quel format ! Donc, on se heurte aussi à une bureaucratie assez lourde sur ce deuxième mode opératoire. Troisièmement, notre méta moteur se charge de regrouper des données disséminées sur internet difficilement identifiables et consolidables.

A quelle clientèle Enigma s’adresse-t-il ? Quels industries et verticaux en particulier ?
Nous collaborons avec de grosses entités de consulting, de crédit, d’assurance, de banques et  hedge funds. Ils cherchent à étoffer leurs analyses, élaborer de nouveaux indicateurs connexes, améliorer leurs leviers décisionnels, faire de nouvelles projections avec des modèles plus élaborés via de nouveaux jeux de données. Par exemple, des banques auront recours à nos services pour améliorer leurs algorithmes qui déterminent la solvabilité de leurs clients. Cette partie « gros clients » nous demandent particulièrement d’efforts étant donné que nous sommes partie prenante dans la recherche des datas. Par ailleurs, nous avons une autre catégorie de clientèle professionnelle qui, elle, souscrit à un abonnement pour avoir accès à notre plate-forme d’outil de recherche de la donnée et de représentation.
De surcroît, notre API[4] fournit une infrastructure dédiée et accessible aux développeurs et professionnels. Ils peuvent ainsi intégrer nos corpus de data en temps réel à grande échelle afin d’étoffer leurs applications tierces, services analytiques et tableaux de bord.

Je me souviens que le Président Obama « himself » (et oui !) avait retweeté vos travaux d’open data sur le shutdown[5] en Octobre 2013 (pour mettre la pression sur le vote du budget et montrer l’ampleur de l’inertie). Sur quels autres types de projets travaillez-vous actuellement ?
Ouais, on était assez fiers de cela !
Nous avons récemment travaillé sur un projet d’import-export avec les douanes américaines qui recensent l’ensemble des containers et leurs contenus partant et arrivant aux Etats-Unis. Chaque semaine, ils nous envoient un CD de jeux de données (on a d’ailleurs dû se racheter un lecteur CD pour l’occasion !). On peut par exemple déterminer le nombre de nouvelles Lamborghini sur le sol américain. Et à partir de là extrapoler très simplement sur l’évolution de la consommation intérieure ou l’évolution du nombre de millionnaires aux Etats-Unis par exemple, avec toujours en sus notre savoir-faire d’enrichissement et contextualisation.

Vous venez de lever à nouveau des fonds. Quels changements et orientations structurels cela va-t-il apporter ?
Nous avons en effet levé fin Janvier 2014 (en série A) 4,5 M$ auprès de Comcast Ventures avec des participations d’American Express Ventures, Crosslink Capital et New York Times Company. Toutes ces participations reflètent la transversalité des applications d’Enigma (transparence, journalisme, banque, …). Pour rappel, nous avions également levé 1,1 M$ auparavant en seed funding début 2013. Par ailleurs, nous allons prochainement annoncer que l’accès à notre plate-forme et recherche de données sera gratuit ! C’est quelque chose que nous avions en tête dès le départ dans notre milestone.
Mais l’intégrer dès le départ aurait été trop couteux. Cela marque un tournant majeur dans notre stratégie et la montée en puissance de notre projet. L’idée derrière cela est de démocratiser notre plate-forme, de démontrer notre scalabilité et proposer davantage de services premium et d’outils analytiques. Ainsi, la combinatoire de ces deux éléments va nous permettre d’adresser de gros clients et poursuivre nos travaux sur les réseaux d’entités en web sémantique. Car je le répète, c’est notre philosophie de l’open data !

Comment compares-tu l’écosystème de l’open data entre la France et les Etats-Unis ?
Tout d’abord, je salue le travail qu’entreprend Henri Verdier[6] à Etalab. C'est un mec extra.
Je trouve que son agence fait un travail remarquable pour libérer et inciter les pouvoirs publics et les ministères à libérer la donnée. Il a donné à Etalab un vrai second souffle. Car pour opérer dans l’open data, il est inconcevable et impossible pour une entreprise privée d’inciter les pouvoirs publics à libérer la donnée sans le travail d’évangélisation et de sensibilisation d’une agence comme d’Etalab. Pour faire émerger un écosystème vertueux de l’open data, il faut que la dynamique soit insufflée au niveau des pouvoirs publics, ce que fait remarquablement bien Etalab. Aux Etats-Unis, le mouvement s’est accéléré sous la bannière du Freedom of Information Act et de l’Open Government Initative[7] de l’Administration Obama. Le Freedom of Information Act relève d’un volet législatif qui stimule certes l’open data, mais qui dépasse plus largement ce périmètre. Cela découle de la culture historique de la transparence aux Etats-Unis, et cela même auprès d’opérateurs privés. Aux Etats-Unis, la libéralisation des données publiques est un axe central. Cette conjonction permet de faire émerger un écosystème et une économie autour des applications et des usages. Aussi, la France est très stricte sur l’anonymisation et la mention de noms privés adossés aux jeux de données. A contrario, je pourrais vous dire très facilement, via le Gouvernement de New York, de combien de propriétés immobilières Robert de Niro dispose à New York.

En tant que designer d’Enigma, quel regard croisé transatlantique portes-tu sur le design interactif quand on connait la primauté du marketing et du design aux Etats-Unis dans la composante produit ?
Les français sont bons en design. Et plus particulièrement en graphisme ce qui n’est pas tout à fait la même chose. Ainsi, je pense que trop de talents français se prédestinent vers le design industriel ou le graphisme, par exemple dans le domaine publicitaire et industriel. Il manque à la France une culture plus prononcée de l’interaction design[8], qui est une discipline très imprégnée et très enseignée aux Etats-Unis. En effet, j’estime que le plus gros obstacle à la compréhension et à la démocratisation des données, par le public, est lié à la difficulté à faire ressortir des cas d’usages et d’applications.
Ainsi, le design interactif a émergé car nous étions jusqu’ici limités par les possibilités techniques très réduites de l’infographie et de la visualisation classique. Par exemple, on ne pouvait mettre en relief qu’un seul sujet d’étude. Or, le design interactif permet justement de rendre les outils de recherche accessibles et d’offrir un cadre de contextualisation.

De France, nous avons l’impression que la Silicon Alley[9] prend sa revanche sur la Californie en ce qui concerne l’entrepreneuriat numérique. Ton sentiment ?
En effet, New York explose actuellement au regard du nombre de startup. La Silicon Alley est un écosystème très vivifiant. Par rapport à la Californie, j’estime que les business model des start up de New York sont dans une certaine mesure, peut-être moins nombreux, mais plus « sérieux » et réalisables. Par ailleurs, les startup de New York sont positionnées, pour la très grande majorité, sur le créneau du B2B a contrario de la Silicon Valley. Elles sont également très portées sur le design interactif. On peut expliquer cet aspect par l’historique de l’industrie de la publication et des médias de New York. De surcroît, les Venture Capital locaux sont « moins » spéculatifs et préfèrent se positionner sur des business model plus « sérieux » par comparaison avec la Silicon Valley

Pour conclure, peux-tu me souligner quelques startup que tu apprécies?
Niveau français, j’appréciais beaucoup Everpix[10] (soutenu par Index Ventures) que je considérais comme le meilleur service de stockage de photos dans le cloud via n’importe quel terminal. Mais, ils ont malheureusement du stopper leur activité fin 2013 faute de financements suffisants. Everpix n’a pas eu le temps d’atteindre sa masse critique monétisable. Côté américains, je suis admiratif de Zendesk[11] (qui n’est plus une startup et fondé par des danois je crois !) au regard de l’excellence du niveau produit qu’ils ont atteint. Même chose pour GitHub[12], qui a réussi à rendre accessible à tout à chacun la publication de codes et la construction d’applications (par essence très compliqué).

Merci à toi Raphaël, à 1 de ces 4 sur NYC !

Pour en savoir plus :




[1] Hicham Oudghiri
[2] Robots d’indexation conçus pour collecter des ressources
[3] Le Freedom of Information Act est une loi américaine de 1966. Fondée sur le principe de la liberté d'information, elle oblige les agences fédérales à transmettre leurs documents, à quiconque en fait la demande
[4] Une Interface de programmation (API) est un protocole de communication temps réel par lequel un logiciel offre des services à d’autres logiciels comme la mise à disposition et l’actualisation de données en temps réel
[5] Mésentente parlementaire sur le budget 2014 qui a entraîné durant quelques semaines l’arrêt du financement des agences gouvernementales
[6] Henri Verdier, co-fondateur de MFG Labs (racheté depuis Havas) et ancien Président du pôle de Compétitivité Digital est depuis Janvier 2013, Directeur d’Etalab (service du Premier ministre français, chargé de créer un « portail unique interministériel des données publiques » françaises)
[7] Cette « initiative » vise à créer un niveau sans précédent de transparence et d'ouverture du gouvernement dans la tendance de l'open source governance et de l’open data, pour permettre à tout citoyen et entreprise intéressés de contribuer à créer les contenus de la politique
[8] Design numérique des systèmes interactifs
[9] La Silicon Alley est un pendant de la Silicon Valley, située en plein cœur de Manhattan. Elle est une technopole concentrant des startup spécialisées dans Internet, les médias, l'édition, la publicité
[10] Everpix a été créé en août 2011 par deux français, Pierre-Olivier Latour, ancien de chez Apple et fondateur de Quartz Composer, et Kevin Quennesson
[11] Zendesk propose aux entreprises les outils nécessaires leur permettant d'établir un service de support auprès de leurs utilisateurs
[12] GitHub est un service web d'hébergement et de gestion de développement de logiciels, utilisant le programme Git

Aucun commentaire:

Enregistrer un commentaire