LoLiTa : Logiciels Libres à Tahiti et dans les îles
Sur le Web

Standblog

Tristan Nitot sur les standards du Web, les navigateurs et la technologie


Articles les plus récents

En vrac sur le climat

mercredi 5 juin 2019 par Tristan — Environnement

Vallon dans le Morvan au printemps


Qwant, Microsoft et Vivatech

dimanche 19 mai 2019 par Tristan — Technologie

J’ai passé 3 jours sur le stand Qwant à Vivatech, et les questions ont fusé suite aux annonces. Je fais donc à l’arrache un article qui j’espère répondra aux questions fréquemment posées sans révéler de choses confidentielles. Je pense que mes collègues publieront la semaine prochaine un billet de blog officiel plus technique sur ce sujet.

Pourquoi ce partenariat avec Microsoft ?

Qwant connaît une très forte croissance (en gros le nombre de requêtes double chaque année[1]), ce qui veut dire qu’il faut augmenter notre capacité serveurs en conséquence. Par ailleurs, nous travaillons à améliorer sans cesse la qualité de nos résultats, ce qui implique de disposer de plus de puissance de calcul pour mieux indexer le Web (lequel est lui aussi en croissance). Tout cela fait que nous devons investir massivement dans l’infrastructure de la façon la plus efficace possible compte tenu des finances dont nous disposons (qui sont infiniment moindre que celle de nos concurrents américains).

Par ailleurs, les utilisateurs de Qwant ont bien remarqué que Microsoft est un partenaire de longue date de Qwant, puisque ce sont eux qui font office de régie publicitaire et contribuent à compléter les résultats de recherche là où Qwant en a besoin comme sur les images comme expliqué dans ce billet. Autrement dit, quand vous voyez une publicité dans les pages de résultats suite à une recherche sur Qwant, vous avez une publicité fournie par Microsoft, c’est d’ailleurs marqué en toutes lettres en bas à droite du bloc publicitaire.

Pub Microsoft sur Qwant.png

Pour en revenir au besoin de puissance supplémentaire, deux possibilités se présentent : acheter des serveurs (ce qu’on a fait jusqu’à présent) ou en louer à des professionnels du Cloud. Maintenant, nous allons faire les deux : acheter des serveurs pour mettre dans nos baies de Datacenter et aussi en louer. Ça va nous permettre d’avoir un Qwant encore plus performant et de meilleur qualité alors qu’il reçoit de plus en plus de demandes.

La vie privée est elle menacée par cet accord ?

Non. C’était bien sûr un point fondamental pour nous et Microsoft l’a bien compris. Pour ceux que la technique intéressent, voici comment nous avons fait pour nous en assurer.

Un moteur de recherche, c’est en gros 4 étapes (j’espère que les spécialistes me pardonneront les simplifications que je fais ci-dessous et que les autre tolèreront mon franglais technique) :

  1. Crawling : parcourir le Web pour lire les pages Web. Evidemment, il y a ici un gros besoin de bande passante ;
  2. Ranking : calculer l’importance de chaque page, leur donner un rang : quelles sont celles qui sont populaires (par exemples parce qu’elles ont plein de liens entrants), quelle est leur qualité (est-ce du spam ou du contenu légitime ?) de façon à savoir lesquelles seront proposées en premier aux utilisateurs ;
  3. Indexation : calculer l’index des pages. Comme un index dans un livre, qui recense à quelle page on trouve quel mot ou quel concept. Super gourmand en calcul, vu qu’on travaille sur des dizaines de milliards de pages Web ! On notera que les données manipulées ne sont pas liées à l’utilisateur vu que ce sont des pages Web qui sont publiques. C’est cette partie-là qui tournera avec des algorithmes Qwant sur des machines qui seront louées à Microsoft.
  4. Front : c’est l’interaction avec l’utilisateur et donc la partie sensible au niveau vie privée, car c’est là qu’on a à la fois la requête de l’utilisateur (sa demande) et son adresse IP[2]. Cette partie reste bien sûr sur les serveurs Qwant (ça va sans dire mais ça va mieux en le disant).

Donc, pour résumer : seules des données issues du Web (et donc publiques) seront traitées par les algorithmes de Qwant qui tourneront sur les serveurs loués à Microsoft.

Pourquoi avoir choisi Microsoft ?

Nous avons tout d’abord essayé de travailler avec d’autres acteurs français et européens, mais Microsoft, avec son Cloud Azure, nous permet de faire des calculs de type FPGA et supporte aussi Kubernetes, ce qui est important pour nous et n’est pas encore suffisamment au point chez d’autres acteurs. Ils disposent aussi de machines équipées de SSD, (donc très performantes en terme d’entrées/sorties, ce qui est important pour l’index).

Signer avec Microsoft ne veut pas non plus dire que nous faisons toute l’indexation sur des machines Azure : nous indexons déjà 20 milliards de pages sur notre infrastructure, et donc nous voulons en indexer 80 milliards de plus sur des machines Azure. Nous conserverons de la capacité d’indexation sur notre infra et nous la ferons même grandir car il est essentiel de ne pas être trop dépendant d’un fournisseur, quel qu’il soit.

Quand même, Microsoft, c’est pas le diable ?

J’avoue que quand je suis allé au Campus Microsoft à Issy les Moulineaux, j’ai un peu eu l’impression de visiter l’Étoile Noire :-D . Mais bon, la guerre des navigateurs et “Linux c’est le cancer” c’était au siècle dernier et depuis Microsoft a bien changé. Ils ont racheté GitHub, ils intègrent un noyau Linux dans Windows 10. Microsoft n’est jamais aussi bon et fréquentable que quand il est challenger. Assurons-nous que cela reste ainsi ;-)

Notes

[1] Et de nombreuses entreprises et administrations annoncent mettre Qwant par défaut sur leurs postes comme BNP Paribas ou l’administration qui va faire une circulaire visant le basculement vers Qwant de 4 millions de postes, ou le lancement de nouveaux produits comme Qwant Causes.

[2] Je rappelle que l’adresse IP est hachée et saltée aussitôt que possible pour empêcher tout rapprochement ultérieur de la requête et de l’IP.


En vrac du vendredi

jeudi 9 mai 2019 par Tristan — En vrac, avion, climat, extinction, facebook, mobilité

Technologie et startups :

Facebook

Amazon

Google :

  • Oracle balance comment Google nous traque dans le monde réel et ça fait mal. Le plus dramatique, c’est qu’Oracle semble… jaloux de la firme de Mountain View !
  • Google va mettre dans Chrome une fonctionnalité pour contrôler les cookies… pour nous faire croire qu’ils sont pour la vie privée. « Un truc pas facile à faire gober, compte tenu de l’immense quantité de données utilisateurs qu’ils récupèrent » explique le Wall Street Journal ;
  • Google multiplie les mesurettes pour la vie privée « Après Facebook, c’est au tour de Google de profiter de son show annuel pour une séance de privacy washing. Le géant américain veut se montrer plus respectueux de nos données, sans changement de fond. Il est surtout question de petites évolutions et autres subtilités dans sa communication. » Comme l’intertitre l’indique, il n’y a pas de minimisation de la collecte. Google va donc continuer au prendre autant de données personnelles qu’avant…

Divers

Climat


Réinventer la citoyenneté à l'heure d'Internet

lundi 6 mai 2019 par Tristan — Technologie

banniere 5juin.jpg

Le 5 juin 2019 de 18 h à 20 h, avec plein de gens qui ont toute la considération et avec qui je partage mon éditeur, C & F Éditions, je vais participer à une table ronde qui se tiendra à Bagnolet (Métro Gallieni). Plus de détails sur https://cfeditions.com/5juin/


En vrac du jeudi

vendredi 19 avril 2019 par Tristan — En vrac, electrique, facebook, google

Arbre en fleurs

Facebook bat des records

Cette semaine, Facebook nous fait un festival de conneries, de scandales et d’embrouilles. Cette boîte s’enfonce à chaque fois un peu plus. Une honte pour toute l’industrie du numérique. Je propose qu’elle change de slogan et remplace son “Move fast and break things” par un plus lucide « Dans le pire, nous ne sommes jamais décevants ». Florilège :

Google n’est pas en reste

En vrac sur le numérique

En vrac sur la politique, le climat, et l’environnement


En vrac du mercredi : climat et numérique

mercredi 10 avril 2019 par Tristan — En vrac, bitcoin, chine, facebook, google, photo, tesla, velo

Velo Moustache au bois de Boulogne au printemps.jpg

À propos de numérique

À propos d’environnement


Citation du jour : Hanna Arendt et l'importance de la vérité

mercredi 10 avril 2019 par Tristan — Politique

Le chomage baisse monte et se stabilise simultanement.PNG

Copie d’écran par h16

Hannah Arendt, politologue et journaliste allemande, qui a travaillé sur le totalitarisme, expliquait en 1974 une chose qui résonne fortement en cette période de désinformation, de fake news, autant sur la politique que sur l’environnement et bien d’autres choses :

Quand tout le monde vous ment en permanence, le résultat n’est pas que vous croyez ces mensonges, mais que plus personne ne croit plus rien. Un peuple qui ne peut plus rien croire ne peut se faire une opinion. Il est privé non seulement de sa capacité d’agir mais aussi de sa capacité de penser et de juger. Et avec un tel peuple vous pouvez faire ce qu’il vous plaît.


En vrac du lundi

lundi 25 mars 2019 par Tristan — En vrac

Bonjour les enfants !

mercredi 20 mars 2019 par Tristan — Technologie

Ce billet est à l’intention des enfants de Paris, plus particulièrement ceux qui seront présent à l’événement sur la Francophonie à la mairie du XVe arrondissement, à qui je présente le Web. (Pour les autres, je mets une photo de votre serviteur avec son vélo pour que vous ne soyez pas venus pour rien ;-) )

Tristan Tour Eiffel Moustache.jpg


Le Web a 30 ans

mardi 12 mars 2019 par Tristan — Technologie

Il y a 30 ans aujourd’hui, naissait le Web. Je ne l’ai découvert que quelques années plus tard, et j’ai été ébahi par son potentiel. Soudain, l’Internet devenait utilisable par beaucoup plus de gens : il suffisait d’avoir un navigateur et de cliquer sur les liens bleus soulignés. C’était à la portée de tous !

Fin 1996, je postule chez Netscape, pour faire partie de l’aventure. Rapidement, j’ai vu une entreprise essayer de prendre le contrôle du Web en diffusant un navigateur avec son système d’exploitation, dont elle avait le monopole. C’était illégal, un abus de position dominante. C’était aussi toxique pour le Web, et cela m’a mis en colère. Coup de bol, au même moment (début 1998), mes collègues californiens lançaient le projet Mozilla, que j’ai rejoint. Vous connaissez peut-être la suite : AOL/Netscape essaye longuement de faire marcher le projet Mozilla jusqu’en 2003 avant de l’abandonner. Mozilla Foundation est créée, je monte Mozilla Europe avec Peter, Pascal,Axel et d’autres. Nous savions que Firefox était dans les tuyaux, et qu’il pouvait jouer un rôle décisif. Son succès a dépassé toutes nos attentes : il est massivement adopté en Europe et dans une moindre mesure aux USA et au Japon. Exit Internet Explorer, le monopole est renversé, la diversité des navigateurs est rétablie.

Février 2015 : je quitte Mozilla après 17 ans d’implication dans le projet. Pour moi, il est toujours très important de proposer un navigateur au service des utilisateurs. Le problème s’est même étendu aux téléphones mobiles, depuis l’avènement des smartphones en 2007. Mais le faire n’est pas suffisant si cela revient à pousser les utilisateurs dans les bras des géants de l’Internet qui collectent les données personnelles de chacun pour mieux servir leurs vrais clients : les annonceurs, à qui est vendue de la publicité ciblée. L’une de ces plateformes est sur le point d’obtenir le monopole des navigateurs… L’histoire est un éternel recommencement !

Juin 2018 : j’arrive chez Qwant. Mon objectif : aider le projet Qwant dans son adoption par les utilisateurs et aussi l’accompagner dans l’open-source / logiciel libre. Qwant a deux particularités :

  1. c’est un projet français et donc européen.
  2. c’est un moteur de recherche qui ne piste pas ses utilisateurs.

C’est la combinaison de ces deux qualités qui m’a séduit, en plus de la volonté d’aller vers plus de Libre.

Car en fait, je pense que le modèle des Google et de Facebook est toxique pour la démocratie. Tout savoir sur tout le monde, c’est une responsabilité que personne ne devrait avoir à porter, pas même un État. Car inévitablement, ça attise les convoitise, ça pousse à la manipulation. Les révélations Snowden (surveiller tous les internautes pour assoir l’hégémonie d’un pays) ou plus récemment Cambridge Analytica (utiliser les données d’un réseau social pour faire basculer des élections démocratiques) démontrent que ces dangers sont réels.

Évidemment, vouloir changer le Web, ça peut sembler naïf. Effectivement, il serait bien prétentieux d’affirmer qu’on est sûrs d’y arriver. Mais faut-il être certain du succès pour s’engager dans un projet ?

Heureusement, Tim Berners-Lee nous le rappelle :

Le Web est fait pour tous, et nous avons collectivement la capacité de le changer. Ça ne sera pas facile. Mais si nous rêvons un peu et travaillons beaucoup, nous pouvons obtenir le Web que nous voulons.

Le rêve, nous l’avons, chez Qwant. Et mon expérience avec Mozilla me laisse croire qu’effectivement, avec beaucoup de travail, c’est possible de changer le Web pour le meilleur. Je sais : j’ai déjà eu la chance de participer à un tel effort chez Mozilla. Vingt et un ans après, je continue de croire qu’il est possible de remporter cette bataille. Et je sais de façon certaine que la cause est juste : le monde a besoin d’un Web où nous, utilisateurs, ne sommes pas considérés comme du bétail. Alors au boulot !


Accueil du site | Contact | Plan du site | | Statistiques du site | Visiteurs : 770966

Suivre la vie du site fr    ?    |    Les sites syndiqués OPML   ?

Site réalisé avec SPIP 2.0.26 + AHUNTSIC , Powered by Mana

Creative Commons License