Assistants intelligents, systèmes autonomes… dans une interview accordée à Wired, Qi Lu, qui a quitté Microsoft pour le géant chinois Baidu, aborde ces sujets et certains de ses propos font échos aux propres travaux d'Apple en la matière. Ils permettent de mieux en comprendre les enjeux ainsi que les défis qui peuvent se présenter, notamment aux entreprises de culture américaine.
Après plusieurs années chez Yahoo, Qi Lu, intime de Bill Gates et de Satya Nadella, a passé 8 ans chez Microsoft où il a piloté la R&D pour Bing, Skype ou encore Office. Au début de cette année il est retourné en Chine afin d'occuper l'un des postes de direction de Baidu.
Comme ses concurrents américains, Baidu développe avec DuerOS un service similaire à Siri ou Cortana et ouvert aux développeurs tiers à l'image d'Alexa chez Amazon. Un assistant présent jusqu'au sein d'équipements d'électroménager (enceintes, réfrigérateurs, téléviseurs…). 731 millions de personnes en Chine sont sur internet, rappelle d'abord le responsable, c'est deux fois la population américaine, ce qui donne d'emblée un « avantage structurel » pour les entreprises du pays.
Qi Lu estime qu'une entreprise chinoise est, paradoxalement, mieux placée que certains de ses homologues américains lorsqu'il s'agit de la reconnaissance vocale au travers des assistants domestiques. Les petits foyers chinois n'ont que peu à voir avec les confortables maisons américaines :
L'environnement acoustique, la représentation des bruits, vont être très différents. Alexa, Echo et Cortana sont optimisés pour les maisons américaines. À mon avis, cela ne fonctionne qu'en Amérique du Nord et peut-être dans une partie de l'Europe. Pour l'essentiel, l'hypothèse de départ est que vous avez des maisons spacieuses, avec plusieurs pièces. En Chine, ce n'est absolument pas le cas. Pour les gens que nous visons, même la jeune génération qui dispose de revenus élevés, ils ont généralement 60 mètres carrés, parfois 90 mètres carrés.
Et d'ajouter que les opportunités offertes à DuerOS sont internationales pour la simple raison « que les maisons au Japon ou au Brésil ressemblent beaucoup plus à celles en Chine qu'à celles aux États-Unis ».
Il salue à ce propos l'avance prise par Amazon avec Alexa, qu'il décrit comme le leader dans le domaine. Un adversaire qui avait été sous-estimé lorsqu'il était chez Microsoft « J'ai travaillé sur Cortana il y a quatre ans et demi. À ce moment là on disait tous "Amazon, oui, cette technologie est tellement en retard." Mais il y a une chose que j'ai apprise, c'est que dans cette course à l'intelligence artificielle, il s'agit en fait d'avoir les bons scénarios d'utilisation et les bons écosystèmes ».
En résumé, Google et Microsoft avaient peut-être la meilleure technologie mais c'est Amazon qui a le mieux réfléchi aux usages. Les autres se concentraient sur une utilisation de ces assistants depuis un téléphone ou un ordinateur, une erreur d'appréciation selon Qi Lu : « À mon avis, le téléphone restera, pour un bon moment encore, un appareil mobile où l'interaction première est tactile ». En clair, tant que vous pouvez utiliser votre téléphone avec les doigts, l'intelligence artificielle et les interactions vocales ne seront que des fonctions annexes, alors qu'il faut un appareil conçu autour de l'intelligence artificielle « pour créer un écosystème solide ».
On parle beaucoup de reconnaissance faciale à propos du prochain iPhone. Cette méthode fait partie du quotidien chez Baidu et avec la reconnaissance vocale, les deux forment des usages qui deviennent courants en Chine même.
Ça m'est devenu tellement plus évident depuis que je vis en Chine, ce que veut dire le fait de placer l'intelligence artificielle avant toute chose. Ça signifie que, dès le départ, vous interagissez différemment avec la technologie. Il faut que ce soit de la reconnaissance de la voix ou de l'image, de la reconnaissance faciale dès le premier contact. Vous pouvez utiliser un écran ou toucher, mais c'est secondaire. Au siège de Baidu, tout est basé sur la reconnaissance des visages. Sur nos distributeurs automatiques vous pouvez acheter des choses avec la voix et votre visage. Et nous travaillons sur un projet de cafétéria. Notre objectif est que, lorsque vous allez dans une cafétéria, vous puissiez sortir avec votre plateau [sans autre forme de procès, ndlr].
Plus loin, il évoque le programme "Apollo" de Baidu de développement d'un système de conduite autonome. Là, ses propos s'alignent avec ceux de Tim Cook tenus récemment lors de la présentation des derniers résultats financiers. Le patron d'Apple replaçait les travaux de son entreprise autour des systèmes autonomes sur une plus large échelle : « Nous sommes focalisés sur les systèmes autonomes du point de vue des technologies de base. Les systèmes autonomes peuvent être utilisés de différentes manières et la conduite autonome n’en est qu’une parmi d'autres, il y a plusieurs domaines d’applications, mais je ne veux pas vous en dire plus. »
Qi Lu en dit un peu plus, il établit un parallèle entre les smartphones et les voitures, chacun dans son domaine est une porte d'entrée vers de nouveaux services sophistiqués :
Si vous voulez vraiment créer de l'intelligence numérique pour acquérir des connaissances, prendre des décisions et s'adapter à l'environnement, vous devez construire des systèmes autonomes. Dans les systèmes autonomes, la voiture est la première application commerciale majeure qui va arriver. C'est comme l'écosystème du téléphone aujourd'hui, il est le plus grand écosystème logiciel sur silicium. Je crois que la même chose va se passer pour les systèmes autonomes.
La voiture va permettre de bâtir un écosystème plus vaste. Et le même ensemble de capacités - matériels, capteurs, processeurs, logiciels - sera utilisé pour fabriquer des robots industriels, des robots domestiques. Nous voulons avoir des centaines d'entreprises et d'universités qui planchent sur ce sujet, en construisant un très vaste écosystème. Ensuite, nous pourrons construire des robots, des drones et fabriquer tous ces systèmes autonomes. Donc, pour moi, l'autonomie est une clé.