Avec une vision audacieuse et une passion pour l'innovation, Rafi Haladjian a joué un rôle clé dans la définition et la réalisation de nouveaux modèles commerciaux qui ont transformé des industries entières. Grâce à sa solide expérience en matière de stratégie, de développement des affaires et de leadership, il est devenu un acteur influent dans les milieux d'affaires et technologiques. Sa carrière exceptionnelle en fait un modèle pour les entrepreneurs en herbe et un leader reconnu dans le monde de l'innovation. Avec Juice dont Rafi Haladjian a eu l’idée en 2007, il s’attaque à la voix artificielle mais surtout aux podcasts natifs et replay. Maintenant que chacun d’entre nous possède des appareils auditifs (les EarPods, NDLR) qu’on ne quitte que rarement, il souffle dans nos oreilles H24. Entretien exclusif avec un visionnaire...
Rafi Haladjian analyse très bien la situation et les usages depuis fort longtemps. Dans tous les domaines de l’information, l’offre est pléthorique et la saturation des contenus écrits et visuels sur des écrans a joué un rôle pour l’appétence du podcast, alors que ce dernier existe depuis vingt ans. "Cela a permis une échappatoire et un temps de disponibilité que nous appelons de notre côté le réveil des oreilles. On pouvait le faire il y a quinze ans, mais si nous le faisons maintenant, c’est que cela a un sens", nous explique Rafi Haladjian.
Le réveil des oreilles
Ce n’est plus la disponibilité des contenus qui est importante mais l’expérience que l’on en a. "Si l’on regarde ce qui s’est passé dans les médias visuels, au début des années 2000, on avait des blogs, tout le monde créait son blog, puis les réseaux sociaux sont arrivés, proposant des enchaînements de contenus très disparates de provenances diverses. Une sorte de fil unificateur de l’expérience de l’utilisateur qui est libre de se disperser et d’aller faire sa cueillette lui-même et qui lui permet de découvrir des choses nouvelles", continue Rafi.
Il décide alors de se lancer dans une nouvelle aventure en utilisant l’intelligence artificielle et les voix de synthèse. Une application qui vous permet de vous laisser entraîner dans un flux de contenus audio différents : des infos de 3 secondes lues en direct avec des voix artificielles depuis la presse écrite, une sélection de podcasts qui font en général moins de 10 minutes, de la musique avec son compte iTunes, Deezer ou Spotify et des extras, dont le fameux Bernard à l’humeur dépressive et l’horloge lue par une voix de synthèse de petite fille. Rafi Haladjian renverse intelligemment le modèle des enceintes connectées. Au lieu d’attendre que l’utilisateur demande ce qu’il veut, Juice vous joue des contenus qui correspondent à vos besoins avec la possibilité de réagir seulement sur les audios que vous n’aimez pas. "Si on m’avait demandé de concocter moi-même mon contenu sur Juice, jamais je n'aurais ajouté des programmes de Radio Classique ou de RTL. Parce que j’étais élevé avec France Inter depuis tout petit. Et là, par défaut, j’ai tous les commentateurs politiques de toutes les radios tous les matins au hasard de manière équilibrée. Par exemple, je les écoute et je trouve chouette la journaliste qui fait l’édito politique sur RTL, elle le fait très bien et c’est très intéressant. J’ai le droit de détester, mais je ne suis pas là pour dire ce que je veux, car sinon je vais toujours demander la même chose. On finit toujours dans une bulle informationnelle."
Il décide alors de se lancer dans une nouvelle aventure en utilisant l’intelligence artificielle et les voix de synthèse. Une application qui vous permet de vous laisser entraîner dans un flux de contenus audio différents : des infos de 3 secondes lues en direct avec des voix artificielles depuis la presse écrite, une sélection de podcasts qui font en général moins de 10 minutes, de la musique avec son compte iTunes, Deezer ou Spotify et des extras, dont le fameux Bernard à l’humeur dépressive et l’horloge lue par une voix de synthèse de petite fille. Rafi Haladjian renverse intelligemment le modèle des enceintes connectées. Au lieu d’attendre que l’utilisateur demande ce qu’il veut, Juice vous joue des contenus qui correspondent à vos besoins avec la possibilité de réagir seulement sur les audios que vous n’aimez pas. "Si on m’avait demandé de concocter moi-même mon contenu sur Juice, jamais je n'aurais ajouté des programmes de Radio Classique ou de RTL. Parce que j’étais élevé avec France Inter depuis tout petit. Et là, par défaut, j’ai tous les commentateurs politiques de toutes les radios tous les matins au hasard de manière équilibrée. Par exemple, je les écoute et je trouve chouette la journaliste qui fait l’édito politique sur RTL, elle le fait très bien et c’est très intéressant. J’ai le droit de détester, mais je ne suis pas là pour dire ce que je veux, car sinon je vais toujours demander la même chose. On finit toujours dans une bulle informationnelle."
Les voix de synthèse sont insupportables
"Écouter des voix de synthèse, même si je trouve que l’on a fait un bon boulot sur le fait de les rendre acceptables, c’est un peu insupportable, les podcasts sont là pour ajouter un peu de voix humaine, ce qui fait que dans l’impression d’ensemble, on ne sait plus qui parle", avoue Rafi Haladjian. On ne sait plus si c’est une voix humaine qui parle ou si c’est un podcast ou une voix de robot. Une des manières de rendre la voix de robot acceptable, c’est aussi de mélanger les genres dans l’impression d’ensemble avec leurs 37 voix, dont certaines composées par Juice. Les voix de robot sont relativement bonnes aujourd’hui et avec un peu d’effort, on ne voit quasiment plus la différence. Surtout que l’équipe de Juice a eu la maline idée d’ajouter un "bed" musical sur les voix artificielles. La musique, par le biais de ses comptes et donc de la musique qu’on aime, vient pour soulager l’utilisateur pour faire des petites virgules musicales afin d’avoir des moments pour souffler un peu.
Des robots injustement accusés
Le travail de sound design est indispensable. "On s’est bien amusés pour rendre les voix de synthèse acceptables en faisant des expériences assez drôles. Avec la même voix de synthèse, on mettait un son de hall de gare derrière et on perdait le sentiment de voix de robot. Ce qui permettait de l’insérer dans un environnement qui le rendait réel. La perception de la voix de synthèse n’est pas uniquement dans la qualité de la voix ou dans la qualité technique de la voix. Elle est dans l’habillage, le contexte, dans la psychologie, l’humour. Souvent, une faute de frappe humaine et la voix de synthèse sonne comme un robot, ils sont injustement accusés…"
Son idée est d’inventer l’audio 2.0. Car pour Rafi Haladjian, il existe un fossé entre ce qui se fait en audio et ce qui se fait dans les médias visuels. "Pourquoi est-ce que sur Internet tout est interactif en agrégeant des contenus qui viennent de 52 APIS et en audio on est encore au jukebox où on ne fait rien d’autre que de rassembler de manière intelligente mais passive des contenus préenregistrés ?" conclut Rafi Haladjian.
Son idée est d’inventer l’audio 2.0. Car pour Rafi Haladjian, il existe un fossé entre ce qui se fait en audio et ce qui se fait dans les médias visuels. "Pourquoi est-ce que sur Internet tout est interactif en agrégeant des contenus qui viennent de 52 APIS et en audio on est encore au jukebox où on ne fait rien d’autre que de rassembler de manière intelligente mais passive des contenus préenregistrés ?" conclut Rafi Haladjian.
Bio Express
Stéphane Dadian
CEO et cofondateur. 27 ans (à gauche sur la photo). Après une formation d’ingénieur à Centrale suivi d’un stage en robotique au Lab de Cap Gemini, il part pour deux ans à l’université du Michigan pour poursuivre des études en robotique et faire de la recherche dans le laboratoire spécialisé dans les technologies du langage et de l’information (NLP). Il travaille ensuite pendant deux ans dans la Silicon Valley dans des start-up spécialisées dans le NLP et la VoiceTech.
Arié Selinger
CTO et cofondateur. 23 ans (au centre). Étudiant à l’École Centrale Paris, il rejoint le Paris Digital Lab où il se forme en intelligence artificielle et software engineering. Il part ensuite dans la Silicon Valley où il fait un stage en traitement du langage naturel (NLP). Il poursuit enfin ses études au Massachusetts Institute of Technology (MIT) où il se spécialise en data science et fait de la recherche au Centre de Recherche Opérationnelle (MIT ORC).
Rafi Haladjian
Chairman et cofondateur (à droite sur la photo). Multi-entrepreneur. Pionnier du Minitel, de l’audiotel, de l’Internet, de l’Internet mobile et de l’Internet des objets. Il a notamment fondé la toute première entreprise de l’Internet français et a cocréé Nabaztag le lapin communicant, précurseur des assistants vocaux et des enceintes connectées.
CEO et cofondateur. 27 ans (à gauche sur la photo). Après une formation d’ingénieur à Centrale suivi d’un stage en robotique au Lab de Cap Gemini, il part pour deux ans à l’université du Michigan pour poursuivre des études en robotique et faire de la recherche dans le laboratoire spécialisé dans les technologies du langage et de l’information (NLP). Il travaille ensuite pendant deux ans dans la Silicon Valley dans des start-up spécialisées dans le NLP et la VoiceTech.
Arié Selinger
CTO et cofondateur. 23 ans (au centre). Étudiant à l’École Centrale Paris, il rejoint le Paris Digital Lab où il se forme en intelligence artificielle et software engineering. Il part ensuite dans la Silicon Valley où il fait un stage en traitement du langage naturel (NLP). Il poursuit enfin ses études au Massachusetts Institute of Technology (MIT) où il se spécialise en data science et fait de la recherche au Centre de Recherche Opérationnelle (MIT ORC).
Rafi Haladjian
Chairman et cofondateur (à droite sur la photo). Multi-entrepreneur. Pionnier du Minitel, de l’audiotel, de l’Internet, de l’Internet mobile et de l’Internet des objets. Il a notamment fondé la toute première entreprise de l’Internet français et a cocréé Nabaztag le lapin communicant, précurseur des assistants vocaux et des enceintes connectées.