From c331eb930e91dcc05f7b61576faab958deaa6837 Mon Sep 17 00:00:00 2001 From: ache Date: Mon, 29 Dec 2025 02:10:53 +0100 Subject: Formating of rail and advertising article --- "articles/les-trains-et-la-publicit\303\251.md" | 64 +++++++++--------------- articles/rail-and-advertising.md | 66 +++++++++---------------- 2 files changed, 45 insertions(+), 85 deletions(-) (limited to 'articles') diff --git "a/articles/les-trains-et-la-publicit\303\251.md" "b/articles/les-trains-et-la-publicit\303\251.md" index 6017588..83bb55f 100644 --- "a/articles/les-trains-et-la-publicit\303\251.md" +++ "b/articles/les-trains-et-la-publicit\303\251.md" @@ -1,5 +1,4 @@ --- - pubDate = 2023-12-19 13:34:00Z tags = ['train', 'publicité', 'IA'] @@ -10,12 +9,9 @@ email = "ache@ache.one" [[alt_lang]] lang = "en" url = "/articles/rail-and-advertising" - --- -La publicité pour les trains -=========================== - +# La publicité pour les trains ![Illustration d'un train qui roule vite.](res/train-speed-inv.svg) Parlons trains. Enfin pub. @@ -23,10 +19,7 @@ Enfin ! Vous verrez bien ! L'idée est d'analyser quelques publicités pour des trains à travers le monde. Mais c'est surtout un prétexte pour vous présenter l'utilisation de technologies d'intelligence artificielle récentes. 🤖 - -Sommaire ----------- - +## Sommaire :::question Pourquoi des pubs pour le train ? @@ -36,7 +29,6 @@ Déjà pourquoi pas ? Ensuite, parce que j'aime analyser la construction et la mise en scène des films. Ici, on va prendre des publicités, car je ne vais pas analyser un film entier avant de vous parler d'IA. - ## Une publicité japonaise Ce petit clip de 15s a été créé par le studio Ponoc. @@ -68,7 +60,6 @@ Bref, publicité qui réussi à faire passer un message et parle à son public. En parlant de publicité qui parle à son public... Voyons une publicité d'outre-Rhin. - ## Der Volksgeist (L'esprit du peuple) Cette publicité, mini-film, a été commandée par la Deutsch Bahn[^db] et réalisée par [Pantera](https://bwgtbld.tv/pantera/). @@ -104,7 +95,6 @@ Le ou la réalisateur⋅trice Pantera a d'ailleurs ensuite réalisé plusieurs p Ses autres talentueuses réalisations sont disponibles sur le site [BWGTBLD](https://bwgtbld.tv/). - ## À la française Ce mini-film réalisé pour le groupe français SNCF n'est pas vraiment une pub. @@ -126,9 +116,10 @@ Rythmée par une quelques notes de piano[^claque], elle décrit la SNCF et ses v On y trouve de nombreux jeux de mots et des figures de styles subtiles. Notamment, la SNCF y décrit ses engagements et son caractère humaniste. -[^claque]: Bien que simple, la musique n'est ici pas délaissée pour autant. -Le rythme est calqué et introduit par le bruit ferroviaire. -Chaque moment qui détonne est accentué par [le sonal signature de la SNCF](https://youtu.be/NA5MwhuHWLo?t=2) qui s'y prête étonnamment bien ! +[^claque]: + Bien que simple, la musique n'est ici pas délaissée pour autant. + Le rythme est calqué et introduit par le bruit ferroviaire. + Chaque moment qui détonne est accentué par [le sonal signature de la SNCF](https://youtu.be/NA5MwhuHWLo?t=2) qui s'y prête étonnamment bien ! Tous les Français sont invités à aimer la SNCF dans cette vidéo fédératrice. 💕 Paradoxalement, elle rassemble en insistant sur la diversité de la France et renoue ainsi avec un de ses engagements, **supporter la diversité**. @@ -148,7 +139,8 @@ La SNCF insiste beaucoup sur son caractère humain[^handy] dans cette vidéo. No Je note cependant que malgrès ses efforts et tout comme la DB, la SNCF a du chemin à parcourir au niveau de l'accessibilité.[^handy] ::: -[^handy]: Par exemple, [le service Accès Plus](https://emeraude.my.site.com/aplus/s/demande-prestation?origin=PKhzh3NUh8) destiné a acompagné les voyageurs, bien que gratuit n'est disponible qu'en français. +[^handy]: + Par exemple, [le service Accès Plus](https://emeraude.my.site.com/aplus/s/demande-prestation?origin=PKhzh3NUh8) destiné a acompagné les voyageurs, bien que gratuit n'est disponible qu'en français. Aussi, les OuiGo offrent, de manière générale, [un mauvais niveau d'accessibilité](https://www.sncf-voyageurs.com/fr/voyagez-avec-nous/preparez-votre-voyage/accessibilite/equipement-a-bord/).   @@ -156,7 +148,6 @@ Je note cependant que malgrès ses efforts et tout comme la DB, la SNCF a du che La volonté de la SNCF de s'améliorer semble lente mais réelle, ainsi le prochain [TGV M](https://fr.wikipedia.org/wiki/TGV_M) annonce être accessibile en complète autonomie. 👍 🚄 Si le sujet vous intéresse, ARTE a réalisé un très bon documentaire sur [le militentisme et l'accessibilité](https://www.arte.tv/fr/videos/110252-001-A/arte-regards/) qui parle suscintement de l'accessibilité des trains. - ## Résumé Cette étude des publicités montre que ces clips sont culturellement très riches. @@ -169,12 +160,12 @@ Pour finir, sur une note drôle, je vous présente cet ensemble de vidéos de pr - ## Parlons tech Les sous-titres des vidéos ont été créer à partir d'outils basés sur [de grands modèles de langage](https://fr.wikipedia.org/wiki/Grand_mod%C3%A8le_de_langage) (LLM). @@ -182,15 +173,14 @@ La vidéo de LDz a été agrandie et est bien plus agréable à regarder que [la Pour créer cet article, j'ai ainsi utilisé : - - [yt-dlp](https://github.com/yt-dlp/yt-dlp), un logiciel libre permettant de télécharger des vidéos depuis de nombreux sites, pas seulement youtube. - - [Whisper](https://en.wikipedia.org/wiki/Whisper_(speech_recognition_system)): Un modèle d'apprentissage automatisé cette fois-ci dédié à la reconnaissance vocale (S2P pour _Speech to Text_) issue d'OpenAI. - - [Seamless](https://github.com/facebookresearch/seamless_communication): Un modèle d'apprentissage automatisé créé par Meta et dédié à la traduction multimodale (Texte <=> Texte / Audio <=> Texte / Audio <=> Audio). - - [Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN): Un modèle dédié à l'amélioration des images. - - [ffmpeg](https://fr.wikipedia.org/wiki/FFmpeg): Le logiciel référence de manipulation des codecs audio. +- [yt-dlp](https://github.com/yt-dlp/yt-dlp), un logiciel libre permettant de télécharger des vidéos depuis de nombreux sites, pas seulement youtube. +- [Whisper](): Un modèle d'apprentissage automatisé cette fois-ci dédié à la reconnaissance vocale (S2P pour _Speech to Text_) issue d'OpenAI. +- [Seamless](https://github.com/facebookresearch/seamless_communication): Un modèle d'apprentissage automatisé créé par Meta et dédié à la traduction multimodale (Texte <=> Texte / Audio <=> Texte / Audio <=> Audio). +- [Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN): Un modèle dédié à l'amélioration des images. +- [ffmpeg](https://fr.wikipedia.org/wiki/FFmpeg): Le logiciel référence de manipulation des codecs audio. Je vais passer sur `yt-dlp` et sur `ffmpeg` et me concentrer sur les technologies d'intelligence artificielle. - ### Whisper Ok, donc puisque les vidéos ne sont pas forcément dans une langue des lecteurs de ce blog, j'aurais aimé avoir des sous-titres aux vidéos. @@ -201,7 +191,6 @@ J'ai déjà les sous-titres de la vidéo en français, ça tombe bien, c'est une J'ai créé un container et installer Whisper d'OpenAI directement. La qualité des résultats est différente en fonction de la langue. - #### Japonais En japonais, je peux difficilement évaluer le résultat. @@ -213,19 +202,18 @@ J'ai également utilisé [insanely-fast-whisper](https://github.com/Vaibhavs10/i Je dois admettre que les résultats sont meilleurs et bien plus rapides qu'avec la version d'OpenAI même si ceux-ci ne sont pas au niveau du traitement des langues latines. ::: - #### L'allemand et le français Pour l'allemand c'est globalement correct[^v3]. La vidéo comporte cependant des phrases coupées qui sont mal retranscrites, aussi deux courtes phrases à la fin sont mal retranscrites. En utilisant le modèle de taille moyen, les résultats sont meilleurs. -[^v3]: Attention à bien utiliser la dernière version. Auquel cas, le support du français et de l'allemand est médiocre. -En effet, avant la version 3, « Apollinaire » devenait systématiquement « Napoléon », ce qui est tout de suite, beaucoup plus Rome antique que romantique. +[^v3]: + Attention à bien utiliser la dernière version. Auquel cas, le support du français et de l'allemand est médiocre. + En effet, avant la version 3, « Apollinaire » devenait systématiquement « Napoléon », ce qui est tout de suite, beaucoup plus Rome antique que romantique. Pour le français, il n'y a qu'une erreur de transcription, mais l'orthographe est parfois à désirer, le lyrisme de la chanson y est certainement pour quelque-chose. - J'ai également essayé whispercpp sur l'audio français et allemand. Les résultats sont très bons et à peu près identique aux versions originales. Légèrement moins bon dans l'ensemble. @@ -250,7 +238,6 @@ Il est difficile de savoir à quel point ces méthodes sont utilisables dans un Aussi, les performances ne sont pas indiquées, et certaines méthodes sont très gourmandes en ressources. J'ai essayé d'utiliser par exemple [tevr-asr-tool](https://github.com/DeutscheKI/tevr-asr-tool) mais celui-ci était très consommateur de ressources (⚠️) et n'était pas adapté à un environnement bruyant. - ### Seamless L'idée ici c'est de traduire les sous-titres de whispercpp vers 3 langues, la langue originale, le français et l'anglais. @@ -262,7 +249,6 @@ Malgré une traduction rapide, les résultats étaient décevants. Aussi, l'utilisation même du modèle était, je trouve, trop complexe. ::: - Il n'existe pas d'outil CLI disponible avec Seamless. On doit automatiquement passer par du code Python. Heureusement, HuggingFace propose tout ce dont on a besoin. @@ -314,7 +300,6 @@ Encore une fois pour le japonais, c'est très difficile d'évaluer la pertinence Surtout quand on se base sur un texte qui est certainement mal retranscrit. Par-contre, pour l'allemand et le français, c'est un sans-faute ! 💯 - ### Real-ESRGAN Ici, ça va être très simple, j'ai suivi les instructions du README. @@ -338,26 +323,23 @@ Le reste est une histoire de ffmpeg, le bon encodeur et les bons paramètres. Il semble qu'il existe un modèle de Real-ESRGAN défié à la vidéo. Cependant, je n'ai découvert son existence qu'après avoir commencé l'amélioration basée sur les images individuelles. -Je vous invite à essayer par vous-même le modèle dédié à l'amélioration vidéo et à m'en faire part par e-mail. ;) +Je vous invite à essayer par vous-même le modèle dédié à l'amélioration vidéo et à m'en faire part par e-mail. ;) ::: - ## Conclusion - La conclusion va être rapide, les technologies à base de LLM sont globalement performantes et vont s'améliorer rapidement. 👌 Ce sont désormais des outils utilisables quotidiennement pour produire des documents de qualités. Elles sont disponibles en local et à partir de logiciels libérateurs. -Ce dernier point est important, car on remarque que ces technologies tournent autour des États-Unis et de l'anglais. +Ce dernier point est important, car on remarque que ces technologies tournent autour des États-Unis et de l'anglais. L'existence de logiciels libérateurs dans ce domaine nous garanti que d'autres pays puissent se munir de ces technologies sans dépendre de grosses sociétés comme Meta, Microsoft ou Google ([GAFAM](https://fr.wikipedia.org/wiki/GAFAM)). -L'hégémonie étasunienne sur les outils d'IA n'est concurrencée que par les [BATX](https://fr.wikipedia.org/wiki/BATX) (Baïdu, Alibaba, Tencent et Xiamoi). -Dans un tel contexte, il n'est pas étonnant que ces outils soient américano-centrés. +L'hégémonie étasunienne sur les outils d'IA n'est concurrencée que par les [BATX](https://fr.wikipedia.org/wiki/BATX) (Baïdu, Alibaba, Tencent et Xiamoi). +Dans un tel contexte, il n'est pas étonnant que ces outils soient américano-centrés. Outre le fait que la langue par défaut de ces outils soit l'anglais (voir la seule langue disponible !), il est notable que ces modèles sont plus performants en anglais que dans le reste des langues européennes. Ce qui pose bien évidement un problème d'équité entre les peuples et qui est de fait un avantage concurrentiel pour les entreprises étasuniennes. - ------------------------ +--- Pour finir, je vais vous narrer comment en 5 minutes, j'ai animé l'illustration de cet article. @@ -422,10 +404,8 @@ Qui me rétorque sur un ton un peu moqueur : « C'est pas mal ! Ton train est un peu court par contre. » 😿 - ![« train » un peu court](res/train-speed-v2.svg) Je m'empresse de l'agrandir, je rajoute au passage deux petites bandes pour traduire la vitesse et le tour est joué ! ![Logo de l'article : Un train qui avance rapidement sur des rails, style simplifié vu de profil.](res/train-speed-inv.svg) - diff --git a/articles/rail-and-advertising.md b/articles/rail-and-advertising.md index 8572c1a..1e16121 100644 --- a/articles/rail-and-advertising.md +++ b/articles/rail-and-advertising.md @@ -1,5 +1,4 @@ --- - pubDate = 2023-12-19 13:34:00Z tags = ['train', 'adverts', 'AI'] @@ -10,21 +9,16 @@ email = "ache@ache.one" [[alt_lang]] lang = "fr" url = "/articles/les-trains-et-la-publicité" - --- -Rail and advertising -=========================== +# Rail and advertising ![Illustration of a fast-moving train](res/train-speed-inv.svg) Let's talk trains and advertising ! The idea is to analyse a few advertisements for trains around the world. But it's mainly a pretext for showing you how recent artificial intelligence technologies can be used to improve an article. 🤖 - -Table of contents ----------- - +## Table of contents :::question Why rail ads ? @@ -33,7 +27,6 @@ Why rail ads ? Because I like to analyse the construction and staging of films. Here we're going to take ads, because I'm not going to analyse an entire film before talking to you about AI. - ## A Japanese advert