diff options
| author | ache <ache@ache.one> | 2025-12-29 02:10:53 +0100 |
|---|---|---|
| committer | ache <ache@ache.one> | 2025-12-29 02:12:37 +0100 |
| commit | c331eb930e91dcc05f7b61576faab958deaa6837 (patch) | |
| tree | 7839abaa9307b66fb117093ad2647054ca3eac51 /articles | |
| parent | Add the new ache.svg based on a single path (diff) | |
Formating of rail and advertising article
Diffstat (limited to 'articles')
| -rw-r--r-- | articles/les-trains-et-la-publicité.md | 64 | ||||
| -rw-r--r-- | articles/rail-and-advertising.md | 66 |
2 files changed, 45 insertions, 85 deletions
diff --git a/articles/les-trains-et-la-publicité.md b/articles/les-trains-et-la-publicité.md index 6017588..83bb55f 100644 --- a/articles/les-trains-et-la-publicité.md +++ b/articles/les-trains-et-la-publicité.md @@ -1,5 +1,4 @@ --- - pubDate = 2023-12-19 13:34:00Z tags = ['train', 'publicité', 'IA'] @@ -10,12 +9,9 @@ email = "ache@ache.one" [[alt_lang]] lang = "en" url = "/articles/rail-and-advertising" - --- -La publicité pour les trains -=========================== - +# La publicité pour les trains  Parlons trains. Enfin pub. @@ -23,10 +19,7 @@ Enfin ! Vous verrez bien ! L'idée est d'analyser quelques publicités pour des trains à travers le monde. Mais c'est surtout un prétexte pour vous présenter l'utilisation de technologies d'intelligence artificielle récentes. 🤖 - -Sommaire ----------- - +## Sommaire :::question Pourquoi des pubs pour le train ? @@ -36,7 +29,6 @@ Déjà pourquoi pas ? Ensuite, parce que j'aime analyser la construction et la mise en scène des films. Ici, on va prendre des publicités, car je ne vais pas analyser un film entier avant de vous parler d'IA. - ## Une publicité japonaise Ce petit clip de 15s a été créé par le studio Ponoc. @@ -68,7 +60,6 @@ Bref, publicité qui réussi à faire passer un message et parle à son public. En parlant de publicité qui parle à son public... Voyons une publicité d'outre-Rhin. - ## Der Volksgeist (L'esprit du peuple) Cette publicité, mini-film, a été commandée par la Deutsch Bahn[^db] et réalisée par [Pantera](https://bwgtbld.tv/pantera/). @@ -104,7 +95,6 @@ Le ou la réalisateur⋅trice Pantera a d'ailleurs ensuite réalisé plusieurs p Ses autres talentueuses réalisations sont disponibles sur le site [BWGTBLD](https://bwgtbld.tv/). - ## À la française Ce mini-film réalisé pour le groupe français SNCF n'est pas vraiment une pub. @@ -126,9 +116,10 @@ Rythmée par une quelques notes de piano[^claque], elle décrit la SNCF et ses v On y trouve de nombreux jeux de mots et des figures de styles subtiles. Notamment, la SNCF y décrit ses engagements et son caractère humaniste. -[^claque]: Bien que simple, la musique n'est ici pas délaissée pour autant. -Le rythme est calqué et introduit par le bruit ferroviaire. -Chaque moment qui détonne est accentué par [le sonal signature de la SNCF](https://youtu.be/NA5MwhuHWLo?t=2) qui s'y prête étonnamment bien ! +[^claque]: + Bien que simple, la musique n'est ici pas délaissée pour autant. + Le rythme est calqué et introduit par le bruit ferroviaire. + Chaque moment qui détonne est accentué par [le sonal signature de la SNCF](https://youtu.be/NA5MwhuHWLo?t=2) qui s'y prête étonnamment bien ! Tous les Français sont invités à aimer la SNCF dans cette vidéo fédératrice. 💕 Paradoxalement, elle rassemble en insistant sur la diversité de la France et renoue ainsi avec un de ses engagements, **supporter la diversité**. @@ -148,7 +139,8 @@ La SNCF insiste beaucoup sur son caractère humain[^handy] dans cette vidéo. No Je note cependant que malgrès ses efforts et tout comme la DB, la SNCF a du chemin à parcourir au niveau de l'accessibilité.[^handy] ::: -[^handy]: Par exemple, [le service Accès Plus](https://emeraude.my.site.com/aplus/s/demande-prestation?origin=PKhzh3NUh8) destiné a acompagné les voyageurs, bien que gratuit n'est disponible qu'en français. +[^handy]: + Par exemple, [le service Accès Plus](https://emeraude.my.site.com/aplus/s/demande-prestation?origin=PKhzh3NUh8) destiné a acompagné les voyageurs, bien que gratuit n'est disponible qu'en français. Aussi, les OuiGo offrent, de manière générale, [un mauvais niveau d'accessibilité](https://www.sncf-voyageurs.com/fr/voyagez-avec-nous/preparez-votre-voyage/accessibilite/equipement-a-bord/). @@ -156,7 +148,6 @@ Je note cependant que malgrès ses efforts et tout comme la DB, la SNCF a du che La volonté de la SNCF de s'améliorer semble lente mais réelle, ainsi le prochain [TGV M](https://fr.wikipedia.org/wiki/TGV_M) annonce être accessibile en complète autonomie. 👍 🚄 Si le sujet vous intéresse, ARTE a réalisé un très bon documentaire sur [le militentisme et l'accessibilité](https://www.arte.tv/fr/videos/110252-001-A/arte-regards/) qui parle suscintement de l'accessibilité des trains. - ## Résumé Cette étude des publicités montre que ces clips sont culturellement très riches. @@ -169,12 +160,12 @@ Pour finir, sur une note drôle, je vous présente cet ensemble de vidéos de pr <video controls class="big" preload=none poster="res/LDz_ads_railway-safety_poster.png"> + <source src="res/LDz_ads_railway-safety.mp4" type="video/mp4; codecs=av01.1.31M.08,Opus; profiles=isom,av01,iso2,mp41" /> <source src="res/LDz_ads_railway-safety.webm" type="video/webm" /> <p>Ensemble de vidéos de la LDz métant en scène les personnages d'Avārijas Brigāde dans de le but de sensibilisé la population à la sureté ferroviaire.</p> </video> - ## Parlons tech Les sous-titres des vidéos ont été créer à partir d'outils basés sur [de grands modèles de langage](https://fr.wikipedia.org/wiki/Grand_mod%C3%A8le_de_langage) (LLM). @@ -182,15 +173,14 @@ La vidéo de LDz a été agrandie et est bien plus agréable à regarder que [la Pour créer cet article, j'ai ainsi utilisé : - - [yt-dlp](https://github.com/yt-dlp/yt-dlp), un logiciel libre permettant de télécharger des vidéos depuis de nombreux sites, pas seulement youtube. - - [Whisper](https://en.wikipedia.org/wiki/Whisper_(speech_recognition_system)): Un modèle d'apprentissage automatisé cette fois-ci dédié à la reconnaissance vocale (S2P pour _Speech to Text_) issue d'OpenAI. - - [Seamless](https://github.com/facebookresearch/seamless_communication): Un modèle d'apprentissage automatisé créé par Meta et dédié à la traduction multimodale (Texte <=> Texte / Audio <=> Texte / Audio <=> Audio). - - [Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN): Un modèle dédié à l'amélioration des images. - - [ffmpeg](https://fr.wikipedia.org/wiki/FFmpeg): Le logiciel référence de manipulation des codecs audio. +- [yt-dlp](https://github.com/yt-dlp/yt-dlp), un logiciel libre permettant de télécharger des vidéos depuis de nombreux sites, pas seulement youtube. +- [Whisper](<https://en.wikipedia.org/wiki/Whisper_(speech_recognition_system)>): Un modèle d'apprentissage automatisé cette fois-ci dédié à la reconnaissance vocale (S2P pour _Speech to Text_) issue d'OpenAI. +- [Seamless](https://github.com/facebookresearch/seamless_communication): Un modèle d'apprentissage automatisé créé par Meta et dédié à la traduction multimodale (Texte <=> Texte / Audio <=> Texte / Audio <=> Audio). +- [Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN): Un modèle dédié à l'amélioration des images. +- [ffmpeg](https://fr.wikipedia.org/wiki/FFmpeg): Le logiciel référence de manipulation des codecs audio. Je vais passer sur `yt-dlp` et sur `ffmpeg` et me concentrer sur les technologies d'intelligence artificielle. - ### Whisper Ok, donc puisque les vidéos ne sont pas forcément dans une langue des lecteurs de ce blog, j'aurais aimé avoir des sous-titres aux vidéos. @@ -201,7 +191,6 @@ J'ai déjà les sous-titres de la vidéo en français, ça tombe bien, c'est une J'ai créé un container et installer Whisper d'OpenAI directement. La qualité des résultats est différente en fonction de la langue. - #### Japonais En japonais, je peux difficilement évaluer le résultat. @@ -213,19 +202,18 @@ J'ai également utilisé [insanely-fast-whisper](https://github.com/Vaibhavs10/i Je dois admettre que les résultats sont meilleurs et bien plus rapides qu'avec la version d'OpenAI même si ceux-ci ne sont pas au niveau du traitement des langues latines. ::: - #### L'allemand et le français Pour l'allemand c'est globalement correct[^v3]. La vidéo comporte cependant des phrases coupées qui sont mal retranscrites, aussi deux courtes phrases à la fin sont mal retranscrites. En utilisant le modèle de taille moyen, les résultats sont meilleurs. -[^v3]: Attention à bien utiliser la dernière version. Auquel cas, le support du français et de l'allemand est médiocre. -En effet, avant la version 3, « Apollinaire » devenait systématiquement « Napoléon », ce qui est tout de suite, beaucoup plus Rome antique que romantique. +[^v3]: + Attention à bien utiliser la dernière version. Auquel cas, le support du français et de l'allemand est médiocre. + En effet, avant la version 3, « Apollinaire » devenait systématiquement « Napoléon », ce qui est tout de suite, beaucoup plus Rome antique que romantique. Pour le français, il n'y a qu'une erreur de transcription, mais l'orthographe est parfois à désirer, le lyrisme de la chanson y est certainement pour quelque-chose. - J'ai également essayé whispercpp sur l'audio français et allemand. Les résultats sont très bons et à peu près identique aux versions originales. Légèrement moins bon dans l'ensemble. @@ -250,7 +238,6 @@ Il est difficile de savoir à quel point ces méthodes sont utilisables dans un Aussi, les performances ne sont pas indiquées, et certaines méthodes sont très gourmandes en ressources. J'ai essayé d'utiliser par exemple [tevr-asr-tool](https://github.com/DeutscheKI/tevr-asr-tool) mais celui-ci était très consommateur de ressources (⚠️) et n'était pas adapté à un environnement bruyant. - ### Seamless L'idée ici c'est de traduire les sous-titres de whispercpp vers 3 langues, la langue originale, le français et l'anglais. @@ -262,7 +249,6 @@ Malgré une traduction rapide, les résultats étaient décevants. Aussi, l'utilisation même du modèle était, je trouve, trop complexe. ::: - Il n'existe pas d'outil CLI disponible avec Seamless. On doit automatiquement passer par du code Python. Heureusement, HuggingFace propose tout ce dont on a besoin. @@ -314,7 +300,6 @@ Encore une fois pour le japonais, c'est très difficile d'évaluer la pertinence Surtout quand on se base sur un texte qui est certainement mal retranscrit. Par-contre, pour l'allemand et le français, c'est un sans-faute ! 💯 - ### Real-ESRGAN Ici, ça va être très simple, j'ai suivi les instructions du README. @@ -338,26 +323,23 @@ Le reste est une histoire de ffmpeg, le bon encodeur et les bons paramètres. Il semble qu'il existe un modèle de Real-ESRGAN défié à la vidéo. Cependant, je n'ai découvert son existence qu'après avoir commencé l'amélioration basée sur les images individuelles. -Je vous invite à essayer par vous-même le modèle dédié à l'amélioration vidéo et à m'en faire part par e-mail. ;) +Je vous invite à essayer par vous-même le modèle dédié à l'amélioration vidéo et à m'en faire part par e-mail. ;) ::: - ## Conclusion - La conclusion va être rapide, les technologies à base de LLM sont globalement performantes et vont s'améliorer rapidement. 👌 Ce sont désormais des outils utilisables quotidiennement pour produire des documents de qualités. Elles sont disponibles en local et à partir de logiciels libérateurs. -Ce dernier point est important, car on remarque que ces technologies tournent autour des États-Unis et de l'anglais. +Ce dernier point est important, car on remarque que ces technologies tournent autour des États-Unis et de l'anglais. L'existence de logiciels libérateurs dans ce domaine nous garanti que d'autres pays puissent se munir de ces technologies sans dépendre de grosses sociétés comme Meta, Microsoft ou Google ([GAFAM](https://fr.wikipedia.org/wiki/GAFAM)). -L'hégémonie étasunienne sur les outils d'IA n'est concurrencée que par les [BATX](https://fr.wikipedia.org/wiki/BATX) (Baïdu, Alibaba, Tencent et Xiamoi). -Dans un tel contexte, il n'est pas étonnant que ces outils soient américano-centrés. +L'hégémonie étasunienne sur les outils d'IA n'est concurrencée que par les [BATX](https://fr.wikipedia.org/wiki/BATX) (Baïdu, Alibaba, Tencent et Xiamoi). +Dans un tel contexte, il n'est pas étonnant que ces outils soient américano-centrés. Outre le fait que la langue par défaut de ces outils soit l'anglais (voir la seule langue disponible !), il est notable que ces modèles sont plus performants en anglais que dans le reste des langues européennes. Ce qui pose bien évidement un problème d'équité entre les peuples et qui est de fait un avantage concurrentiel pour les entreprises étasuniennes. - ------------------------ +--- Pour finir, je vais vous narrer comment en 5 minutes, j'ai animé l'illustration de cet article. @@ -422,10 +404,8 @@ Qui me rétorque sur un ton un peu moqueur : « C'est pas mal ! Ton train est un peu court par contre. » 😿 -  Je m'empresse de l'agrandir, je rajoute au passage deux petites bandes pour traduire la vitesse et le tour est joué !  - diff --git a/articles/rail-and-advertising.md b/articles/rail-and-advertising.md index 8572c1a..1e16121 100644 --- a/articles/rail-and-advertising.md +++ b/articles/rail-and-advertising.md @@ -1,5 +1,4 @@ --- - pubDate = 2023-12-19 13:34:00Z tags = ['train', 'adverts', 'AI'] @@ -10,21 +9,16 @@ email = "ache@ache.one" [[alt_lang]] lang = "fr" url = "/articles/les-trains-et-la-publicité" - --- -Rail and advertising -=========================== +# Rail and advertising  Let's talk trains and advertising ! The idea is to analyse a few advertisements for trains around the world. But it's mainly a pretext for showing you how recent artificial intelligence technologies can be used to improve an article. 🤖 - -Table of contents ----------- - +## Table of contents :::question Why rail ads ? @@ -33,7 +27,6 @@ Why rail ads ? Because I like to analyse the construction and staging of films. Here we're going to take ads, because I'm not going to analyse an entire film before talking to you about AI. - ## A Japanese advert <video controls class="big" preload=none poster="res/JR_West-ads-Summer_Train_poster.png"> @@ -60,13 +53,11 @@ Here the advert is a very clever staging of holiday memories and nostalgia. There are many references to reality, such as the Shinkansen N700 series and the recognisable Shin-Ōsaka station. In particular, we see and hear a Japanese cicada, a true symbol of summer in Japan. - In short, this is an advert that gets a message across and speaks to its audience. 👏 Speaking of advertising that speaks to its audience ... Let's take a look at an advert from Germany. - ## Der Volksgeist (The people's spirit) This mini-film advert was commissioned by Deutsch Bahn[^db] and produced by [Pantera](https://bwgtbld.tv/pantera/). @@ -101,13 +92,11 @@ The director⋅tress Pantera went on to make several ads for the Mercedez Benz c I invite you to have a look at the other creations of the [BWGTBLD company](https://bwgtbld.tv/). - ## The French touch This mini-film made for the French SNCF group isn't really an advert. The aim is not to sell you something, but to work on the brand's image and promote the SNCF's new slogan "For all of us". - <video controls class="big" preload=none poster="res/SNCF-ad-Hexagonal_poster.png"> <source src="res/SNCF-ad-Hexagonal.webm"/> <track kind="captions" srclang="fr" src="res/SNCF-ad-Hexagonal-fr.vtt" default label="Français"/> @@ -124,10 +113,10 @@ Punctuated by a few piano notes [^claque], it describes the SNCF and its values. There are many puns and subtle figures of speech. In particular, the SNCF describes its commitments and its humanist nature. - -[^claque]: Although the music is simple, it is not outdone. -The rhythm is modelled on and introduced by railway noise. -Every snappy moment is accentuated by [the SNCF's jingel](https://youtu.be/NA5MwhuHWLo?t=2) which lends itself surprisingly well! +[^claque]: + Although the music is simple, it is not outdone. + The rhythm is modelled on and introduced by railway noise. + Every snappy moment is accentuated by [the SNCF's jingel](https://youtu.be/NA5MwhuHWLo?t=2) which lends itself surprisingly well! All French people are invited to love the SNCF in this unifying video. 💕 Paradoxically, it brings people together by emphasising France's diversity, thus reviving one of its commitments, **supporter la diversité**. @@ -153,13 +142,13 @@ To finish on a funny note, here's a set of accident prevention videos from the L <video controls class="big" preload=none poster="res/LDz_ads_railway-safety_poster.png"> + <source src="res/LDz_ads_railway-safety.mp4" type="video/mp4; codecs=av01.1.31M.08,Opus; profiles=isom,av01,iso2,mp41" /> <source src="res/LDz_ads_railway-safety.webm" type="video/webm" /> <p>Set of LDz video staging the characters of Avārijas Brigāde about rail safety.</p> </video> - ## Let's get technical The video subtitles were created using tools based on [LLM](https://en.wikipedia.org/wiki/Large_language_model). @@ -167,26 +156,24 @@ The LDz video has been enlarged and is much more pleasant to watch than [the ori To create this article, I used: - - [yt-dlp](https://github.com/yt-dlp/yt-dlp): A free software that can download videos from many websites, not only YouTube. - - [Whisper](https://en.wikipedia.org/wiki/Whisper_(speech_recognition_system)): A machine learning model for _Speech to Text_ (S2P) made by OpenAI. - - [Seamless](https://github.com/facebookresearch/seamless_communication): A machine learning model made by Meta and made to be a multimodal translation (Text <=> Text / Audio <=> Text / Audio <=> Audio). - - [Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN): A model dedicated to image enhancement. - - [ffmpeg](https://fr.wikipedia.org/wiki/FFmpeg): The reference software for handling audio codecs. +- [yt-dlp](https://github.com/yt-dlp/yt-dlp): A free software that can download videos from many websites, not only YouTube. +- [Whisper](<https://en.wikipedia.org/wiki/Whisper_(speech_recognition_system)>): A machine learning model for _Speech to Text_ (S2P) made by OpenAI. +- [Seamless](https://github.com/facebookresearch/seamless_communication): A machine learning model made by Meta and made to be a multimodal translation (Text <=> Text / Audio <=> Text / Audio <=> Audio). +- [Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN): A model dedicated to image enhancement. +- [ffmpeg](https://fr.wikipedia.org/wiki/FFmpeg): The reference software for handling audio codecs. I will not write about yt-dlp and ffmpeg and concentrate myself on machine learning tools. - ### Whisper Ok, so since the videos aren't necessarily in a language that readers of this blog speak, I would have liked to have subtitles for the videos. - - I used Whisper to transcribe every video. - - I already have the subtitles of the SNCF ad, I will use that to verify the quality of Whisper, since French is my mother tongue. - - I set up a container and installed Whisper. +- I used Whisper to transcribe every video. +- I already have the subtitles of the SNCF ad, I will use that to verify the quality of Whisper, since French is my mother tongue. +- I set up a container and installed Whisper. In my conclusion, the quality of the transcriptions vary wildly based on the language. - #### Japanese In Japanese, I can hardly evaluate the result. @@ -198,17 +185,17 @@ I also used [insanely-fast-whisper](https://github.com/Vaibhavs10/insanely-fast- I have to admit that the results are better and much faster than with the OpenAI's version, even if they are not at the level of Latin language processing. ::: - #### German and French + To transcribe German it's ok[^v3]. However, the video contains cut sentences that are poorly transcribed, and two short sentences at the end are also poorly transcribed. Using the medium-sized model, the results are better. In French, there is only one transcription error[^v3], but the spelling sometimes leaves something to be desired, the lyricism of the song certainly having something to do with it. - -[^v3]: Make sure you are using the latest version. Otherwise, support for French and German is mediocre. -In fact, before version 3, "Apollinaire" systematically became "Napoléon", which is a lot less romantic. +[^v3]: + Make sure you are using the latest version. Otherwise, support for French and German is mediocre. + In fact, before version 3, "Apollinaire" systematically became "Napoléon", which is a lot less romantic. I've also tried whispercpp on the French and German audio. The results are very good and more or less identical to the OpenAI versions. @@ -222,7 +209,6 @@ Now I just need to translate them. 🎉 As it happens, whisper and whispercpp offer to translate directly into English (English only). However, I would also like to have the French version. - :::question Why didn't you use other transcription methods? ::: @@ -297,7 +283,6 @@ Once again for Japanese, it's very difficult to assess the relevance of the tran Especially when you're basing it on a text that's certainly badly transcribed. On the other hand, for German and French, it's flawless! 💯 - ### Real-ESRGAN Here, it's going to be very simple, I followed the instructions in the README. @@ -324,24 +309,21 @@ However, I only found out about it after I'd started enhancing based on individu I invite you to try out the video enhancement model for yourself and let me know how good is it by e-mail ;) ::: - ## Conclusion I will be quick, LLM-based technologies are performing well and are going to improve rapidly. 👌 They are now tools that can be used on a daily basis to produce quality documents. They are now available locally and from liberating software. -This last point is important, as we can see that these technologies revolve around the United States and the English language. +This last point is important, as we can see that these technologies revolve around the United States and the English language. The existence of open-source software in this field guarantees that other countries will be able to acquire these technologies without depending on large companies such as Meta, Microsoft or Google ([Big Tech](https://en.wikipedia.org/wiki/Big_Tech)). -The American hegemony over AI tools is rivalled only by the [BATX](https://en.wikipedia.org/wiki/BATX) (Baidu, Alibaba, Tencent and Xiamoi). -In such a context, it is not surprising that these tools are US-centric. +The American hegemony over AI tools is rivalled only by the [BATX](https://en.wikipedia.org/wiki/BATX) (Baidu, Alibaba, Tencent and Xiamoi). +In such a context, it is not surprising that these tools are US-centric. While the default language of these tools is English (sometimes the only language available!), these models perform better at English than in the rest of the European languages. This is obviously a problem of fairness between peoples, and is in fact a competitive advantage for US companies. - ------------------------ - +--- To conclude, I'm going to describe how in 5 minutes, I animated the illustration for this article. @@ -355,7 +337,6 @@ So I can spend a lot of time finding the right SVG to animate. Here, on the contrary, it was very quick. On [iconbuddy](https://iconbuddy.app), a free vector icon site, I searched for 'train' and came across this illustration created by IBM. -  Using Inkscape, I separate the image into several components that I'm going to animate independently. @@ -412,4 +393,3 @@ She retorts in a slightly mocking tone: I quickly enlarged it, added two small strips to reflect the speed and that was it!  - |