summaryrefslogtreecommitdiff
path: root/articles/les-trains-et-la-publicité.md
diff options
context:
space:
mode:
Diffstat (limited to 'articles/les-trains-et-la-publicité.md')
-rw-r--r--articles/les-trains-et-la-publicité.md76
1 files changed, 38 insertions, 38 deletions
diff --git a/articles/les-trains-et-la-publicité.md b/articles/les-trains-et-la-publicité.md
index f9de952..6017588 100644
--- a/articles/les-trains-et-la-publicité.md
+++ b/articles/les-trains-et-la-publicité.md
@@ -19,7 +19,7 @@ La publicité pour les trains
![Illustration d'un train qui roule vite.](res/train-speed-inv.svg)
Parlons trains. Enfin pub.
-Enfin vous verez bien !
+Enfin ! Vous verrez bien !
L'idée est d'analyser quelques publicités pour des trains à travers le monde.
Mais c'est surtout un prétexte pour vous présenter l'utilisation de technologies d'intelligence artificielle récentes. 🤖
@@ -34,7 +34,7 @@ Pourquoi des pubs pour le train ?
Déjà pourquoi pas ?
Ensuite, parce que j'aime analyser la construction et la mise en scène des films.
-Ici on va prendre des publicités, car je ne vais pas analyser un film entier avant de vous parler d'IA.
+Ici, on va prendre des publicités, car je ne vais pas analyser un film entier avant de vous parler d'IA.
## Une publicité japonaise
@@ -61,11 +61,11 @@ Son changement d'avis sur ce voyage est traduit par son sourire qui passe d'une
Le public visé est la famille en général, pas spécialement les enfants.
Ici la publicité est une mise en scène très habile des souvenirs de vacances et de la nostalgie.
On y voit de très nombreuses références à la réalité comme le Shinkansen série N700 ou la gare Shin-Ōsaka qui est tout à fait reconnaissable.
-En particulier, on voit et entend une cigale japonaise, véritable symbole de l'été au japon.
+En particulier, on voit et entend une cigale japonaise, véritable symbole de l'été au Japon.
Bref, publicité qui réussi à faire passer un message et parle à son public.
-En parlant de publicité qui parle à son public ...
+En parlant de publicité qui parle à son public...
Voyons une publicité d'outre-Rhin.
@@ -108,7 +108,7 @@ Ses autres talentueuses réalisations sont disponibles sur le site [BWGTBLD](htt
## À la française
Ce mini-film réalisé pour le groupe français SNCF n'est pas vraiment une pub.
-Le but n'est pas de vous vendre quelque chose mais de travailler l'image de la marque et de promouvoir le nouveau slogan de la SNCF « Pour nous tous ».
+Le but n'est pas de vous vendre quelque chose, mais de travailler l'image de la marque et de promouvoir le nouveau slogan de la SNCF « Pour nous tous ».
<video controls class="big" preload=none poster="res/SNCF-ad-Hexagonal_poster.png">
<source src="res/SNCF-ad-Hexagonal.webm"/>
@@ -126,14 +126,14 @@ Rythmée par une quelques notes de piano[^claque], elle décrit la SNCF et ses v
On y trouve de nombreux jeux de mots et des figures de styles subtiles.
Notamment, la SNCF y décrit ses engagements et son caractère humaniste.
-[^claque]: Bien que simple, la musique n'est ici pas delessée pour autant.
+[^claque]: Bien que simple, la musique n'est ici pas délaissée pour autant.
Le rythme est calqué et introduit par le bruit ferroviaire.
-Chaque moment qui détonne est accentué par [le sonal signature de la SNCF](https://youtu.be/NA5MwhuHWLo?t=2) qui s'y prête étonnament bien !
+Chaque moment qui détonne est accentué par [le sonal signature de la SNCF](https://youtu.be/NA5MwhuHWLo?t=2) qui s'y prête étonnamment bien !
Tous les Français sont invités à aimer la SNCF dans cette vidéo fédératrice. 💕
Paradoxalement, elle rassemble en insistant sur la diversité de la France et renoue ainsi avec un de ses engagements, **supporter la diversité**.
-Au fur et à mesure, la vidéo qui décrivait la SNCF décrit de plus en plus les Français même, notamment par l'utilisation du pronom impersonnel « on », ambïgue depuis le début de la vidéo, qui peut désigner autant la SNCF que les Français.
+Au fur et à mesure, la vidéo qui décrivait la SNCF décrie de plus en plus les Français même, principalement par l'utilisation du pronom impersonnel « on », ambigu depuis le début de la vidéo, qui peut désigner autant la SNCF que les Français.
Par cet amalgame, elle fait appel à la fierté patriotique des citoyens français.
Le lien étant crée, c'est le moment idéal pour la SNCF d'aborder le sujet de ses défauts et de les partager avec son public, puisque ses défauts sont les défauts clichés des Français.
@@ -143,7 +143,7 @@ Cette dernière idée est particulièrement mise en avant avec la phrase choc fi
Qui présente ainsi définitivement les faiblesses en qualités à travers un jeu de mot très français.
:::attention
-La SNCF insiste beaucoup sur son caractère humain[^handy] dans cette vidéo. Notamment en présentant dans personnes handicapées dans sont clip.
+La SNCF insiste beaucoup sur son caractère humain[^handy] dans cette vidéo. Notamment en présentant des personnes handicapées dans son clip.
Je note cependant que malgrès ses efforts et tout comme la DB, la SNCF a du chemin à parcourir au niveau de l'accessibilité.[^handy]
:::
@@ -159,7 +159,7 @@ Je note cependant que malgrès ses efforts et tout comme la DB, la SNCF a du che
## Résumé
-Cette étude des publicités montrent que ces clips sont culturellement très riches.
+Cette étude des publicités montre que ces clips sont culturellement très riches.
On remarque que ces groupes n'hésitent pas à investir de l'argent pour se promouvoir, ou qu'en tout cas qu'ils ont de l'expérience dans leur communication.
Les références sont ancrées dans la culture du pays et je remarque que cela entre en contradiction avec les politiques modernes d'ouverture du marché ferroviaire à la concurrence, notamment étrangère.
On s'attendrait plus à une communication en anglais par exemple avec des références basées sur [la pop culture](https://fr.wikipedia.org/wiki/Culture_populaire).
@@ -178,13 +178,13 @@ Pour finir, sur une note drôle, je vous présente cet ensemble de vidéos de pr
## Parlons tech
Les sous-titres des vidéos ont été créer à partir d'outils basés sur [de grands modèles de langage](https://fr.wikipedia.org/wiki/Grand_mod%C3%A8le_de_langage) (LLM).
-La vidéo de LDz a été agrandie et est bien plus agréable à regardée que [la version originale](https://youtu.be/f4HtbPt1DCk).
+La vidéo de LDz a été agrandie et est bien plus agréable à regarder que [la version originale](https://youtu.be/f4HtbPt1DCk).
-Pour créer cet article, j'ai ainsi utilisé:
+Pour créer cet article, j'ai ainsi utilisé :
- [yt-dlp](https://github.com/yt-dlp/yt-dlp), un logiciel libre permettant de télécharger des vidéos depuis de nombreux sites, pas seulement youtube.
- [Whisper](https://en.wikipedia.org/wiki/Whisper_(speech_recognition_system)): Un modèle d'apprentissage automatisé cette fois-ci dédié à la reconnaissance vocale (S2P pour _Speech to Text_) issue d'OpenAI.
- - [Seamless](https://github.com/facebookresearch/seamless_communication): Un modèle d'apprentissage automatisé créer par Meta et dédié à la traduction multimodale (Text <=> Text / Audio <=> Text / Audio <=> Audio).
+ - [Seamless](https://github.com/facebookresearch/seamless_communication): Un modèle d'apprentissage automatisé créé par Meta et dédié à la traduction multimodale (Texte <=> Texte / Audio <=> Texte / Audio <=> Audio).
- [Real-ESRGAN](https://github.com/xinntao/Real-ESRGAN): Un modèle dédié à l'amélioration des images.
- [ffmpeg](https://fr.wikipedia.org/wiki/FFmpeg): Le logiciel référence de manipulation des codecs audio.
@@ -210,7 +210,7 @@ Il me semble cependant que celui-ci est difficilement compréhensible, les phras
:::note
J'ai également utilisé [insanely-fast-whisper](https://github.com/Vaibhavs10/insanely-fast-whisper) pour retranscrire le japonais.
-Je dois admettre que les résultats sont meilleurs et bien plus rapides qu'avec la version d'OpenAI même si ceci ne sont pas au niveau du traitement des langues latines.
+Je dois admettre que les résultats sont meilleurs et bien plus rapides qu'avec la version d'OpenAI même si ceux-ci ne sont pas au niveau du traitement des langues latines.
:::
@@ -223,32 +223,32 @@ En utilisant le modèle de taille moyen, les résultats sont meilleurs.
[^v3]: Attention à bien utiliser la dernière version. Auquel cas, le support du français et de l'allemand est médiocre.
En effet, avant la version 3, « Apollinaire » devenait systématiquement « Napoléon », ce qui est tout de suite, beaucoup plus Rome antique que romantique.
-Pour le français, il n'y a qu'une erreur de transcription mais l'orthographe est parfois à désirer, le lyrisme de la chanson y est certainement pour quelque-chose.
+Pour le français, il n'y a qu'une erreur de transcription, mais l'orthographe est parfois à désirer, le lyrisme de la chanson y est certainement pour quelque-chose.
J'ai également essayé whispercpp sur l'audio français et allemand.
Les résultats sont très bons et à peu près identique aux versions originales.
Légèrement moins bon dans l'ensemble.
J'ai même essayé [un modèle fine-tuné pour le français](https://huggingface.co/bofenghuang/whisper-large-v3-french/tree/main).
-Celui-ci corrige en effet, l'erreur de transcription que Whisper avait mais en crée une autre !
+Celui-ci corrige en effet, l'erreur de transcription que Whisper avait, mais en crée une autre !
Ainsi, après quelques retouches, j'ai donc les sous-titres originaux des vidéos ! 🥳
Il me suffit maintenant seulement de les traduire. 🎉
Il se trouve que whisper et whispercpp proposent de traduire directement vers l'anglais (uniquement l'anglais).
-Cependant, je voudrais avoir également la version française.
+Cependant, je voudrais avoir aussi la version française.
:::question
Pourquoi ne pas avoir utilisé d'autres méthodes de transcription ?
:::
-C'est une question intéressant.
+C'est une question intéressante.
En effet, il existe de nombreuses méthodes de transcriptions.
Il existe même un [classement de ces méthodes sur paperswithcode.com](https://paperswithcode.com/sota/speech-recognition-on-common-voice-french).
Il est difficile de savoir à quel point ces méthodes sont utilisables dans un contexte réel, avec du bruit pas exemple.
-Aussi, les performances ne sont pas indiquées, et certaine méthodes sont très gourmandes en ressources.
-J'ai essayé d'utiliser par exemple [tevr-asr-tool](https://github.com/DeutscheKI/tevr-asr-tool) mais celui-ci était très consomateur de ressources (⚠️) et n'était pas adapté à un environment bruillant.
+Aussi, les performances ne sont pas indiquées, et certaines méthodes sont très gourmandes en ressources.
+J'ai essayé d'utiliser par exemple [tevr-asr-tool](https://github.com/DeutscheKI/tevr-asr-tool) mais celui-ci était très consommateur de ressources (⚠️) et n'était pas adapté à un environnement bruyant.
### Seamless
@@ -256,10 +256,10 @@ J'ai essayé d'utiliser par exemple [tevr-asr-tool](https://github.com/DeutscheK
L'idée ici c'est de traduire les sous-titres de whispercpp vers 3 langues, la langue originale, le français et l'anglais.
:::information
-En première version de cet article, j'ai utilisé [NLLB](https://github.com/facebookresearch/fairseq/tree/nllb) qui est un modèle d'apprentissage automatisé créer par Meta et dédié à la traduction textuelle.
+En première version de cet article, j'ai utilisé [NLLB](https://github.com/facebookresearch/fairseq/tree/nllb) qui est un modèle d'apprentissage automatisé créé par Meta et dédié à la traduction textuelle.
-Malgrès une traduction rapide, les résultats étaient décevants.
-Aussi, l'utilisation même du modèle était, je trouve, trop complèxe.
+Malgré une traduction rapide, les résultats étaient décevants.
+Aussi, l'utilisation même du modèle était, je trouve, trop complexe.
:::
@@ -310,7 +310,7 @@ with open(f'{Path(fileToTranslate).stem}_{langTrg}.srt', 'w') as f:
Le résultat est globalement bluffant ! 🤯
-Encore une fois pour le japonais, c'est très difficile d'évaluer la pertinance de la traduction.
+Encore une fois pour le japonais, c'est très difficile d'évaluer la pertinence de la traduction.
Surtout quand on se base sur un texte qui est certainement mal retranscrit.
Par-contre, pour l'allemand et le français, c'est un sans-faute ! 💯
@@ -322,7 +322,7 @@ D'abord, je me suis assuré d'avoir Pytorch d'installer et que Python est en ver
Ensuite, j'ai téléchargé le modèle pré-entrainé conseillé `RealESRGAN_x4plus.pth`.
Je suis d'ailleurs assez étonné de ne pas trouver plus de variantes disponibles sur HuggingFace.
-Ensuite, j'ai agrandi chacune des images de la vidéo initial avec ce petit script:
+Ensuite, j'ai agrandi chacune des images de la vidéo initiale avec ce petit script :
```sh
for i in $(seq 1 14706); do
@@ -336,9 +336,9 @@ Le reste est une histoire de ffmpeg, le bon encodeur et les bons paramètres.
:::note
Il semble qu'il existe un modèle de Real-ESRGAN défié à la vidéo.
-Cependant, je n'ai découvert son existance qu'après avoir commencé l'amélioration basée sur les images individuelles.
+Cependant, je n'ai découvert son existence qu'après avoir commencé l'amélioration basée sur les images individuelles.
-Je vous invite à essayer par vous même le modèle dédié à l'amélioration vidéo et à m'en faire part par e-mail. ;)
+Je vous invite à essayer par vous-même le modèle dédié à l'amélioration vidéo et à m'en faire part par e-mail. ;)
:::
@@ -347,28 +347,28 @@ Je vous invite à essayer par vous même le modèle dédié à l'amélioration v
La conclusion va être rapide, les technologies à base de LLM sont globalement performantes et vont s'améliorer rapidement. 👌
Ce sont désormais des outils utilisables quotidiennement pour produire des documents de qualités.
-Elles sont désormais disponibles en local et à partir de logiciels librérateurs.
+Elles sont disponibles en local et à partir de logiciels libérateurs.
Ce dernier point est important, car on remarque que ces technologies tournent autour des États-Unis et de l'anglais.
-L'existance de logiciels libérateurs dans ce domaine nous garanti que d'autres pays puissent se munir de ces technologies sans dépendre de grosses sociétés comme Meta, Microsoft ou Google ([GAFAM](https://fr.wikipedia.org/wiki/GAFAM)).
+L'existence de logiciels libérateurs dans ce domaine nous garanti que d'autres pays puissent se munir de ces technologies sans dépendre de grosses sociétés comme Meta, Microsoft ou Google ([GAFAM](https://fr.wikipedia.org/wiki/GAFAM)).
-L'égémonie étasunienne sur les outils d'IA n'est concurencée que par les [BATX](https://fr.wikipedia.org/wiki/BATX) (Baïdu, Alibaba, Tencent et Xiamoi).
-Dans un tel contexte, il n'est pas étonnant que ces outils soient américano centrés.
-Outre le fait que la langue par défaut de ces outils soit l'anglais (voir la seule langue disponible !), il est notable que ces modèles sont plus performants en anglais que dans le reste des langues européennes. Ce qui pose bien évidement un problème d'équïté entre les peuples et qui est de fait un avantage concurrenciel pour les entreprises étasuniennes.
+L'hégémonie étasunienne sur les outils d'IA n'est concurrencée que par les [BATX](https://fr.wikipedia.org/wiki/BATX) (Baïdu, Alibaba, Tencent et Xiamoi).
+Dans un tel contexte, il n'est pas étonnant que ces outils soient américano-centrés.
+Outre le fait que la langue par défaut de ces outils soit l'anglais (voir la seule langue disponible !), il est notable que ces modèles sont plus performants en anglais que dans le reste des langues européennes. Ce qui pose bien évidement un problème d'équité entre les peuples et qui est de fait un avantage concurrentiel pour les entreprises étasuniennes.
-----------------------
-Pour finir, je vais vous narrer comment en 5min, j'ai animé l'illustration de cet article.
+Pour finir, je vais vous narrer comment en 5 minutes, j'ai animé l'illustration de cet article.
J'avais déjà une petite idée de ce que je voulais comme animation, un train qui avance, l'idée de vitesse, etc.
Souvent dans mes animations, ce qui me limite est l'illustration SVG de base.[^talent]
Je peux ainsi passer beaucoup de temps à trouver le bon SVG à animer.
-[^talent]: Et bien sur, mon manque de talent pour réaliser ce type d'illustration moi-même.
+[^talent]: Et bien sûr, mon manque de talent pour réaliser ce type d'illustration moi-même.
Ici, ça a été au contraire très rapide.
-Sur [iconbuddy](https://iconbuddy.app), un site d'icônes vectoriels libres d'utilisation, en cherchant « train » je tombe sur cette illustration crée par IBM.
+Sur [iconbuddy](https://iconbuddy.app), un site d'icônes vectorielles libres d'utilisation, en cherchant « train » je tombe sur cette illustration créée par IBM.
![Train à grande vitesse sur rails.](res/train-origin.svg)
@@ -416,9 +416,9 @@ On peut rajouter du CSS directement dans le SVG, c'est pratique.
}
```
-Très rapidement j'ai un résultat convainquant que je présente à ma copine.
+Très rapidement, j'ai un résultat convaincant que je présente à ma copine.
-Qui me rétorque sur un ton un peu moqueur:
+Qui me rétorque sur un ton un peu moqueur :
« C'est pas mal ! Ton train est un peu court par contre. »
😿
@@ -427,5 +427,5 @@ Qui me rétorque sur un ton un peu moqueur:
Je m'empresse de l'agrandir, je rajoute au passage deux petites bandes pour traduire la vitesse et le tour est joué !
-![Logo de l'article: Un train qui avance rapidement sur des rails, style simplifié vue de profil.](res/train-speed-inv.svg)
+![Logo de l'article : Un train qui avance rapidement sur des rails, style simplifié vu de profil.](res/train-speed-inv.svg)