Entre la mode et les affaires - Comment l'IA révolutionne la production de contenu
Johannes Sommer
GPT, lle modèle linguistique d'OpenAI basé sur l'Intelligence Artificielle, a révolutionné la production de contenu. Il génère automatiquement du texte et du contenu qu'il est impossible de distinguer d'un contenu humain. Johannes Sommer vous emmène sur le chemin de la production de contenu alimentée par l'IA.
Que cache l'acronyme GPT ?
GPT est sur toutes les lèvres, mais que signifient ces trois lettres ?
G = modèle de langage génératif qui génère des textes en langue naturelle. Il imite la parole humaine et génère automatiquement des textes qui ne se distinguent pas du contenu écrit par des personnes réelles.
P = Pré-entraîné, signifie que le modèle linguistique a été entraîné sur un vaste ensemble de données textuelles globales.
T = Transformer est le nom de l'architecture du réseau neuronal utilisé pour former le modèle.
OpenAI - Le moteur de l'innovation en matière d'IA
L'entreprise américaine Open AI a conçu le modèle linguistique. Après quelques développements et l'implication actuelle de Microsoft, la commercialisation est un objectif déclaré et un but de l'entreprise. Des fonctions d'assistance sont intégrées dans les produits Microsoft. De nombreux autres acteurs, dont Google, Meta, SAP et Adobe, investissent massivement dans l'intégration des technologies d'IA dans leur propre gamme de produits.
Nous devons tous y faire face !
L'énigme ffascinante du modèle linguistique et de son apprentissage
La base du modèle linguistique a été entraînée sur l'ensemble du contenu disponible sur l'internet anglophone et au-delà.
Il est important de souligner qu'un modèle de langage utilise des probabilités pour analyser le contexte d'une entrée et générer le mot suivant le plus probable sur cette base.
Le modèle apprend à partir d'une variété de contenus sur l'internet et ajuste ses probabilités. Le changement de contexte modifie les probabilités des mots suivants. ChatGPT ne fonctionne pas en récupérant des connaissances, mais en générant des chaînes de mots basées sur des probabilités.
Exemple : « J'ai mangé la pizza alors qu'elle était encore ? » . En se basant sur la probabilité du mot suivant, le modèle de langage continue à écrire cette phrase. Dans cet exemple, la probabilité que le mot suivant soit « chaude » est de 80,45 %.
Lorsque le contexte de l'entrée change, la probabilité du mot suivant change aussi. Pour l'entrée « Mon four s'est cassé, j'ai donc mangé la pizza alors qu'elle était encore ? » , le mot suivant le plus probable n'est plus « chaude » mais « froide » .
ChatGPT calcule le mot suivant. C'est ainsi que les chaînes de mots sont construites. Le mot ou le caractère suivant est appelé « token » .
Tokens et prompts : Composants clés du modèle linguistique de GPT
Les tokens sont la sortie générée, l'entrée est appelée « prompt » . Un prompt peut être, par exemple, une question. L'ensemble de la conversation est considéré comme une entrée dans ChatGPT. Les questions et les réponses sont analysées dans leur contexte, car le cours complet de la conversation est pris en compte lors de l'utilisation de ChatGPT.
La longueur de l'entrée et de la sortie joue un rôle dans le calcul des tokens. En effet, des entrées plus longues permettent de générer davantage de tokens, ce qui accroît la complexité du calcul.
Le revers de la médaille
Malgré des capacités impressionnantes, il existe des faiblesses, dont certaines seront décrites. Par exemple, le calcul, le comptage et l'orthographe ne fonctionnent pas bien.
La raison en est - on ne le répétera jamais assez - que GPT n'est pas un modèle de connaissance, mais un modèle de langage. Un exemple l'illustre :
Combien de temps faut-il à 24 musiciens pour jouer un morceau de musique s'il faut 10 minutes à 12 musiciens? Cette question a été posée à la fois sur GPT-3 et sur GPT-4.
GPT-3 a répondu : 5 minutes.
Si vous signalez l'erreur à GPT-4, il s'ensuit des excuses et une explication de la raison pour laquelle ce n'est pas logique : Et bien sûr, la solution correcte s'ensuit. Cet exemple montre à quel point le saut de développement entre GPT-3 et GPT-4 a été énorme.
Quand l'homme devient le problème de l'IA
Parce que les hommes forment l'IA, les biais involontaires dans les systèmes d'IA constituent un défi. Il s'agit d'un problème qui ne peut être complètement éliminé.
Qu'est-ce qui va changer radicalement ?
L'IA a trouvé sa place dans de nombreux domaines de travail. Des textes sont créés avec l'aide de l'IA, des contre-arguments ou des résumés sont rédigés, des images et des photos sont générées sur la base d'un briefing textuel, des codes sont écrits, des vidéos ou des livres multimédias sont créés en temps réel. Et chaque semaine, une multitude de nouvelles entreprises et de startups se créent pour développer de nouvelles applications. Nous sommes donc confrontés à un véritable déluge d'applications qui ont également un impact sur nos processus d'entreprise.
Génération d'image purement basée sur le texte (cette fille n'existe pas dans la vie réelle) | Source : Midjourney
Des approches créatives pour une production de contenu réussie
Vous trouverez ci-dessous quelques exemples de domaines dans lesquels l'IA peut vous aider à créer du contenu.
- Résumé du contenu, teasers, générer des réécritures
- Newsletters (personnalisée)
- Individualiser les messages des agences
- Rédaction augmentée
- Recherche et découverte de contenu
- SEO ghostwriting
- Production de livres vidéo pour podcasts et livres audio
- Illustrations pour le contenu
- Génération des légendes
Exemples de l'expérience pratique de Retresco
- Immobilienscout crée des exposés automatisés.
- Retresco produit 124 000 rapports de match de football par semaine pour la Fédération allemande de football (DFB). Les arbitres transmettent les données à Fußball.de, sur la base desquelles les textes sont créés.
- Media Markt et Saturn créent des descriptions de produits automatisées qui sont gérées par une petite équipe éditoriale.
Comme le montrent les exemples, les données des clients constituent la base de textes personnalisés générés automatiquement. Les attributs sélectionnés au préalable sont utilisés par l'IA pour décrire les produits ou rédiger les textes. Même si un humain est toujours impliqué dans le processus pour vérifier et confirmer le modèle, cela permet de produire du contenu à grande échelle.
La protection des données avec l'OpenAI ?
OpenAI a récemment fait beaucoup pour se mettre en conformité avec le RGPD. Par exemple, les entreprises clientes peuvent exclure l'utilisation de leurs données pour la formation de modèles linguistiques.
Résumé
Roy Amara, ancien président de l'Institute for the Future, a déclaré : « Nous avons tendance à surestimer l'impact d'une technologie à court terme. Bien sûr, il y a un ou deux problèmes de démarrage qui nous font sourire. Mais nous sous-estimons l'impact à long terme » .