Vidéo générative : fusil de la révolution audiovisuelle

Désormais, les vidéos dotées d’intelligence artificielle doivent être étiquetées pour clarifier les informations pour les utilisateurs. (Gratuit)

Il y a vingt ans, concevoir une vidéo sans casting, maquillage, costumes, décors, éclairage, budget considérable et obtenir le matériel audiovisuel à la vitesse « lumières, caméra, action » frôlait l'inimaginable. Aujourd'hui, l' émergence de la vidéo générative révolutionne la conception de la communication dans son expression audiovisuelle, transformant la manière dont nous produisons et consommons des histoires du format le plus emblématique du web .

Les lignes suivantes cherchent à zoomer sur les opportunités, les limites, les défis et les tendances présentées par la vidéo générative, un outil de création de contenu applicable à diverses industries.

À cet égard, l’étude Adobe (2024) « Global Marketing Content Trends and Preferences » indique que la génération Z (ceux nés entre 1995 et 2010) et les millennials (ceux nés entre 1981 et 1994) préfèrent la vidéo aux autres formats numériques, avec 98 %. % et 91 %, respectivement.

À l’échelle mondiale, l’étude susmentionnée montre que les personnes interrogées sont 24 % plus susceptibles d’acheter du contenu court que du contenu long. En ce sens, cette préférence pour les contenus courts et concis s’étend aux réseaux sociaux. Ainsi, 84 % des utilisateurs penchent vers les sous-titres courts , ce qui marque une tendance à l'économie de langage et à une attention immédiate.

Explorons maintenant l'essence de la vidéo générative. Pourquoi transcenderait-elle l'industrie de la communication audiovisuelle et comment se déroule son évolution aujourd'hui ? La vidéo générative, c'est-à-dire la vidéo créée par l'intelligence artificielle (IA) , découle de descriptions textuelles ou de simples instructions textuelles. Sa pertinence réside dans la démocratisation de la production vidéo.

Fin 2022, grâce aux initiatives de géants technologiques comme Meta, Google et la startup Runway, émergent des modèles pionniers capables de transformer du texte en vidéo. Cependant, au cours des premiers mois de cette année, OpenAI a lancé « Sora », un modèle capable de générer des vidéos réalistes, se présentant comme le plus avancé du marché.

Grâce à une vaste banque de vidéos à laquelle elle a accès, Sora peut générer du matériel audiovisuel innovant, utile à la production cinématographique et/ou à la gestion des réseaux sociaux. Même s'il présente encore des défauts, il réalise des scènes avec un réalisme bien plus grand que ses prédécesseurs, une résolution acceptable et, en plus, une durée plus longue (jusqu'à une minute dans sa version initiale).

Actuellement, OpenAI a limité l'outil à un groupe sélectionné (des universitaires, des professionnels et une équipe de sécurité), chargé de rechercher d'éventuelles erreurs dans la plateforme.

S’il est vrai que l’entreprise qui a créé ChatGPT préside également la course aux technologies audiovisuelles, sur la base de ces avancées, de nombreuses entreprises ciblent ce nouveau marché. Deux des sociétés de transformation de texte en image les plus connues, telles que Midjourney et Stability AI, commencent à s'aventurer dans le format vidéo.

A noter que le potentiel de cette technologie s'observe déjà dans la réalisation de certains courts métrages. Un exemple récent est « Somme Requiem » (2024). Cette production de 2,5 minutes, réalisée par la société de production Myles de Los Angeles, montre des soldats coincés dans la neige pendant la trêve de Noël de la Première Guerre mondiale. Les plans ont été générés à l’aide de l’outil d’intelligence artificielle Runway.

Comme nous l’avons noté initialement, la vidéo basée sur l’IA marque une étape importante dans la création de contenu audiovisuel, offrant de multiples possibilités. Sa contribution s'exprime en termes de rentabilité. Ainsi, les processus complexes et spécifiques à un secteur tels que l'écriture de scripts ou le montage vidéo sont simplifiés. L'utilisation d'algorithmes avancés et de techniques d'apprentissage automatique réduisent les délais de pré-production, de production et de post-production.

À ces fins, selon IE Business School (2024), il convient également de souligner les outils de création vidéo tels que Pictory (simplifie la création, l'édition et la synthèse des vidéos), Synthesia (génère des vidéos avec des avatars numériques), Raw Shorts (facilite la création de vidéos explicatives et promotionnelles), Quickvid.ai (spécialisé dans les vidéos courtes pour YouTube), FlexClip (crée des vidéos animées) et Deepbrain AI (génère des vidéos à partir de texte).

De même, Fliki (crée des vidéos sociales avec intégration de synthèse vocale), Lumen 5 (produit des vidéos pour les réseaux sociaux), Rephrase.ai (crée des vidéos avec des personnes parlant à partir de textes) et Designs.ai (crée des vidéos, des logos, des bannières et maquettes) sont d’autres plateformes à prendre en compte.

En conséquence, les producteurs de contenu disposent désormais de plus grandes possibilités pour améliorer le processus créatif. Ainsi, la production vidéo de qualité devient plus accessible aux entreprises de toute taille.

Cependant, malgré le fait que la vidéo générative progresse à pas de géant, elle présente différentes limites techniques. Il n’est pas rare de trouver des erreurs telles que des caractères comportant de nombreux doigts ou de très gros doigts. Ainsi, conserver divers éléments dans une séquence vidéo constitue un défi de taille. Par conséquent, la cohérence est un facteur essentiel pour lequel les outils actuels ne produisent que des secondes dans ce format.

De plus, les algorithmes ne peuvent toujours pas transmettre les émotions humaines typiques des récits audiovisuels, ce qui génère des problèmes d’authenticité du contenu. Cependant, les experts pensent qu’ils peuvent corriger les failles en entraînant leurs systèmes avec de plus en plus de données.

Récemment, YouTube a supprimé plus de 100 vidéos après que Forbes US a découvert que la plateforme indiquait où télécharger des applications pornographiques et comment utiliser l'intelligence artificielle pour retirer les vêtements des personnes figurant sur n'importe quelle image.

Sur la base de ce qui précède, de profondes inquiétudes sont soulevées quant à l’utilisation malveillante de ces outils et aux conséquences possibles de leur utilisation généralisée.

Selon le MIT Technology Review (2024), il existe quatre considérations clés pour faire progresser la vidéo générative. Tout d’abord, une innovation constante. Avec « Sora » aux commandes, cette technologie fait face à des défis de cohérence et de réalisme pour les vidéos longues. La deuxième considération concerne les applications larges. Malgré son extraordinaire potentiel, il existe encore des limites au contrôle et à la précision de la vidéo générative.

Concernant le troisième, la préparation à une nouvelle réalité. L’adoption de cette technologie nécessite une synergie responsable de la part des développeurs et du public. Enfin, on ne peut manquer de mentionner la désinformation et les deepfakes (fichiers vidéo, image ou audio manipulés avec l’IA, les faisant passer pour du contenu authentique afin de tromper).

Enfin, le montage vidéo en temps réel, la compréhension des émotions par des algorithmes et l’hyper-personnalisation des contenus font partie des grandes tendances de la vidéo générative, selon l’incubateur en ligne Faster Capital (2024).

En conclusion, à mesure que la technologie progresse, la vidéo générée par l’IA se connectera aux téléspectateurs à un niveau plus profond. Les algorithmes adapteront plus précisément la vidéo de chaque utilisateur en fonction de ses intérêts. Cela ouvrira de nouvelles opportunités et modifiera les rôles des créateurs de contenu.

Cependant, à la même vitesse avec laquelle elle crée du contenu, l’IA génère également des dichotomies et des dilemmes éthiques. La préférence entre une technologie plus puissante ou plus sûre. Entre efficacité et créativité. Entre la mer inexorable des banalités et le désert des contenus réflexifs. Entre le viral et le moral.

Pour diffuser une série Netflix . L’épisode « Joan is Horrible » de la série britannique de science-fiction « Black Mirror » reflète certaines des controverses susmentionnées. La protagoniste est confrontée au fait que toute sa vie quotidienne est reproduite à l'écran, pratiquement en temps réel, étant une série hautement écoutée sur une plateforme de streaming , accessible non seulement à elle, mais aussi à tout abonné dudit service. Le succès de la série réside dans le désir des utilisateurs de voir les anti-valeurs du protagoniste. Le chapitre soulève le débat sur l’éthique de l’intelligence artificielle et de la vie privée face à la génération de contenu à haut débit.

Nous nous trouvons ainsi dans une révolution technologique sans précédent. Sur la base de principes éthiques, construisons des espaces audiovisuels qui favorisent une créativité illimitée, la qualité de l'information et, pourquoi pas, l'esprit critique. L’avenir de la société dépendra de notre engagement à adopter ces changements de manière responsable, en évitant la tentation du succès commercial à tout prix, préservant ainsi les valeurs qui nous rendent humains. C'est juste et nécessaire.

Vidéo générative : fusil de la révolution audiovisuelle

Opportunités et limites

Défis et tendances

Lisez aussi