Titre original : "Le roi des rouleaux l'utilise ! 100 outils AIGC de niveau trésor à partager, fortement recommandés pour la collection ! ! "
En parlant d'outils AIGC, vous ne connaissez encore que ChatGPT ?
En fait, de plus en plus d'applications AIGC ne sont pas basées sur le GPT d'OpenAI. Dans le domaine du divertissement, la musique de couverture des chanteurs "AI Stefanie Sun" et "AI Jay Chou" est devenue populaire et les chanteurs eux-mêmes ont été émerveillés ; dans le domaine du commerce électronique, les humains virtuels de l'IA lisent des scripts générés par l'IA 7x24 heures , et vendu des millions de biens pour les entreprises ; Dans des salles de classe spéciales, des enseignants virtuels proposent des cours de langue des signes basés sur un contenu vocal pour aider les personnes sourdes à acquérir des connaissances... Ces scénarios sont devenus le terrain d'atterrissage de modèles auto-développés à grande échelle ou open source des modèles.
Selon les statistiques de Zhishi, à la mi-mai, il existe au moins 100 outils AIGC représentatifs dans le monde. Du travail de bureau quotidien aux médias sociaux, de la production de jeux à la conception graphique, de la réglementation financière à la vente de produits, le positionnement des rôles des outils AIGC a été mis à jour de l'ancien "observation + prédiction" à l'actuel "génération + prise de décision", favorisant l'implémentation de l'AIGC "point impair" apparaît.
▲ La carte du nuage de mots montre autour de ChatGPT, d'autres outils AIGC avec un taux d'utilisation et un taux de mention élevés
Dans le domaine de la rédaction de texte, les outils AIGC dirigés par des chatbots conversationnels tels que ChatGPT et Wenxinyiyan permettent aux utilisateurs de gagner du temps et de l'argent pour récupérer des informations, et peuvent effectuer une série de tâches inefficaces et répétitives sous forme de dialogue. , Tencent Wenyong, écriture intelligente WPS, etc.
Dans le domaine de la génération d'images, AIGC a également subverti et remodelé la méthode de dessin précédente. "Yiwen Shengtu" offre aux créateurs des styles différents et des sources d'inspiration infinies, et a déclenché une révolution de la productivité dans le domaine du design. Des outils tels que Midjourney et DALL-E continuent de repousser les limites de l'imagination des gens.
Dans le domaine de l'audio et de la vidéo, l'IA peut générer de l'audio et de la vidéo selon des styles prédéfinis en analysant des données sources massives, ce qui non seulement raccourcit le cycle de création, mais dépasse également les limites de l'espace physique et du temps. Les outils couramment utilisés incluent Xunfei Hearing, MusicLM, Runway Gen-2, etc.
En plus des scénarios d'application ci-dessus, il existe également des scénarios plus subdivisés tels que le bureau collaboratif, l'apprentissage des langues, la diffusion en direct du commerce électronique, la programmation et les idoles virtuelles humaines numériques.La technologie AIGC peut être utilisée au niveau technique avec un faible coût marginal et haute efficacité pour répondre aux besoins individuels des utilisateurs.
Il convient de mentionner qu'à l'ère actuelle des informations de phishing et des fausses nouvelles qui inondent les pages, afin de distinguer le contenu AIGC du contenu réel, NetEase et People's Daily Online ont successivement lancé des outils de détection de contenu AIGC pour contrôler les risques liés au contenu. Il existe également des outils liés à la détection de contenu AIGC à l'étranger, tels que Copyleaks, spécialisé dans la détection de plagiat de texte, et DetectGPT, un assistant de contrôle de plagiat pour les articles.
**Cet article interprète plus de 100 outils AIGC des sept sections et joint des liens Web pour aider les utilisateurs à améliorer la productivité au travail. ** En fait, les outils AIGC à la maison et à l'étranger poussent comme des champignons chaque jour, donc les 100 outils AIGC inclus dans cet article ne couvrent pas entièrement l'industrie, mais nous espérons fournir une référence pour l'industrie en termes de catégories et directions .
01. Outils d'écriture AIGC : écriture en un clic
Convient pour les scènes de vie ou de bureau
La génération de texte est l'une des premières technologies commerciales d'AIGC, et c'est aussi la technologie la plus mature qu'AIGC ait développée jusqu'à présent. Aujourd'hui, les outils d'écriture de l'IA ont fait un saut qualitatif dans la capacité à comprendre le contexte, à capturer des connaissances de bon sens, à générer des textes longs et des contenus complets, précis et logiques. .
Les principaux scénarios d'atterrissage des outils d'écriture d'IA peuvent être grossièrement divisés en trois catégories :
Le premier est la génération de texte orientée application, telle que la recherche de phrases selon le sens, le dictionnaire inversé, etc., qui ont des scénarios d'utilisation de fonction relativement clairs, et la direction d'utilisation est également relativement claire. La seconde est la génération de texte créatif, comme Notion AI, l'écriture intelligente WPS, etc., qui peut être utilisée pour la continuation de texte et la génération de contenu, etc. La plupart d'entre eux sont des écritures non structurées, et les utilisateurs ont plus d'espace et de liberté pour la création de texte. Le troisième est la génération de texte conversationnel, tels que Wenxinyiyan, Tongyiqianwen, Xunfei Xinghuo, etc., qui sont hautement interactifs et ont des exigences plus élevées pour les capacités de compréhension du langage naturel des grands modèles.
Notion AI : utilisez ChatGPT pour aider le texte "beauté"
Notion AI est un assistant d'écriture dont les fonctions principales incluent l'écriture, l'édition, la synthèse, etc. Il peut générer automatiquement des articles de blog, des calendriers de réunions, la rédaction de médias sociaux, des communiqués de presse, des e-mails de vente et de la poésie pour répondre aux besoins de différents scénarios. Les utilisateurs peuvent laisser Notion AI traiter le premier brouillon d'un article pour obtenir plus d'idées d'écriture ; ou l'utiliser comme éditeur pour vérifier les erreurs d'orthographe, de grammaire et de traduction.
L'outil adopte actuellement le modèle "essai gratuit + paiement", offrant à chaque nouvel utilisateur 20 opportunités d'essai gratuit, et une fois le nombre de fois épuisé, vous devez acheter le service. Le prix est de 10 dollars US/personne/mois , ce qui équivaut à 68,9 yuans.
Liens web:
Baidu Wenxin Yiyan : "le farceur de l'IA" qui connaît le mieux le chinois
Wenxinyiyan est un robot de chat développé par Baidu. Ses principales fonctions incluent le dialogue et l'interaction avec les utilisateurs, la réponse aux questions, l'aide à la création, etc., pour aider les utilisateurs à obtenir des informations, des connaissances et une inspiration créative. Les scénarios d'utilisation incluent la création littéraire, les affaires rédaction, mathématiques et sciences, calcul, interprétation chinoise, génération multimodale, etc.
En plus de la rédaction, les avantages de Wenxinyiyan incluent la possibilité de créer des images et la possibilité de générer automatiquement des vidéos basées sur la rédaction.
Liens web:
Ali Tongyi Qianwen : Écrire des lettres d'amour est facile
Tongyi Qianwen est un modèle d'Alibaba Cloud auto-développé à grande échelle.Il est actuellement équipé de 9 applications, qui sont principalement divisées en efficacité, vie et divertissement.
(1) Catégorie d'efficacité, comprenant trois applications : rédaction de plans, analyse SWOT et génération de descriptions de produits ;
(2) Catégorie Vie, comprenant trois applications : « Recettes volantes », « Composition des élèves du primaire » et « Et ensuite » ;
(3) Catégorie Divertissement, y compris "Rainbow Fart Expert", "Write Love Letters" et "Write Poems for You".
À l'heure actuelle, les principales fonctions de Tongyi Qianwen comprennent la rédaction, le dialogue et le chat, les questions et réponses sur les connaissances, le raisonnement logique, l'écriture de code, la synthèse de texte et les services de compréhension d'images et de vidéos.
Liens web:
Xunfei Xinghuo : 7 dimensions majeures de la capacité, la performance n'est pas inférieure à ChatGPT
Xunfei Xinghuo est un grand modèle lancé par iFLYTEK le 6 mai. Il comporte sept dimensions de génération de texte, de compréhension du langage, de questions et réponses sur les connaissances, de raisonnement logique, de mathématiques, de code et de multimodalité. Après évaluation et comparaison, il s'avère que c'est a surpassé ChatGPT en compréhension de la langue et en mathématiques.
Xunfei Xinghuo peut effectuer une génération de texte long multistyle, multilingue et multitâche, et peut également effectuer une détection de grammaire et une correction d'erreurs sur la rédaction en anglais, et sa capacité de compréhension de la langue n'est pas inférieure aux systèmes existants qui sont mesurables en Chine.
Liens web:
Sequence monkey : un singe IA capable de répondre à des questions complexes
Le grand modèle de langage "Sequence Monkey" lancé par la société d'intelligence artificielle Mobvoi, son système de capacités prend le langage comme noyau et couvre six dimensions de "la connaissance, le dialogue, les mathématiques, la logique, le raisonnement et la planification". génération, génération d'images, différentes tâches telles que la génération de contenu 3D, la génération de la parole et la reconnaissance vocale.
Sequence Monkey a déjà une certaine capacité de compréhension du langage naturel, de connaissances, de logique et de raisonnement. Pour "Quelle capitale provinciale a la plus grande population, le Hunan ou le Hubei ?", "De quelle école le fondateur de l'entreprise derrière Tmall est-il diplômé ?", etc. Il a été en mesure de donner rapidement des résultats précis pour de telles questions qui nécessitent une réflexion plus approfondie.
Liens web:
openapi.mobvoi.com
Tencent Wenyong Effidit : un artefact d'écriture sur papier pour la continuation sans fil
Wenyong Effidit (Efficient and Intelligent Editing) est un assistant d'écriture intelligent développé par Tencent AI Lab. Il utilise la technologie de l'IA pour aider les rédacteurs à diverger d'idées, enrichir les expressions et améliorer l'efficacité de l'édition et de l'écriture de texte. Ses fonctions incluent la correction intelligente des erreurs, complétion de texte, réécriture de texte, expansion de texte, recommandation de mots, recommandation de phrases, génération et autres fonctions.
Liens web:
Recherchez les phrases selon le sens de WantQuotes : Encyclopédie des citations célèbres
Il s'agit d'un outil de traitement de rédaction développé par l'équipe de recherche de l'Université Tsinghua. Il utilise la technologie d'IA et de traitement du langage naturel (PNL) la plus avancée pour aider les gens à traiter la lecture, l'écriture, la recherche de rédaction et les citations célèbres plus facilement et plus rapidement. .
Les utilisateurs n'ont qu'à saisir le vocabulaire du sujet pertinent, et il peut trouver des dictons célèbres, des poèmes, des dictons, des idiomes, etc.
Liens web:
Dictionnaire inversé WantWord : un dictionnaire de synonymes et de synonymes, les mots d'adieu ne sont pas expressifs
Le dictionnaire inversé et la recherche de phrases par sens sont tous deux développés par l'équipe de recherche de l'Université Tsinghua. Ils peuvent aider à trouver des synonymes plus appropriés et plus vivants à travers les mots donnés, et également prendre en charge la traduction simultanée et mutuelle entre le chinois et l'anglais.
Liens web:
FlowUS AI : disque réseau + mémo + assistant d'écriture
Xiliu est un logiciel de gestion des connaissances et de bureau collaboratif qui se concentre sur la fourniture de services aux petites organisations et aux particuliers. Il intègre plusieurs fonctions telles que la rédaction de documents, le stockage des connaissances, des tableaux multidimensionnels et des cartes mentales sur une seule plate-forme. Ses utilisateurs sont des étudiants. groupe est le groupe principal, représentant plus de 1/3 du nombre total d'utilisateurs.
FlowUS a également été adapté à ChatGPT.Les utilisateurs peuvent utiliser FlowUS AI pour réaliser des fonctions d'écriture, d'écriture continue, de traduction, de polissage et autres selon leurs propres besoins.
Liens web:
Écriture intelligente WPS : génère automatiquement divers articles en 1 seconde
WPS Smart Writing est un produit d'écriture intelligent lancé par Kingsoft Office pour aider les utilisateurs à créer efficacement. Il comprend principalement quatre fonctions : la génération automatique de texte, la rédaction de brouillons auxiliaires, la supplémentation intelligente des phrases et la relecture intelligente du texte.
Ses données textuelles et les informations connexes proviennent de médias faisant autorité et de sites Web publics du gouvernement.Le sujet couvre divers scénarios d'écriture tels que des discours, des résumés, des plans, des nouvelles, etc., et il est connecté à des documents Jinshan, qui peuvent réaliser le téléchargement simultané de Après l'écriture en ligne, les utilisateurs peuvent accéder à Kingsoft Documents pour effectuer des modifications de documents plus professionnelles telles que la composition.
Liens web:
GrammarlyGo : grammaire en ligne "bug catcher"
L'outil de vérification orthographique en anglais Grammarly a également lancé le service d'intelligence artificielle GrammarlyGo, qui peut générer des brouillons d'e-mails basés sur des invites de mots clés saisis par les utilisateurs, ou aider les articles existants à changer le ton et le style du texte, ajuster la longueur des articles, etc., et brouillon contours pour l'écriture de sujet.
Liens web:
Volcano Writing WritingGo : traduction et affinement en un clic
Volcano Writing est un assistant d'écriture lancé par ByteDance. Il prend actuellement en charge les services d'écriture intelligente de l'IA pour l'édition de texte intégral. Qu'il s'agisse de réviser des articles, de peaufiner des CV, de rédiger des documents de candidature pour étudier à l'étranger, d'écrire des textes auto-médias, etc. Plus de 20 scénarios d'écriture, Volcano Writing peut être couvert.
L'utilisateur saisit le contenu du texte qu'il souhaite peaufiner et modifier, et après avoir cliqué sur "Optimisation en un clic", il peut identifier automatiquement le type de texte, le style et le but de l'écriture. L'utilisateur peut également ajuster l'étendue de la modification et la plate-forme peut le produire en fonction du texte original en un seul clic.Le résultat de la réécriture en anglais prend également en charge les fonctions d'intelligence artificielle telles que la correction d'erreurs intelligente et diverses réécritures, ce qui rend l'expression de la langue plus authentique et concise.
Liens web:
Zhishi Q&A : robot Q&A intelligent
Zhishi Q&A est un système Q&A intelligent basé sur la technologie AI. Les utilisateurs peuvent saisir des questions sur la plate-forme Zhishi Q&A, et le système analysera automatiquement les questions et donnera la meilleure réponse. En même temps, il fournit également une variété de méthodes interactives, y compris la saisie de texte, la saisie vocale, etc., pour répondre aux besoins des différents utilisateurs.
Liens web:
En plus des outils d'écriture AIGC familiers ci-dessus, il existe encore de nombreux "produits impopulaires" en attente d'expérience utilisateur, tels que Friday AI Writing Assistant, Love Rewriting, Claude, Creator, Secret Tower Writing Cat, Subtxt, Writesonic, etc.
02. Outil d'image AIGC : la carte de Vincent est plus que Midjourney
Liberté de peindre en un clic
2022 peut être considérée comme la "première année de la peinture IA". Une variété d'outils de peinture IA ont démontré de bonnes capacités de compréhension et de génération d'images à l'aide d'invites de texte.
Avec l'aide de GPT-4, une nouvelle vague de compétition a également été déclenchée dans le domaine de "Vincent map". Midjourney, qui a été mis à jour vers la version V5, est populaire sur Internet avec un groupe de photos de couple. Adobe, le leader de l'industrie du design, n'est pas loin derrière. Il s'est empressé de lancer "Adobe Firefly" pour concourir. majorité des concepteurs. Les outils d'image d'IA d'aujourd'hui sont plus matures et plus variés en termes de commercialisation et d'art que l'an dernier.
▲ Un groupe de photos de couple rétro générées automatiquement par Midjourney
Les scénarios techniques des outils d'image peuvent être divisés en trois types : génération d'image, modification partielle d'image et édition d'image.
L'un est la génération d'images. Les produits représentés par Midjourney, Stable Diffusion et DALL-E 2 se concentrent principalement sur la génération d'images de bout en bout, qui peut générer une image complète avec un style spécifié basé sur une description textuelle ou un croquis. La logique technique sous-jacente est claire et peuvent fournir Les créateurs fournissent certaines sources d'inspiration et de références créatives.
La seconde est l'édition d'images. Les fonctions principales incluent la suppression intelligente du filigrane d'image, la définition de filtres de style, la modification du style d'image ou l'amélioration de la clarté de l'image, etc., représentées par des produits tels que Imagen AI et Chuangketie AI Painter.
Le troisième est la modification partielle de l'image, le produit représentatif est Adobe Firefly. Son principal avantage se concentre sur la modification de certains éléments de l'image, ou la modification et l'ajustement couche par couche, ce qui convient à la création secondaire ou à l'amélioration de la post-production.
Disco Diffusion : Dessinez avec la bouche
Disco Diffusion est un programme de dessin qui s'exécute sur Google Colab. Les utilisateurs disposant d'un compte Google peuvent l'exécuter directement sur le navigateur, mais les utilisateurs doivent avoir certaines connaissances en matière de code.
Une fois que l'utilisateur a saisi une phrase de description, le programme peut automatiquement rendre et générer une image de la scène correspondante. Il est préférable de générer des images abstraites avec un style plus rêveur, et l'effet est moyen lors de la génération de représentations réalistes et de la saisie de plus de descriptions de texte.
Liens web:
À mi-parcours : "photographe" de l'IA
Midjourney est un chatbot de peinture IA lancé par l'un des auteurs de Disco Diffusion, qui est porté sur Discord. Après le lancement de GPT-4, il est également rapidement passé à la version V5. La nouvelle version est plus raffinée en termes de fidélité d'image et de traitement des détails, et a un niveau de commercialisation plus élevé, atteignant presque le point où elle peut "déguiser le réel".
Dans la version précédente, le style des images générées était principalement cartoon ou surréaliste, et il y avait peu d'images réalistes.Après la mise à jour vers la version V5, Midjourney est rapidement devenu populaire avec un groupe de photos de couples qu'il était difficile de distinguer entre vrai et faux , et a atteint le La texture du film est plus réaliste en termes de gros plans de mains, de gros plans d'yeux et de traitement de la lumière et des ombres.
De plus, dans Midjourney V5, les utilisateurs peuvent personnaliser le format d'image. Lors de la saisie d'un texte de description, des adjectifs plus détaillés et des détails d'image tels que l'ambiance, le style, la lumière et l'ombre sont requis. Cela oblige les utilisateurs à avoir un contrôle plus actif sur les images et des images plus claires. imagination.
Liens web:
Diffusion stable : génération d'images au niveau du pixel
Stable Diffusion est un générateur d'images AI gratuit et open-source. Actuellement, la dernière version de Stable Diffusion XL a été testée pour le public.
Par rapport à la version précédente, les utilisateurs de la nouvelle version de SD-XL n'ont besoin que d'utiliser une description plus courte pour générer des images. La structure du corps humain et le traitement des détails des images sont plus réalistes et plus conformes à l'esthétique du public. les portraits sont également plus clairs et plus réalistes. .
Liens web:
DALL-E 2 : Maître de la peinture réaliste
DALL-E 2 est un outil de génération et d'édition d'images lancé par OpenAI, célèbre pour son excellent effet de génération et sa couleur artistique. L'utilisateur n'a qu'à saisir un brief, et il peut synthétiser les trois éléments de concept, d'attribut et de style, et générer une image réaliste qui répond aux besoins de l'utilisateur, et en même temps, il peut également avoir les styles de peinture de différents artistes.
Par exemple, l'utilisateur saisit trois éléments : le concept "un chiot", l'attribut "sur l'herbe" et le style "style Pop artiste Andy Warhol", et il peut produire des images qui remplissent ces trois conditions. Les fonctionnalités de l'outil incluent également l'édition d'images, le morphing de style, etc.
Liens web:
Imagen AI : les images générées peuvent être fausses
Imagen AI est un outil d'intelligence artificielle texte-image développé par Google. Il peut produire des portraits, des peintures à l'huile, des rendus CGI et d'autres images en fonction des invites écrites de l'utilisateur. Les images ont un sens plus fort de la réalité et une plus grande précision dans la compréhension du langage. .
Liens web:
Adobe Firefly : dessin IA + édition d'images en un seul arrêt
Adobe Firefly est un outil de dessin AI lancé par Adobe et Nvidia. Actuellement, il a réalisé les fonctions de génération d'images à partir de texte, de conversion de croquis en images et de modification du contenu de l'image en un clic. Il peut également modifier les images générées automatiquement en couches et produire une image à taux de résolution ultra-haute.
Liens web:
Un style d'écriture et de cœur : prise en charge de la génération d'images à partir d'images et de la conversion d'images en vidéos
Wenxin Yige est un produit de peinture AI lancé par Baidu qui s'appuie sur la pagaie volante et la technologie des grands modèles Wenxin. Les utilisateurs n'ont qu'à entrer leur propre texte créatif et choisir le style d'image souhaité pour obtenir une peinture générée par Wenxinyige. Ils peuvent également choisir le type d'image, le rapport d'image et le nombre d'images générées à la fois. À l'heure actuelle, Wenxin Yige a pris en charge plus de dix styles d'images différents tels que la peinture à l'huile, l'aquarelle, l'animation et le réalisme.
Liens web:
Ali Luban Luban : artefact pour la cartographie du commerce électronique
Luban est un produit de conception d'image développé indépendamment par Alibaba Intelligent Design Lab. Basé sur la technologie de génération d'images AI, Luban peut réaliser la conception d'un grand nombre d'images de bannières, d'images d'affiches et d'images de lieux en peu de temps. Les utilisateurs n'ont qu'à saisir le style et la taille qu'ils souhaitent obtenir, et Luban peut remplacer manuellement les projets de conception chronophages et laborieux tels que l'analyse des matériaux, la découpe et la correspondance des couleurs, et générer plusieurs ensembles de solutions de conception qui répondent aux besoins en temps réel.
Lors de la promotion "Double 11" en 2017, Luban a généré 8 000 affiches par seconde, au cours desquelles un total de 400 millions d'affiches de produits ont été produites, ce qui a permis aux gens de mieux comprendre les capacités de dessin de l'IA.
Liens web:
Chuangketie AI Painter : Vous pouvez être designer même si vous ne savez pas dessiner
Chuangketie, une plate-forme de conception entrepreneuriale, a lancé un produit de peinture d'intelligence artificielle, AI Painter, et a lancé deux scénarios fonctionnels couramment utilisés, "Wen Sheng Tu" et "Tu Sheng Man".
Dans le scénario "Wen Sheng Tu", les utilisateurs n'ont qu'à saisir le texte requis simple, sélectionner le style de peinture qu'ils souhaitent et l'image cible peut être générée en un clic. Les styles existants incluent le style ancien, la peinture à l'huile, la peinture en couleur, les bandes dessinées , CG, etc...
Dans le scénario "Picture Man", les utilisateurs n'ont qu'à télécharger l'image cible et saisir des instructions textuelles simples pour obtenir une image peinte à la main personnalisée. Ses fonctions incluent également la détection des contours, la coloration des brouillons de ligne et la détection de la pose. Fonction.
Liens web:
03. Outils audio AIGC : son variable, clonage, réduction de bruit
En plus des scénarios d'application tels que le texte et les images, l'audio est également un scénario d'application avec lequel nous avons un large éventail de contacts dans notre vie quotidienne. Le changement de voix humaine, la synthèse vocale et le clonage dans de courtes vidéos sont les technologies de recherche populaires d'AIGC dans le domaine audio, y compris l'animation, les films et le doublage de personnages dans les jeux, qui peuvent désormais être réalisés par l'IA. Des entreprises technologiques telles que Microsoft et Google ont également lancé leurs propres services Text-to-Speech (text-to-speech).
Les outils audio IA peuvent être divisés en deux types selon différents attributs fonctionnels : l'un est les outils de traitement du son représentés par So-Vits-Svc, Adobe Podcast AI Voice, Magic Sound Workshop, etc., qui utilisent la technologie IA pour réparer le son et améliorer l'audio. qualité Ou convertir le timbre, etc. ; le second est les outils de production musicale représentés par MusicLM, Netease Tianyin, Aiva, etc., qui peuvent réaliser la fonction "texte en musique" dans des domaines plus subdivisés.
"AI Stefanie Sun" est devenu populaire sur Internet du jour au lendemain. Des chansons telles que "Hair Like Snow" et "Rainy Day" "reprises" par elle ont dépassé le million de vues sur Bilibili, et ces chansons ont été transmises par les propriétaires d'UP. le projet open source So-Vits-Svc.
Ce modèle utilise l'encodeur de contenu SoftVC pour extraire les caractéristiques vocales audio source du vrai chanteur, puis les transfère dans le modèle de synthèse vocale VITS, de sorte que la voix originale du chanteur soit préservée. Des "chanteurs IA" similaires incluent AI Jay Chou, AI Xu Song, AI Wang Xinling, etc.
En plus de simuler les voix de chanteurs connus, il peut également simuler un grand nombre de voix réelles à partir d'enregistrements téléphoniques, de vidéos vidéo et d'autres matériaux.Auparavant, certains propriétaires d'UP utilisaient ce modèle pour communiquer avec le défunt. Cependant, en raison de l'abus croissant du projet, l'auteur a supprimé le projet.
Adobe Podcast AI Voice : traitement audio de podcast professionnel
Adobe Podcast AI Voice est un amplificateur audio alimenté par l'IA d'Adobe qui utilise l'IA pour améliorer la qualité des enregistrements audio de blog.
Une fois que l'utilisateur s'est connecté au compte Adobe, téléchargez le fichier audio qui nécessite un traitement de réduction du bruit, AI traitera automatiquement le fichier audio, et une fois l'effet de lecture audio satisfaisant obtenu, l'utilisateur peut le télécharger directement sur l'ordinateur pour une utilisation gratuite. .
Liens web:
MusicLM : modèle d'IA capable de chanter
MusicLM est un véritable modèle d'IA générative publié par Google. Grâce à ce modèle, de la musique haute fidélité peut être directement générée à partir de texte. En plus du texte, qu'il s'agisse de fredonner, de chanter, de percussions, de performances d'instruments, etc., MusicLM peut créer de la musique à partir de ces mélodies existantes et s'assurer que la musique n'est pas déformée.
Son plus grand atout est qu'il peut générer une piste complète de 5 minutes basée sur un ou deux mots rapides, avec différents styles, y compris la musique électronique, le jazz, le blues, la pop, etc. La durée de la chanson peut également être définie à l'avance, comme une piste complète de 5 minutes ou un segment de bourdonnement de dix secondes.
En outre, il peut également générer des morceaux joués par des instruments spécifiques, et même le niveau de performance des interprètes peut être défini. Il peut également créer de la musique en fonction des caractéristiques de l'époque et du lieu où elle est jouée. Musique populaire jouée par un orgue au bord de la mer".
MusicLM est formé dans une base de données musicale pouvant contenir jusqu'à 280 000 heures, quel que soit le style ou l'émotion de la chanson.
Liens web:
Xunfei Hear : la voix au texte à tout moment, n'importe où
Xunfei Hearing est un produit vocal intelligent d'iFLYTEK, s'appuyant sur le traitement du langage naturel d'iFLYTEK, la reconnaissance d'empreintes vocales et la reconnaissance vocale et d'autres technologies vocales, iFLYTEK Hearing peut répondre aux besoins vocaux des utilisateurs dans divers scénarios, les scénarios applicables couvrent différentes occasions telles que les procès-verbaux de réunion, conférences, entrevues avec les médias et écrit personnel.
Ses fonctions avantageuses incluent également l'ajout de sous-titres bilingues aux vidéos, l'interprétation simultanée multilingue et la génération de sous-titres pour les vidéoconférences, etc., pour aider les utilisateurs à surmonter les barrières linguistiques et faciliter la communication et la collaboration.
Liens web:
NetEase Tianyin : Les paroles, la musique, l'arrangement et le chant sont complétés en un seul arrêt
Netease Tianyin est un système de création de musique d'arrangeur AI produit par Netease, qui peut créer de la musique AI en ligne. Son plus grand avantage est que le seuil de création musicale est bas et que les utilisateurs peuvent compléter un arrangement musical original conformément aux directives en peu de temps.
L'atelier de Tianyin comprend un certain nombre de styles musicaux spécifiques, notamment la pop, le folk, l'électronique, le style national, etc. chanson en ajoutant, soustrayant, copiant, ajustant des paragraphes, etc. Une fois toutes les modifications terminées, elles seront automatiquement rendues et vous pourrez obtenir un arrangement original créé par vous-même après une courte attente.
Liens web:
Magic Sound Workshop : un outil indispensable pour le commentaire cinématographique et télévisuel big V
Moyin Workshop est un produit de la série vocale AI lancé par la société AI Sortir pour demander. Les utilisateurs peuvent utiliser efficacement et facilement la technologie vocale AI pour simuler la voix d'une personne réelle avec des caractéristiques personnelles, créer du contenu audio AI et convertir du texte en une personne réelle avec un clic.
L'utilisateur importe rapidement l'article à synthétiser dans le son de l'interface et effectue une édition en ligne via une page d'opération similaire au document, de sorte que le document puisse être converti en audio de manière pratique. Les fonctions de la page d'édition comprennent : le marquage d'accentuation, les caractères multi-phonétiques, le marquage sujet aux fautes de frappe, l'ajout d'un son de fond, le doublage mixte multi-personnes, la vitesse variable, le rythme et de nombreuses autres fonctions.
Pour les utilisateurs qui aiment la technologie, la finance et d'autres domaines, Moyin Workshop a également ajouté des modèles vocaux d'IA des PDG de nombreuses sociétés liées en arrière-plan, afin que les utilisateurs qui les connaissent puissent utiliser leur voix pour produire du contenu audio.
Liens web:
Fake You : Les voix peuvent aussi être truquées
FakeYou est un outil d'édition audio de synthèse vocale qui utilise la technologie de falsification profonde pour générer une synthèse vocale dans différentes langues et voix. Les utilisateurs peuvent utiliser les voix de leurs personnages préférés pour créer de l'audio, et il fournit également du texte AI -fonctions vocales.
Lorsque l'utilisateur entre un morceau de texte à générer et choisit qui veut lire le texte, puis clique sur le bouton "parler", une voix "parlée" par la personne cible est automatiquement générée.
Liens web:
LyricStudio : l'IA vous aide à écrire des paroles
LyricStudio est un créateur de paroles en ligne qui aide les utilisateurs à générer des paroles originales qui imitent leur propre style et trouvent une rime pour un mot spécifique. Les utilisateurs peuvent télécharger une description textuelle ou un clip musical, et il le convertit en paroles qui correspondent au contenu.
Selon les données de son site officiel, l'outil a collaboré pour créer plus d'un million de chansons, et 15 % des utilisateurs de la plateforme sont des producteurs de musique professionnels. LyricStudio a aidé le rappeur Curtiss King à publier les paroles de l'album iTunes n°1.
Liens web:
LALAL.AI : extraction en un clic des sons d'instruments
LALAL.AI est un outil de séparation de musique en ligne qui peut segmenter et extraire les voix et les instruments de la musique.
Sa technologie de séparation de musique en ligne est entièrement basée sur l'apprentissage automatique et l'intelligence artificielle. Avant la version précédente, elle ne pouvait séparer que les voix humaines. Désormais, elle peut extraire avec précision les voix humaines, les guitares électriques, les guitares acoustiques, les pianos et la batterie à partir de fichiers audio et vidéo. ., basse et bien d'autres instruments.
URL :
Aiva : productrice de musique IA
Aiva est un outil de musique IA du même nom, auto-développé par la société de musique IA "Aiva". Les utilisateurs peuvent aider les musiciens à produire et à écrire de la musique originale grâce à la technologie IA. La plate-forme couvre une variété de styles différents, tels que le classique , rock, musique électronique, pop, style national, blues, hip hop, etc. Sur la page de composition automatique, les utilisateurs peuvent choisir parmi 11 genres, notamment la tonalité de signature de clé, le rythme de signature de temps, le rythme de stimulation, l'instrumentation, la durée, etc.
Aiva a également étudié les œuvres représentatives et les styles musicaux de Mozart, Bach, Beethoven et d'autres musiciens grâce à un apprentissage en profondeur, et a établi un modèle d'apprentissage basé sur ces caractéristiques musicales pour aider les musiciens à créer de la musique. Dans le même temps, Aiva est également le premier compositeur d'IA certifié de l'histoire et a publié 5 albums.
Liens web:
Supertone : un artefact qui change la voix
Supertone est un studio de son créatif basé sur l'IA en Corée du Sud qui fournit une synthèse vocale et une technologie d'amélioration de la parole en temps réel pour aider les utilisateurs à créer facilement divers types de contenu sonore, y compris la simple lecture de texte sur des œuvres d'art, des chansons, etc., permettant aux utilisateurs de changer leurs voix et d'autres moyens Pour apaiser les préoccupations concernant les problèmes d'informations personnelles.
Supertone propose également une technologie appelée "VoicePrint", qui convertit la voix d'un utilisateur en une empreinte numérique qui la distingue des voix des autres utilisateurs.
Liens web:
04. Outil vidéo AIGC : le montage automatique et la génération de fonctions de storyboard sont là
Les graphiques de Vincent sont maintenant devenus la technologie AIGC courante, mais la génération de texte en vidéo en est encore à ses balbutiements.
Runway, la start-up d'intelligence artificielle basée à New York, a développé un modèle vidéo génératif Gen-2, qui peut générer une vidéo hautement composite à partir d'une simple description. D'autres entreprises se sont également jointes à nous, telles que Text2Video-Zero, Video-P2P, TemporalNet lancée par la plateforme d'édition d'images PiscArt, et Text-to-video développée par Ali.La vidéo générée par texte pourrait également entrer dans une concurrence féroce dans un avenir proche .étape.
Deepfakes : changement de visage de la vidéo AI
Les deepfakes sont désormais synonymes de vidéos synthétisées par l'IA. Microsoft a lancé FaceShifter, qui peut transformer une image originale floue en une image falsifiée claire et crédible ; Disney et l'ETH Zurich ont développé et lancé conjointement un outil de production vidéo Deepfakes de niveau mégapixel, et dans la série "Star Wars" Dans le film, Deepfakes étaient utilisé pour ramener les acteurs décédés sur grand écran.
Cependant, les risques de sécurité causés par cela se sont également succédés.Pour certaines vidéos haute définition et à lumière extrêmement naturelle, même l'algorithme Deppfakes le plus sophistiqué ne peut pas les identifier avec précision.
En conséquence, dès les élections américaines de 2020, Facebook a annoncé une interdiction totale de l'utilisation de Deepfakes sur la plateforme, et YouTube et TikTok n'ont pas fait exception, interdisant explicitement l'utilisation illégale de la technologie Deepfakes dans les vidéos. Le "Code civil" qui sera mis en œuvre dans mon pays en 2021 souligne également que les principales plateformes vidéo doivent restreindre strictement le contenu des vidéos d'IA qui changent de visage, et qu'elles ne doivent pas être utilisées à volonté sans autorisation.
Runway Gen-2 : Générez des films à succès en 30 secondes
Gen-2 est un modèle Transformer de bout en bout lancé par la start-up Runway. Les utilisateurs peuvent utiliser des images et du texte comme conditions pour générer une vidéo originale de style lent à partir de zéro.
La résolution vidéo qu'il génère est aussi élevée que 1280 × 720 et la durée est d'environ 30 à 60 secondes.Actuellement, les fonctions suivantes peuvent être réalisées : générer une vidéo, générer des images, agrandir les images sans limite en fonction des invites de texte, mélanger les styles d'image , entraîner des modèles d'IA, supprimer un élément de la vidéo, soustraire l'arrière-plan, etc.
Récemment, Runway a lancé sa première application mobile, en utilisant le modèle Gen-1, les utilisateurs peuvent télécharger du texte, des images ou des vidéos sur le téléphone mobile, et laisser le modèle transformer le style de la vidéo en fonction du contenu.
Liens web:
Make-A-Video : convertissez directement le texte en vidéo
En septembre 2022, Meta a lancé son propre logiciel de conversion de texte en vidéo "Make-A-Video". Une fois que l'utilisateur a entré quelques descriptions de mots simples, le logiciel créera une vidéo silencieuse.
Dans la vidéo de démonstration officielle, l'utilisateur peut obtenir une vidéo de quelques secondes en saisissant des descriptions textuelles telles que "un jeune couple marchant sous une pluie battante" et "un ours en peluche qui a peint un portrait". De plus, Make-A-Video peut également animer des images statiques, basées sur la technologie "Diagramme de Vincent".
Selon le responsable, le modèle est formé à l'aide de données de synthèse d'images et de vidéos non étiquetées. Après avoir appris, le modèle peut "prédire" ce qui se passera à côté de l'image, où elle se déplacera et se déplacera vers l'endroit où l'image sera dans un très peu de temps L'endroit où il apparaît pour former une courte vidéo.
Liens web:
Shangtang Zhiying: artefact de trésor expert en vidéo courte
SenseTime a lancé une plate-forme de publicité et de marketing à guichet unique pour SenseTime, qui comprend le moteur de création de courtes vidéos "SenseTime", qui peut générer de courtes vidéos créatives en un seul clic, y compris la génération de script, le remplacement d'arrière-plan, le remplacement d'écran horizontal et vertical et le sous-titre Une variété de services pour la production de publicité vidéo peut aider les annonceurs à économiser sur le coût de la production de contenu publicitaire.
Le service "Video Element Analysis" inclus dans SenseTime peut analyser et extraire des informations telles que la longueur, la scène, la scène, le personnage, les accessoires et les lignes de chaque plan dans une courte vidéo grâce à la technologie de structuration vidéo AI, et créer automatiquement un script de plan grandement réduit le temps d'écriture du script et assiste efficacement les créateurs dans la création secondaire.
En outre, la plate-forme fournit également un grand nombre de scripts vidéo populaires pour fournir aux créateurs une inspiration créative.
Liens web:
Décohérence : Générez une vidéo en un clic sur l'image
Decoherence est un outil pour créer des vidéos d'IA où les utilisateurs peuvent choisir parmi une variété de styles d'IA.
Liens web:
Tencent Zhiying : artefact de création de courtes vidéos
"Tencent Zhiying" s'adresse principalement aux créateurs de courtes vidéos, et ses fonctions présentées sont de véritables documents protégés par le droit d'auteur et des émissions humaines numériques. Les utilisateurs peuvent générer une vidéo humaine numérique en téléchargeant des photos et du texte. Les utilisateurs peuvent également l'utiliser avec la fonction intelligente de doublage AI pour choisir différents timbres pour les humains numériques.
Liens web:
05. Outils bureautiques AIGC : AI+OA réalise un clic "à partir de zéro"
Le 17 mars, Microsoft a officiellement lancé Microsoft 365 Copilot, qui intègre les capacités de GPT-4 et ChatGPT dans les outils Office, et a lancé la fonction Business Chat intégrant les données Office 365, qui améliore le niveau de bureau numérique et évite aux employés des tâches inefficaces, Liberated du travail répétitif.
Kingsoft Office, en tant qu'entreprise leader dans le domaine des bureaux collaboratifs nationaux, a également lancé une plate-forme de bureau générative "WPS AI" avec de grandes capacités de modèle linguistique en seulement un mois, devenant ainsi la première application de type ChatGPT dans le domaine des bureaux collaboratifs nationaux. De plus, des entreprises telles que Baidu, ByteDance et DingTalk ont successivement lancé leurs propres outils bureautiques collaboratifs d'IA.
Le système d'application OA (Office Automation) s'est progressivement développé et a mûri. En tant que pont reliant les employés et les entreprises, il pourrait devenir à l'avenir l'entrée du grand modèle de langage dans l'écologie du B-end.
En plus du domaine du bureau collaboratif, les outils d'IA peuvent également être appliqués dans des scénarios plus verticaux et combinés à des besoins plus pratiques. Par exemple, "IA + apprentissage des langues" a DuolinguoMax, et "IA + livraison e-commerce" a créé un version intelligente du e-commerce, site e-commerce Shopify, outil de marketing e-commerce eCommerce s, etc. avec une description de phrase.
1. Copilote Microsoft 365 : version Gpt-4 de Microsoft Family Bucket
Microsoft 365 Coplilot a suivi GPT-4 au petit matin du 17 mars, et tous les logiciels bureautiques, y compris Word, Excel, Powerpoint, Outlook, Teams, etc. ont été lancés avec des fonctions d'IA génératives.
Dans Word, Copilot n'a besoin que d'une simple invite pour créer un premier brouillon, et peut également ajuster le ton de l'article en fonction des besoins de l'utilisateur, comme professionnel et sérieux, enthousiaste et décontracté, etc., et peut supprimer automatiquement le même endroit dans l'article , pour plus de simplification.
Copillot dans Excel peut aider les utilisateurs à analyser les données, à analyser directement les tendances des données et à visualiser les résultats de l'analyse des données.
Ce qui est encore plus étonnant, c'est que Powerpoint peut déjà générer directement un PPT, et Copilot peut convertir directement un document existant en PPT avec des sources marquées. Si les utilisateurs estiment que le PPT est trop long, ils peuvent utiliser directement la description textuelle pour compresser, ajuster la mise en page ou formater le texte en un seul clic.
Copilot dans Outlook peut aider les utilisateurs à classer les e-mails selon certains critères, résumer et affiner le sujet des e-mails longs et retranscrire plusieurs mots-clés ou brouillons dans des e-mails officiels.
Liens web:
Google Workspace : technologie + bureau = artefact pour les travailleurs
Google Workspace est un espace de travail Google qui comprend des outils bureautiques tels que Docs, Slides, Sheet et Gmail. Google a annoncé en mars qu'il intégrerait l'IA dans ces composants d'outils. Après avoir accédé au modèle d'IA générative, les utilisateurs pourront créer un e-mail complet, un plan d'affaires ou une feuille de frais de marketing publicitaire à l'aide de ces outils en saisissant une courte description textuelle.
Dans Docs, l'IA générative peut aider les utilisateurs à rédiger le premier brouillon de texte, peaufiner et réviser le texte, relire et corriger les erreurs ; Gmail peut répondre et résumer les e-mails, marquer les questions importantes, etc. ; Slides peut générer automatiquement des images, de l'audio et de la vidéo en fonction de le thème et les insérer dans le modèle ; Sheet peut effectuer automatiquement le traitement des données, le tri des tableaux, la classification du contexte et même l'analyse des données brutes.
À l'heure actuelle, Google adopte un plan de paiement flexible, qui est divisé en version de base pour débutants, en version standard et en version professionnelle Plus, permettant aux utilisateurs de s'abonner en fonction de leurs besoins réels.
Liens web:
Baidu Ruliu : IA + gestion des connaissances
Baidu Ruliu a lancé la « Ruliu Intelligent Work Platform 2.0 » pour le marché des services d'entreprise à la fin de l'année dernière, comprenant trois matrices de produits intelligents : gestion intelligente des connaissances, conférence intelligente et établi intelligent.
Dans la gestion intelligente des connaissances, il existe trois applications de gestion des connaissances de "base de connaissances intelligente", "double moteur de recherche et de recommandation" et "chaîne d'étoiles de la connaissance", qui rassemblent des documents dispersés, des e-mails, des notes et d'autres fichiers en un seul endroit, les employés peuvent trouver les documents et connaissances requis de la manière la plus pratique.
Les réunions intelligentes connectent intelligemment les employés, les espaces et les équipements. Avant la réunion, Ruliu Conference Assistant peut vous aider à vérifier l'horaire des participants, à réserver le meilleur moment de réunion et à envoyer le matériel de réunion ; pendant la réunion, Ruliu Assistant peut enregistrer les discours des participants et convertir la voix en texte en temps réel temps, marquant les informations clés; Après cela, l'assistant de réunion générera automatiquement une tâche de réunion, ce qui est pratique pour les employés pour passer en revue les points clés de la réunion.
Différentes cartes de travail sont collectées dans l'établi intelligent pour rendre le système de tâches plus flexible et plus clair, et différentes cartes de travail sont associées en fonction des employés occupant différents postes. Par exemple, le workbench RH intègre des cartes de travail pour les assistants d'entretien et des modules de gestion du recrutement ; le workbench du manager comprend des cartes de travail en trois dimensions pour le suivi de l'efficacité, l'analyse collaborative et la gestion des processus, fournissant aux managers des données sur les tâches de l'équipe.
Liens web:
Dingding slash "/": la baguette magique génère des applets en un clic
Une semaine après la sortie du modèle à grande échelle de Tongyi Qianwen, DingTalk a annoncé son accès officiel. Après avoir accédé au grand modèle Qianwen, les utilisateurs n'ont qu'à utiliser une barre oblique "/" pour effectuer un travail de bureau intelligent. Les principaux scénarios d'utilisation incluent le chat de groupe, les documents, la visioconférence et le développement d'applet.
Dans la discussion de groupe, les nouveaux entrants n'ont qu'à saisir "/" dans la boîte de dialogue pour obtenir les points contextuels de la discussion de groupe, et la barre oblique peut également générer des tâches, planifier des rendez-vous et créer des émoticônes pour des réunions importantes.
Dans une discussion en tête-à-tête, les utilisateurs peuvent directement utiliser des barres obliques pour créer un chatbot afin de lui permettre d'acquérir automatiquement des connaissances et de répondre aux questions.
Dans les documents, slash peut générer automatiquement du copywriting et des affiches dans différents styles ; dans les vidéoconférences, slash peut résumer les points de rencontre, les choses à faire, etc. en un seul clic.
De plus, la fonction la plus inattendue de slash est de générer de petits programmes en langage naturel et de les utiliser dans le groupe sous la forme de "Dingding cool application".
5. Kingsoft Office WPS AI : l'IA rédige des documents
Le jour même où DingTalk a annoncé l'accès au grand modèle et le lancement de l'assistant de bureau intelligent "/", Kingsoft Office, l'un des principaux éditeurs nationaux de logiciels de bureau, a également annoncé officiellement le lancement de "WPS AI". Le grand modèle sous-jacent est fourni par MiniMax, qui comprend actuellement de multiples fonctions telles que la génération de contenu, le dialogue multi-tours et l'optimisation du contenu. À l'avenir, il pourrait évoluer vers la version domestique de "Microsoft 365 Coplilot" et être entièrement intégré dans la suite WPS.
Liens web:
Feishu My AI : assistant administratif version Bytedance
Le 11 avril, Feishu, la plateforme bureautique de ByteDance, a également lancé l'assistant intelligent d'IA "My AI". Ses fonctions incluent la synthèse automatique des comptes rendus de réunion, la création de rapports, la poursuite de la rédaction et l'optimisation du contenu textuel, etc. Dans Feishu, My AI peut également aider les utilisateurs à créer des horaires et à rechercher la base de connaissances interne de l'entreprise par le dialogue. Cependant, My AI est toujours en cours, et la version bêta publique et l'heure de lancement n'ont pas encore été annoncées.
Liens web:
Shopify : l'IA transforme le service client e-commerce en quelques secondes
Le 1er mars, après que ChatGPT a annoncé l'ouverture de l'API, la plate-forme de services de commerce électronique transfrontalier Shopify a pris les devants dans l'intégration. Après avoir intégré ChatGPT, Shopify peut utiliser un service client intelligent pour communiquer avec les utilisateurs, aider les consommateurs à faire des recommandations personnalisées et gagner du temps d'achat ; ChatGPT effectue également l'analyse des données d'examen, l'optimisation des titres et des mots clés, la rédaction marketing et la programmation de développement de sites Web intelligents pour les produits de la plate-forme et de nombreuses autres fonctions pour aider à améliorer l'efficacité opérationnelle des sites Web de commerce électronique et à optimiser l'expérience d'achat des consommateurs.
Liens web:
ChatGPT e-commerce : pronostiqueur e-commerce
Liens web:
GitHub Copilot X : Programmation Xiaobai peut aussi écrire du code
Après que Microsoft a lancé la nouvelle version du moteur de recherche Bing, du navigateur Edge et du bucket de la famille Office, sa plate-forme d'hébergement de code GitHub a également publié Copilot X, qui a introduit ChatGPT dans l'environnement de développement intégré, même les utilisateurs sans base de code peuvent compter sur "bouge ta bouche " Écrivez le code.
Dans GitHub Copilot Chat, les utilisateurs peuvent lui envoyer des instructions pour écrire du code dans une fenêtre de chat. Pour les codes qui s'exécutent anormalement, il peut directement trouver le bogue (erreur) et le modifier ; dans GitHub Copilot Voice, il peut même être implémenté. voix pour coder en une seule étape, le développeur parle directement et donne des instructions en langage naturel, et il peut générer des codes pertinents.
En plus des fonctions ci-dessus, si l'utilisateur ne comprend pas une certaine ligne de code, laissez simplement Copilot expliquer la fonction du code dans le chat.
Liens web:
Lucioles : les procès-verbaux de réunion sont facilement résolus
Liens web:
Feishu Miaoji : Mille mots pour un texte, un mot vaut mille mots
Liens web:
06. Outils de vie AIGC : cuisiner, prendre des notes, faire des guides de voyage
Laissez l'IA devenir l'intendant de la vie
En plus des outils d'IA hautement applicables tels que la génération de texte et le montage audio et vidéo, divers nouveaux produits AIGC ont fait leur apparition dans la vie quotidienne.
Par exemple, ChefGPT aide à générer des recettes pour les utilisateurs qui ont mal à la tête tous les jours, Dover Autopilot, un outil de recrutement d'IA qui fournit des CV de talents de haute qualité pour les chasseurs de têtes, BibiGPT, qui peut prendre des notes tout en regardant des vidéos, et Bedtime Story AI, qui peut générer des histoires courtes avant d'aller se coucher.WatchNow, qui recommande des listes de films selon vos préférences personnelles, etc., la vie entièrement intelligente n'est plus une intrigue uniquement dans les films de science-fiction, et l'IA est pleinement entrée dans notre vie quotidienne.
BibiGPT : un outil convivial pour les étudiants, permettant de transférer en un clic des vidéos vers des notes
La vidéo est trop longue pour résumer les points clés ? Trop pressé pour prendre des notes en regardant une vidéo ? BibiGPT, un logiciel de résumé audio et vidéo développé sur la base de ChatGPT, résout bien ces problèmes. Pour les vidéos sur Bilibili et Youtube, BibiGPT peut résumer le contenu clé en un clic. Les utilisateurs n'ont qu'à coller le lien vidéo qu'ils ont visité sur la boîte de recherche et cliquez sur ""Résumé en un clic", vous pouvez obtenir une note de résumé vidéo.
Liens web:
Dover Autopilot : logiciel de recrutement IA
Dover Autopilot est un outil de recrutement automatisé. Les recruteurs n'ont qu'à entrer un simple lien de description de poste, et il peut trouver des demandeurs d'emploi qui correspondent aux exigences du poste en quelques minutes grâce à des sources de données telles que LinkedIn et d'autres sites Web de recherche d'emploi. Il peut également générer automatiquement des e-mails personnalisés. pour les candidats.
Lien Web : dover.com/start
ChefGPT : une encyclopédie de recettes pour les novices en alimentation
Il s'agit d'un outil de recommandation de recettes IA.Lorsque l'utilisateur saisit les ingrédients et les outils existants à portée de main, ainsi que le temps de cuisson réservé, il peut recommander une recette qui répond aux besoins.
Il y a deux modes dans la page, l'un est le mode gourmet et l'autre est le mode tout sélectionner. Le mode Gourmet a des exigences plus élevées en matière d'autonomie de l'utilisateur, obligeant les utilisateurs à sélectionner des ingrédients et des ustensiles de cuisine, puis à les saisir dans la page Web, tandis que le mode Tout sélectionner est plus convivial pour les "novices de la cuisine", et vous pouvez obtenir une copie qui répond aux exigences sans en utilisant votre cerveau Des recettes pour de vrais besoins.
Liens web:
Journeai : Guide de voyage pour routards
Journeai est un conseiller en voyages par chat basé sur l'IA, qui vise à créer des itinéraires de voyage personnalisés pour les utilisateurs. Il peut générer des itinéraires en fonction des préférences de l'utilisateur, y compris les arrangements d'activités et les partenaires de voyage à explorer.
Cet outil convient non seulement aux vacanciers qui ont besoin de personnaliser les arrangements d'itinéraires personnalisés, mais convient également pour aider les agences de voyages à améliorer l'expérience utilisateur.
Liens web:
07.
Outil de détection de contenu AIGC : AIGC contrefait
Ouvrir la voie à l'identification de contenu
Avec le développement de la technologie AIGC entrant dans la voie rapide, cela a également causé beaucoup de fausses informations, de plagiat de texte, de fraude académique, de litiges en matière de droit d'auteur et d'autres effets indésirables et événements négatifs connexes. Les conflits de sécurité inconnus sont inévitables, ce qui nécessite le développement de technologies pertinentes pour la détection et le filtrage.
Bien qu'il n'y ait pas beaucoup d'outils de détection de contenu AIGC actuellement sur le marché, ils peuvent déjà distinguer avec précision le contenu AIGC tel que le texte, les images et les sons générés. Système de détection de plagiat CrossCheck, etc.
1、Copyleaks:
Copyleaks est actuellement l'un des outils de détection de contenu d'IA les plus populaires au monde.L'avantage le plus important est qu'en plus de détecter le contenu en anglais, il peut également détecter le contenu écrit en espagnol, en français et dans d'autres langues. Pour les textes qui sont tous générés par l'IA, Copyleaks peut atteindre une précision de reconnaissance de 99,99 %, mais pour le contenu textuel à moitié vrai ou faux, il le marquera comme du texte généré artificiellement.
Liens web:
AIGC-X : Identifiez l'authenticité d'un texte chinois avec des yeux perçants
People.cn Information Technology Company, une filiale du Quotidien du Peuple, qui se concentre sur le contrôle des risques liés au contenu, a développé le premier outil de détection de contenu généré par l'IA en Chine, AIGC-X. Cet outil peut être utilisé pour distinguer le texte généré par la machine du artificiellement Il peut détecter et filtrer les fausses nouvelles, le plagiat de contenu, le spam, etc., et surtout fournir un support technique dans les zones grises telles que les fausses informations, la fraude scolaire et le phishing.
Cependant, AIGC-X ne prend actuellement en charge que la détection du contenu chinois, et la capacité de détection des images, du contenu audio et vidéo doit être améliorée.
Liens web:
DetectGPT : outil anti-reconnaissance, la fraude et la tricherie sont inévitables
L'outil de détection de zéro échantillon DetectGPT a été développé par une équipe de recherche de l'université de Stanford aux États-Unis, il est principalement utilisé pour lutter contre le phénomène de génération de papier courant dans les universités. Un document de recherche intitulé "DetectGPT : détection de texte générée par une machine à zéro à l'aide de la courbure de probabilité" a été publié sur le site Web de préimpression arXiv.
Cet outil de détection propose un nouvel indicateur pour juger du texte généré par le grand modèle de langue. Il suffit de scanner le contenu téléchargé sur la page Web pour déterminer si le contenu du texte est généré à l'aide du grand modèle de langue.
Liens web:
NetEase NetShield : Détection précise des mots sensibles
NetEase NetShield, basé sur les années d'expérience de NetEase dans l'industrie, fournit des modèles de correspondance personnalisés et des solutions de détection personnalisées pour les caractéristiques du spam textuel. Le contenu détourné pour des tiers sera également automatiquement filtré.
Liens web:
Détection de texte intelligente Sumei : identification rapide du texte à risque
Sumei utilise un moteur de reconnaissance de contenu intelligent complet pour identifier efficacement les contenus sensibles, interdits, pornographiques, violents, abusifs, publicitaires et autres contenus textuels à risque dans divers scénarios, aidant ainsi les utilisateurs à identifier davantage les informations à risque. À l'heure actuelle, Sumei a été en mesure de détecter automatiquement 175 langues étrangères et prend en charge l'identification des étiquettes de risque dans 18 langues courantes telles que l'anglais, l'arabe, le thaï et l'indonésien.
Liens web:
08. Conclusion : l'AIGC a amorcé une révolution de la productivité dans tous les domaines
Devenez copilote pour les créateurs
Outre l'écriture, la génération d'images, le montage audio et vidéo, les assistants de bureau, la détection de contenu, etc., d'autres sous-divisions attendent d'être explorées.
Aujourd'hui, l'IA se lance à grands pas dans le domaine de la production de contenus numériques. En plus d'être comparable aux professionnels de l'écriture, du question-réponse, de la peinture et des villes centenaires, elle a également démontré la puissante capacité de compréhension des grands modèles de langage. Mais il ne peut servir que de « copilote (copilote/assistant) » pour aider les humains à prendre des décisions, aider les créateurs dans la production continue et les idées itératives, et ne remplacera pas ces travaux vraiment précieux.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Hematemesis trie 100 artefacts AIGC, et les ouvriers accélèrent ! La collecte est fortement recommandée !
Source : Sagesse
Auteur | Wu Feining
Éditeur | Li Shuiqing
Titre original : "Le roi des rouleaux l'utilise ! 100 outils AIGC de niveau trésor à partager, fortement recommandés pour la collection ! ! "
En parlant d'outils AIGC, vous ne connaissez encore que ChatGPT ?
En fait, de plus en plus d'applications AIGC ne sont pas basées sur le GPT d'OpenAI. Dans le domaine du divertissement, la musique de couverture des chanteurs "AI Stefanie Sun" et "AI Jay Chou" est devenue populaire et les chanteurs eux-mêmes ont été émerveillés ; dans le domaine du commerce électronique, les humains virtuels de l'IA lisent des scripts générés par l'IA 7x24 heures , et vendu des millions de biens pour les entreprises ; Dans des salles de classe spéciales, des enseignants virtuels proposent des cours de langue des signes basés sur un contenu vocal pour aider les personnes sourdes à acquérir des connaissances... Ces scénarios sont devenus le terrain d'atterrissage de modèles auto-développés à grande échelle ou open source des modèles.
Selon les statistiques de Zhishi, à la mi-mai, il existe au moins 100 outils AIGC représentatifs dans le monde. Du travail de bureau quotidien aux médias sociaux, de la production de jeux à la conception graphique, de la réglementation financière à la vente de produits, le positionnement des rôles des outils AIGC a été mis à jour de l'ancien "observation + prédiction" à l'actuel "génération + prise de décision", favorisant l'implémentation de l'AIGC "point impair" apparaît.
Dans le domaine de la rédaction de texte, les outils AIGC dirigés par des chatbots conversationnels tels que ChatGPT et Wenxinyiyan permettent aux utilisateurs de gagner du temps et de l'argent pour récupérer des informations, et peuvent effectuer une série de tâches inefficaces et répétitives sous forme de dialogue. , Tencent Wenyong, écriture intelligente WPS, etc.
Dans le domaine de la génération d'images, AIGC a également subverti et remodelé la méthode de dessin précédente. "Yiwen Shengtu" offre aux créateurs des styles différents et des sources d'inspiration infinies, et a déclenché une révolution de la productivité dans le domaine du design. Des outils tels que Midjourney et DALL-E continuent de repousser les limites de l'imagination des gens.
Dans le domaine de l'audio et de la vidéo, l'IA peut générer de l'audio et de la vidéo selon des styles prédéfinis en analysant des données sources massives, ce qui non seulement raccourcit le cycle de création, mais dépasse également les limites de l'espace physique et du temps. Les outils couramment utilisés incluent Xunfei Hearing, MusicLM, Runway Gen-2, etc.
En plus des scénarios d'application ci-dessus, il existe également des scénarios plus subdivisés tels que le bureau collaboratif, l'apprentissage des langues, la diffusion en direct du commerce électronique, la programmation et les idoles virtuelles humaines numériques.La technologie AIGC peut être utilisée au niveau technique avec un faible coût marginal et haute efficacité pour répondre aux besoins individuels des utilisateurs.
Il convient de mentionner qu'à l'ère actuelle des informations de phishing et des fausses nouvelles qui inondent les pages, afin de distinguer le contenu AIGC du contenu réel, NetEase et People's Daily Online ont successivement lancé des outils de détection de contenu AIGC pour contrôler les risques liés au contenu. Il existe également des outils liés à la détection de contenu AIGC à l'étranger, tels que Copyleaks, spécialisé dans la détection de plagiat de texte, et DetectGPT, un assistant de contrôle de plagiat pour les articles.
**Cet article interprète plus de 100 outils AIGC des sept sections et joint des liens Web pour aider les utilisateurs à améliorer la productivité au travail. ** En fait, les outils AIGC à la maison et à l'étranger poussent comme des champignons chaque jour, donc les 100 outils AIGC inclus dans cet article ne couvrent pas entièrement l'industrie, mais nous espérons fournir une référence pour l'industrie en termes de catégories et directions .
01. Outils d'écriture AIGC : écriture en un clic
Convient pour les scènes de vie ou de bureau
La génération de texte est l'une des premières technologies commerciales d'AIGC, et c'est aussi la technologie la plus mature qu'AIGC ait développée jusqu'à présent. Aujourd'hui, les outils d'écriture de l'IA ont fait un saut qualitatif dans la capacité à comprendre le contexte, à capturer des connaissances de bon sens, à générer des textes longs et des contenus complets, précis et logiques. .
Les principaux scénarios d'atterrissage des outils d'écriture d'IA peuvent être grossièrement divisés en trois catégories :
Notion AI est un assistant d'écriture dont les fonctions principales incluent l'écriture, l'édition, la synthèse, etc. Il peut générer automatiquement des articles de blog, des calendriers de réunions, la rédaction de médias sociaux, des communiqués de presse, des e-mails de vente et de la poésie pour répondre aux besoins de différents scénarios. Les utilisateurs peuvent laisser Notion AI traiter le premier brouillon d'un article pour obtenir plus d'idées d'écriture ; ou l'utiliser comme éditeur pour vérifier les erreurs d'orthographe, de grammaire et de traduction.
L'outil adopte actuellement le modèle "essai gratuit + paiement", offrant à chaque nouvel utilisateur 20 opportunités d'essai gratuit, et une fois le nombre de fois épuisé, vous devez acheter le service. Le prix est de 10 dollars US/personne/mois , ce qui équivaut à 68,9 yuans.
Wenxinyiyan est un robot de chat développé par Baidu. Ses principales fonctions incluent le dialogue et l'interaction avec les utilisateurs, la réponse aux questions, l'aide à la création, etc., pour aider les utilisateurs à obtenir des informations, des connaissances et une inspiration créative. Les scénarios d'utilisation incluent la création littéraire, les affaires rédaction, mathématiques et sciences, calcul, interprétation chinoise, génération multimodale, etc.
En plus de la rédaction, les avantages de Wenxinyiyan incluent la possibilité de créer des images et la possibilité de générer automatiquement des vidéos basées sur la rédaction.
Tongyi Qianwen est un modèle d'Alibaba Cloud auto-développé à grande échelle.Il est actuellement équipé de 9 applications, qui sont principalement divisées en efficacité, vie et divertissement.
(1) Catégorie d'efficacité, comprenant trois applications : rédaction de plans, analyse SWOT et génération de descriptions de produits ;
(2) Catégorie Vie, comprenant trois applications : « Recettes volantes », « Composition des élèves du primaire » et « Et ensuite » ;
(3) Catégorie Divertissement, y compris "Rainbow Fart Expert", "Write Love Letters" et "Write Poems for You".
À l'heure actuelle, les principales fonctions de Tongyi Qianwen comprennent la rédaction, le dialogue et le chat, les questions et réponses sur les connaissances, le raisonnement logique, l'écriture de code, la synthèse de texte et les services de compréhension d'images et de vidéos.
Xunfei Xinghuo est un grand modèle lancé par iFLYTEK le 6 mai. Il comporte sept dimensions de génération de texte, de compréhension du langage, de questions et réponses sur les connaissances, de raisonnement logique, de mathématiques, de code et de multimodalité. Après évaluation et comparaison, il s'avère que c'est a surpassé ChatGPT en compréhension de la langue et en mathématiques.
Xunfei Xinghuo peut effectuer une génération de texte long multistyle, multilingue et multitâche, et peut également effectuer une détection de grammaire et une correction d'erreurs sur la rédaction en anglais, et sa capacité de compréhension de la langue n'est pas inférieure aux systèmes existants qui sont mesurables en Chine.
Liens web:
Le grand modèle de langage "Sequence Monkey" lancé par la société d'intelligence artificielle Mobvoi, son système de capacités prend le langage comme noyau et couvre six dimensions de "la connaissance, le dialogue, les mathématiques, la logique, le raisonnement et la planification". génération, génération d'images, différentes tâches telles que la génération de contenu 3D, la génération de la parole et la reconnaissance vocale.
Sequence Monkey a déjà une certaine capacité de compréhension du langage naturel, de connaissances, de logique et de raisonnement. Pour "Quelle capitale provinciale a la plus grande population, le Hunan ou le Hubei ?", "De quelle école le fondateur de l'entreprise derrière Tmall est-il diplômé ?", etc. Il a été en mesure de donner rapidement des résultats précis pour de telles questions qui nécessitent une réflexion plus approfondie.
openapi.mobvoi.com
Wenyong Effidit (Efficient and Intelligent Editing) est un assistant d'écriture intelligent développé par Tencent AI Lab. Il utilise la technologie de l'IA pour aider les rédacteurs à diverger d'idées, enrichir les expressions et améliorer l'efficacité de l'édition et de l'écriture de texte. Ses fonctions incluent la correction intelligente des erreurs, complétion de texte, réécriture de texte, expansion de texte, recommandation de mots, recommandation de phrases, génération et autres fonctions.
Il s'agit d'un outil de traitement de rédaction développé par l'équipe de recherche de l'Université Tsinghua. Il utilise la technologie d'IA et de traitement du langage naturel (PNL) la plus avancée pour aider les gens à traiter la lecture, l'écriture, la recherche de rédaction et les citations célèbres plus facilement et plus rapidement. .
Les utilisateurs n'ont qu'à saisir le vocabulaire du sujet pertinent, et il peut trouver des dictons célèbres, des poèmes, des dictons, des idiomes, etc.
Le dictionnaire inversé et la recherche de phrases par sens sont tous deux développés par l'équipe de recherche de l'Université Tsinghua. Ils peuvent aider à trouver des synonymes plus appropriés et plus vivants à travers les mots donnés, et également prendre en charge la traduction simultanée et mutuelle entre le chinois et l'anglais.
Xiliu est un logiciel de gestion des connaissances et de bureau collaboratif qui se concentre sur la fourniture de services aux petites organisations et aux particuliers. Il intègre plusieurs fonctions telles que la rédaction de documents, le stockage des connaissances, des tableaux multidimensionnels et des cartes mentales sur une seule plate-forme. Ses utilisateurs sont des étudiants. groupe est le groupe principal, représentant plus de 1/3 du nombre total d'utilisateurs.
FlowUS a également été adapté à ChatGPT.Les utilisateurs peuvent utiliser FlowUS AI pour réaliser des fonctions d'écriture, d'écriture continue, de traduction, de polissage et autres selon leurs propres besoins.
WPS Smart Writing est un produit d'écriture intelligent lancé par Kingsoft Office pour aider les utilisateurs à créer efficacement. Il comprend principalement quatre fonctions : la génération automatique de texte, la rédaction de brouillons auxiliaires, la supplémentation intelligente des phrases et la relecture intelligente du texte.
Ses données textuelles et les informations connexes proviennent de médias faisant autorité et de sites Web publics du gouvernement.Le sujet couvre divers scénarios d'écriture tels que des discours, des résumés, des plans, des nouvelles, etc., et il est connecté à des documents Jinshan, qui peuvent réaliser le téléchargement simultané de Après l'écriture en ligne, les utilisateurs peuvent accéder à Kingsoft Documents pour effectuer des modifications de documents plus professionnelles telles que la composition.
L'outil de vérification orthographique en anglais Grammarly a également lancé le service d'intelligence artificielle GrammarlyGo, qui peut générer des brouillons d'e-mails basés sur des invites de mots clés saisis par les utilisateurs, ou aider les articles existants à changer le ton et le style du texte, ajuster la longueur des articles, etc., et brouillon contours pour l'écriture de sujet.
Volcano Writing est un assistant d'écriture lancé par ByteDance. Il prend actuellement en charge les services d'écriture intelligente de l'IA pour l'édition de texte intégral. Qu'il s'agisse de réviser des articles, de peaufiner des CV, de rédiger des documents de candidature pour étudier à l'étranger, d'écrire des textes auto-médias, etc. Plus de 20 scénarios d'écriture, Volcano Writing peut être couvert.
L'utilisateur saisit le contenu du texte qu'il souhaite peaufiner et modifier, et après avoir cliqué sur "Optimisation en un clic", il peut identifier automatiquement le type de texte, le style et le but de l'écriture. L'utilisateur peut également ajuster l'étendue de la modification et la plate-forme peut le produire en fonction du texte original en un seul clic.Le résultat de la réécriture en anglais prend également en charge les fonctions d'intelligence artificielle telles que la correction d'erreurs intelligente et diverses réécritures, ce qui rend l'expression de la langue plus authentique et concise.
Zhishi Q&A est un système Q&A intelligent basé sur la technologie AI. Les utilisateurs peuvent saisir des questions sur la plate-forme Zhishi Q&A, et le système analysera automatiquement les questions et donnera la meilleure réponse. En même temps, il fournit également une variété de méthodes interactives, y compris la saisie de texte, la saisie vocale, etc., pour répondre aux besoins des différents utilisateurs.
En plus des outils d'écriture AIGC familiers ci-dessus, il existe encore de nombreux "produits impopulaires" en attente d'expérience utilisateur, tels que Friday AI Writing Assistant, Love Rewriting, Claude, Creator, Secret Tower Writing Cat, Subtxt, Writesonic, etc.
02. Outil d'image AIGC : la carte de Vincent est plus que Midjourney
Liberté de peindre en un clic
2022 peut être considérée comme la "première année de la peinture IA". Une variété d'outils de peinture IA ont démontré de bonnes capacités de compréhension et de génération d'images à l'aide d'invites de texte.
Avec l'aide de GPT-4, une nouvelle vague de compétition a également été déclenchée dans le domaine de "Vincent map". Midjourney, qui a été mis à jour vers la version V5, est populaire sur Internet avec un groupe de photos de couple. Adobe, le leader de l'industrie du design, n'est pas loin derrière. Il s'est empressé de lancer "Adobe Firefly" pour concourir. majorité des concepteurs. Les outils d'image d'IA d'aujourd'hui sont plus matures et plus variés en termes de commercialisation et d'art que l'an dernier.
Les scénarios techniques des outils d'image peuvent être divisés en trois types : génération d'image, modification partielle d'image et édition d'image.
La seconde est l'édition d'images. Les fonctions principales incluent la suppression intelligente du filigrane d'image, la définition de filtres de style, la modification du style d'image ou l'amélioration de la clarté de l'image, etc., représentées par des produits tels que Imagen AI et Chuangketie AI Painter.
Le troisième est la modification partielle de l'image, le produit représentatif est Adobe Firefly. Son principal avantage se concentre sur la modification de certains éléments de l'image, ou la modification et l'ajustement couche par couche, ce qui convient à la création secondaire ou à l'amélioration de la post-production.
Disco Diffusion est un programme de dessin qui s'exécute sur Google Colab. Les utilisateurs disposant d'un compte Google peuvent l'exécuter directement sur le navigateur, mais les utilisateurs doivent avoir certaines connaissances en matière de code.
Une fois que l'utilisateur a saisi une phrase de description, le programme peut automatiquement rendre et générer une image de la scène correspondante. Il est préférable de générer des images abstraites avec un style plus rêveur, et l'effet est moyen lors de la génération de représentations réalistes et de la saisie de plus de descriptions de texte.
Liens web:
Midjourney est un chatbot de peinture IA lancé par l'un des auteurs de Disco Diffusion, qui est porté sur Discord. Après le lancement de GPT-4, il est également rapidement passé à la version V5. La nouvelle version est plus raffinée en termes de fidélité d'image et de traitement des détails, et a un niveau de commercialisation plus élevé, atteignant presque le point où elle peut "déguiser le réel".
Dans la version précédente, le style des images générées était principalement cartoon ou surréaliste, et il y avait peu d'images réalistes.Après la mise à jour vers la version V5, Midjourney est rapidement devenu populaire avec un groupe de photos de couples qu'il était difficile de distinguer entre vrai et faux , et a atteint le La texture du film est plus réaliste en termes de gros plans de mains, de gros plans d'yeux et de traitement de la lumière et des ombres.
De plus, dans Midjourney V5, les utilisateurs peuvent personnaliser le format d'image. Lors de la saisie d'un texte de description, des adjectifs plus détaillés et des détails d'image tels que l'ambiance, le style, la lumière et l'ombre sont requis. Cela oblige les utilisateurs à avoir un contrôle plus actif sur les images et des images plus claires. imagination.
Stable Diffusion est un générateur d'images AI gratuit et open-source. Actuellement, la dernière version de Stable Diffusion XL a été testée pour le public.
Par rapport à la version précédente, les utilisateurs de la nouvelle version de SD-XL n'ont besoin que d'utiliser une description plus courte pour générer des images. La structure du corps humain et le traitement des détails des images sont plus réalistes et plus conformes à l'esthétique du public. les portraits sont également plus clairs et plus réalistes. .
DALL-E 2 est un outil de génération et d'édition d'images lancé par OpenAI, célèbre pour son excellent effet de génération et sa couleur artistique. L'utilisateur n'a qu'à saisir un brief, et il peut synthétiser les trois éléments de concept, d'attribut et de style, et générer une image réaliste qui répond aux besoins de l'utilisateur, et en même temps, il peut également avoir les styles de peinture de différents artistes.
Par exemple, l'utilisateur saisit trois éléments : le concept "un chiot", l'attribut "sur l'herbe" et le style "style Pop artiste Andy Warhol", et il peut produire des images qui remplissent ces trois conditions. Les fonctionnalités de l'outil incluent également l'édition d'images, le morphing de style, etc.
Imagen AI est un outil d'intelligence artificielle texte-image développé par Google. Il peut produire des portraits, des peintures à l'huile, des rendus CGI et d'autres images en fonction des invites écrites de l'utilisateur. Les images ont un sens plus fort de la réalité et une plus grande précision dans la compréhension du langage. .
Liens web:
Adobe Firefly est un outil de dessin AI lancé par Adobe et Nvidia. Actuellement, il a réalisé les fonctions de génération d'images à partir de texte, de conversion de croquis en images et de modification du contenu de l'image en un clic. Il peut également modifier les images générées automatiquement en couches et produire une image à taux de résolution ultra-haute.
Wenxin Yige est un produit de peinture AI lancé par Baidu qui s'appuie sur la pagaie volante et la technologie des grands modèles Wenxin. Les utilisateurs n'ont qu'à entrer leur propre texte créatif et choisir le style d'image souhaité pour obtenir une peinture générée par Wenxinyige. Ils peuvent également choisir le type d'image, le rapport d'image et le nombre d'images générées à la fois. À l'heure actuelle, Wenxin Yige a pris en charge plus de dix styles d'images différents tels que la peinture à l'huile, l'aquarelle, l'animation et le réalisme.
Liens web:
Luban est un produit de conception d'image développé indépendamment par Alibaba Intelligent Design Lab. Basé sur la technologie de génération d'images AI, Luban peut réaliser la conception d'un grand nombre d'images de bannières, d'images d'affiches et d'images de lieux en peu de temps. Les utilisateurs n'ont qu'à saisir le style et la taille qu'ils souhaitent obtenir, et Luban peut remplacer manuellement les projets de conception chronophages et laborieux tels que l'analyse des matériaux, la découpe et la correspondance des couleurs, et générer plusieurs ensembles de solutions de conception qui répondent aux besoins en temps réel.
Lors de la promotion "Double 11" en 2017, Luban a généré 8 000 affiches par seconde, au cours desquelles un total de 400 millions d'affiches de produits ont été produites, ce qui a permis aux gens de mieux comprendre les capacités de dessin de l'IA.
Chuangketie, une plate-forme de conception entrepreneuriale, a lancé un produit de peinture d'intelligence artificielle, AI Painter, et a lancé deux scénarios fonctionnels couramment utilisés, "Wen Sheng Tu" et "Tu Sheng Man".
Dans le scénario "Wen Sheng Tu", les utilisateurs n'ont qu'à saisir le texte requis simple, sélectionner le style de peinture qu'ils souhaitent et l'image cible peut être générée en un clic. Les styles existants incluent le style ancien, la peinture à l'huile, la peinture en couleur, les bandes dessinées , CG, etc...
Dans le scénario "Picture Man", les utilisateurs n'ont qu'à télécharger l'image cible et saisir des instructions textuelles simples pour obtenir une image peinte à la main personnalisée. Ses fonctions incluent également la détection des contours, la coloration des brouillons de ligne et la détection de la pose. Fonction.
03. Outils audio AIGC : son variable, clonage, réduction de bruit
En plus des scénarios d'application tels que le texte et les images, l'audio est également un scénario d'application avec lequel nous avons un large éventail de contacts dans notre vie quotidienne. Le changement de voix humaine, la synthèse vocale et le clonage dans de courtes vidéos sont les technologies de recherche populaires d'AIGC dans le domaine audio, y compris l'animation, les films et le doublage de personnages dans les jeux, qui peuvent désormais être réalisés par l'IA. Des entreprises technologiques telles que Microsoft et Google ont également lancé leurs propres services Text-to-Speech (text-to-speech).
Les outils audio IA peuvent être divisés en deux types selon différents attributs fonctionnels : l'un est les outils de traitement du son représentés par So-Vits-Svc, Adobe Podcast AI Voice, Magic Sound Workshop, etc., qui utilisent la technologie IA pour réparer le son et améliorer l'audio. qualité Ou convertir le timbre, etc. ; le second est les outils de production musicale représentés par MusicLM, Netease Tianyin, Aiva, etc., qui peuvent réaliser la fonction "texte en musique" dans des domaines plus subdivisés.
"AI Stefanie Sun" est devenu populaire sur Internet du jour au lendemain. Des chansons telles que "Hair Like Snow" et "Rainy Day" "reprises" par elle ont dépassé le million de vues sur Bilibili, et ces chansons ont été transmises par les propriétaires d'UP. le projet open source So-Vits-Svc.
En plus de simuler les voix de chanteurs connus, il peut également simuler un grand nombre de voix réelles à partir d'enregistrements téléphoniques, de vidéos vidéo et d'autres matériaux.Auparavant, certains propriétaires d'UP utilisaient ce modèle pour communiquer avec le défunt. Cependant, en raison de l'abus croissant du projet, l'auteur a supprimé le projet.
Adobe Podcast AI Voice est un amplificateur audio alimenté par l'IA d'Adobe qui utilise l'IA pour améliorer la qualité des enregistrements audio de blog.
Une fois que l'utilisateur s'est connecté au compte Adobe, téléchargez le fichier audio qui nécessite un traitement de réduction du bruit, AI traitera automatiquement le fichier audio, et une fois l'effet de lecture audio satisfaisant obtenu, l'utilisateur peut le télécharger directement sur l'ordinateur pour une utilisation gratuite. .
MusicLM est un véritable modèle d'IA générative publié par Google. Grâce à ce modèle, de la musique haute fidélité peut être directement générée à partir de texte. En plus du texte, qu'il s'agisse de fredonner, de chanter, de percussions, de performances d'instruments, etc., MusicLM peut créer de la musique à partir de ces mélodies existantes et s'assurer que la musique n'est pas déformée.
En outre, il peut également générer des morceaux joués par des instruments spécifiques, et même le niveau de performance des interprètes peut être défini. Il peut également créer de la musique en fonction des caractéristiques de l'époque et du lieu où elle est jouée. Musique populaire jouée par un orgue au bord de la mer".
MusicLM est formé dans une base de données musicale pouvant contenir jusqu'à 280 000 heures, quel que soit le style ou l'émotion de la chanson.
Liens web:
Xunfei Hearing est un produit vocal intelligent d'iFLYTEK, s'appuyant sur le traitement du langage naturel d'iFLYTEK, la reconnaissance d'empreintes vocales et la reconnaissance vocale et d'autres technologies vocales, iFLYTEK Hearing peut répondre aux besoins vocaux des utilisateurs dans divers scénarios, les scénarios applicables couvrent différentes occasions telles que les procès-verbaux de réunion, conférences, entrevues avec les médias et écrit personnel.
Ses fonctions avantageuses incluent également l'ajout de sous-titres bilingues aux vidéos, l'interprétation simultanée multilingue et la génération de sous-titres pour les vidéoconférences, etc., pour aider les utilisateurs à surmonter les barrières linguistiques et faciliter la communication et la collaboration.
Netease Tianyin est un système de création de musique d'arrangeur AI produit par Netease, qui peut créer de la musique AI en ligne. Son plus grand avantage est que le seuil de création musicale est bas et que les utilisateurs peuvent compléter un arrangement musical original conformément aux directives en peu de temps.
L'atelier de Tianyin comprend un certain nombre de styles musicaux spécifiques, notamment la pop, le folk, l'électronique, le style national, etc. chanson en ajoutant, soustrayant, copiant, ajustant des paragraphes, etc. Une fois toutes les modifications terminées, elles seront automatiquement rendues et vous pourrez obtenir un arrangement original créé par vous-même après une courte attente.
Moyin Workshop est un produit de la série vocale AI lancé par la société AI Sortir pour demander. Les utilisateurs peuvent utiliser efficacement et facilement la technologie vocale AI pour simuler la voix d'une personne réelle avec des caractéristiques personnelles, créer du contenu audio AI et convertir du texte en une personne réelle avec un clic.
L'utilisateur importe rapidement l'article à synthétiser dans le son de l'interface et effectue une édition en ligne via une page d'opération similaire au document, de sorte que le document puisse être converti en audio de manière pratique. Les fonctions de la page d'édition comprennent : le marquage d'accentuation, les caractères multi-phonétiques, le marquage sujet aux fautes de frappe, l'ajout d'un son de fond, le doublage mixte multi-personnes, la vitesse variable, le rythme et de nombreuses autres fonctions.
Pour les utilisateurs qui aiment la technologie, la finance et d'autres domaines, Moyin Workshop a également ajouté des modèles vocaux d'IA des PDG de nombreuses sociétés liées en arrière-plan, afin que les utilisateurs qui les connaissent puissent utiliser leur voix pour produire du contenu audio.
FakeYou est un outil d'édition audio de synthèse vocale qui utilise la technologie de falsification profonde pour générer une synthèse vocale dans différentes langues et voix. Les utilisateurs peuvent utiliser les voix de leurs personnages préférés pour créer de l'audio, et il fournit également du texte AI -fonctions vocales.
Lorsque l'utilisateur entre un morceau de texte à générer et choisit qui veut lire le texte, puis clique sur le bouton "parler", une voix "parlée" par la personne cible est automatiquement générée.
LyricStudio est un créateur de paroles en ligne qui aide les utilisateurs à générer des paroles originales qui imitent leur propre style et trouvent une rime pour un mot spécifique. Les utilisateurs peuvent télécharger une description textuelle ou un clip musical, et il le convertit en paroles qui correspondent au contenu.
Selon les données de son site officiel, l'outil a collaboré pour créer plus d'un million de chansons, et 15 % des utilisateurs de la plateforme sont des producteurs de musique professionnels. LyricStudio a aidé le rappeur Curtiss King à publier les paroles de l'album iTunes n°1.
Liens web:
LALAL.AI est un outil de séparation de musique en ligne qui peut segmenter et extraire les voix et les instruments de la musique.
Sa technologie de séparation de musique en ligne est entièrement basée sur l'apprentissage automatique et l'intelligence artificielle. Avant la version précédente, elle ne pouvait séparer que les voix humaines. Désormais, elle peut extraire avec précision les voix humaines, les guitares électriques, les guitares acoustiques, les pianos et la batterie à partir de fichiers audio et vidéo. ., basse et bien d'autres instruments.
Aiva est un outil de musique IA du même nom, auto-développé par la société de musique IA "Aiva". Les utilisateurs peuvent aider les musiciens à produire et à écrire de la musique originale grâce à la technologie IA. La plate-forme couvre une variété de styles différents, tels que le classique , rock, musique électronique, pop, style national, blues, hip hop, etc. Sur la page de composition automatique, les utilisateurs peuvent choisir parmi 11 genres, notamment la tonalité de signature de clé, le rythme de signature de temps, le rythme de stimulation, l'instrumentation, la durée, etc.
Aiva a également étudié les œuvres représentatives et les styles musicaux de Mozart, Bach, Beethoven et d'autres musiciens grâce à un apprentissage en profondeur, et a établi un modèle d'apprentissage basé sur ces caractéristiques musicales pour aider les musiciens à créer de la musique. Dans le même temps, Aiva est également le premier compositeur d'IA certifié de l'histoire et a publié 5 albums.
Liens web:
Supertone est un studio de son créatif basé sur l'IA en Corée du Sud qui fournit une synthèse vocale et une technologie d'amélioration de la parole en temps réel pour aider les utilisateurs à créer facilement divers types de contenu sonore, y compris la simple lecture de texte sur des œuvres d'art, des chansons, etc., permettant aux utilisateurs de changer leurs voix et d'autres moyens Pour apaiser les préoccupations concernant les problèmes d'informations personnelles.
Supertone propose également une technologie appelée "VoicePrint", qui convertit la voix d'un utilisateur en une empreinte numérique qui la distingue des voix des autres utilisateurs.
Liens web:
04. Outil vidéo AIGC : le montage automatique et la génération de fonctions de storyboard sont là
Les graphiques de Vincent sont maintenant devenus la technologie AIGC courante, mais la génération de texte en vidéo en est encore à ses balbutiements.
Runway, la start-up d'intelligence artificielle basée à New York, a développé un modèle vidéo génératif Gen-2, qui peut générer une vidéo hautement composite à partir d'une simple description. D'autres entreprises se sont également jointes à nous, telles que Text2Video-Zero, Video-P2P, TemporalNet lancée par la plateforme d'édition d'images PiscArt, et Text-to-video développée par Ali.La vidéo générée par texte pourrait également entrer dans une concurrence féroce dans un avenir proche .étape.
Les deepfakes sont désormais synonymes de vidéos synthétisées par l'IA. Microsoft a lancé FaceShifter, qui peut transformer une image originale floue en une image falsifiée claire et crédible ; Disney et l'ETH Zurich ont développé et lancé conjointement un outil de production vidéo Deepfakes de niveau mégapixel, et dans la série "Star Wars" Dans le film, Deepfakes étaient utilisé pour ramener les acteurs décédés sur grand écran.
Cependant, les risques de sécurité causés par cela se sont également succédés.Pour certaines vidéos haute définition et à lumière extrêmement naturelle, même l'algorithme Deppfakes le plus sophistiqué ne peut pas les identifier avec précision.
En conséquence, dès les élections américaines de 2020, Facebook a annoncé une interdiction totale de l'utilisation de Deepfakes sur la plateforme, et YouTube et TikTok n'ont pas fait exception, interdisant explicitement l'utilisation illégale de la technologie Deepfakes dans les vidéos. Le "Code civil" qui sera mis en œuvre dans mon pays en 2021 souligne également que les principales plateformes vidéo doivent restreindre strictement le contenu des vidéos d'IA qui changent de visage, et qu'elles ne doivent pas être utilisées à volonté sans autorisation.
Gen-2 est un modèle Transformer de bout en bout lancé par la start-up Runway. Les utilisateurs peuvent utiliser des images et du texte comme conditions pour générer une vidéo originale de style lent à partir de zéro.
La résolution vidéo qu'il génère est aussi élevée que 1280 × 720 et la durée est d'environ 30 à 60 secondes.Actuellement, les fonctions suivantes peuvent être réalisées : générer une vidéo, générer des images, agrandir les images sans limite en fonction des invites de texte, mélanger les styles d'image , entraîner des modèles d'IA, supprimer un élément de la vidéo, soustraire l'arrière-plan, etc.
Récemment, Runway a lancé sa première application mobile, en utilisant le modèle Gen-1, les utilisateurs peuvent télécharger du texte, des images ou des vidéos sur le téléphone mobile, et laisser le modèle transformer le style de la vidéo en fonction du contenu.
Liens web:
En septembre 2022, Meta a lancé son propre logiciel de conversion de texte en vidéo "Make-A-Video". Une fois que l'utilisateur a entré quelques descriptions de mots simples, le logiciel créera une vidéo silencieuse.
Dans la vidéo de démonstration officielle, l'utilisateur peut obtenir une vidéo de quelques secondes en saisissant des descriptions textuelles telles que "un jeune couple marchant sous une pluie battante" et "un ours en peluche qui a peint un portrait". De plus, Make-A-Video peut également animer des images statiques, basées sur la technologie "Diagramme de Vincent".
Selon le responsable, le modèle est formé à l'aide de données de synthèse d'images et de vidéos non étiquetées. Après avoir appris, le modèle peut "prédire" ce qui se passera à côté de l'image, où elle se déplacera et se déplacera vers l'endroit où l'image sera dans un très peu de temps L'endroit où il apparaît pour former une courte vidéo.
Liens web:
SenseTime a lancé une plate-forme de publicité et de marketing à guichet unique pour SenseTime, qui comprend le moteur de création de courtes vidéos "SenseTime", qui peut générer de courtes vidéos créatives en un seul clic, y compris la génération de script, le remplacement d'arrière-plan, le remplacement d'écran horizontal et vertical et le sous-titre Une variété de services pour la production de publicité vidéo peut aider les annonceurs à économiser sur le coût de la production de contenu publicitaire.
Le service "Video Element Analysis" inclus dans SenseTime peut analyser et extraire des informations telles que la longueur, la scène, la scène, le personnage, les accessoires et les lignes de chaque plan dans une courte vidéo grâce à la technologie de structuration vidéo AI, et créer automatiquement un script de plan grandement réduit le temps d'écriture du script et assiste efficacement les créateurs dans la création secondaire.
En outre, la plate-forme fournit également un grand nombre de scripts vidéo populaires pour fournir aux créateurs une inspiration créative.
Liens web:
Decoherence est un outil pour créer des vidéos d'IA où les utilisateurs peuvent choisir parmi une variété de styles d'IA.
Liens web:
"Tencent Zhiying" s'adresse principalement aux créateurs de courtes vidéos, et ses fonctions présentées sont de véritables documents protégés par le droit d'auteur et des émissions humaines numériques. Les utilisateurs peuvent générer une vidéo humaine numérique en téléchargeant des photos et du texte. Les utilisateurs peuvent également l'utiliser avec la fonction intelligente de doublage AI pour choisir différents timbres pour les humains numériques.
Liens web:
05. Outils bureautiques AIGC : AI+OA réalise un clic "à partir de zéro"
Le 17 mars, Microsoft a officiellement lancé Microsoft 365 Copilot, qui intègre les capacités de GPT-4 et ChatGPT dans les outils Office, et a lancé la fonction Business Chat intégrant les données Office 365, qui améliore le niveau de bureau numérique et évite aux employés des tâches inefficaces, Liberated du travail répétitif.
Kingsoft Office, en tant qu'entreprise leader dans le domaine des bureaux collaboratifs nationaux, a également lancé une plate-forme de bureau générative "WPS AI" avec de grandes capacités de modèle linguistique en seulement un mois, devenant ainsi la première application de type ChatGPT dans le domaine des bureaux collaboratifs nationaux. De plus, des entreprises telles que Baidu, ByteDance et DingTalk ont successivement lancé leurs propres outils bureautiques collaboratifs d'IA.
Le système d'application OA (Office Automation) s'est progressivement développé et a mûri. En tant que pont reliant les employés et les entreprises, il pourrait devenir à l'avenir l'entrée du grand modèle de langage dans l'écologie du B-end.
En plus du domaine du bureau collaboratif, les outils d'IA peuvent également être appliqués dans des scénarios plus verticaux et combinés à des besoins plus pratiques. Par exemple, "IA + apprentissage des langues" a DuolinguoMax, et "IA + livraison e-commerce" a créé un version intelligente du e-commerce, site e-commerce Shopify, outil de marketing e-commerce eCommerce s, etc. avec une description de phrase.
Microsoft 365 Coplilot a suivi GPT-4 au petit matin du 17 mars, et tous les logiciels bureautiques, y compris Word, Excel, Powerpoint, Outlook, Teams, etc. ont été lancés avec des fonctions d'IA génératives.
Dans Word, Copilot n'a besoin que d'une simple invite pour créer un premier brouillon, et peut également ajuster le ton de l'article en fonction des besoins de l'utilisateur, comme professionnel et sérieux, enthousiaste et décontracté, etc., et peut supprimer automatiquement le même endroit dans l'article , pour plus de simplification.
Copillot dans Excel peut aider les utilisateurs à analyser les données, à analyser directement les tendances des données et à visualiser les résultats de l'analyse des données.
Ce qui est encore plus étonnant, c'est que Powerpoint peut déjà générer directement un PPT, et Copilot peut convertir directement un document existant en PPT avec des sources marquées. Si les utilisateurs estiment que le PPT est trop long, ils peuvent utiliser directement la description textuelle pour compresser, ajuster la mise en page ou formater le texte en un seul clic.
Copilot dans Outlook peut aider les utilisateurs à classer les e-mails selon certains critères, résumer et affiner le sujet des e-mails longs et retranscrire plusieurs mots-clés ou brouillons dans des e-mails officiels.
Google Workspace est un espace de travail Google qui comprend des outils bureautiques tels que Docs, Slides, Sheet et Gmail. Google a annoncé en mars qu'il intégrerait l'IA dans ces composants d'outils. Après avoir accédé au modèle d'IA générative, les utilisateurs pourront créer un e-mail complet, un plan d'affaires ou une feuille de frais de marketing publicitaire à l'aide de ces outils en saisissant une courte description textuelle.
Dans Docs, l'IA générative peut aider les utilisateurs à rédiger le premier brouillon de texte, peaufiner et réviser le texte, relire et corriger les erreurs ; Gmail peut répondre et résumer les e-mails, marquer les questions importantes, etc. ; Slides peut générer automatiquement des images, de l'audio et de la vidéo en fonction de le thème et les insérer dans le modèle ; Sheet peut effectuer automatiquement le traitement des données, le tri des tableaux, la classification du contexte et même l'analyse des données brutes.
À l'heure actuelle, Google adopte un plan de paiement flexible, qui est divisé en version de base pour débutants, en version standard et en version professionnelle Plus, permettant aux utilisateurs de s'abonner en fonction de leurs besoins réels.
Baidu Ruliu a lancé la « Ruliu Intelligent Work Platform 2.0 » pour le marché des services d'entreprise à la fin de l'année dernière, comprenant trois matrices de produits intelligents : gestion intelligente des connaissances, conférence intelligente et établi intelligent.
Dans la gestion intelligente des connaissances, il existe trois applications de gestion des connaissances de "base de connaissances intelligente", "double moteur de recherche et de recommandation" et "chaîne d'étoiles de la connaissance", qui rassemblent des documents dispersés, des e-mails, des notes et d'autres fichiers en un seul endroit, les employés peuvent trouver les documents et connaissances requis de la manière la plus pratique.
Différentes cartes de travail sont collectées dans l'établi intelligent pour rendre le système de tâches plus flexible et plus clair, et différentes cartes de travail sont associées en fonction des employés occupant différents postes. Par exemple, le workbench RH intègre des cartes de travail pour les assistants d'entretien et des modules de gestion du recrutement ; le workbench du manager comprend des cartes de travail en trois dimensions pour le suivi de l'efficacité, l'analyse collaborative et la gestion des processus, fournissant aux managers des données sur les tâches de l'équipe.
Liens web:
Une semaine après la sortie du modèle à grande échelle de Tongyi Qianwen, DingTalk a annoncé son accès officiel. Après avoir accédé au grand modèle Qianwen, les utilisateurs n'ont qu'à utiliser une barre oblique "/" pour effectuer un travail de bureau intelligent. Les principaux scénarios d'utilisation incluent le chat de groupe, les documents, la visioconférence et le développement d'applet.
Dans la discussion de groupe, les nouveaux entrants n'ont qu'à saisir "/" dans la boîte de dialogue pour obtenir les points contextuels de la discussion de groupe, et la barre oblique peut également générer des tâches, planifier des rendez-vous et créer des émoticônes pour des réunions importantes.
Dans une discussion en tête-à-tête, les utilisateurs peuvent directement utiliser des barres obliques pour créer un chatbot afin de lui permettre d'acquérir automatiquement des connaissances et de répondre aux questions.
Dans les documents, slash peut générer automatiquement du copywriting et des affiches dans différents styles ; dans les vidéoconférences, slash peut résumer les points de rencontre, les choses à faire, etc. en un seul clic.
De plus, la fonction la plus inattendue de slash est de générer de petits programmes en langage naturel et de les utiliser dans le groupe sous la forme de "Dingding cool application".
Le jour même où DingTalk a annoncé l'accès au grand modèle et le lancement de l'assistant de bureau intelligent "/", Kingsoft Office, l'un des principaux éditeurs nationaux de logiciels de bureau, a également annoncé officiellement le lancement de "WPS AI". Le grand modèle sous-jacent est fourni par MiniMax, qui comprend actuellement de multiples fonctions telles que la génération de contenu, le dialogue multi-tours et l'optimisation du contenu. À l'avenir, il pourrait évoluer vers la version domestique de "Microsoft 365 Coplilot" et être entièrement intégré dans la suite WPS.
Liens web:
Le 11 avril, Feishu, la plateforme bureautique de ByteDance, a également lancé l'assistant intelligent d'IA "My AI". Ses fonctions incluent la synthèse automatique des comptes rendus de réunion, la création de rapports, la poursuite de la rédaction et l'optimisation du contenu textuel, etc. Dans Feishu, My AI peut également aider les utilisateurs à créer des horaires et à rechercher la base de connaissances interne de l'entreprise par le dialogue. Cependant, My AI est toujours en cours, et la version bêta publique et l'heure de lancement n'ont pas encore été annoncées.
Le 1er mars, après que ChatGPT a annoncé l'ouverture de l'API, la plate-forme de services de commerce électronique transfrontalier Shopify a pris les devants dans l'intégration. Après avoir intégré ChatGPT, Shopify peut utiliser un service client intelligent pour communiquer avec les utilisateurs, aider les consommateurs à faire des recommandations personnalisées et gagner du temps d'achat ; ChatGPT effectue également l'analyse des données d'examen, l'optimisation des titres et des mots clés, la rédaction marketing et la programmation de développement de sites Web intelligents pour les produits de la plate-forme et de nombreuses autres fonctions pour aider à améliorer l'efficacité opérationnelle des sites Web de commerce électronique et à optimiser l'expérience d'achat des consommateurs.
Liens web:
Liens web:
Après que Microsoft a lancé la nouvelle version du moteur de recherche Bing, du navigateur Edge et du bucket de la famille Office, sa plate-forme d'hébergement de code GitHub a également publié Copilot X, qui a introduit ChatGPT dans l'environnement de développement intégré, même les utilisateurs sans base de code peuvent compter sur "bouge ta bouche " Écrivez le code.
Dans GitHub Copilot Chat, les utilisateurs peuvent lui envoyer des instructions pour écrire du code dans une fenêtre de chat. Pour les codes qui s'exécutent anormalement, il peut directement trouver le bogue (erreur) et le modifier ; dans GitHub Copilot Voice, il peut même être implémenté. voix pour coder en une seule étape, le développeur parle directement et donne des instructions en langage naturel, et il peut générer des codes pertinents.
En plus des fonctions ci-dessus, si l'utilisateur ne comprend pas une certaine ligne de code, laissez simplement Copilot expliquer la fonction du code dans le chat.
Liens web:
Liens web:
06. Outils de vie AIGC : cuisiner, prendre des notes, faire des guides de voyage
Laissez l'IA devenir l'intendant de la vie
En plus des outils d'IA hautement applicables tels que la génération de texte et le montage audio et vidéo, divers nouveaux produits AIGC ont fait leur apparition dans la vie quotidienne.
Par exemple, ChefGPT aide à générer des recettes pour les utilisateurs qui ont mal à la tête tous les jours, Dover Autopilot, un outil de recrutement d'IA qui fournit des CV de talents de haute qualité pour les chasseurs de têtes, BibiGPT, qui peut prendre des notes tout en regardant des vidéos, et Bedtime Story AI, qui peut générer des histoires courtes avant d'aller se coucher.WatchNow, qui recommande des listes de films selon vos préférences personnelles, etc., la vie entièrement intelligente n'est plus une intrigue uniquement dans les films de science-fiction, et l'IA est pleinement entrée dans notre vie quotidienne.
La vidéo est trop longue pour résumer les points clés ? Trop pressé pour prendre des notes en regardant une vidéo ? BibiGPT, un logiciel de résumé audio et vidéo développé sur la base de ChatGPT, résout bien ces problèmes. Pour les vidéos sur Bilibili et Youtube, BibiGPT peut résumer le contenu clé en un clic. Les utilisateurs n'ont qu'à coller le lien vidéo qu'ils ont visité sur la boîte de recherche et cliquez sur ""Résumé en un clic", vous pouvez obtenir une note de résumé vidéo.
Liens web:
Dover Autopilot est un outil de recrutement automatisé. Les recruteurs n'ont qu'à entrer un simple lien de description de poste, et il peut trouver des demandeurs d'emploi qui correspondent aux exigences du poste en quelques minutes grâce à des sources de données telles que LinkedIn et d'autres sites Web de recherche d'emploi. Il peut également générer automatiquement des e-mails personnalisés. pour les candidats.
Lien Web : dover.com/start
Il s'agit d'un outil de recommandation de recettes IA.Lorsque l'utilisateur saisit les ingrédients et les outils existants à portée de main, ainsi que le temps de cuisson réservé, il peut recommander une recette qui répond aux besoins.
Il y a deux modes dans la page, l'un est le mode gourmet et l'autre est le mode tout sélectionner. Le mode Gourmet a des exigences plus élevées en matière d'autonomie de l'utilisateur, obligeant les utilisateurs à sélectionner des ingrédients et des ustensiles de cuisine, puis à les saisir dans la page Web, tandis que le mode Tout sélectionner est plus convivial pour les "novices de la cuisine", et vous pouvez obtenir une copie qui répond aux exigences sans en utilisant votre cerveau Des recettes pour de vrais besoins.
Journeai est un conseiller en voyages par chat basé sur l'IA, qui vise à créer des itinéraires de voyage personnalisés pour les utilisateurs. Il peut générer des itinéraires en fonction des préférences de l'utilisateur, y compris les arrangements d'activités et les partenaires de voyage à explorer.
Liens web:
Outil de détection de contenu AIGC : AIGC contrefait
Ouvrir la voie à l'identification de contenu
Avec le développement de la technologie AIGC entrant dans la voie rapide, cela a également causé beaucoup de fausses informations, de plagiat de texte, de fraude académique, de litiges en matière de droit d'auteur et d'autres effets indésirables et événements négatifs connexes. Les conflits de sécurité inconnus sont inévitables, ce qui nécessite le développement de technologies pertinentes pour la détection et le filtrage.
Bien qu'il n'y ait pas beaucoup d'outils de détection de contenu AIGC actuellement sur le marché, ils peuvent déjà distinguer avec précision le contenu AIGC tel que le texte, les images et les sons générés. Système de détection de plagiat CrossCheck, etc.
1、Copyleaks:
Copyleaks est actuellement l'un des outils de détection de contenu d'IA les plus populaires au monde.L'avantage le plus important est qu'en plus de détecter le contenu en anglais, il peut également détecter le contenu écrit en espagnol, en français et dans d'autres langues. Pour les textes qui sont tous générés par l'IA, Copyleaks peut atteindre une précision de reconnaissance de 99,99 %, mais pour le contenu textuel à moitié vrai ou faux, il le marquera comme du texte généré artificiellement.
Liens web:
People.cn Information Technology Company, une filiale du Quotidien du Peuple, qui se concentre sur le contrôle des risques liés au contenu, a développé le premier outil de détection de contenu généré par l'IA en Chine, AIGC-X. Cet outil peut être utilisé pour distinguer le texte généré par la machine du artificiellement Il peut détecter et filtrer les fausses nouvelles, le plagiat de contenu, le spam, etc., et surtout fournir un support technique dans les zones grises telles que les fausses informations, la fraude scolaire et le phishing.
Cependant, AIGC-X ne prend actuellement en charge que la détection du contenu chinois, et la capacité de détection des images, du contenu audio et vidéo doit être améliorée.
Liens web:
L'outil de détection de zéro échantillon DetectGPT a été développé par une équipe de recherche de l'université de Stanford aux États-Unis, il est principalement utilisé pour lutter contre le phénomène de génération de papier courant dans les universités. Un document de recherche intitulé "DetectGPT : détection de texte générée par une machine à zéro à l'aide de la courbure de probabilité" a été publié sur le site Web de préimpression arXiv.
Cet outil de détection propose un nouvel indicateur pour juger du texte généré par le grand modèle de langue. Il suffit de scanner le contenu téléchargé sur la page Web pour déterminer si le contenu du texte est généré à l'aide du grand modèle de langue.
NetEase NetShield, basé sur les années d'expérience de NetEase dans l'industrie, fournit des modèles de correspondance personnalisés et des solutions de détection personnalisées pour les caractéristiques du spam textuel. Le contenu détourné pour des tiers sera également automatiquement filtré.
Liens web:
Sumei utilise un moteur de reconnaissance de contenu intelligent complet pour identifier efficacement les contenus sensibles, interdits, pornographiques, violents, abusifs, publicitaires et autres contenus textuels à risque dans divers scénarios, aidant ainsi les utilisateurs à identifier davantage les informations à risque. À l'heure actuelle, Sumei a été en mesure de détecter automatiquement 175 langues étrangères et prend en charge l'identification des étiquettes de risque dans 18 langues courantes telles que l'anglais, l'arabe, le thaï et l'indonésien.
Devenez copilote pour les créateurs
Outre l'écriture, la génération d'images, le montage audio et vidéo, les assistants de bureau, la détection de contenu, etc., d'autres sous-divisions attendent d'être explorées.
Aujourd'hui, l'IA se lance à grands pas dans le domaine de la production de contenus numériques. En plus d'être comparable aux professionnels de l'écriture, du question-réponse, de la peinture et des villes centenaires, elle a également démontré la puissante capacité de compréhension des grands modèles de langage. Mais il ne peut servir que de « copilote (copilote/assistant) » pour aider les humains à prendre des décisions, aider les créateurs dans la production continue et les idées itératives, et ne remplacera pas ces travaux vraiment précieux.