Título original: "¡El rey de los rollos lo está usando! 100 herramientas AIGC de nivel de tesoro para compartir, ¡muy recomendables para coleccionar! ! "
Hablando de herramientas AIGC, ¿todavía solo conoces ChatGPT?
De hecho, cada vez más aplicaciones AIGC no se basan en GPT de OpenAI. En el campo del entretenimiento, la versión musical de los cantantes "AI Stefanie Sun" y "AI Jay Chou" se hizo popular, y los propios cantantes quedaron asombrados; en el campo del comercio electrónico, los humanos virtuales AI leen guiones generados por AI 7x24 horas , y vendió millones de bienes para empresas En aulas especiales, los profesores virtuales emiten cursos de lenguaje de señas basados en contenido de voz para ayudar a las personas sordas a aprender conocimientos... Estos escenarios se han convertido en el campo de aterrizaje de modelos de desarrollo propio a gran escala o de código abierto modelos
Según las estadísticas de Zhishi, a mediados de mayo existen al menos 100 herramientas AIGC representativas en el mundo. Desde el trabajo de oficina diario hasta las redes sociales, desde la producción de juegos hasta el diseño gráfico, desde las regulaciones financieras hasta las ventas de productos, el posicionamiento de funciones de las herramientas AIGC se ha actualizado desde la anterior "observación + predicción" a la actual "generación + toma de decisiones", promoviendo aparece la implementación del "punto impar" de AIGC.
▲ El mapa de la nube de palabras se muestra alrededor de ChatGPT, otras herramientas AIGC con una alta tasa de uso y tasa de mención
En el campo de la escritura de texto, las herramientas AIGC lideradas por chatbots conversacionales como ChatGPT y Wenxinyiyan ahorran tiempo y dinero a las personas en la recuperación de información, y pueden completar una serie de tareas ineficientes y repetitivas en forma de diálogo.Otras herramientas de escritura también incluyen Notion AI , Tencent Wenyong, escritura inteligente WPS, etc.
En el campo de la generación de imágenes, AIGC también ha subvertido y remodelado el método de dibujo anterior. "Yiwen Shengtu" proporciona a los creadores diferentes estilos y fuentes infinitas de inspiración, y ha desencadenado una revolución en la productividad en el campo del diseño. Herramientas como Midjourney y DALL-E continúan expandiendo los límites de la imaginación de las personas.
En el campo del audio y el video, la IA puede generar audio y video de acuerdo con estilos preestablecidos mediante el análisis de datos de origen masivos, lo que no solo acorta el ciclo de creación, sino que también supera las limitaciones del espacio físico y el tiempo. Las herramientas de uso común incluyen Xunfei Hearing, MusicLM, Runway Gen-2, etc.
Además de los escenarios de aplicación anteriores, también hay más escenarios subdivididos, como oficina colaborativa, aprendizaje de idiomas, transmisión en vivo de comercio electrónico, programación e ídolos virtuales humanos digitales.La tecnología AIGC se puede utilizar desde el nivel técnico con un bajo costo marginal y alta eficiencia Manera de satisfacer las necesidades individuales de los usuarios.
Lo que más vale la pena mencionar es que en la era actual de información de phishing y noticias falsas que inundan las páginas, para distinguir el contenido AIGC del contenido real, NetEase y People's Daily Online han lanzado sucesivamente herramientas de detección de contenido AIGC para controlar los riesgos del contenido. También existen herramientas relacionadas con la detección de contenido AIGC en el extranjero, como Copyleaks, que se especializa en la detección de plagio de texto, y DetectGPT, un asistente de verificación de plagio para artículos.
**Este artículo interpreta más de 100 herramientas AIGC de las siete secciones y adjunta enlaces web para ayudar a los usuarios a mejorar la productividad laboral. **En realidad, las herramientas AIGC en el país y en el extranjero surgen como hongos todos los días, por lo que las 100 herramientas AIGC incluidas en este artículo no cubren completamente la industria, pero esperamos brindar alguna referencia para la industria en términos de categorías y direcciones. .
01. Herramientas de escritura AIGC: escritura con un solo clic
Adecuado para escenas de la vida o de la oficina.
La generación de texto es una de las primeras tecnologías comerciales de AIGC y también es la tecnología más madura que AIGC ha desarrollado hasta el momento. Hoy, las herramientas de escritura de IA han dado un salto cualitativo en la capacidad de comprender el contexto, capturar el conocimiento del sentido común, generar textos largos y contenido completo, preciso y lógico. .
Los principales escenarios de aterrizaje de las herramientas de escritura de IA se pueden dividir aproximadamente en las siguientes tres categorías:
La primera es la generación de texto orientada a la aplicación, como la búsqueda de oraciones según el significado, el diccionario inverso, etc., que tienen escenarios de uso de funciones relativamente claros, y la dirección de uso también es relativamente clara. El segundo es la generación de texto creativo, como Notion AI, escritura inteligente WPS, etc., que se puede utilizar para la continuación del texto y la generación de contenido, etc. La mayoría de ellos son escritura no estructurada y los usuarios tienen mayor espacio y libertad para la creación de texto. El tercero es la generación de texto conversacional, como Wenxinyiyan, Tongyiqianwen, Xunfei Xinghuo, etc., que son altamente interactivos y tienen mayores requisitos para las capacidades de comprensión del lenguaje natural de los modelos grandes.
Notion AI: use ChatGPT para ayudar a enviar mensajes de texto con "belleza"
Notion AI es un asistente de escritura cuyas funciones principales incluyen escribir, editar, resumir, etc. Puede generar automáticamente publicaciones de blog, calendarios de reuniones, redacción de textos publicitarios para redes sociales, comunicados de prensa, correos electrónicos de ventas y poesía para satisfacer las necesidades de diferentes escenarios. Los usuarios pueden dejar que Notion AI procese el primer borrador de un artículo para obtener más ideas para escribir, o utilizarlo como editor para revisar la ortografía, la gramática y los errores de traducción.
Actualmente, la herramienta adopta el modelo de "prueba gratuita + pago", que brinda a cada nuevo usuario 20 oportunidades de prueba gratuitas y, una vez que se agota la cantidad de veces, debe comprar el servicio. El precio es de 10 dólares estadounidenses por persona y mes. , que equivale a 68,9 yuanes.
Enlaces web:
Baidu Wenxin Yiyan: el "bromista de IA" que mejor sabe chino
Wenxinyiyan es un robot de chat desarrollado por Baidu. Sus funciones principales incluyen el diálogo y la interacción con los usuarios, responder preguntas y ayudar en la creación, etc., para ayudar a los usuarios a obtener información, conocimiento e inspiración creativa. Los escenarios de uso incluyen creación literaria, negocios redacción, matemáticas y ciencias, cálculo, interpretación de chino, generación multimodal, etc.
Además de la redacción publicitaria, las ventajas de Wenxinyiyan incluyen la capacidad de crear imágenes y la capacidad de generar videos automáticamente basados en la redacción publicitaria.
Enlaces web:
Ali Tongyi Qianwen: escribir cartas de amor es fácil
Tongyi Qianwen es un modelo de desarrollo propio a gran escala de Alibaba Cloud. Actualmente está equipado con 9 aplicaciones, que se dividen principalmente en eficiencia, vida y entretenimiento.
(1) Categoría de eficiencia, incluidas tres aplicaciones: redacción de esquemas, análisis FODA y generación de descripción de productos;
(2) Categoría de vida, incluidas tres aplicaciones: "Recetas voladoras", "Composición de la escuela primaria" y "Y luego";
(3) Categoría de entretenimiento, que incluye "Rainbow Fart Expert", "Escribe cartas de amor" y "Escribe poemas para ti".
En la actualidad, las funciones principales de Tongyi Qianwen incluyen redacción, diálogo y chat, preguntas y respuestas de conocimiento, razonamiento lógico, escritura de código, resumen de texto y servicios de comprensión de imágenes y videos.
Enlaces web:
Xunfei Xinghuo: 7 dimensiones principales de habilidad, el rendimiento no es inferior a ChatGPT
Xunfei Spark es un modelo grande lanzado por iFLYTEK el 6 de mayo. Tiene siete dimensiones de generación de texto, comprensión del lenguaje, preguntas y respuestas de conocimiento, razonamiento lógico, matemáticas, código y multimodalidad. Después de la evaluación y comparación, se encuentra que Ha superado a ChatGPT en comprensión del lenguaje y capacidad matemática.
Xunfei Xinghuo puede completar la generación de texto largo de varios estilos, varios idiomas y varias tareas, y también puede realizar la detección de gramática y la corrección de errores en la redacción en inglés, y su capacidad de comprensión del idioma no es inferior a los sistemas existentes que se pueden medir en China.
Enlaces web:
Sequence monkey: un mono de IA que puede responder preguntas complejas
El gran modelo de lenguaje "Sequence Monkey" lanzado por la compañía de inteligencia artificial Mobvoi, su sistema de capacidades toma el lenguaje como núcleo y cubre seis dimensiones de "conocimiento, diálogo, matemáticas, lógica, razonamiento y planificación". Puede admitir texto simultáneamente generación, generación de imágenes, diferentes tareas como generación de contenido 3D, generación de voz y reconocimiento de voz.
Sequence Monkey ya tiene cierta capacidad de comprensión, conocimiento, lógica y razonamiento del lenguaje natural. Por ejemplo, "¿Qué capital provincial tiene la población más grande, Hunan o Hubei?", "¿De qué escuela se graduó el fundador de la compañía detrás de Tmall?", Etc. Ha sido capaz de dar rápidamente resultados precisos para esas preguntas que requieren una reflexión más profunda.
Enlaces web:
openapi.mobvoi.com
Tencent Wenyong Effidit: un artefacto de escritura en papel para la continuación inalámbrica
Wenyong Effidit (Edición eficiente e inteligente) es un asistente de escritura inteligente desarrollado por Tencent AI Lab. Utiliza tecnología de IA para ayudar a los escritores a divergir ideas, enriquecer expresiones y mejorar la eficiencia de la edición y escritura de texto. Sus funciones incluyen corrección inteligente de errores, finalización de texto, reescritura de texto, expansión de texto, recomendación de palabras, recomendación de oraciones, generación y otras funciones.
Enlaces web:
Busca frases según el significado de WantQuotes: Enciclopedia de citas célebres
Es una herramienta de procesamiento de redacción desarrollada por el equipo de investigación de la Universidad de Tsinghua. Utiliza la IA y la tecnología de procesamiento de lenguaje natural (NLP) más avanzadas para ayudar a las personas a procesar la lectura, la escritura, la búsqueda de redacción y las citas famosas de manera más conveniente y rápida. .
Los usuarios solo necesitan ingresar el vocabulario del tema relevante, y pueden encontrar dichos famosos, poemas, dichos, modismos, etc.
Enlaces web:
Diccionario inverso WantWord: un diccionario de sinónimos y sinónimos, las palabras de despedida no son expresivas
El equipo de investigación de la Universidad de Tsinghua desarrolló el diccionario inverso y la búsqueda de oraciones por significado. Pueden ayudar a encontrar sinónimos más apropiados y vívidos a través de las palabras dadas, y también admiten la traducción simultánea y mutua entre chino e inglés.
Enlaces web:
FlowUS AI: disco de red + memo + asistente de escritura
Xiliu es un software de gestión del conocimiento y de oficina colaborativa que se enfoca en brindar servicios para pequeñas organizaciones e individuos. Integra múltiples funciones como escribir documentos, almacenar conocimiento, tablas multidimensionales y mapas mentales en una sola plataforma. Sus usuarios son estudiantes universitarios. El grupo es el grupo principal y representa más de 1/3 del número total de usuarios.
FlowUS también se ha adaptado a ChatGPT. Los usuarios pueden usar FlowUS AI para realizar la escritura, la continuación de la escritura, la traducción, el pulido y otras funciones según sus propias necesidades.
Enlaces web:
Escritura inteligente WPS: genera automáticamente varios artículos en 1 segundo
WPS Smart Writing es un producto de escritura inteligente lanzado por Kingsoft Office para ayudar a los usuarios a crear de manera eficiente. Incluye principalmente cuatro funciones: generación automática de texto, redacción de borradores auxiliares, complemento inteligente de oraciones y revisión inteligente de textos.
Sus datos de texto e información relacionada provienen de medios autorizados y sitios web públicos del gobierno. El tema cubre varios escenarios de escritura, como discursos, resúmenes, planes, noticias, etc., y está conectado con documentos de Jinshan, que pueden realizar la carga simultánea de Textos a la nube Después de escribir en línea, los usuarios pueden ir a Kingsoft Documents para realizar una edición de documentos más profesional, como la composición tipográfica.
Enlaces web:
GrammarlyGo: gramática en línea "atrapador de errores"
La herramienta de revisión ortográfica en inglés Grammarly también lanzó el servicio de inteligencia artificial GrammarlyGo, que puede generar borradores de correo electrónico en función de las indicaciones de palabras clave ingresadas por los usuarios, o ayudar a los artículos existentes a cambiar el tono y el estilo del texto, ajustar la longitud de los artículos, etc., y redactar esquemas para la redacción de temas.
Enlaces web:
Volcano Writing WritingGo: traducción y pulido con un solo clic
Volcano Writing es un asistente de escritura lanzado por ByteDance. Actualmente es compatible con los servicios de escritura inteligente de IA para la edición de texto completo. Ya sea para revisar documentos, pulir currículos, escribir documentos de solicitud para estudiar en el extranjero, escribir auto-redacción de medios, etc. Más de 20 escenarios de escritura, Volcano Writing se puede cubrir.
El usuario ingresa el contenido de texto que desea pulir y modificar, y después de hacer clic en "optimización con un clic", puede identificar automáticamente el tipo de texto, el estilo y el propósito de escritura. El usuario también puede ajustar el alcance de la modificación y la plataforma. puede generarlo basado en el texto original con un solo clic. El resultado de la reescritura en inglés también es compatible con funciones de inteligencia artificial, como la corrección inteligente de errores y varias reescrituras, lo que hace que la expresión del idioma sea más auténtica y concisa.
Enlaces web:
Preguntas y respuestas de Zhishi: robot inteligente de preguntas y respuestas
Zhishi Q&A es un sistema inteligente de preguntas y respuestas basado en tecnología de IA. Los usuarios pueden ingresar preguntas en la plataforma Zhishi Q&A, y el sistema analizará automáticamente las preguntas y dará la mejor respuesta. Al mismo tiempo, también proporciona una variedad de métodos interactivos, que incluyen entrada de texto, entrada de voz, etc., para satisfacer las necesidades de diferentes usuarios.
Enlaces web:
Además de las herramientas de escritura AIGC familiares anteriores, todavía hay muchos "productos impopulares" que esperan la experiencia del usuario, como Friday AI Writing Assistant, Love Rewrite, Claude, Creator, Secret Tower Writing Cat, Subtxt, Writesonic, etc.
02. Herramienta de imagen AIGC: el mapa de Vincent es más que Midjourney
Libertad para pintar con un clic
Se puede decir que 2022 será el "primer año de la pintura de IA". Una variedad de herramientas de pintura de IA han demostrado una buena capacidad de comprensión y generación de imágenes con la ayuda de indicaciones de texto.
Con la ayuda de GPT-4, también se ha desencadenado una nueva ola de competencia en el campo del "mapa Vincent". Midjourney, que se ha actualizado a la versión V5, es popular en todo Internet con un grupo de fotos de pareja. Adobe, el líder en la industria del diseño, no se queda atrás. Se apresuró a lanzar "Adobe Firefly" para competir. mayoría de los trabajadores del diseño. Las herramientas de imagen de IA de hoy son más maduras y más variadas en términos de comercialización y arte que el año pasado.
▲ Un grupo de fotos retro de pareja generadas automáticamente por Midjourney
Los escenarios técnicos de las herramientas de imagen se pueden dividir en tres tipos: generación de imágenes, modificación parcial de imágenes y edición de imágenes.
Uno es la generación de imágenes. Los productos representados por Midjourney, Stable Diffusion y DALL-E 2 se centran principalmente en la generación de imágenes de extremo a extremo, que puede generar una imagen completa con un estilo específico basado en una descripción de texto o un boceto. La lógica técnica subyacente es clara y puede proporcionar a los Creadores proporcionar ciertas fuentes de inspiración y referencias creativas.
El segundo es la edición de imágenes. Las funciones principales incluyen la eliminación inteligente de marcas de agua de imágenes, la configuración de filtros de estilo, la modificación del estilo de imagen o la mejora de la claridad de la imagen, etc., representadas por productos como Imagen AI y Chuangketie AI Painter.
El tercero es la modificación parcial de la imagen, el producto representativo es Adobe Firefly. Su principal ventaja se centra en cambiar algunos elementos de la imagen, o modificar y ajustar capa por capa, lo cual es adecuado para la creación secundaria o la mejora de la postproducción.
Disco Diffusion: Dibuja con la boca
Disco Diffusion es un programa de dibujo que se ejecuta en Google Colab. Los usuarios con una cuenta de Google pueden ejecutarlo directamente en el navegador, pero los usuarios deben tener ciertos conocimientos de código.
Después de que el usuario ingresa una oración de descripción, el programa puede representar y generar automáticamente una imagen de la escena correspondiente. Es mejor para generar imágenes abstractas con un estilo más soñador, y el efecto es promedio cuando genera representaciones realistas e ingresa más descripciones de texto.
Enlaces web:
Midjourney: AI "fotógrafo"
Midjourney es un chatbot de pintura de IA lanzado por uno de los autores de Disco Diffusion, que se transmite en Discord. Después del lanzamiento de GPT-4, también cambió rápidamente a la versión V5. La nueva versión es más refinada en términos de fidelidad de imagen y procesamiento de detalles, y tiene un mayor nivel de comercialización, llegando casi al punto en que puede "disfrazar lo real".
En la versión anterior, el estilo de las imágenes generadas era principalmente de dibujos animados o surrealista, y había pocas imágenes realistas.Después de actualizar a la versión V5, Midjourney rápidamente se hizo popular con un grupo de fotos de parejas que eran difíciles de distinguir entre verdaderas y falsas. , y ha alcanzado La textura de la película es más realista en términos de primeros planos de manos, primeros planos de ojos y procesamiento de luces y sombras.
Además, en Midjourney V5, los usuarios pueden personalizar la relación de aspecto. Al ingresar el texto de la descripción, se requieren adjetivos más detallados y detalles de la imagen, como el estado de ánimo, el estilo y la luz y la sombra. Esto requiere que los usuarios tengan un control más activo sobre las imágenes y más claras. imaginación.
Enlaces web:
Difusión estable: generación de imágenes a nivel de píxeles
Stable Diffusion es un generador de imágenes de IA gratuito y de código abierto. Actualmente, la última versión de Stable Diffusion XL ha sido probada para el público.
En comparación con la versión anterior, los usuarios del nuevo SD-XL solo necesitan usar una descripción más corta para generar imágenes. La estructura del cuerpo humano y el procesamiento de detalles de las imágenes son más realistas y están más en línea con la estética del público. Los retratos generados son también más claro y más realista. .
Enlaces web:
DALL-E 2: Maestro de la pintura realista
DALL-E 2 es una herramienta de generación y edición de imágenes lanzada por OpenAI, famosa por su excelente efecto de generación y color artístico. El usuario solo necesita ingresar un resumen, y puede sintetizar los tres elementos de concepto, atributo y estilo, y generar una imagen realista que satisfaga las necesidades del usuario y, al mismo tiempo, también puede tener los estilos de pintura de diferentes artistas.
Por ejemplo, el usuario ingresa tres elementos: el concepto "un cachorro", el atributo "sobre la hierba" y el estilo "estilo del artista pop Andy Warhol", y puede producir imágenes que cumplan con estas tres condiciones. Las características de la herramienta también incluyen edición de imágenes, transformación de estilo y más.
Enlaces web:
Imagen AI: Las imágenes generadas pueden ser falsas
Imagen AI es una herramienta de IA de texto a imagen desarrollada por Google. Puede generar fotografías de retratos, pinturas al óleo, representaciones CGI y otras imágenes de acuerdo con las indicaciones escritas del usuario. Las imágenes tienen un sentido más fuerte de la realidad y una mayor precisión en la comprensión del lenguaje. .
Enlaces web:
Adobe Firefly: dibujo con IA + edición de imágenes en un solo lugar
Adobe Firefly es una herramienta de dibujo de IA lanzada por Adobe y Nvidia. Actualmente, se ha dado cuenta de las funciones de generar imágenes a partir de texto, convertir bocetos en imágenes y modificar el contenido de la imagen con un solo clic. También puede modificar las imágenes generadas automáticamente en capas y Imagen de tasa de resolución ultra alta de salida.
Enlaces web:
Un estilo de escritura y corazón: soporte para generar imágenes a partir de imágenes y convertir imágenes en videos
Wenxin Yige es un producto de pintura de IA lanzado por Baidu que se basa en la paleta voladora y la tecnología de modelo grande de Wenxin. Los usuarios solo necesitan ingresar su propio texto creativo y elegir el estilo de imagen deseado para obtener una pintura generada por Wenxinyige. También pueden elegir el tipo de imagen, la relación de imagen y la cantidad de imágenes generadas a la vez. En la actualidad, Wenxin Yige admite más de diez estilos diferentes de imágenes, como pintura al óleo, acuarela, animación y realismo.
Enlaces web:
Ali Luban Luban: Artefacto para mapeo de comercio electrónico
Luban es un producto de diseño de imágenes desarrollado de forma independiente por Alibaba Intelligent Design Lab. Basado en la tecnología de generación de imágenes de IA, Luban puede completar el diseño de una gran cantidad de imágenes de pancartas, carteles e imágenes de lugares en poco tiempo. Los usuarios solo necesitan ingresar el estilo y el tamaño que desean lograr, y Luban puede reemplazar los proyectos de diseño que consumen mucho tiempo y mano de obra, como el análisis de materiales, el recorte y la combinación de colores manualmente, y generar múltiples conjuntos de soluciones de diseño que cumplen con los requisitos. requerimientos en tiempo real.
Durante la promoción "Doble 11" en 2017, Luban generó 8000 carteles por segundo, durante los cuales se produjeron un total de 400 millones de carteles de productos, lo que refrescó la comprensión de las personas sobre las capacidades de dibujo de la IA.
Enlaces web:
Chuangketie AI Painter: puedes ser diseñador incluso si no sabes dibujar
Chuangketie, una plataforma de diseño empresarial, lanzó un producto de pintura de inteligencia artificial, AI Painter, y lanzó dos escenarios funcionales de uso común, "Wen Sheng Tu" y "Tu Sheng Man".
En el escenario "Wen Sheng Tu", los usuarios solo necesitan ingresar el texto simple requerido, seleccionar el estilo de pintura que desean y la imagen de destino se puede generar con un clic. Los estilos existentes incluyen estilo antiguo, pintura al óleo, pintura en color, cómics. , GC, etc
En el escenario "Picture Man", los usuarios solo necesitan cargar la imagen de destino e ingresar instrucciones de texto simples para obtener una imagen pintada a mano personalizada. Sus funciones también incluyen detección de bordes, coloreado de borrador de línea y detección de pose. Función.
Enlaces web:
03. Herramientas de audio AIGC: sonido variable, clonación, reducción de ruido
Además de los escenarios de aplicación como texto e imágenes, el audio también es un escenario de aplicación en el que tenemos una amplia gama de contactos en nuestra vida diaria. El cambio de voz humana, la síntesis de voz y la clonación en videos cortos son las tecnologías de investigación populares de AIGC en el campo del audio, que incluyen animación, películas y doblaje de personajes en juegos, que ahora puede realizar AI. Empresas tecnológicas como Microsoft y Google también han lanzado sus propios servicios Text-to-Speech (texto a voz).
Las herramientas de audio de IA se pueden dividir en dos tipos según diferentes atributos funcionales: una son las herramientas de procesamiento de sonido representadas por So-Vits-Svc, Adobe Podcast AI Voice, Magic Sound Workshop, etc., que utilizan tecnología de IA para reparar el sonido y mejorar el audio. calidad O convertir timbre, etc.; el segundo son las herramientas de producción musical representadas por MusicLM, Netease Tianyin, Aiva, etc., que pueden realizar la función de "texto a música" en campos más subdivididos.
1. So-Vits-Svc: crea el explosivo "AI Stefanie Sun" en Internet
"AI Stefanie Sun" se hizo popular en Internet de la noche a la mañana. Canciones como "Hair Like Snow" y "Rainy Day" "cover" hechas por ella se han reproducido más de un millón de veces en Bilibili, y los propietarios de UP pasan estas canciones. Realizado por el proyecto de código abierto So-Vits-Svc.
Este modelo utiliza el codificador de contenido SoftVC para extraer las características de voz de audio de origen del cantante real y luego las transfiere al modelo de síntesis de voz VITS, de modo que se conserva la voz original del cantante. "Cantantes de IA" similares incluyen AI Jay Chou, AI Xu Song, AI Wang Xinling, etc.
Además de simular las voces de cantantes conocidos, también puede simular una gran cantidad de voces reales a partir de grabaciones telefónicas, videos y otros materiales.Anteriormente, algunos dueños de UP usaban este modelo para comunicarse con los fallecidos. Sin embargo, debido al creciente abuso del proyecto, el autor lo eliminó.
Adobe Podcast AI Voice: procesamiento de audio de podcast profesional
Adobe Podcast AI Voice es un potenciador de audio impulsado por IA de Adobe que utiliza IA para mejorar la calidad de las grabaciones de audio de los blogs.
Después de que el usuario inicie sesión en la cuenta de Adobe, cargue el archivo de audio que necesita procesamiento de reducción de ruido, AI procesará automáticamente el archivo de audio y, una vez que se logre el efecto de reproducción de audio satisfactorio, el usuario puede descargarlo directamente a la computadora para uso gratuito .
Enlaces web:
MusicLM: modelo de IA que puede cantar
MusicLM es un verdadero modelo de IA generativa lanzado por Google. A través de este modelo, la música de alta fidelidad se puede generar directamente a partir del texto. Además del texto, ya sea tarareando, cantando, percusionando, interpretando instrumentos, etc., MusicLM puede crear música basada en estas melodías existentes y garantizar que la música no se distorsione.
Su mayor destaque es que puede generar una pista completa de 5 minutos a partir de una o dos palabras clave, con varios estilos, incluyendo música electrónica, jazz, blues, pop, etc. La duración de la canción también se puede configurar de antemano, como una pista completa de 5 minutos o un segmento de tarareo de diez segundos.
Además, también puede generar piezas tocadas por instrumentos específicos, e incluso se puede establecer el nivel de interpretación de los intérpretes.También puede crear música de acuerdo con las características de la época y el lugar donde se ejecuta.Música popular tocada por un órgano junto al mar".
MusicLM se entrena en una base de datos de música de hasta 280.000 horas, sin importar el estilo o la emoción de la canción.
Enlaces web:
Xunfei Hear: Voz a texto en cualquier momento y en cualquier lugar
Xunfei Hearing es un producto de voz inteligente de iFLYTEK, que se basa en el procesamiento del lenguaje natural, el reconocimiento de voz y el reconocimiento de voz y otras tecnologías de voz de iFLYTEK. iFLYTEK Hearing puede satisfacer las necesidades de voz de los usuarios en varios escenarios. Los escenarios aplicables cubren diferentes ocasiones, como actas de reuniones, conferencias, entrevistas con los medios y escritos personales.
Sus funciones ventajosas también incluyen agregar subtítulos bilingües a videos, interpretación simultánea multilingüe y generar subtítulos para videoconferencias, etc., para ayudar a los usuarios a superar las barreras del idioma y facilitar la comunicación y la colaboración.
Enlaces web:
NetEase Tianyin: letras, música, arreglos y canto se completan en una sola parada
Netease Tianyin es un sistema de creación de música con arreglos de IA producido por Netease, que puede crear música de IA en línea. Su mayor ventaja es que el umbral para la creación de música es bajo y los usuarios pueden completar un arreglo musical original de acuerdo con las pautas en un corto período de tiempo.
El banco de trabajo de Tianyin incluye una serie de estilos musicales específicos, incluidos pop, folk, electrónica, estilo nacional, etc. canción agregando, restando, copiando, ajustando párrafos, etc. Después de completar toda la edición, se procesará automáticamente y podrá obtener un arreglo original creado por usted mismo después de una breve espera.
Enlaces web:
Magic Sound Workshop: una herramienta imprescindible para los comentarios de cine y televisión big V
Moyin Workshop es un producto de la serie de voz de IA lanzado por la compañía de IA Going out to ask. Los usuarios pueden usar de manera eficiente y conveniente la tecnología de voz de IA para simular la voz de una persona real con características personales, crear contenido de audio de IA y convertir texto en una persona real con una clic voz.
El usuario importa rápidamente el artículo que se va a sintetizar en sonido en la interfaz y realiza la edición en línea a través de una página de operación similar al documento, de modo que el documento se puede convertir en audio de manera conveniente. Las funciones en la página de edición incluyen: marcado de énfasis, caracteres multifonéticos, marcado propenso a errores tipográficos, adición de sonido de fondo, doblaje mixto de varias personas, velocidad variable, ritmo y muchas otras funciones.
Para los usuarios a los que les gusta la tecnología, las finanzas y otros campos, Moyin Workshop también ha agregado modelos de voz de IA de directores ejecutivos de muchas empresas relacionadas en segundo plano, para que los usuarios que estén familiarizados con ellos puedan usar sus voces para producir contenido de audio.
Enlaces web:
Fake You: las voces también se pueden falsificar
FakeYou es una herramienta de edición de audio de texto a voz que utiliza tecnología de falsificación profunda para generar texto a voz en diferentes idiomas y voces. Los usuarios pueden usar las voces de sus personajes favoritos para crear audio, y también proporciona texto AI -a las funciones del habla.
Cuando el usuario ingresa un fragmento de texto para generar y elige quién quiere leer el texto, y luego hace clic en el botón "hablar", se genera automáticamente una voz "hablada" por la persona objetivo.
Enlaces web:
LyricStudio: AI te ayuda a escribir letras
LyricStudio es un creador de letras en línea que ayuda a los usuarios a generar una letra original que imita su propio estilo y encuentra una rima para una palabra específica. Los usuarios pueden cargar una descripción de texto o un clip musical, y lo convierte en letras que coinciden con el contenido.
Según datos de su web oficial, la herramienta ha colaborado para crear más de 1 millón de canciones, y el 15% de los usuarios de la plataforma son productores musicales profesionales. LyricStudio ayudó al rapero Curtiss King a escribir las letras del álbum número 1 en iTunes.
Enlaces web:
LALAL.AI: extracción de sonidos de instrumentos con un solo clic
LALAL.AI es una herramienta de separación de música en línea que puede segmentar y extraer voces e instrumentos de la música.
Su tecnología de separación de música en línea se basa completamente en aprendizaje automático e inteligencia artificial. Antes de la versión anterior, solo podía separar voces humanas. Ahora puede extraer con precisión voces humanas, guitarras eléctricas, guitarras acústicas, pianos y baterías de archivos de audio y video. ., bajo y muchos otros instrumentos.
URL:
Aiva: productor musical de IA
Aiva es una herramienta de música de IA con el mismo nombre desarrollada por la compañía de música de IA "Aiva". Los usuarios pueden ayudar a los músicos a producir y escribir música original a través de la tecnología de IA. La plataforma cubre una variedad de estilos diferentes, como música clásica , rock, música electrónica, pop, estilo nacional, Blues, hip hop, etc. En la página de composición automática, hay 11 géneros para que los usuarios elijan, incluida la melodía de la armadura de clave, el ritmo de la armadura de tiempo, la frecuencia de ritmo, la instrumentación, la duración, etc.
Aiva también estudió las obras representativas y los estilos musicales de Mozart, Bach, Beethoven y otros músicos a través del aprendizaje profundo y estableció un modelo de aprendizaje basado en estas características musicales para ayudar a los músicos a crear música. Al mismo tiempo, Aiva también es el primer compositor certificado por IA de la historia y ha publicado 5 álbumes.
Enlaces web:
Supertono: un artefacto que cambia la voz
Supertone es un estudio de sonido creativo de IA en Corea del Sur que proporciona síntesis de voz y tecnología de mejora del habla en tiempo real para ayudar a los usuarios a crear fácilmente varios tipos de contenido de sonido, incluida la lectura de texto simple para obras de arte, canciones, etc., lo que permite a los usuarios cambiar sus voces y otras formas Para aliviar las preocupaciones sobre problemas de información personal.
Supertone también ofrece una tecnología llamada "VoicePrint", que convierte la voz de un usuario en una huella digital que la distingue de las voces de otros usuarios.
Enlaces web:
04. Herramienta de video AIGC: la edición automática y la generación de funciones de guión gráfico están aquí
Los gráficos de Vincent ahora se han convertido en la principal tecnología AIGC, pero la generación de texto a video aún está en pañales.
La startup de inteligencia artificial con sede en Nueva York, Runway, ha desarrollado un modelo de video generativo Gen-2, que puede generar un video altamente compuesto a partir de una descripción simple. También se han sumado otras empresas, como Text2Video-Zero, Video-P2P y TemporalNet lanzadas por la plataforma de edición de imágenes PiscArt, y Text-to-video desarrollada por Ali.El video generado por texto también puede entrar en una feroz competencia en un futuro cercano. .etapa
Deepfakes: cambio de cara de video AI
Deepfakes ahora es sinónimo de videos sintetizados por IA. Microsoft lanzó FaceShifter, que puede procesar una imagen original borrosa en una imagen falsa clara y creíble; Disney y ETH Zurich desarrollaron y lanzaron conjuntamente una herramienta de producción de video Deepfakes a nivel de megapíxeles, y en la serie "Star Wars" en la película, Deepfakes fueron solía traer a los actores fallecidos a la pantalla grande.
Sin embargo, los riesgos de seguridad causados por esto también han venido uno tras otro: para algunos videos de alta definición y luz extremadamente natural, incluso el algoritmo Deppfakes más sofisticado no puede identificarlos con precisión.
Como resultado, ya en las elecciones estadounidenses de 2020, Facebook anunció una prohibición total del uso de Deepfakes en la plataforma, y YouTube y TikTok no fueron la excepción, ya que prohibieron explícitamente el uso ilegal de la tecnología Deepfakes en los videos. El "Código Civil" que se implementará en mi país en 2021 también señala que las principales plataformas de video deben restringir estrictamente el contenido de los videos que cambian la cara de la IA, y no deben usarse a voluntad sin permiso.
Runway Gen-2: genere películas de gran éxito en 30 segundos
Gen-2 es un modelo de Transformer de extremo a extremo lanzado por la empresa emergente Runway. Los usuarios pueden usar imágenes y texto como condiciones para generar un video original de estilo lento desde cero.
La resolución de video que genera es tan alta como 1280 × 720, y la duración es de aproximadamente 30-60 segundos. Actualmente, se pueden realizar las siguientes funciones: generar video, generar imágenes, expandir imágenes sin límite de acuerdo con las indicaciones de texto, mezclar estilos de imagen , entrenar modelos de IA, eliminar un elemento del video, restar el fondo, etc.
Recientemente, Runway lanzó su primera aplicación móvil, utilizando el modelo Gen-1, los usuarios pueden cargar texto, imágenes o videos en el teléfono móvil y dejar que el modelo transforme el estilo del video según el contenido.
Enlaces web:
Make-A-Video: convierte texto a video directamente
En septiembre de 2022, Meta lanzó su propio software de texto a video "Make-A-Video". Después de que el usuario ingrese algunas descripciones de palabras simples, el software creará un video silencioso.
En el video de demostración oficial, el usuario puede obtener un video de unos segundos ingresando descripciones de texto como "una pareja joven caminando bajo la lluvia intensa" y "un oso de peluche que ha estado pintando un retrato". Además, Make-A-Video también puede animar imágenes estáticas, que se basa en la tecnología del "diagrama de Vincent".
Según el funcionario, el modelo se entrena utilizando datos de síntesis de imágenes y videos sin etiquetar. Después de aprender, el modelo puede "predecir" lo que sucederá junto a la imagen, dónde se moverá y se moverá hacia donde estará la imagen en un muy tiempo corto La ubicación donde aparece para formar un video corto.
Enlaces web:
Shangtang Zhiying: artefacto del tesoro experto en video corto
SenseTime ha lanzado una plataforma integral de publicidad y marketing para SenseTime, que incluye el motor de creación de videos cortos "SenseTime", que puede generar videos cortos creativos con un solo clic, incluida la generación de guiones, reemplazo de fondo, reemplazo de pantalla horizontal y vertical y subtítulos. generación Una variedad de servicios para la producción de publicidad en video puede ayudar a los anunciantes a ahorrar el costo de la producción de contenido publicitario.
El servicio "Análisis de elementos de video" incluido en SenseTime puede analizar y extraer información como la duración, la escena, la escena, el personaje, los accesorios y las líneas de cada toma en un video corto a través de la tecnología de estructuración de video AI, y crear automáticamente un guión de toma en gran medida. reduce el tiempo de redacción de guiones y ayuda eficazmente a los creadores en la creación secundaria.
Además, la plataforma también proporciona una gran cantidad de guiones de video populares para brindar inspiración creativa a los creadores.
Enlaces web:
Decoherencia: genera video con un clic de la imagen
Decoherence es una herramienta para crear videos de IA donde los usuarios pueden elegir entre una variedad de estilos de IA.
Enlaces web:
Tencent Zhiying: artefacto de creación de videos cortos
"Tencent Zhiying" está dirigido principalmente a creadores de videos cortos, y sus funciones destacadas son materiales genuinos con derechos de autor y transmisiones humanas digitales. Los usuarios pueden generar un video humano digital cargando fotos y texto. Los usuarios también pueden usarlo con la función de doblaje inteligente de IA para elegir diferentes timbres para humanos digitales.
Enlaces web:
05. Herramientas de oficina AIGC: AI+OA realiza un clic "desde cero"
El 17 de marzo, Microsoft lanzó oficialmente Microsoft 365 Copilot, que integra las capacidades de GPT-4 y ChatGPT en las herramientas de Office, y lanzó la función Business Chat que integra los datos de Office 365, lo que mejora el nivel de la oficina digital y evita que los empleados sean ineficientes, liberados. del trabajo repetitivo.
Kingsoft Office, como empresa líder en el campo de la oficina colaborativa doméstica, también lanzó una plataforma de oficina generativa "WPS AI" con grandes capacidades de modelo de lenguaje en solo un mes, convirtiéndose en la primera aplicación similar a ChatGPT en la pista de la oficina colaborativa doméstica. Además, empresas como Baidu, ByteDance y DingTalk han lanzado sucesivamente sus propias herramientas de oficina colaborativas de IA.
El sistema de aplicación OA (Automatización de la Oficina) se ha desarrollado y madurado gradualmente. Como un puente que conecta a los empleados y las empresas, puede convertirse en la entrada del gran modelo de lenguaje en la ecología B-end en el futuro.
Además del campo de la oficina colaborativa, las herramientas de IA también pueden aplicarse en escenarios más verticales y combinarse con necesidades más prácticas. Por ejemplo, "IA + aprendizaje de idiomas" tiene DuolinguoMax, y "AI + entrega de comercio electrónico" ha creado un versión inteligente de comercio electrónico Sitio web de comercio electrónico Shopify, herramienta de marketing de comercio electrónico eCommerce s, etc. con una descripción de la oración.
1. Microsoft 365 Copilot: versión Gpt-4 de Microsoft Family Bucket
Microsoft 365 Coplilot siguió a GPT-4 en la madrugada del 17 de marzo, y todo el software de oficina, incluidos Word, Excel, Powerpoint, Outlook, Teams, etc., se lanzó con funciones de IA generativa.
En Word, Copilot solo necesita un aviso simple para crear un primer borrador, y también puede ajustar el tono del artículo según las necesidades del usuario, como profesional y serio, entusiasta e informal, etc., y puede eliminar automáticamente el mismo lugar. en el artículo , para una mayor simplificación.
Copillot en Excel puede ayudar a los usuarios a analizar datos, analizar directamente tendencias de datos y visualizar resultados de análisis de datos.
Lo que es aún más sorprendente es que Powerpoint ya puede generar directamente un PPT y Copilot puede convertir directamente un documento existente en un PPT con fuentes marcadas. Si los usuarios sienten que el PPT es demasiado largo, pueden usar directamente la descripción del texto para comprimir, ajustar el diseño o formatear el texto con un solo clic.
Copilot en Outlook puede ayudar a los usuarios a clasificar los correos electrónicos de acuerdo con ciertos criterios, resumir y refinar el tema de los correos electrónicos extensos y transcribir varias palabras clave o borradores en correos electrónicos oficiales.
Enlaces web:
Google Workspace: tecnología + oficina = artefacto para trabajadores
Google Workspace es un banco de trabajo de Google que incluye herramientas de oficina como Docs, Slides, Sheet y Gmail. Google anunció en marzo que integrará IA en estos componentes de herramientas. Después de acceder al modelo generativo de IA, los usuarios podrán crear un correo electrónico completo, un plan de negocios o una hoja de tarifas de marketing publicitario con la ayuda de estas herramientas ingresando una breve descripción de texto.
En Docs, la IA generativa puede ayudar a los usuarios a redactar el primer borrador del texto, pulir y revisar el texto, revisar y corregir errores; Gmail puede responder y resumir correos electrónicos, marcar asuntos importantes, etc.; Presentaciones puede generar automáticamente imágenes, audio y video según el tema e insertarlos en la plantilla; Sheet puede realizar automáticamente el procesamiento de datos, la clasificación de tablas, la clasificación de contexto e incluso el análisis de datos sin procesar.
En la actualidad, Google adopta un plan de pago flexible, que se divide en la versión empresarial básica para principiantes, la versión empresarial estándar y la versión empresarial Plus, lo que permite a los usuarios suscribirse de acuerdo con sus necesidades reales.
Enlaces web:
Baidu Ruliu: IA + gestión del conocimiento
Baidu Ruliu lanzó la "Plataforma de trabajo inteligente Ruliu 2.0" para el mercado de servicios empresariales a fines del año pasado, que incluye tres matrices de productos inteligentes: gestión inteligente del conocimiento, conferencia inteligente y banco de trabajo inteligente.
En la gestión inteligente del conocimiento, hay tres aplicaciones de gestión del conocimiento de "base de conocimiento inteligente", "motor dual de búsqueda y recomendación" y "cadena de estrella del conocimiento", que reúnen documentos, correos electrónicos, notas y otros archivos dispersos en un solo lugar, los empleados pueden encontrar los documentos y conocimientos requeridos de la manera más conveniente.
Las reuniones inteligentes conectan de manera inteligente a empleados, espacios y equipos. Antes de la reunión, Ruliu Conference Assistant puede ayudarlo a verificar el horario de los participantes, reservar el mejor horario para la reunión y enviar los materiales de la reunión; durante la reunión, Ruliu Assistant puede grabar los discursos de los participantes y convertir la voz en texto en tiempo real. tiempo, marcando información clave; Después de eso, el asistente de la reunión generará automáticamente una tarea pendiente de la reunión, lo cual es conveniente para que los empleados revisen los puntos clave de la reunión.
Se recopilan diferentes tarjetas de trabajo en el banco de trabajo inteligente para que el sistema de tareas sea más flexible y claro, y se combinan diferentes tarjetas de trabajo según los empleados en diferentes puestos. Por ejemplo, el banco de trabajo de recursos humanos está integrado con tarjetas de trabajo para asistentes de entrevistas y módulos de gestión de contratación; el banco de trabajo del gerente incluye tarjetas de trabajo tridimensionales para el seguimiento de la eficiencia, el análisis colaborativo y la gestión de procesos, proporcionando a los gerentes datos de tareas del equipo.
Enlaces web:
Dingding slash "/": la varita mágica genera applets con un solo clic
Una semana después del lanzamiento del modelo a gran escala de Tongyi Qianwen, DingTalk anunció su acceso oficial. Después de acceder al modelo grande de Qianwen, los usuarios solo necesitan usar una barra inclinada "/" para realizar un trabajo de oficina inteligente. Los principales escenarios de uso incluyen chat grupal, documentos, videoconferencia y desarrollo de subprogramas.
En el chat grupal, los nuevos participantes solo necesitan ingresar "/" en el cuadro de diálogo para obtener los puntos contextuales del chat grupal, y la barra inclinada también puede generar tareas pendientes, programar citas y hacer emoticones para reuniones importantes.
En un chat uno a uno, los usuarios pueden usar directamente barras oblicuas para crear un chatbot que le permita aprender automáticamente el conocimiento y responder preguntas.
En documentos, slash puede generar automáticamente textos publicitarios y carteles en varios estilos; en videoconferencias, slash puede resumir puntos de encuentro, tareas pendientes, etc. con un solo clic.
Además, la función más inesperada de slash es generar pequeños programas en lenguaje natural y usarlos en el grupo en forma de "Dingding cool application".
5. Kingsoft Office WPS AI: AI escribe documentos
El mismo día que DingTalk anunció el acceso al modelo grande y el lanzamiento del asistente de oficina inteligente "/", Kingsoft Office, una empresa líder en software de oficina nacional, también anunció oficialmente el lanzamiento de "WPS AI". El gran modelo subyacente lo proporciona MiniMax, que actualmente incluye múltiples funciones, como generación de contenido, diálogo de múltiples rondas y optimización de contenido. En el futuro, puede evolucionar hacia la versión doméstica de "Microsoft 365 Coplilot" y estar completamente integrado en la suite WPS.
Enlaces web:
Feishu My AI: asistente administrativo de la versión Bytedance
El 11 de abril, Feishu, la plataforma de oficina de ByteDance, también lanzó el asistente inteligente de IA "My AI". Sus funciones incluyen resumir automáticamente las actas de las reuniones, crear informes, continuar escribiendo y optimizar el contenido del texto, etc. En Feishu, My AI también puede ayudar a los usuarios a crear horarios y buscar en la base de conocimiento interna de la empresa a través del diálogo. Sin embargo, My AI todavía está en progreso y aún no se han anunciado la versión beta pública y el tiempo de lanzamiento.
Enlaces web:
Shopify: AI transforma el servicio al cliente de comercio electrónico en segundos
El 1 de marzo, después de que ChatGPT anunciara la apertura de la API, la plataforma de servicios de comercio electrónico transfronterizo Shopify tomó la delantera en la integración. Después de integrar ChatGPT, Shopify puede usar el servicio de atención al cliente inteligente para comunicarse con los usuarios, ayudar a los consumidores a hacer recomendaciones personalizadas y ahorrar tiempo de compra; ChatGPT también lleva a cabo análisis de datos de revisión, optimización de títulos y palabras clave, redacción de textos publicitarios y programación inteligente de desarrollo de sitios web para productos de plataforma y muchas otras funciones para ayudar a mejorar la eficiencia operativa de los sitios web de comercio electrónico y optimizar la experiencia de compra del consumidor.
Enlaces web:
ChatGPTs de comercio electrónico: informante de comercio electrónico
Enlaces web:
GitHub Copilot X: la programación Xiaobai también puede escribir código
Después de que Microsoft lanzara la nueva versión del motor de búsqueda Bing, el navegador Edge y el cubo de la familia Office, su plataforma de alojamiento de código GitHub también lanzó Copilot X, que introdujo ChatGPT en el entorno de desarrollo integrado, incluso los usuarios con una base de código cero pueden confiar en "mueve la boca". "Escribe el código.
En GitHub Copilot Chat, los usuarios pueden enviarle instrucciones para escribir código en una ventana de chat, para aquellos códigos que se ejecutan de manera anormal, puede encontrar directamente el error (error) y modificarlo, en GitHub Copilot Voice, incluso se puede implementar. voz a código en un solo paso, el desarrollador habla directamente y da instrucciones en lenguaje natural, y puede generar códigos relevantes.
Además de las funciones anteriores, si el usuario no entiende una determinada línea de código, simplemente deje que Copilot le explique la función del código en el chat.
Enlaces web:
Luciérnagas: actas de reuniones fácilmente resueltas
Enlaces web:
Feishu Miaoji: Mil palabras a texto, una palabra vale más que mil palabras
Enlaces web:
06. Herramientas de vida AIGC: cocinar, tomar notas, hacer guías de viaje
Deje que la IA se convierta en el administrador de la vida
Además de las herramientas de inteligencia artificial altamente aplicables, como la generación de texto y la edición de audio y video, han surgido varios productos AIGC nuevos en la vida diaria.
Por ejemplo, ChefGPT ayuda a generar recetas para usuarios que tienen dolor de cabeza todos los días, Dover Autopilot, una herramienta de reclutamiento de inteligencia artificial que proporciona currículos de talento de alta calidad para headhunters, BibiGPT, que puede tomar notas mientras ve videos, y Bedtime Story AI, que puede generar historias cortas antes de ir a la cama, WatchNow, que recomienda listas de películas por preferencia personal, etc., la vida completamente inteligente ya no es una trama solo en las películas de ciencia ficción, y la IA ha entrado de lleno en nuestra vida diaria.
BibiGPT: una herramienta amigable para estudiantes universitarios que permite la transferencia de videos a notas con un solo clic
¿El video es demasiado largo para resumir los puntos clave? ¿Demasiado apurado para tomar notas mientras ve un video? BibiGPT, un software de resumen de audio y video desarrollado en base a ChatGPT, resuelve bien estos problemas. Para videos en Bilibili y Youtube, BibiGPT puede resumir el contenido clave con un solo clic. Los usuarios solo necesitan pegar el enlace del video que visitaron en el cuadro de búsqueda y haga clic en " "Resumen de un clic", puede obtener una nota de resumen de video.
Enlaces web:
Dover Autopilot: software de reclutamiento de IA
Dover Autopilot es una herramienta de contratación automatizada. Los reclutadores solo necesitan ingresar un enlace de descripción de trabajo simple, y puede encontrar solicitantes de empleo que coincidan con los requisitos laborales en minutos a través de fuentes de datos como LinkedIn y otros sitios web de búsqueda de empleo. También puede generar automáticamente correos electrónicos personalizados. para candidatos
Enlace web: dover.com/start
ChefGPT: una enciclopedia de recetas para principiantes en comida
Esta es una herramienta de recomendación de recetas de IA, cuando el usuario ingresa los ingredientes existentes y las herramientas a mano, así como el tiempo de cocción reservado, puede recomendar una receta que satisfaga las necesidades.
Hay dos modos en la página, uno es el modo gourmet y el otro es el modo seleccionar todo. El modo gourmet tiene requisitos más altos para la autonomía del usuario, ya que requiere que los usuarios seleccionen ingredientes y utensilios de cocina antes de ingresarlos en la página web, mientras que el modo seleccionar todo es más amigable para los "noobs de la cocina" y puede obtener una copia que cumpla con los requisitos sin usando sus cerebros Recetas para necesidades reales.
Enlaces web:
Journeai: Guía de viaje para mochileros
Journeai es un asesor de viajes por chat basado en IA, que tiene como objetivo crear rutas de viaje personalizadas para los usuarios. Puede generar itinerarios de acuerdo con las preferencias del usuario, incluidos los arreglos de actividades y los socios de viaje. explorar.
Esta herramienta no solo es adecuada para los vacacionistas que necesitan personalizar los arreglos de itinerarios personalizados, sino también para ayudar a las agencias de viajes a mejorar la experiencia del usuario.
Enlaces web:
07
Herramienta de detección de contenido AIGC: AIGC falsificado
Liderando el camino en la identificación de contenido
Con el desarrollo de la tecnología AIGC avanzando por la vía rápida, también ha causado una gran cantidad de información falsa, plagio de texto, fraude académico, disputas de derechos de autor y otros efectos adversos y eventos negativos relacionados. Las disputas de seguridad desconocidas son inevitables, lo que requiere el desarrollo de tecnologías relevantes para la detección y la detección.
Aunque actualmente no hay muchas herramientas de detección de contenido AIGC en el mercado, ya pueden distinguir con precisión el contenido AIGC, como texto generado, imágenes y sonidos, el sistema de detección de plagio CrossCheck, etc.
1, fugas de copia:
Copyleaks es actualmente una de las herramientas de detección de contenido de IA más populares en el mundo.La ventaja más destacada es que además de detectar contenido en inglés, también puede detectar contenido escrito en español, francés y otros idiomas. Para los textos generados por IA, Copyleaks puede lograr una precisión de reconocimiento del 99,99 %, pero para el contenido de texto que es medio verdadero o falso, lo marcará como texto generado artificialmente.
Enlaces web:
AIGC-X: identifique la autenticidad del texto chino con ojos agudos
People.cn Information Technology Company, una subsidiaria de People's Daily, que se enfoca en el control de riesgos de contenido, ha desarrollado la primera herramienta de detección de contenido generado por IA en China, AIGC-X. Esta herramienta se puede usar para distinguir el texto generado por una máquina de Puede detectar y filtrar artificialmente fake news, plagio de contenidos, spam, etc., y especialmente dar soporte técnico en áreas grises como información falsa, fraude académico y phishing.
Sin embargo, AIGC-X actualmente solo admite la detección de contenido chino, y es necesario mejorar la capacidad de detección de contenido de imágenes, audio y video.
Enlaces web:
DetectGPT: herramienta anti-reconocimiento, el fraude y las trampas son inevitables
La herramienta de detección de muestra cero DetectGPT fue desarrollada por un equipo de investigación de la Universidad de Stanford en los Estados Unidos y se utiliza principalmente para combatir el fenómeno de generación de papel que es común en las universidades. Un artículo de investigación titulado "DetectGPT: Zero-Shot Machine-Generated Text Detection usando Probability Curvature" ha sido publicado en el sitio web de preimpresión arXiv.
Esta herramienta de detección propone un nuevo indicador para juzgar el texto generado por el modelo de lenguaje grande. Solo necesita escanear el contenido cargado en la página web para determinar si el contenido del texto se genera usando el modelo de lenguaje grande.
Enlaces web:
NetEase NetShield: detección precisa de palabras confidenciales
NetEase NetShield, basado en los años de experiencia de NetEase en la industria, proporciona modelos de comparación personalizados y soluciones de detección personalizadas para las características del spam de texto.El contenido desviado para terceros también se filtrará automáticamente.
Enlaces web:
Detección de texto inteligente Sumei: identificación rápida de texto riesgoso
Sumei utiliza un motor de reconocimiento de contenido inteligente de pila completa para identificar de manera efectiva la desviación de publicidad confidencial, prohibida, pornográfica, violenta, abusiva y otro contenido de texto riesgoso en varios escenarios, lo que ayuda a los usuarios a identificar aún más la información riesgosa. En la actualidad, Sumei ha podido detectar automáticamente 175 idiomas extranjeros y admite la identificación de etiquetas de riesgo en 18 idiomas principales, como inglés, árabe, tailandés e indonesio.
Enlaces web:
08. Conclusión: AIGC revolucionó la productividad en todos los campos
Conviértete en copiloto para creadores
La pista AIGC está repleta. Además de la escritura, la generación de imágenes, la edición de audio y video, los asistentes de oficina, la detección de contenido, etc., hay más subdivisiones que esperan ser exploradas.
Hoy en día, la IA se está adentrando en el campo de la producción de contenido digital y, además de ser comparable a los profesionales de la escritura, las preguntas y respuestas, la pintura y las ciudades centenarias, también ha demostrado la poderosa capacidad de comprensión de los grandes modelos lingüísticos. Pero solo puede servir como un "Copiloto (copiloto/asistente)" para ayudar a los humanos a tomar decisiones, ayudar a los creadores en la producción continua y las ideas iterativas, y no reemplazará ese trabajo verdaderamente valioso.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
¡Hematemesis clasifica 100 artefactos AIGC y los trabajadores aceleran! ¡Se recomienda encarecidamente la colección!
Fuente: Sabiduría
Autor | Wu Feining
Redactor | Li Shuiqing
Título original: "¡El rey de los rollos lo está usando! 100 herramientas AIGC de nivel de tesoro para compartir, ¡muy recomendables para coleccionar! ! "
Hablando de herramientas AIGC, ¿todavía solo conoces ChatGPT?
De hecho, cada vez más aplicaciones AIGC no se basan en GPT de OpenAI. En el campo del entretenimiento, la versión musical de los cantantes "AI Stefanie Sun" y "AI Jay Chou" se hizo popular, y los propios cantantes quedaron asombrados; en el campo del comercio electrónico, los humanos virtuales AI leen guiones generados por AI 7x24 horas , y vendió millones de bienes para empresas En aulas especiales, los profesores virtuales emiten cursos de lenguaje de señas basados en contenido de voz para ayudar a las personas sordas a aprender conocimientos... Estos escenarios se han convertido en el campo de aterrizaje de modelos de desarrollo propio a gran escala o de código abierto modelos
Según las estadísticas de Zhishi, a mediados de mayo existen al menos 100 herramientas AIGC representativas en el mundo. Desde el trabajo de oficina diario hasta las redes sociales, desde la producción de juegos hasta el diseño gráfico, desde las regulaciones financieras hasta las ventas de productos, el posicionamiento de funciones de las herramientas AIGC se ha actualizado desde la anterior "observación + predicción" a la actual "generación + toma de decisiones", promoviendo aparece la implementación del "punto impar" de AIGC.
En el campo de la escritura de texto, las herramientas AIGC lideradas por chatbots conversacionales como ChatGPT y Wenxinyiyan ahorran tiempo y dinero a las personas en la recuperación de información, y pueden completar una serie de tareas ineficientes y repetitivas en forma de diálogo.Otras herramientas de escritura también incluyen Notion AI , Tencent Wenyong, escritura inteligente WPS, etc.
En el campo de la generación de imágenes, AIGC también ha subvertido y remodelado el método de dibujo anterior. "Yiwen Shengtu" proporciona a los creadores diferentes estilos y fuentes infinitas de inspiración, y ha desencadenado una revolución en la productividad en el campo del diseño. Herramientas como Midjourney y DALL-E continúan expandiendo los límites de la imaginación de las personas.
En el campo del audio y el video, la IA puede generar audio y video de acuerdo con estilos preestablecidos mediante el análisis de datos de origen masivos, lo que no solo acorta el ciclo de creación, sino que también supera las limitaciones del espacio físico y el tiempo. Las herramientas de uso común incluyen Xunfei Hearing, MusicLM, Runway Gen-2, etc.
Además de los escenarios de aplicación anteriores, también hay más escenarios subdivididos, como oficina colaborativa, aprendizaje de idiomas, transmisión en vivo de comercio electrónico, programación e ídolos virtuales humanos digitales.La tecnología AIGC se puede utilizar desde el nivel técnico con un bajo costo marginal y alta eficiencia Manera de satisfacer las necesidades individuales de los usuarios.
Lo que más vale la pena mencionar es que en la era actual de información de phishing y noticias falsas que inundan las páginas, para distinguir el contenido AIGC del contenido real, NetEase y People's Daily Online han lanzado sucesivamente herramientas de detección de contenido AIGC para controlar los riesgos del contenido. También existen herramientas relacionadas con la detección de contenido AIGC en el extranjero, como Copyleaks, que se especializa en la detección de plagio de texto, y DetectGPT, un asistente de verificación de plagio para artículos.
**Este artículo interpreta más de 100 herramientas AIGC de las siete secciones y adjunta enlaces web para ayudar a los usuarios a mejorar la productividad laboral. **En realidad, las herramientas AIGC en el país y en el extranjero surgen como hongos todos los días, por lo que las 100 herramientas AIGC incluidas en este artículo no cubren completamente la industria, pero esperamos brindar alguna referencia para la industria en términos de categorías y direcciones. .
01. Herramientas de escritura AIGC: escritura con un solo clic
Adecuado para escenas de la vida o de la oficina.
La generación de texto es una de las primeras tecnologías comerciales de AIGC y también es la tecnología más madura que AIGC ha desarrollado hasta el momento. Hoy, las herramientas de escritura de IA han dado un salto cualitativo en la capacidad de comprender el contexto, capturar el conocimiento del sentido común, generar textos largos y contenido completo, preciso y lógico. .
Los principales escenarios de aterrizaje de las herramientas de escritura de IA se pueden dividir aproximadamente en las siguientes tres categorías:
Notion AI es un asistente de escritura cuyas funciones principales incluyen escribir, editar, resumir, etc. Puede generar automáticamente publicaciones de blog, calendarios de reuniones, redacción de textos publicitarios para redes sociales, comunicados de prensa, correos electrónicos de ventas y poesía para satisfacer las necesidades de diferentes escenarios. Los usuarios pueden dejar que Notion AI procese el primer borrador de un artículo para obtener más ideas para escribir, o utilizarlo como editor para revisar la ortografía, la gramática y los errores de traducción.
Actualmente, la herramienta adopta el modelo de "prueba gratuita + pago", que brinda a cada nuevo usuario 20 oportunidades de prueba gratuitas y, una vez que se agota la cantidad de veces, debe comprar el servicio. El precio es de 10 dólares estadounidenses por persona y mes. , que equivale a 68,9 yuanes.
Wenxinyiyan es un robot de chat desarrollado por Baidu. Sus funciones principales incluyen el diálogo y la interacción con los usuarios, responder preguntas y ayudar en la creación, etc., para ayudar a los usuarios a obtener información, conocimiento e inspiración creativa. Los escenarios de uso incluyen creación literaria, negocios redacción, matemáticas y ciencias, cálculo, interpretación de chino, generación multimodal, etc.
Además de la redacción publicitaria, las ventajas de Wenxinyiyan incluyen la capacidad de crear imágenes y la capacidad de generar videos automáticamente basados en la redacción publicitaria.
Tongyi Qianwen es un modelo de desarrollo propio a gran escala de Alibaba Cloud. Actualmente está equipado con 9 aplicaciones, que se dividen principalmente en eficiencia, vida y entretenimiento.
(1) Categoría de eficiencia, incluidas tres aplicaciones: redacción de esquemas, análisis FODA y generación de descripción de productos;
(2) Categoría de vida, incluidas tres aplicaciones: "Recetas voladoras", "Composición de la escuela primaria" y "Y luego";
(3) Categoría de entretenimiento, que incluye "Rainbow Fart Expert", "Escribe cartas de amor" y "Escribe poemas para ti".
En la actualidad, las funciones principales de Tongyi Qianwen incluyen redacción, diálogo y chat, preguntas y respuestas de conocimiento, razonamiento lógico, escritura de código, resumen de texto y servicios de comprensión de imágenes y videos.
Xunfei Spark es un modelo grande lanzado por iFLYTEK el 6 de mayo. Tiene siete dimensiones de generación de texto, comprensión del lenguaje, preguntas y respuestas de conocimiento, razonamiento lógico, matemáticas, código y multimodalidad. Después de la evaluación y comparación, se encuentra que Ha superado a ChatGPT en comprensión del lenguaje y capacidad matemática.
Xunfei Xinghuo puede completar la generación de texto largo de varios estilos, varios idiomas y varias tareas, y también puede realizar la detección de gramática y la corrección de errores en la redacción en inglés, y su capacidad de comprensión del idioma no es inferior a los sistemas existentes que se pueden medir en China.
Enlaces web:
El gran modelo de lenguaje "Sequence Monkey" lanzado por la compañía de inteligencia artificial Mobvoi, su sistema de capacidades toma el lenguaje como núcleo y cubre seis dimensiones de "conocimiento, diálogo, matemáticas, lógica, razonamiento y planificación". Puede admitir texto simultáneamente generación, generación de imágenes, diferentes tareas como generación de contenido 3D, generación de voz y reconocimiento de voz.
Sequence Monkey ya tiene cierta capacidad de comprensión, conocimiento, lógica y razonamiento del lenguaje natural. Por ejemplo, "¿Qué capital provincial tiene la población más grande, Hunan o Hubei?", "¿De qué escuela se graduó el fundador de la compañía detrás de Tmall?", Etc. Ha sido capaz de dar rápidamente resultados precisos para esas preguntas que requieren una reflexión más profunda.
openapi.mobvoi.com
Wenyong Effidit (Edición eficiente e inteligente) es un asistente de escritura inteligente desarrollado por Tencent AI Lab. Utiliza tecnología de IA para ayudar a los escritores a divergir ideas, enriquecer expresiones y mejorar la eficiencia de la edición y escritura de texto. Sus funciones incluyen corrección inteligente de errores, finalización de texto, reescritura de texto, expansión de texto, recomendación de palabras, recomendación de oraciones, generación y otras funciones.
Es una herramienta de procesamiento de redacción desarrollada por el equipo de investigación de la Universidad de Tsinghua. Utiliza la IA y la tecnología de procesamiento de lenguaje natural (NLP) más avanzadas para ayudar a las personas a procesar la lectura, la escritura, la búsqueda de redacción y las citas famosas de manera más conveniente y rápida. .
Los usuarios solo necesitan ingresar el vocabulario del tema relevante, y pueden encontrar dichos famosos, poemas, dichos, modismos, etc.
El equipo de investigación de la Universidad de Tsinghua desarrolló el diccionario inverso y la búsqueda de oraciones por significado. Pueden ayudar a encontrar sinónimos más apropiados y vívidos a través de las palabras dadas, y también admiten la traducción simultánea y mutua entre chino e inglés.
Xiliu es un software de gestión del conocimiento y de oficina colaborativa que se enfoca en brindar servicios para pequeñas organizaciones e individuos. Integra múltiples funciones como escribir documentos, almacenar conocimiento, tablas multidimensionales y mapas mentales en una sola plataforma. Sus usuarios son estudiantes universitarios. El grupo es el grupo principal y representa más de 1/3 del número total de usuarios.
FlowUS también se ha adaptado a ChatGPT. Los usuarios pueden usar FlowUS AI para realizar la escritura, la continuación de la escritura, la traducción, el pulido y otras funciones según sus propias necesidades.
WPS Smart Writing es un producto de escritura inteligente lanzado por Kingsoft Office para ayudar a los usuarios a crear de manera eficiente. Incluye principalmente cuatro funciones: generación automática de texto, redacción de borradores auxiliares, complemento inteligente de oraciones y revisión inteligente de textos.
Sus datos de texto e información relacionada provienen de medios autorizados y sitios web públicos del gobierno. El tema cubre varios escenarios de escritura, como discursos, resúmenes, planes, noticias, etc., y está conectado con documentos de Jinshan, que pueden realizar la carga simultánea de Textos a la nube Después de escribir en línea, los usuarios pueden ir a Kingsoft Documents para realizar una edición de documentos más profesional, como la composición tipográfica.
La herramienta de revisión ortográfica en inglés Grammarly también lanzó el servicio de inteligencia artificial GrammarlyGo, que puede generar borradores de correo electrónico en función de las indicaciones de palabras clave ingresadas por los usuarios, o ayudar a los artículos existentes a cambiar el tono y el estilo del texto, ajustar la longitud de los artículos, etc., y redactar esquemas para la redacción de temas.
Volcano Writing es un asistente de escritura lanzado por ByteDance. Actualmente es compatible con los servicios de escritura inteligente de IA para la edición de texto completo. Ya sea para revisar documentos, pulir currículos, escribir documentos de solicitud para estudiar en el extranjero, escribir auto-redacción de medios, etc. Más de 20 escenarios de escritura, Volcano Writing se puede cubrir.
El usuario ingresa el contenido de texto que desea pulir y modificar, y después de hacer clic en "optimización con un clic", puede identificar automáticamente el tipo de texto, el estilo y el propósito de escritura. El usuario también puede ajustar el alcance de la modificación y la plataforma. puede generarlo basado en el texto original con un solo clic. El resultado de la reescritura en inglés también es compatible con funciones de inteligencia artificial, como la corrección inteligente de errores y varias reescrituras, lo que hace que la expresión del idioma sea más auténtica y concisa.
Zhishi Q&A es un sistema inteligente de preguntas y respuestas basado en tecnología de IA. Los usuarios pueden ingresar preguntas en la plataforma Zhishi Q&A, y el sistema analizará automáticamente las preguntas y dará la mejor respuesta. Al mismo tiempo, también proporciona una variedad de métodos interactivos, que incluyen entrada de texto, entrada de voz, etc., para satisfacer las necesidades de diferentes usuarios.
Además de las herramientas de escritura AIGC familiares anteriores, todavía hay muchos "productos impopulares" que esperan la experiencia del usuario, como Friday AI Writing Assistant, Love Rewrite, Claude, Creator, Secret Tower Writing Cat, Subtxt, Writesonic, etc.
02. Herramienta de imagen AIGC: el mapa de Vincent es más que Midjourney
Libertad para pintar con un clic
Se puede decir que 2022 será el "primer año de la pintura de IA". Una variedad de herramientas de pintura de IA han demostrado una buena capacidad de comprensión y generación de imágenes con la ayuda de indicaciones de texto.
Con la ayuda de GPT-4, también se ha desencadenado una nueva ola de competencia en el campo del "mapa Vincent". Midjourney, que se ha actualizado a la versión V5, es popular en todo Internet con un grupo de fotos de pareja. Adobe, el líder en la industria del diseño, no se queda atrás. Se apresuró a lanzar "Adobe Firefly" para competir. mayoría de los trabajadores del diseño. Las herramientas de imagen de IA de hoy son más maduras y más variadas en términos de comercialización y arte que el año pasado.
Los escenarios técnicos de las herramientas de imagen se pueden dividir en tres tipos: generación de imágenes, modificación parcial de imágenes y edición de imágenes.
El segundo es la edición de imágenes. Las funciones principales incluyen la eliminación inteligente de marcas de agua de imágenes, la configuración de filtros de estilo, la modificación del estilo de imagen o la mejora de la claridad de la imagen, etc., representadas por productos como Imagen AI y Chuangketie AI Painter.
El tercero es la modificación parcial de la imagen, el producto representativo es Adobe Firefly. Su principal ventaja se centra en cambiar algunos elementos de la imagen, o modificar y ajustar capa por capa, lo cual es adecuado para la creación secundaria o la mejora de la postproducción.
Disco Diffusion es un programa de dibujo que se ejecuta en Google Colab. Los usuarios con una cuenta de Google pueden ejecutarlo directamente en el navegador, pero los usuarios deben tener ciertos conocimientos de código.
Después de que el usuario ingresa una oración de descripción, el programa puede representar y generar automáticamente una imagen de la escena correspondiente. Es mejor para generar imágenes abstractas con un estilo más soñador, y el efecto es promedio cuando genera representaciones realistas e ingresa más descripciones de texto.
Enlaces web:
Midjourney es un chatbot de pintura de IA lanzado por uno de los autores de Disco Diffusion, que se transmite en Discord. Después del lanzamiento de GPT-4, también cambió rápidamente a la versión V5. La nueva versión es más refinada en términos de fidelidad de imagen y procesamiento de detalles, y tiene un mayor nivel de comercialización, llegando casi al punto en que puede "disfrazar lo real".
En la versión anterior, el estilo de las imágenes generadas era principalmente de dibujos animados o surrealista, y había pocas imágenes realistas.Después de actualizar a la versión V5, Midjourney rápidamente se hizo popular con un grupo de fotos de parejas que eran difíciles de distinguir entre verdaderas y falsas. , y ha alcanzado La textura de la película es más realista en términos de primeros planos de manos, primeros planos de ojos y procesamiento de luces y sombras.
Además, en Midjourney V5, los usuarios pueden personalizar la relación de aspecto. Al ingresar el texto de la descripción, se requieren adjetivos más detallados y detalles de la imagen, como el estado de ánimo, el estilo y la luz y la sombra. Esto requiere que los usuarios tengan un control más activo sobre las imágenes y más claras. imaginación.
Stable Diffusion es un generador de imágenes de IA gratuito y de código abierto. Actualmente, la última versión de Stable Diffusion XL ha sido probada para el público.
En comparación con la versión anterior, los usuarios del nuevo SD-XL solo necesitan usar una descripción más corta para generar imágenes. La estructura del cuerpo humano y el procesamiento de detalles de las imágenes son más realistas y están más en línea con la estética del público. Los retratos generados son también más claro y más realista. .
DALL-E 2 es una herramienta de generación y edición de imágenes lanzada por OpenAI, famosa por su excelente efecto de generación y color artístico. El usuario solo necesita ingresar un resumen, y puede sintetizar los tres elementos de concepto, atributo y estilo, y generar una imagen realista que satisfaga las necesidades del usuario y, al mismo tiempo, también puede tener los estilos de pintura de diferentes artistas.
Por ejemplo, el usuario ingresa tres elementos: el concepto "un cachorro", el atributo "sobre la hierba" y el estilo "estilo del artista pop Andy Warhol", y puede producir imágenes que cumplan con estas tres condiciones. Las características de la herramienta también incluyen edición de imágenes, transformación de estilo y más.
Imagen AI es una herramienta de IA de texto a imagen desarrollada por Google. Puede generar fotografías de retratos, pinturas al óleo, representaciones CGI y otras imágenes de acuerdo con las indicaciones escritas del usuario. Las imágenes tienen un sentido más fuerte de la realidad y una mayor precisión en la comprensión del lenguaje. .
Enlaces web:
Adobe Firefly es una herramienta de dibujo de IA lanzada por Adobe y Nvidia. Actualmente, se ha dado cuenta de las funciones de generar imágenes a partir de texto, convertir bocetos en imágenes y modificar el contenido de la imagen con un solo clic. También puede modificar las imágenes generadas automáticamente en capas y Imagen de tasa de resolución ultra alta de salida.
Wenxin Yige es un producto de pintura de IA lanzado por Baidu que se basa en la paleta voladora y la tecnología de modelo grande de Wenxin. Los usuarios solo necesitan ingresar su propio texto creativo y elegir el estilo de imagen deseado para obtener una pintura generada por Wenxinyige. También pueden elegir el tipo de imagen, la relación de imagen y la cantidad de imágenes generadas a la vez. En la actualidad, Wenxin Yige admite más de diez estilos diferentes de imágenes, como pintura al óleo, acuarela, animación y realismo.
Enlaces web:
Luban es un producto de diseño de imágenes desarrollado de forma independiente por Alibaba Intelligent Design Lab. Basado en la tecnología de generación de imágenes de IA, Luban puede completar el diseño de una gran cantidad de imágenes de pancartas, carteles e imágenes de lugares en poco tiempo. Los usuarios solo necesitan ingresar el estilo y el tamaño que desean lograr, y Luban puede reemplazar los proyectos de diseño que consumen mucho tiempo y mano de obra, como el análisis de materiales, el recorte y la combinación de colores manualmente, y generar múltiples conjuntos de soluciones de diseño que cumplen con los requisitos. requerimientos en tiempo real.
Durante la promoción "Doble 11" en 2017, Luban generó 8000 carteles por segundo, durante los cuales se produjeron un total de 400 millones de carteles de productos, lo que refrescó la comprensión de las personas sobre las capacidades de dibujo de la IA.
Chuangketie, una plataforma de diseño empresarial, lanzó un producto de pintura de inteligencia artificial, AI Painter, y lanzó dos escenarios funcionales de uso común, "Wen Sheng Tu" y "Tu Sheng Man".
En el escenario "Wen Sheng Tu", los usuarios solo necesitan ingresar el texto simple requerido, seleccionar el estilo de pintura que desean y la imagen de destino se puede generar con un clic. Los estilos existentes incluyen estilo antiguo, pintura al óleo, pintura en color, cómics. , GC, etc
En el escenario "Picture Man", los usuarios solo necesitan cargar la imagen de destino e ingresar instrucciones de texto simples para obtener una imagen pintada a mano personalizada. Sus funciones también incluyen detección de bordes, coloreado de borrador de línea y detección de pose. Función.
03. Herramientas de audio AIGC: sonido variable, clonación, reducción de ruido
Además de los escenarios de aplicación como texto e imágenes, el audio también es un escenario de aplicación en el que tenemos una amplia gama de contactos en nuestra vida diaria. El cambio de voz humana, la síntesis de voz y la clonación en videos cortos son las tecnologías de investigación populares de AIGC en el campo del audio, que incluyen animación, películas y doblaje de personajes en juegos, que ahora puede realizar AI. Empresas tecnológicas como Microsoft y Google también han lanzado sus propios servicios Text-to-Speech (texto a voz).
Las herramientas de audio de IA se pueden dividir en dos tipos según diferentes atributos funcionales: una son las herramientas de procesamiento de sonido representadas por So-Vits-Svc, Adobe Podcast AI Voice, Magic Sound Workshop, etc., que utilizan tecnología de IA para reparar el sonido y mejorar el audio. calidad O convertir timbre, etc.; el segundo son las herramientas de producción musical representadas por MusicLM, Netease Tianyin, Aiva, etc., que pueden realizar la función de "texto a música" en campos más subdivididos.
"AI Stefanie Sun" se hizo popular en Internet de la noche a la mañana. Canciones como "Hair Like Snow" y "Rainy Day" "cover" hechas por ella se han reproducido más de un millón de veces en Bilibili, y los propietarios de UP pasan estas canciones. Realizado por el proyecto de código abierto So-Vits-Svc.
Además de simular las voces de cantantes conocidos, también puede simular una gran cantidad de voces reales a partir de grabaciones telefónicas, videos y otros materiales.Anteriormente, algunos dueños de UP usaban este modelo para comunicarse con los fallecidos. Sin embargo, debido al creciente abuso del proyecto, el autor lo eliminó.
Adobe Podcast AI Voice es un potenciador de audio impulsado por IA de Adobe que utiliza IA para mejorar la calidad de las grabaciones de audio de los blogs.
Después de que el usuario inicie sesión en la cuenta de Adobe, cargue el archivo de audio que necesita procesamiento de reducción de ruido, AI procesará automáticamente el archivo de audio y, una vez que se logre el efecto de reproducción de audio satisfactorio, el usuario puede descargarlo directamente a la computadora para uso gratuito .
MusicLM es un verdadero modelo de IA generativa lanzado por Google. A través de este modelo, la música de alta fidelidad se puede generar directamente a partir del texto. Además del texto, ya sea tarareando, cantando, percusionando, interpretando instrumentos, etc., MusicLM puede crear música basada en estas melodías existentes y garantizar que la música no se distorsione.
Además, también puede generar piezas tocadas por instrumentos específicos, e incluso se puede establecer el nivel de interpretación de los intérpretes.También puede crear música de acuerdo con las características de la época y el lugar donde se ejecuta.Música popular tocada por un órgano junto al mar".
MusicLM se entrena en una base de datos de música de hasta 280.000 horas, sin importar el estilo o la emoción de la canción.
Enlaces web:
Xunfei Hearing es un producto de voz inteligente de iFLYTEK, que se basa en el procesamiento del lenguaje natural, el reconocimiento de voz y el reconocimiento de voz y otras tecnologías de voz de iFLYTEK. iFLYTEK Hearing puede satisfacer las necesidades de voz de los usuarios en varios escenarios. Los escenarios aplicables cubren diferentes ocasiones, como actas de reuniones, conferencias, entrevistas con los medios y escritos personales.
Sus funciones ventajosas también incluyen agregar subtítulos bilingües a videos, interpretación simultánea multilingüe y generar subtítulos para videoconferencias, etc., para ayudar a los usuarios a superar las barreras del idioma y facilitar la comunicación y la colaboración.
Netease Tianyin es un sistema de creación de música con arreglos de IA producido por Netease, que puede crear música de IA en línea. Su mayor ventaja es que el umbral para la creación de música es bajo y los usuarios pueden completar un arreglo musical original de acuerdo con las pautas en un corto período de tiempo.
El banco de trabajo de Tianyin incluye una serie de estilos musicales específicos, incluidos pop, folk, electrónica, estilo nacional, etc. canción agregando, restando, copiando, ajustando párrafos, etc. Después de completar toda la edición, se procesará automáticamente y podrá obtener un arreglo original creado por usted mismo después de una breve espera.
Moyin Workshop es un producto de la serie de voz de IA lanzado por la compañía de IA Going out to ask. Los usuarios pueden usar de manera eficiente y conveniente la tecnología de voz de IA para simular la voz de una persona real con características personales, crear contenido de audio de IA y convertir texto en una persona real con una clic voz.
El usuario importa rápidamente el artículo que se va a sintetizar en sonido en la interfaz y realiza la edición en línea a través de una página de operación similar al documento, de modo que el documento se puede convertir en audio de manera conveniente. Las funciones en la página de edición incluyen: marcado de énfasis, caracteres multifonéticos, marcado propenso a errores tipográficos, adición de sonido de fondo, doblaje mixto de varias personas, velocidad variable, ritmo y muchas otras funciones.
Para los usuarios a los que les gusta la tecnología, las finanzas y otros campos, Moyin Workshop también ha agregado modelos de voz de IA de directores ejecutivos de muchas empresas relacionadas en segundo plano, para que los usuarios que estén familiarizados con ellos puedan usar sus voces para producir contenido de audio.
FakeYou es una herramienta de edición de audio de texto a voz que utiliza tecnología de falsificación profunda para generar texto a voz en diferentes idiomas y voces. Los usuarios pueden usar las voces de sus personajes favoritos para crear audio, y también proporciona texto AI -a las funciones del habla.
Cuando el usuario ingresa un fragmento de texto para generar y elige quién quiere leer el texto, y luego hace clic en el botón "hablar", se genera automáticamente una voz "hablada" por la persona objetivo.
LyricStudio es un creador de letras en línea que ayuda a los usuarios a generar una letra original que imita su propio estilo y encuentra una rima para una palabra específica. Los usuarios pueden cargar una descripción de texto o un clip musical, y lo convierte en letras que coinciden con el contenido.
Según datos de su web oficial, la herramienta ha colaborado para crear más de 1 millón de canciones, y el 15% de los usuarios de la plataforma son productores musicales profesionales. LyricStudio ayudó al rapero Curtiss King a escribir las letras del álbum número 1 en iTunes.
Enlaces web:
LALAL.AI es una herramienta de separación de música en línea que puede segmentar y extraer voces e instrumentos de la música.
Su tecnología de separación de música en línea se basa completamente en aprendizaje automático e inteligencia artificial. Antes de la versión anterior, solo podía separar voces humanas. Ahora puede extraer con precisión voces humanas, guitarras eléctricas, guitarras acústicas, pianos y baterías de archivos de audio y video. ., bajo y muchos otros instrumentos.
Aiva es una herramienta de música de IA con el mismo nombre desarrollada por la compañía de música de IA "Aiva". Los usuarios pueden ayudar a los músicos a producir y escribir música original a través de la tecnología de IA. La plataforma cubre una variedad de estilos diferentes, como música clásica , rock, música electrónica, pop, estilo nacional, Blues, hip hop, etc. En la página de composición automática, hay 11 géneros para que los usuarios elijan, incluida la melodía de la armadura de clave, el ritmo de la armadura de tiempo, la frecuencia de ritmo, la instrumentación, la duración, etc.
Aiva también estudió las obras representativas y los estilos musicales de Mozart, Bach, Beethoven y otros músicos a través del aprendizaje profundo y estableció un modelo de aprendizaje basado en estas características musicales para ayudar a los músicos a crear música. Al mismo tiempo, Aiva también es el primer compositor certificado por IA de la historia y ha publicado 5 álbumes.
Enlaces web:
Supertone es un estudio de sonido creativo de IA en Corea del Sur que proporciona síntesis de voz y tecnología de mejora del habla en tiempo real para ayudar a los usuarios a crear fácilmente varios tipos de contenido de sonido, incluida la lectura de texto simple para obras de arte, canciones, etc., lo que permite a los usuarios cambiar sus voces y otras formas Para aliviar las preocupaciones sobre problemas de información personal.
Supertone también ofrece una tecnología llamada "VoicePrint", que convierte la voz de un usuario en una huella digital que la distingue de las voces de otros usuarios.
Enlaces web:
04. Herramienta de video AIGC: la edición automática y la generación de funciones de guión gráfico están aquí
Los gráficos de Vincent ahora se han convertido en la principal tecnología AIGC, pero la generación de texto a video aún está en pañales.
La startup de inteligencia artificial con sede en Nueva York, Runway, ha desarrollado un modelo de video generativo Gen-2, que puede generar un video altamente compuesto a partir de una descripción simple. También se han sumado otras empresas, como Text2Video-Zero, Video-P2P y TemporalNet lanzadas por la plataforma de edición de imágenes PiscArt, y Text-to-video desarrollada por Ali.El video generado por texto también puede entrar en una feroz competencia en un futuro cercano. .etapa
Deepfakes ahora es sinónimo de videos sintetizados por IA. Microsoft lanzó FaceShifter, que puede procesar una imagen original borrosa en una imagen falsa clara y creíble; Disney y ETH Zurich desarrollaron y lanzaron conjuntamente una herramienta de producción de video Deepfakes a nivel de megapíxeles, y en la serie "Star Wars" en la película, Deepfakes fueron solía traer a los actores fallecidos a la pantalla grande.
Sin embargo, los riesgos de seguridad causados por esto también han venido uno tras otro: para algunos videos de alta definición y luz extremadamente natural, incluso el algoritmo Deppfakes más sofisticado no puede identificarlos con precisión.
Como resultado, ya en las elecciones estadounidenses de 2020, Facebook anunció una prohibición total del uso de Deepfakes en la plataforma, y YouTube y TikTok no fueron la excepción, ya que prohibieron explícitamente el uso ilegal de la tecnología Deepfakes en los videos. El "Código Civil" que se implementará en mi país en 2021 también señala que las principales plataformas de video deben restringir estrictamente el contenido de los videos que cambian la cara de la IA, y no deben usarse a voluntad sin permiso.
Gen-2 es un modelo de Transformer de extremo a extremo lanzado por la empresa emergente Runway. Los usuarios pueden usar imágenes y texto como condiciones para generar un video original de estilo lento desde cero.
La resolución de video que genera es tan alta como 1280 × 720, y la duración es de aproximadamente 30-60 segundos. Actualmente, se pueden realizar las siguientes funciones: generar video, generar imágenes, expandir imágenes sin límite de acuerdo con las indicaciones de texto, mezclar estilos de imagen , entrenar modelos de IA, eliminar un elemento del video, restar el fondo, etc.
Recientemente, Runway lanzó su primera aplicación móvil, utilizando el modelo Gen-1, los usuarios pueden cargar texto, imágenes o videos en el teléfono móvil y dejar que el modelo transforme el estilo del video según el contenido.
Enlaces web:
En septiembre de 2022, Meta lanzó su propio software de texto a video "Make-A-Video". Después de que el usuario ingrese algunas descripciones de palabras simples, el software creará un video silencioso.
En el video de demostración oficial, el usuario puede obtener un video de unos segundos ingresando descripciones de texto como "una pareja joven caminando bajo la lluvia intensa" y "un oso de peluche que ha estado pintando un retrato". Además, Make-A-Video también puede animar imágenes estáticas, que se basa en la tecnología del "diagrama de Vincent".
Según el funcionario, el modelo se entrena utilizando datos de síntesis de imágenes y videos sin etiquetar. Después de aprender, el modelo puede "predecir" lo que sucederá junto a la imagen, dónde se moverá y se moverá hacia donde estará la imagen en un muy tiempo corto La ubicación donde aparece para formar un video corto.
Enlaces web:
SenseTime ha lanzado una plataforma integral de publicidad y marketing para SenseTime, que incluye el motor de creación de videos cortos "SenseTime", que puede generar videos cortos creativos con un solo clic, incluida la generación de guiones, reemplazo de fondo, reemplazo de pantalla horizontal y vertical y subtítulos. generación Una variedad de servicios para la producción de publicidad en video puede ayudar a los anunciantes a ahorrar el costo de la producción de contenido publicitario.
El servicio "Análisis de elementos de video" incluido en SenseTime puede analizar y extraer información como la duración, la escena, la escena, el personaje, los accesorios y las líneas de cada toma en un video corto a través de la tecnología de estructuración de video AI, y crear automáticamente un guión de toma en gran medida. reduce el tiempo de redacción de guiones y ayuda eficazmente a los creadores en la creación secundaria.
Además, la plataforma también proporciona una gran cantidad de guiones de video populares para brindar inspiración creativa a los creadores.
Enlaces web:
Decoherence es una herramienta para crear videos de IA donde los usuarios pueden elegir entre una variedad de estilos de IA.
Enlaces web:
"Tencent Zhiying" está dirigido principalmente a creadores de videos cortos, y sus funciones destacadas son materiales genuinos con derechos de autor y transmisiones humanas digitales. Los usuarios pueden generar un video humano digital cargando fotos y texto. Los usuarios también pueden usarlo con la función de doblaje inteligente de IA para elegir diferentes timbres para humanos digitales.
Enlaces web:
05. Herramientas de oficina AIGC: AI+OA realiza un clic "desde cero"
El 17 de marzo, Microsoft lanzó oficialmente Microsoft 365 Copilot, que integra las capacidades de GPT-4 y ChatGPT en las herramientas de Office, y lanzó la función Business Chat que integra los datos de Office 365, lo que mejora el nivel de la oficina digital y evita que los empleados sean ineficientes, liberados. del trabajo repetitivo.
Kingsoft Office, como empresa líder en el campo de la oficina colaborativa doméstica, también lanzó una plataforma de oficina generativa "WPS AI" con grandes capacidades de modelo de lenguaje en solo un mes, convirtiéndose en la primera aplicación similar a ChatGPT en la pista de la oficina colaborativa doméstica. Además, empresas como Baidu, ByteDance y DingTalk han lanzado sucesivamente sus propias herramientas de oficina colaborativas de IA.
El sistema de aplicación OA (Automatización de la Oficina) se ha desarrollado y madurado gradualmente. Como un puente que conecta a los empleados y las empresas, puede convertirse en la entrada del gran modelo de lenguaje en la ecología B-end en el futuro.
Además del campo de la oficina colaborativa, las herramientas de IA también pueden aplicarse en escenarios más verticales y combinarse con necesidades más prácticas. Por ejemplo, "IA + aprendizaje de idiomas" tiene DuolinguoMax, y "AI + entrega de comercio electrónico" ha creado un versión inteligente de comercio electrónico Sitio web de comercio electrónico Shopify, herramienta de marketing de comercio electrónico eCommerce s, etc. con una descripción de la oración.
Microsoft 365 Coplilot siguió a GPT-4 en la madrugada del 17 de marzo, y todo el software de oficina, incluidos Word, Excel, Powerpoint, Outlook, Teams, etc., se lanzó con funciones de IA generativa.
En Word, Copilot solo necesita un aviso simple para crear un primer borrador, y también puede ajustar el tono del artículo según las necesidades del usuario, como profesional y serio, entusiasta e informal, etc., y puede eliminar automáticamente el mismo lugar. en el artículo , para una mayor simplificación.
Copillot en Excel puede ayudar a los usuarios a analizar datos, analizar directamente tendencias de datos y visualizar resultados de análisis de datos.
Lo que es aún más sorprendente es que Powerpoint ya puede generar directamente un PPT y Copilot puede convertir directamente un documento existente en un PPT con fuentes marcadas. Si los usuarios sienten que el PPT es demasiado largo, pueden usar directamente la descripción del texto para comprimir, ajustar el diseño o formatear el texto con un solo clic.
Copilot en Outlook puede ayudar a los usuarios a clasificar los correos electrónicos de acuerdo con ciertos criterios, resumir y refinar el tema de los correos electrónicos extensos y transcribir varias palabras clave o borradores en correos electrónicos oficiales.
Google Workspace es un banco de trabajo de Google que incluye herramientas de oficina como Docs, Slides, Sheet y Gmail. Google anunció en marzo que integrará IA en estos componentes de herramientas. Después de acceder al modelo generativo de IA, los usuarios podrán crear un correo electrónico completo, un plan de negocios o una hoja de tarifas de marketing publicitario con la ayuda de estas herramientas ingresando una breve descripción de texto.
En Docs, la IA generativa puede ayudar a los usuarios a redactar el primer borrador del texto, pulir y revisar el texto, revisar y corregir errores; Gmail puede responder y resumir correos electrónicos, marcar asuntos importantes, etc.; Presentaciones puede generar automáticamente imágenes, audio y video según el tema e insertarlos en la plantilla; Sheet puede realizar automáticamente el procesamiento de datos, la clasificación de tablas, la clasificación de contexto e incluso el análisis de datos sin procesar.
En la actualidad, Google adopta un plan de pago flexible, que se divide en la versión empresarial básica para principiantes, la versión empresarial estándar y la versión empresarial Plus, lo que permite a los usuarios suscribirse de acuerdo con sus necesidades reales.
Baidu Ruliu lanzó la "Plataforma de trabajo inteligente Ruliu 2.0" para el mercado de servicios empresariales a fines del año pasado, que incluye tres matrices de productos inteligentes: gestión inteligente del conocimiento, conferencia inteligente y banco de trabajo inteligente.
En la gestión inteligente del conocimiento, hay tres aplicaciones de gestión del conocimiento de "base de conocimiento inteligente", "motor dual de búsqueda y recomendación" y "cadena de estrella del conocimiento", que reúnen documentos, correos electrónicos, notas y otros archivos dispersos en un solo lugar, los empleados pueden encontrar los documentos y conocimientos requeridos de la manera más conveniente.
Se recopilan diferentes tarjetas de trabajo en el banco de trabajo inteligente para que el sistema de tareas sea más flexible y claro, y se combinan diferentes tarjetas de trabajo según los empleados en diferentes puestos. Por ejemplo, el banco de trabajo de recursos humanos está integrado con tarjetas de trabajo para asistentes de entrevistas y módulos de gestión de contratación; el banco de trabajo del gerente incluye tarjetas de trabajo tridimensionales para el seguimiento de la eficiencia, el análisis colaborativo y la gestión de procesos, proporcionando a los gerentes datos de tareas del equipo.
Enlaces web:
Una semana después del lanzamiento del modelo a gran escala de Tongyi Qianwen, DingTalk anunció su acceso oficial. Después de acceder al modelo grande de Qianwen, los usuarios solo necesitan usar una barra inclinada "/" para realizar un trabajo de oficina inteligente. Los principales escenarios de uso incluyen chat grupal, documentos, videoconferencia y desarrollo de subprogramas.
En el chat grupal, los nuevos participantes solo necesitan ingresar "/" en el cuadro de diálogo para obtener los puntos contextuales del chat grupal, y la barra inclinada también puede generar tareas pendientes, programar citas y hacer emoticones para reuniones importantes.
En un chat uno a uno, los usuarios pueden usar directamente barras oblicuas para crear un chatbot que le permita aprender automáticamente el conocimiento y responder preguntas.
En documentos, slash puede generar automáticamente textos publicitarios y carteles en varios estilos; en videoconferencias, slash puede resumir puntos de encuentro, tareas pendientes, etc. con un solo clic.
Además, la función más inesperada de slash es generar pequeños programas en lenguaje natural y usarlos en el grupo en forma de "Dingding cool application".
El mismo día que DingTalk anunció el acceso al modelo grande y el lanzamiento del asistente de oficina inteligente "/", Kingsoft Office, una empresa líder en software de oficina nacional, también anunció oficialmente el lanzamiento de "WPS AI". El gran modelo subyacente lo proporciona MiniMax, que actualmente incluye múltiples funciones, como generación de contenido, diálogo de múltiples rondas y optimización de contenido. En el futuro, puede evolucionar hacia la versión doméstica de "Microsoft 365 Coplilot" y estar completamente integrado en la suite WPS.
Enlaces web:
El 11 de abril, Feishu, la plataforma de oficina de ByteDance, también lanzó el asistente inteligente de IA "My AI". Sus funciones incluyen resumir automáticamente las actas de las reuniones, crear informes, continuar escribiendo y optimizar el contenido del texto, etc. En Feishu, My AI también puede ayudar a los usuarios a crear horarios y buscar en la base de conocimiento interna de la empresa a través del diálogo. Sin embargo, My AI todavía está en progreso y aún no se han anunciado la versión beta pública y el tiempo de lanzamiento.
El 1 de marzo, después de que ChatGPT anunciara la apertura de la API, la plataforma de servicios de comercio electrónico transfronterizo Shopify tomó la delantera en la integración. Después de integrar ChatGPT, Shopify puede usar el servicio de atención al cliente inteligente para comunicarse con los usuarios, ayudar a los consumidores a hacer recomendaciones personalizadas y ahorrar tiempo de compra; ChatGPT también lleva a cabo análisis de datos de revisión, optimización de títulos y palabras clave, redacción de textos publicitarios y programación inteligente de desarrollo de sitios web para productos de plataforma y muchas otras funciones para ayudar a mejorar la eficiencia operativa de los sitios web de comercio electrónico y optimizar la experiencia de compra del consumidor.
Enlaces web:
Enlaces web:
Después de que Microsoft lanzara la nueva versión del motor de búsqueda Bing, el navegador Edge y el cubo de la familia Office, su plataforma de alojamiento de código GitHub también lanzó Copilot X, que introdujo ChatGPT en el entorno de desarrollo integrado, incluso los usuarios con una base de código cero pueden confiar en "mueve la boca". "Escribe el código.
En GitHub Copilot Chat, los usuarios pueden enviarle instrucciones para escribir código en una ventana de chat, para aquellos códigos que se ejecutan de manera anormal, puede encontrar directamente el error (error) y modificarlo, en GitHub Copilot Voice, incluso se puede implementar. voz a código en un solo paso, el desarrollador habla directamente y da instrucciones en lenguaje natural, y puede generar códigos relevantes.
Además de las funciones anteriores, si el usuario no entiende una determinada línea de código, simplemente deje que Copilot le explique la función del código en el chat.
Enlaces web:
Enlaces web:
06. Herramientas de vida AIGC: cocinar, tomar notas, hacer guías de viaje
Deje que la IA se convierta en el administrador de la vida
Además de las herramientas de inteligencia artificial altamente aplicables, como la generación de texto y la edición de audio y video, han surgido varios productos AIGC nuevos en la vida diaria.
Por ejemplo, ChefGPT ayuda a generar recetas para usuarios que tienen dolor de cabeza todos los días, Dover Autopilot, una herramienta de reclutamiento de inteligencia artificial que proporciona currículos de talento de alta calidad para headhunters, BibiGPT, que puede tomar notas mientras ve videos, y Bedtime Story AI, que puede generar historias cortas antes de ir a la cama, WatchNow, que recomienda listas de películas por preferencia personal, etc., la vida completamente inteligente ya no es una trama solo en las películas de ciencia ficción, y la IA ha entrado de lleno en nuestra vida diaria.
¿El video es demasiado largo para resumir los puntos clave? ¿Demasiado apurado para tomar notas mientras ve un video? BibiGPT, un software de resumen de audio y video desarrollado en base a ChatGPT, resuelve bien estos problemas. Para videos en Bilibili y Youtube, BibiGPT puede resumir el contenido clave con un solo clic. Los usuarios solo necesitan pegar el enlace del video que visitaron en el cuadro de búsqueda y haga clic en " "Resumen de un clic", puede obtener una nota de resumen de video.
Enlaces web:
Dover Autopilot es una herramienta de contratación automatizada. Los reclutadores solo necesitan ingresar un enlace de descripción de trabajo simple, y puede encontrar solicitantes de empleo que coincidan con los requisitos laborales en minutos a través de fuentes de datos como LinkedIn y otros sitios web de búsqueda de empleo. También puede generar automáticamente correos electrónicos personalizados. para candidatos
Enlace web: dover.com/start
Esta es una herramienta de recomendación de recetas de IA, cuando el usuario ingresa los ingredientes existentes y las herramientas a mano, así como el tiempo de cocción reservado, puede recomendar una receta que satisfaga las necesidades.
Hay dos modos en la página, uno es el modo gourmet y el otro es el modo seleccionar todo. El modo gourmet tiene requisitos más altos para la autonomía del usuario, ya que requiere que los usuarios seleccionen ingredientes y utensilios de cocina antes de ingresarlos en la página web, mientras que el modo seleccionar todo es más amigable para los "noobs de la cocina" y puede obtener una copia que cumpla con los requisitos sin usando sus cerebros Recetas para necesidades reales.
Journeai es un asesor de viajes por chat basado en IA, que tiene como objetivo crear rutas de viaje personalizadas para los usuarios. Puede generar itinerarios de acuerdo con las preferencias del usuario, incluidos los arreglos de actividades y los socios de viaje. explorar.
Enlaces web:
Herramienta de detección de contenido AIGC: AIGC falsificado
Liderando el camino en la identificación de contenido
Con el desarrollo de la tecnología AIGC avanzando por la vía rápida, también ha causado una gran cantidad de información falsa, plagio de texto, fraude académico, disputas de derechos de autor y otros efectos adversos y eventos negativos relacionados. Las disputas de seguridad desconocidas son inevitables, lo que requiere el desarrollo de tecnologías relevantes para la detección y la detección.
Aunque actualmente no hay muchas herramientas de detección de contenido AIGC en el mercado, ya pueden distinguir con precisión el contenido AIGC, como texto generado, imágenes y sonidos, el sistema de detección de plagio CrossCheck, etc.
1, fugas de copia:
Copyleaks es actualmente una de las herramientas de detección de contenido de IA más populares en el mundo.La ventaja más destacada es que además de detectar contenido en inglés, también puede detectar contenido escrito en español, francés y otros idiomas. Para los textos generados por IA, Copyleaks puede lograr una precisión de reconocimiento del 99,99 %, pero para el contenido de texto que es medio verdadero o falso, lo marcará como texto generado artificialmente.
Enlaces web:
People.cn Information Technology Company, una subsidiaria de People's Daily, que se enfoca en el control de riesgos de contenido, ha desarrollado la primera herramienta de detección de contenido generado por IA en China, AIGC-X. Esta herramienta se puede usar para distinguir el texto generado por una máquina de Puede detectar y filtrar artificialmente fake news, plagio de contenidos, spam, etc., y especialmente dar soporte técnico en áreas grises como información falsa, fraude académico y phishing.
Sin embargo, AIGC-X actualmente solo admite la detección de contenido chino, y es necesario mejorar la capacidad de detección de contenido de imágenes, audio y video.
Enlaces web:
La herramienta de detección de muestra cero DetectGPT fue desarrollada por un equipo de investigación de la Universidad de Stanford en los Estados Unidos y se utiliza principalmente para combatir el fenómeno de generación de papel que es común en las universidades. Un artículo de investigación titulado "DetectGPT: Zero-Shot Machine-Generated Text Detection usando Probability Curvature" ha sido publicado en el sitio web de preimpresión arXiv.
Esta herramienta de detección propone un nuevo indicador para juzgar el texto generado por el modelo de lenguaje grande. Solo necesita escanear el contenido cargado en la página web para determinar si el contenido del texto se genera usando el modelo de lenguaje grande.
NetEase NetShield, basado en los años de experiencia de NetEase en la industria, proporciona modelos de comparación personalizados y soluciones de detección personalizadas para las características del spam de texto.El contenido desviado para terceros también se filtrará automáticamente.
Enlaces web:
Sumei utiliza un motor de reconocimiento de contenido inteligente de pila completa para identificar de manera efectiva la desviación de publicidad confidencial, prohibida, pornográfica, violenta, abusiva y otro contenido de texto riesgoso en varios escenarios, lo que ayuda a los usuarios a identificar aún más la información riesgosa. En la actualidad, Sumei ha podido detectar automáticamente 175 idiomas extranjeros y admite la identificación de etiquetas de riesgo en 18 idiomas principales, como inglés, árabe, tailandés e indonesio.
Conviértete en copiloto para creadores
La pista AIGC está repleta. Además de la escritura, la generación de imágenes, la edición de audio y video, los asistentes de oficina, la detección de contenido, etc., hay más subdivisiones que esperan ser exploradas.
Hoy en día, la IA se está adentrando en el campo de la producción de contenido digital y, además de ser comparable a los profesionales de la escritura, las preguntas y respuestas, la pintura y las ciudades centenarias, también ha demostrado la poderosa capacidad de comprensión de los grandes modelos lingüísticos. Pero solo puede servir como un "Copiloto (copiloto/asistente)" para ayudar a los humanos a tomar decisiones, ayudar a los creadores en la producción continua y las ideas iterativas, y no reemplazará ese trabajo verdaderamente valioso.