Hematemesis phân loại 100 hiện vật AIGC và công nhân tăng tốc! Bộ sưu tập được khuyến khích mạnh mẽ!

巴比特_

2023-07-05 06:01:33

Nguồn: Trí Tuệ

Tác giả | Ngô Phi Ninh

Chủ biên | Lý Thủy Thanh

Tiêu đề gốc: "The King of Rolls is Using It! 100 công cụ AIGC cấp kho báu để chia sẻ, rất khuyến khích để sưu tập! ! "

Nhắc đến công cụ AIGC, bạn vẫn chỉ biết đến ChatGPT?

Trên thực tế, ngày càng có nhiều ứng dụng AIGC không dựa trên GPT của OpenAI. Trong lĩnh vực giải trí, nhạc cover của các ca sĩ "AI Stefanie Sun" và "AI Jay Chou" trở nên nổi tiếng và chính các ca sĩ cũng phải kinh ngạc; trong lĩnh vực thương mại điện tử, con người ảo AI đọc các kịch bản do AI tạo ra 7x24 giờ , và bán được hàng triệu sản phẩm cho các doanh nghiệp ; trong các lớp học đặc biệt , giáo viên ảo xuất các khóa học ngôn ngữ ký hiệu dựa trên nội dung giọng nói để giúp người khiếm thính học kiến thức ... Những kịch bản này đã trở thành bãi đáp của các mô hình tự phát triển quy mô lớn hoặc mã nguồn mở người mẫu.

Theo thống kê của Zhishi, tính đến giữa tháng 5, có ít nhất 100 công cụ AIGC đại diện trên thế giới. Từ công việc văn phòng hàng ngày đến phương tiện truyền thông xã hội, từ sản xuất trò chơi đến thiết kế đồ họa, từ quy định tài chính đến bán sản phẩm, vị trí vai trò của các công cụ AIGC đã được nâng cấp từ "quan sát + dự đoán" trước đây thành "thế hệ + ra quyết định" ngày nay, thúc đẩy việc triển khai điểm "lẻ" AIGC xuất hiện.

▲Bản đồ đám mây từ hiển thị xung quanh ChatGPT, các công cụ AIGC khác với tỷ lệ sử dụng và tỷ lệ đề cập cao

Trong lĩnh vực soạn thảo văn bản, các công cụ AIGC do các chatbot đàm thoại như ChatGPT và Wenxinyiyan dẫn dắt giúp tiết kiệm thời gian và chi phí của mọi người trong việc truy xuất thông tin, đồng thời có thể hoàn thành một loạt các tác vụ lặp đi lặp lại dưới dạng đối thoại. , Tencent Wenyong, WPS Smart Writing, v.v.

Trong lĩnh vực tạo hình ảnh, AIGC cũng đã phá bỏ và định hình lại phương pháp vẽ trước đó. "Yiwen Shengtu" mang đến cho người sáng tạo những phong cách khác nhau và nguồn cảm hứng vô tận, đồng thời tạo ra một cuộc cách mạng về năng suất trong lĩnh vực thiết kế. Các công cụ như Midjourney và DALL-E tiếp tục mở rộng ranh giới trí tưởng tượng của mọi người.

Trong lĩnh vực âm thanh và video, AI có thể tạo âm thanh và video theo các kiểu định sẵn bằng cách phân tích dữ liệu nguồn khổng lồ, điều này không chỉ rút ngắn chu kỳ tạo mà còn vượt qua giới hạn về không gian và thời gian vật lý. Các công cụ thường được sử dụng bao gồm Xunfei Listening, MusicLM, Runway Gen-2, v.v.

Ngoài các kịch bản ứng dụng trên, còn có các kịch bản được chia nhỏ hơn như văn phòng hợp tác, học ngôn ngữ, phát sóng trực tiếp thương mại điện tử, lập trình và thần tượng ảo của con người kỹ thuật số.Công nghệ AIGC có thể được sử dụng từ cấp độ kỹ thuật với chi phí cận biên thấp và hiệu quả cao.cách đáp ứng nhu cầu cá nhân của người sử dụng.

Điều đáng nói hơn là trong thời đại thông tin lừa đảo và tin giả tràn ngập các trang hiện nay, để phân biệt nội dung AIGC với nội dung thật, NetEase và People's Daily Online đã liên tiếp tung ra các công cụ phát hiện nội dung AIGC để kiểm soát rủi ro nội dung. Ngoài ra còn có các công cụ liên quan đến phát hiện nội dung AIGC ở nước ngoài, chẳng hạn như Copyleaks, chuyên phát hiện đạo văn và DetectGPT, trợ lý kiểm tra đạo văn cho các bài báo.

**Bài viết này giải thích hơn 100 công cụ AIGC từ bảy phần và đính kèm các liên kết web để giúp người dùng cải thiện năng suất làm việc. **Thực tế, các công cụ AIGC trong và ngoài nước đang mọc lên như nấm mỗi ngày, vì vậy 100 công cụ AIGC trong bài viết này không bao quát hết ngành, nhưng chúng tôi hy vọng sẽ cung cấp một số tài liệu tham khảo cho ngành về danh mục và hướng đi .

01. Công cụ viết AIGC: viết bằng một cú nhấp chuột

Thích hợp cho cuộc sống hoặc cảnh văn phòng

Tạo văn bản là một trong những công nghệ thương mại đầu tiên của AIGC và đây cũng là công nghệ trưởng thành nhất mà AIGC đã phát triển cho đến nay. Ngày nay, các công cụ viết AI đã có bước nhảy vọt về chất trong khả năng hiểu ngữ cảnh, nắm bắt kiến thức thông thường, tạo ra các văn bản dài và nội dung đầy đủ, chính xác và logic. .

Các kịch bản hạ cánh chính của các công cụ viết AI có thể được tạm chia thành ba loại sau:

Đầu tiên là tạo văn bản hướng ứng dụng, chẳng hạn như tìm kiếm câu theo nghĩa, từ điển ngược, v.v., có các kịch bản sử dụng chức năng tương đối rõ ràng và hướng sử dụng cũng tương đối rõ ràng. Thứ hai là tạo văn bản sáng tạo, chẳng hạn như Notion AI, viết thông minh WPS, v.v., có thể được sử dụng để tiếp tục văn bản và tạo nội dung, v.v. Hầu hết chúng là văn bản không có cấu trúc và người dùng có nhiều không gian và tự do hơn để tạo văn bản. Thứ ba là tạo văn bản đàm thoại, chẳng hạn như Wenxinyiyan, Tongyiqianwen, Xunfei Xinghuo, v.v., có tính tương tác cao và có yêu cầu cao hơn về khả năng hiểu ngôn ngữ tự nhiên của các mô hình lớn.

Notion AI: Sử dụng ChatGPT để nhắn tin "làm đẹp"

Notion AI là một trợ lý viết có các chức năng chính bao gồm viết, chỉnh sửa, tóm tắt, v.v. Nó có thể tự động tạo các bài đăng trên blog, lịch họp, viết quảng cáo trên mạng xã hội, thông cáo báo chí, email bán hàng và thơ để đáp ứng nhu cầu của các tình huống khác nhau. Người dùng có thể để Notion AI xử lý bản thảo đầu tiên của một bài viết để có thêm ý tưởng viết; hoặc sử dụng nó như một trình chỉnh sửa để kiểm tra lỗi chính tả, ngữ pháp và bản dịch.

Công cụ hiện đang áp dụng mô hình "dùng thử miễn phí + thanh toán", cung cấp cho mỗi người dùng mới 20 cơ hội dùng thử miễn phí và sau khi sử dụng hết số lần, bạn cần mua dịch vụ, giá 10 đô la Mỹ/người/tháng , tương đương với 68,9 nhân dân tệ.

Liên kết web:

Baidu Wenxin Yiyan: "AI joker" hiểu tiếng Trung nhất

Wenxinyiyan là một robot trò chuyện do Baidu phát triển. Các chức năng chính của nó bao gồm đối thoại và tương tác với người dùng, trả lời câu hỏi và hỗ trợ sáng tạo, v.v., giúp người dùng có được thông tin, kiến thức và cảm hứng sáng tạo. Các tình huống sử dụng bao gồm sáng tác văn học, kinh doanh viết quảng cáo, toán học và khoa học, tính toán, phiên dịch tiếng Trung, tạo đa phương thức, v.v.

Ngoài khả năng viết quảng cáo, các ưu điểm của Wenxinyiyan bao gồm khả năng tạo ảnh và khả năng tự động tạo video dựa trên quá trình sao chép.

Liên kết web:

Ali Tongyi Qianwen: Viết thư tình thì dễ

Tongyi Qianwen là một mô hình đám mây Alibaba tự phát triển quy mô lớn, hiện được trang bị 9 ứng dụng, chủ yếu được chia thành hiệu quả, cuộc sống và giải trí.

(1) Hạng mục hiệu quả, bao gồm ba ứng dụng: viết đề cương, phân tích SWOT và tạo mô tả sản phẩm;

(2) Thể loại Cuộc sống, gồm ba ứng dụng: “Bí quyết bay”, “Sáng tác về trường tiểu học”, và “Rồi”;

(3) Hạng mục Giải trí, bao gồm "Chuyên gia đánh rắm cầu vồng", "Viết thư tình" và "Viết thơ cho em".

Hiện tại, các chức năng chính của Tongyi Qianwen bao gồm viết quảng cáo, đối thoại và trò chuyện, hỏi đáp về kiến thức, suy luận logic, viết mã, tóm tắt văn bản và các dịch vụ hiểu hình ảnh và video.

Liên kết web:

Xunfei Xinghuo: 7 khía cạnh năng lực chính, hiệu suất không thua gì ChatGPT

Xunfei Xinghuo là một mô hình lớn do iFLYTEK ra mắt vào ngày 6 tháng 5. Nó có bảy khía cạnh là tạo văn bản, hiểu ngôn ngữ, hỏi đáp kiến thức, suy luận logic, toán học, mã và đa phương thức. Sau khi đánh giá và so sánh, người ta thấy rằng nó đã vượt trội ChatGPT về khả năng hiểu ngôn ngữ và toán học.

Xunfei Xinghuo có thể hoàn thành việc tạo văn bản dài đa phong cách, đa ngôn ngữ, đa tác vụ, đồng thời có thể thực hiện phát hiện và sửa lỗi ngữ pháp khi viết quảng cáo bằng tiếng Anh, đồng thời khả năng hiểu ngôn ngữ của nó không thua kém các hệ thống hiện có có thể đo lường được ở Trung Quốc.

Liên kết web:

Con khỉ trình tự: một con khỉ AI có thể trả lời các câu hỏi phức tạp

Mô hình ngôn ngữ lớn "Sequence Monkey" do công ty AI Mobvoi đưa ra, hệ thống năng lực của nó lấy ngôn ngữ làm cốt lõi và bao hàm sáu chiều "kiến thức, đối thoại, toán học, logic, lý luận và lập kế hoạch". Nó có thể đồng thời hỗ trợ văn bản tạo, tạo hình ảnh, Các tác vụ khác nhau như tạo nội dung 3D, tạo giọng nói và nhận dạng giọng nói.

Sequence Monkey đã có khả năng hiểu ngôn ngữ tự nhiên, kiến thức, logic và suy luận nhất định, chẳng hạn như "Thủ phủ của tỉnh nào có dân số đông hơn, Hồ Nam hay Hồ Bắc?", "Người sáng lập công ty đứng sau Tmall đã tốt nghiệp trường nào?", v.v. .Đã có thể nhanh chóng đưa ra kết quả chính xác cho những câu hỏi cần tư duy thêm như vậy.

Liên kết web:

openapi.mobvoi.com

Tencent Wenyong Effidit: hiện vật viết bằng giấy để tiếp tục không dây

Wenyong Effidit (Chỉnh sửa hiệu quả và thông minh) là một trợ lý viết thông minh do Tencent AI Lab phát triển. Nó sử dụng công nghệ AI để hỗ trợ người viết phân chia ý tưởng, làm phong phú thêm cách diễn đạt và nâng cao hiệu quả soạn thảo văn bản và viết. Các chức năng của nó bao gồm sửa lỗi thông minh, hoàn thành văn bản, viết lại văn bản, mở rộng văn bản, đề xuất từ, đề xuất câu, tạo và các chức năng khác.

Liên kết web:

Tra câu theo nghĩa của WantQuotes: Bách khoa toàn thư về những câu nói nổi tiếng

Nó là một công cụ xử lý bài viết quảng cáo được phát triển bởi nhóm nghiên cứu của Đại học Thanh Hoa. Nó sử dụng công nghệ xử lý ngôn ngữ tự nhiên và AI (NLP) tiên tiến nhất để giúp mọi người xử lý việc đọc, viết, tìm kiếm bài viết sao chép và các trích dẫn nổi tiếng một cách thuận tiện và nhanh chóng hơn. .

Người dùng chỉ cần nhập từ vựng chủ đề có liên quan và nó có thể tìm thấy những câu nói, bài thơ, câu nói, thành ngữ nổi tiếng có liên quan, v.v.

Liên kết web:

Từ điển ngược WantWord: từ điển đồng nghĩa và từ trái nghĩa, từ chia tay không biểu cảm

Từ điển đảo ngược và tìm kiếm câu theo nghĩa đều được phát triển bởi nhóm nghiên cứu của Đại học Thanh Hoa, giúp tìm từ đồng nghĩa phù hợp và sinh động hơn thông qua các từ cho sẵn, đồng thời hỗ trợ dịch đồng thời và dịch lẫn nhau giữa tiếng Trung và tiếng Anh.

Liên kết web:

FlowUS AI: đĩa mạng + ghi nhớ + trợ lý viết

Xiliu là một phần mềm văn phòng cộng tác và quản lý tri thức, tập trung vào việc cung cấp dịch vụ cho các tổ chức và cá nhân nhỏ, tích hợp nhiều chức năng như viết tài liệu, lưu trữ tri thức, bảng đa chiều và sơ đồ tư duy vào một nền tảng. Người dùng của nó là sinh viên đại học group là nhóm chính, chiếm hơn 1/3 tổng số người dùng.

FlowUS cũng đã được điều chỉnh cho ChatGPT, người dùng có thể sử dụng FlowUS AI để thực hiện viết, viết tiếp, dịch, đánh bóng và các chức năng khác theo nhu cầu của riêng họ.

Liên kết web:

Viết thông minh WPS: tự động tạo các bài viết khác nhau trong 1 giây

WPS Smart Writing là sản phẩm viết thông minh được Kingsoft Office tung ra nhằm hỗ trợ người dùng sáng tạo hiệu quả, chủ yếu bao gồm 4 chức năng: tạo văn bản tự động, viết nháp bổ trợ, bổ sung câu thông minh và hiệu đính văn bản thông minh.

Dữ liệu văn bản và thông tin liên quan của nó đến từ các phương tiện truyền thông có thẩm quyền và các trang web công cộng của chính phủ. Chủ đề bao gồm các tình huống viết khác nhau như bài phát biểu, tóm tắt, kế hoạch, tin tức, v.v., và nó được kết nối với các tài liệu của Jinshan, có thể thực hiện tải lên đồng thời văn bản lên đám mây.Sau khi soạn thảo trực tuyến, người dùng có thể vào Kingsoft Documents để thực hiện các thao tác chỉnh sửa tài liệu chuyên nghiệp hơn như sắp chữ.

Liên kết web:

GrammarlyGo: "công cụ bắt lỗi" ngữ pháp trực tuyến

Công cụ kiểm tra chính tả tiếng Anh Grammarly cũng ra mắt dịch vụ AI GrammarlyGo, có thể tạo email nháp dựa trên gợi ý từ khóa do người dùng nhập hoặc giúp các bài viết hiện có thay đổi giọng điệu và kiểu chữ, điều chỉnh độ dài bài viết, v.v. dàn ý cho bài viết chủ đề.

Liên kết web:

Volcano Writing WritingGo: Dịch và đánh bóng bằng một cú nhấp chuột

Volcano Writing là một trợ lý viết do ByteDance ra mắt. Nó hiện đang hỗ trợ các dịch vụ viết thông minh bằng AI để chỉnh sửa toàn văn. Cho dù đó là sửa đổi giấy tờ, đánh bóng sơ yếu lý lịch, viết hồ sơ du học, viết quảng cáo cho phương tiện truyền thông cá nhân, v.v. Hơn 20 kịch bản viết, Volcano Viết có thể được bảo hiểm.

Người dùng nhập nội dung văn bản muốn đánh bóng và sửa đổi, sau khi nhấp vào "tối ưu hóa bằng một cú nhấp chuột", nó có thể tự động xác định loại văn bản, kiểu dáng và mục đích viết. Người dùng cũng có thể điều chỉnh mức độ sửa đổi và nền tảng có thể xuất nó dựa trên văn bản gốc chỉ bằng một cú nhấp chuột Kết quả viết lại tiếng Anh cũng hỗ trợ các chức năng AI như sửa lỗi thông minh và viết lại nhiều dạng, giúp cách diễn đạt ngôn ngữ chân thực và ngắn gọn hơn.

Liên kết web:

Zhishi Q&A: robot hỏi đáp thông minh

Zhishi Q&A là hệ thống hỏi đáp thông minh dựa trên công nghệ AI, người dùng có thể nhập câu hỏi trên nền tảng Zhishi Q&A, hệ thống sẽ tự động phân tích câu hỏi và đưa ra câu trả lời đúng nhất. Đồng thời, nó cũng cung cấp nhiều phương thức tương tác, bao gồm nhập văn bản, nhập giọng nói, v.v., để đáp ứng nhu cầu của những người dùng khác nhau.

Liên kết web:

Bên cạnh những công cụ viết AIGC quen thuộc trên, vẫn còn rất nhiều "hàng ế" đang chờ người dùng trải nghiệm như Friday AI Writing Assistant, Love Rewriting, Claude, Creator, Secret Tower Writing Cat, Subtxt, Writesonic, v.v.

02. Công cụ hình ảnh AIGC: Bản đồ của Vincent hơn Midjourney

Tự do vẽ bằng một cú nhấp chuột

Có thể nói năm 2022 là "năm đầu tiên của vẽ tranh AI", một loạt các công cụ vẽ tranh AI đã thể hiện khả năng hiểu và tạo hình ảnh tốt với sự trợ giúp của lời nhắc văn bản.

Với sự trợ giúp của GPT-4, một làn sóng cạnh tranh mới cũng đã bắt đầu trong lĩnh vực "bản đồ Vincent". Midjourney đã được cập nhật lên phiên bản V5, nổi tiếng khắp Internet với một nhóm ảnh cặp đôi, Adobe, hãng thiết kế hàng đầu cũng không kém cạnh, đã vội vàng tung ra "Adobe Firefly" để cạnh tranh. đa số công nhân thiết kế. Các công cụ hình ảnh AI ngày nay đã trưởng thành hơn và đa dạng hơn về mặt thương mại hóa và nghệ thuật so với năm ngoái.

▲ Nhóm ảnh cặp đôi cổ điển do Midjourney tạo tự động

Kịch bản kỹ thuật của các công cụ hình ảnh có thể được chia thành ba loại: tạo hình ảnh, sửa đổi một phần hình ảnh và chỉnh sửa hình ảnh.

Một là tạo hình ảnh. Các sản phẩm được đại diện bởi Midjourney, Stable Diffusion và DALL-E 2 chủ yếu tập trung vào việc tạo hình ảnh từ đầu đến cuối, có thể tạo ra một hình ảnh hoàn chỉnh với kiểu được chỉ định dựa trên mô tả văn bản hoặc bản phác thảo. có thể cung cấp Người sáng tạo cung cấp một số nguồn cảm hứng và tài liệu tham khảo sáng tạo.

Thứ hai là chỉnh sửa hình ảnh. Các chức năng chính bao gồm loại bỏ hình mờ hình ảnh thông minh, thiết lập bộ lọc kiểu, sửa đổi kiểu hình ảnh hoặc cải thiện độ rõ nét của hình ảnh, v.v., được đại diện bởi các sản phẩm như Imagen AI và Chuangketie AI Painter.

Thứ ba là sửa đổi một phần hình ảnh, sản phẩm đại diện là Adobe Firefly. Ưu điểm chính của nó tập trung vào việc thay đổi một số thành phần của hình ảnh hoặc sửa đổi và điều chỉnh từng lớp, phù hợp để tạo phụ hoặc cải thiện hậu kỳ.

Disco Diffusion: Vẽ bằng miệng

Disco Diffusion là chương trình vẽ chạy trên Google Colab, người dùng có tài khoản Google có thể chạy trực tiếp trên trình duyệt nhưng người dùng cần có kiến thức về code nhất định.

Sau khi người dùng nhập một câu mô tả, chương trình có thể tự động hiển thị và tạo ảnh của cảnh tương ứng, tốt hơn khi tạo các bức tranh trừu tượng với phong cách mơ mộng hơn và hiệu quả ở mức trung bình khi tạo các hình ảnh đại diện thực tế và nhập nhiều mô tả văn bản hơn.

Liên kết web:

Giữa hành trình: "nhiếp ảnh gia" AI

Midjourney là một chatbot AI vẽ tranh do một trong những tác giả của Disco Diffusion ra mắt, được thực hiện trên Discord. Sau khi GPT-4 ra mắt, nó cũng nhanh chóng chuyển sang phiên bản V5. Phiên bản mới được trau chuốt hơn về độ trung thực của hình ảnh và khả năng xử lý chi tiết, đồng thời có mức độ thương mại hóa cao hơn, gần như đạt đến mức có thể "ngụy thật".

Ở phiên bản trước, phong cách tạo ảnh chủ yếu là hoạt hình hoặc siêu thực, ít ảnh chân thực, sau khi cập nhật lên phiên bản V5, Midjourney nhanh chóng nổi đình nổi đám với nhóm ảnh cặp đôi khó phân biệt thật giả. .Kết cấu của phim chân thực hơn về cận cảnh tay, cận cảnh mắt và xử lý ánh sáng và bóng tối.

Ngoài ra, trong Midjourney V5, người dùng có thể tùy chỉnh tỷ lệ khung hình, khi nhập văn bản mô tả, các tính từ và chi tiết hình ảnh chi tiết hơn như tâm trạng, phong cách, ánh sáng và bóng râm sẽ được yêu cầu, điều này đòi hỏi người dùng phải chủ động kiểm soát hình ảnh và rõ ràng hơn trí tưởng tượng.

Liên kết web:

Khuếch tán ổn định: tạo hình ảnh ở cấp độ pixel

Stable Diffusion là trình tạo hình ảnh AI mã nguồn mở và miễn phí. Hiện tại, phiên bản mới nhất của Stable Diffusion XL đã được thử nghiệm công khai.

So với phiên bản trước, người dùng SD-XL mới chỉ cần sử dụng mô tả ngắn hơn để tạo ra hình ảnh. cũng rõ ràng và thực tế hơn. .

Liên kết web:

DALL-E 2: Bậc thầy hội họa hiện thực

DALL-E 2 là một công cụ tạo và chỉnh sửa hình ảnh do OpenAI ra mắt, nổi tiếng với hiệu ứng tạo và màu sắc nghệ thuật tuyệt vời. Người dùng chỉ cần nhập một bản tóm tắt và nó có thể tổng hợp ba yếu tố khái niệm, thuộc tính và phong cách và tạo ra một hình ảnh chân thực đáp ứng nhu cầu của người dùng, đồng thời, nó cũng có thể có các phong cách vẽ của nghệ sĩ khác nhau.

Ví dụ: người dùng nhập ba yếu tố: khái niệm "con chó con", thuộc tính "trên cỏ" và phong cách "Phong cách nghệ sĩ nhạc pop Andy Warhol" và nó có thể tạo ra những bức ảnh đáp ứng ba điều kiện này. Các tính năng của công cụ này cũng bao gồm chỉnh sửa hình ảnh, biến đổi phong cách, v.v.

Liên kết web:

Imagen AI: Hình ảnh được tạo ra có thể bị làm giả

Imagen AI là một công cụ AI chuyển văn bản thành hình ảnh do Google phát triển. Công cụ này có thể xuất ảnh chân dung, tranh sơn dầu, kết xuất CGI và các hình ảnh khác theo lời nhắc bằng văn bản của người dùng. Hình ảnh có cảm giác thực tế mạnh mẽ hơn và độ chính xác cao hơn trong việc hiểu ngôn ngữ .

Liên kết web:

Adobe Firefly: AI vẽ + chỉnh sửa ảnh trong một lần dừng

Adobe Firefly là một công cụ vẽ AI do Adobe và Nvidia tung ra. Hiện tại, nó đã nhận ra các chức năng tạo ảnh từ văn bản, chuyển đổi bản phác thảo thành ảnh và sửa đổi nội dung ảnh chỉ bằng một cú nhấp chuột. Nó cũng có thể sửa đổi các bức ảnh được tạo tự động theo lớp và xuất hình ảnh có độ phân giải cực cao.

Liên kết web:

Một phong cách viết và trái tim: hỗ trợ tạo ảnh từ ảnh và chuyển đổi ảnh thành video

Wenxin Yige là một sản phẩm vẽ AI do Baidu tung ra dựa trên mái chèo bay và công nghệ mô hình lớn Wenxin. Người dùng chỉ cần nhập văn bản sáng tạo của riêng mình và chọn kiểu ảnh mong muốn để có được một bức tranh do Wenxinyige tạo ra.Họ cũng có thể chọn loại ảnh, tỷ lệ ảnh và số lượng ảnh được tạo trong một lần. Hiện tại, Wenxin Yige đã hỗ trợ hơn mười phong cách hình ảnh khác nhau như tranh sơn dầu, màu nước, hoạt hình và chủ nghĩa hiện thực.

Liên kết web:

Ali Luban Luban: Hiện vật cho bản đồ thương mại điện tử

Luban là một sản phẩm thiết kế hình ảnh được phát triển độc lập bởi Phòng thí nghiệm thiết kế thông minh của Alibaba. Dựa trên công nghệ tạo ảnh AI, Luban có thể hoàn thành việc thiết kế một số lượng lớn ảnh Biểu ngữ, ảnh áp phích và ảnh địa điểm trong thời gian ngắn. Người dùng chỉ cần nhập kiểu dáng và kích thước họ muốn đạt được và Luban có thể thay thế các dự án thiết kế tốn nhiều thời gian và công sức như phân tích vật liệu, cắt bỏ và khớp màu theo cách thủ công và tạo ra nhiều bộ giải pháp thiết kế đáp ứng nhu cầu của khách hàng. yêu cầu trong thời gian thực.

Trong chương trình khuyến mãi "Double 11" vào năm 2017, Luban đã tạo ra 8.000 áp phích mỗi giây, trong đó tổng cộng 400 triệu áp phích sản phẩm đã được sản xuất, giúp nâng cao hiểu biết của mọi người về khả năng vẽ của AI.

Liên kết web:

Chuangketie AI Painter: Bạn có thể trở thành nhà thiết kế dù không biết vẽ

Chuangketie, một nền tảng thiết kế dành cho doanh nhân, đã ra mắt sản phẩm vẽ tranh trí tuệ nhân tạo, AI Painter, đồng thời đưa ra hai kịch bản chức năng thường được sử dụng là "Wen Sheng Tu" và "Tu Sheng Man".

Trong kịch bản "Wen Sheng Tu", người dùng chỉ cần nhập văn bản yêu cầu đơn giản, chọn phong cách vẽ mình muốn và hình ảnh mục tiêu có thể được tạo bằng một cú nhấp chuột. Các phong cách hiện có bao gồm phong cách cổ xưa, tranh sơn dầu, tranh màu, truyện tranh , CG, v.v.

Trong kịch bản "Picture Man", người dùng chỉ cần tải lên bức tranh mục tiêu và nhập các hướng dẫn bằng văn bản đơn giản để có được một bức tranh vẽ tay tùy chỉnh.Các chức năng của nó cũng bao gồm phát hiện cạnh, tô màu phác thảo dòng và phát hiện tư thế.Chức năng.

Liên kết web:

03. Công cụ âm thanh AIGC: biến đổi âm thanh, nhân bản, giảm tiếng ồn

Ngoài các kịch bản ứng dụng như văn bản và hình ảnh, âm thanh cũng là một kịch bản ứng dụng mà chúng ta tiếp xúc rất nhiều trong cuộc sống hàng ngày. Thay đổi giọng nói của con người, tổng hợp giọng nói và nhân bản trong các video ngắn là những công nghệ nghiên cứu phổ biến của AIGC trong lĩnh vực âm thanh, bao gồm hoạt ảnh, phim và lồng tiếng nhân vật trong trò chơi, giờ đây đã có thể được thực hiện bởi AI. Các hãng công nghệ như Microsoft và Google cũng tung ra dịch vụ Text-to-Speech (chuyển văn bản thành giọng nói) của riêng họ.

Các công cụ âm thanh AI có thể được chia thành hai loại theo các thuộc tính chức năng khác nhau: một là các công cụ xử lý âm thanh được đại diện bởi So-Vits-Svc, Adobe Podcast AI Voice, Magic Sound Workshop, v.v., sử dụng công nghệ AI để sửa chữa âm thanh và cải thiện âm thanh chất lượng Hoặc chuyển đổi âm sắc, v.v.; thứ hai là các công cụ sản xuất âm nhạc do MusicLM, Netease Tianyin, Aiva, v.v., có thể nhận ra chức năng "chuyển văn bản thành nhạc" trong các lĩnh vực được chia nhỏ hơn.

1. So-Vits-Svc: Tạo "AI Stefanie Sun" bùng nổ trên toàn Internet

"AI Stefanie Sun" đã trở nên nổi tiếng trên Internet chỉ sau một đêm. Các bài hát như "Hair Like Snow" và "Rainy Day" do cô ấy "cover" đã được phát hơn một triệu lần trên Bilibili và những bài hát này đã được chủ sở hữu UP chuyển qua .Được tạo bởi dự án mã nguồn mở So-Vits-Svc.

Mô hình này sử dụng bộ mã hóa nội dung SoftVC để trích xuất các đặc điểm giọng nói âm thanh nguồn của ca sĩ thực, sau đó chuyển nó vào mô hình tổng hợp giọng nói VITS, để giữ nguyên giọng gốc của ca sĩ. Những "ca sĩ AI" tương tự bao gồm AI Jay Chou, AI Xu Song, AI Wang Xinling, v.v.

Ngoài việc mô phỏng giọng hát của các ca sĩ nổi tiếng, nó còn có thể mô phỏng một số lượng lớn giọng nói thực dựa trên bản ghi âm điện thoại, video video và các tài liệu khác, trước đây, một số chủ sở hữu UP đã sử dụng mô hình này để liên lạc với người đã khuất. Tuy nhiên, do tình trạng lạm dụng dự án ngày càng nhiều nên tác giả đã gỡ bỏ dự án.

Adobe Podcast AI Voice: xử lý âm thanh podcast chuyên nghiệp

Adobe Podcast AI Voice là một công cụ tăng cường âm thanh được hỗ trợ bởi AI của Adobe, sử dụng AI để cải thiện chất lượng của bản ghi âm blog.

Sau khi người dùng đăng nhập tài khoản Adobe, tải lên tệp âm thanh cần xử lý giảm tiếng ồn, AI sẽ tự động xử lý tệp âm thanh và sau khi đạt được hiệu quả phát lại âm thanh ưng ý, người dùng có thể trực tiếp tải xuống máy tính để sử dụng miễn phí .

Liên kết web:

MusicLM: Mô hình AI biết hát

MusicLM là một mô hình AI tạo ra hoàn toàn thực sự do Google phát hành. Thông qua mô hình này, âm nhạc có độ trung thực cao có thể được tạo trực tiếp từ văn bản. Ngoài văn bản, cho dù đó là ngâm nga, hát, bộ gõ, biểu diễn nhạc cụ, v.v., MusicLM có thể tạo nhạc dựa trên những giai điệu hiện có này và đảm bảo rằng âm nhạc không bị biến dạng.

Điểm nổi bật nhất của nó là nó có thể tạo ra một bản nhạc hoàn chỉnh dài 5 phút dựa trên một hoặc hai từ gợi ý, với nhiều phong cách khác nhau, bao gồm nhạc điện tử, jazz, blues, Pop, v.v. Thời lượng của bài hát cũng có thể được đặt trước, chẳng hạn như một bản nhạc hoàn chỉnh dài 5 phút hoặc một đoạn ngâm nga dài 10 giây.

Ngoài ra, nó cũng có thể tạo ra các bản nhạc do các nhạc cụ cụ thể chơi, thậm chí có thể thiết lập trình độ biểu diễn của người biểu diễn, nó cũng có thể tạo ra âm nhạc theo đặc điểm của thời gian và địa điểm chơi. nội tạng bên bờ biển".

MusicLM được đào tạo trong cơ sở dữ liệu âm nhạc lên tới 280.000 giờ, bất kể bài hát dành cho phong cách hay cảm xúc nào.

Liên kết web:

Xunfei Hear: Chuyển giọng nói thành tin nhắn mọi lúc, mọi nơi

Xunfei Listening là một sản phẩm giọng nói thông minh của iFLYTEK, dựa trên khả năng xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói và nhận dạng giọng nói của iFLYTEK cũng như các công nghệ giọng nói khác, iFLYTEK Listening có thể đáp ứng nhu cầu thoại của người dùng trong nhiều tình huống khác nhau. bài giảng, phỏng vấn truyền thông, và viết cá nhân.

Các chức năng thuận lợi của nó cũng bao gồm thêm phụ đề song ngữ vào video, giải thích đồng thời đa ngôn ngữ và tạo phụ đề cho hội nghị truyền hình, v.v., để giúp người dùng vượt qua rào cản ngôn ngữ và tạo điều kiện giao tiếp và cộng tác.

Liên kết web:

NetEase Tianyin: Lời bài hát, âm nhạc, sắp xếp và ca hát được hoàn thành trong một lần dừng

Netease Tianyin là một hệ thống tạo nhạc sắp xếp AI do Netease sản xuất, có thể tạo nhạc AI trực tuyến. Ưu điểm lớn nhất của nó là ngưỡng tạo nhạc thấp và người dùng có thể hoàn thành bản sắp xếp nhạc gốc theo hướng dẫn trong một khoảng thời gian ngắn.

Bàn làm việc của Tianyin bao gồm một số phong cách âm nhạc cụ thể, bao gồm pop, dân gian, điện tử, phong cách dân tộc, v.v. Nó hỗ trợ người dùng tạo một bộ hợp âm của riêng mình từ đầu và cũng hỗ trợ kéo các hợp âm cài sẵn vào phần chỉnh sửa. bài hát bằng cách thêm, bớt, sao chép, điều chỉnh đoạn văn, v.v. Sau khi hoàn tất chỉnh sửa, nó sẽ tự động hiển thị và bạn có thể nhận được bản sắp xếp gốc do chính mình tạo sau một thời gian ngắn chờ đợi.

Liên kết web:

Magic Sound Workshop: công cụ không thể thiếu cho bình luận phim và truyền hình big V

Moyin Workshop là sản phẩm thuộc chuỗi sản phẩm giọng nói AI do công ty AI Đi ra ngoài hỏi ra mắt. Người dùng có thể sử dụng công nghệ giọng nói AI một cách hiệu quả và thuận tiện để mô phỏng giọng nói của người thật với các đặc điểm cá nhân, tạo nội dung âm thanh AI và chuyển đổi văn bản thành người thật chỉ bằng một cú nhấp chuột. click.giọng nói.

Người dùng nhanh chóng nhập bài viết cần tổng hợp thành âm thanh trong giao diện và thực hiện chỉnh sửa trực tuyến thông qua một trang thao tác tương tự như tài liệu để chuyển tài liệu thành âm thanh một cách thuận tiện. Các chức năng trên trang chỉnh sửa bao gồm: đánh dấu trọng âm, ký tự đa ngữ âm, đánh dấu lỗi chính tả, thêm âm thanh nền, lồng tiếng hỗn hợp nhiều người, tốc độ thay đổi, nhịp điệu và nhiều chức năng khác.

Đối với những người dùng yêu thích công nghệ, tài chính và các lĩnh vực khác, Moyin Workshop cũng đã bổ sung thêm các mẫu giọng nói AI của CEO của nhiều công ty liên quan ở chế độ nền để người dùng quen thuộc có thể sử dụng giọng nói của họ để sản xuất nội dung âm thanh.

Liên kết web:

Fake You: Giọng nói cũng có thể bị làm giả

FakeYou là một công cụ chỉnh sửa âm thanh chuyển văn bản thành giọng nói sử dụng công nghệ giả mạo sâu để tạo văn bản thành giọng nói bằng các ngôn ngữ và giọng nói khác nhau. Người dùng có thể sử dụng giọng nói của các nhân vật yêu thích của mình để tạo âm thanh và nó cũng cung cấp văn bản AI chức năng -to-speech.

Khi người dùng nhập một đoạn văn bản sẽ được tạo và chọn người muốn đọc văn bản, sau đó nhấp vào nút "nói", giọng nói của người mục tiêu sẽ tự động được tạo.

Liên kết web:

LyricStudio: AI giúp bạn viết lời bài hát

LyricStudio là trình tạo lời bài hát trực tuyến giúp người dùng tạo lời bài hát gốc bắt chước phong cách của riêng họ và tìm vần cho một từ cụ thể. Người dùng có thể tải lên một mô tả văn bản hoặc đoạn nhạc và nó sẽ chuyển đổi nó thành lời bài hát phù hợp với nội dung.

Theo dữ liệu từ trang web chính thức của nó, công cụ này đã hợp tác để tạo ra hơn 1 triệu bài hát và 15% người dùng trên nền tảng này là nhà sản xuất âm nhạc chuyên nghiệp. LyricStudio đã giúp lời bài hát cho album iTunes số 1 của rapper Curtiss King.

Liên kết web:

LALAL.AI: Trích xuất âm thanh nhạc cụ bằng một cú nhấp chuột

LALAL.AI là một công cụ tách nhạc trực tuyến có thể phân đoạn và trích xuất giọng hát cũng như nhạc cụ từ âm nhạc.

Công nghệ tách nhạc trực tuyến của nó hoàn toàn dựa trên máy học và trí tuệ nhân tạo, trước phiên bản trước chỉ có thể tách giọng người, giờ đây nó có thể trích xuất chính xác giọng người, guitar điện, guitar acoustic, piano và trống từ các tệp âm thanh và video ., bass và nhiều nhạc cụ khác.

URL:

Aiva: Nhà sản xuất âm nhạc AI

Aiva là một công cụ âm nhạc AI cùng tên do công ty âm nhạc AI "Aiva" tự phát triển. Người dùng có thể hỗ trợ các nhạc sĩ sản xuất và viết nhạc gốc thông qua công nghệ AI. Nền tảng bao gồm nhiều phong cách khác nhau, chẳng hạn như cổ điển , rock, nhạc điện tử, pop, phong cách dân tộc, Blues, hip hop, v.v. Trên trang soạn nhạc tự động, có 11 thể loại để người dùng lựa chọn, bao gồm Key Signature Tune, Time Signature beat, Pacing Rate, Instrumentation, Duration, v.v.

Aiva cũng đã nghiên cứu các tác phẩm tiêu biểu và phong cách âm nhạc của Mozart, Bach, Beethoven và các nhạc sĩ khác thông qua học sâu, đồng thời thiết lập một mô hình học tập dựa trên những đặc điểm âm nhạc này để giúp các nhạc sĩ sáng tạo âm nhạc. Đồng thời, Aiva cũng là nhà soạn nhạc được chứng nhận AI đầu tiên trong lịch sử và đã xuất bản 5 album.

Liên kết web:

Supertone: tạo tác thay đổi giọng nói

Supertone là một studio âm thanh sáng tạo AI của Hàn Quốc, cung cấp công nghệ tổng hợp giọng nói và tăng cường giọng nói theo thời gian thực để giúp người dùng dễ dàng tạo nhiều loại nội dung âm thanh khác nhau, bao gồm đọc văn bản đơn giản đến các tác phẩm nghệ thuật, bài hát, v.v., cho phép người dùng thay đổi âm thanh của họ. tiếng nói và các cách khác Để giảm bớt lo ngại về các vấn đề thông tin cá nhân.

Supertone cũng cung cấp một công nghệ gọi là "VoicePrint", chuyển đổi giọng nói của người dùng thành dấu vân tay kỹ thuật số để phân biệt giọng nói đó với giọng nói của người dùng khác.

Liên kết web:

04. Công cụ video AIGC: tự động chỉnh sửa và tạo các chức năng bảng phân cảnh có tại đây

Đồ thị Vincent hiện đã trở thành công nghệ AIGC chủ đạo, nhưng việc tạo văn bản thành video vẫn còn ở giai đoạn sơ khai.

Công ty khởi nghiệp AI có trụ sở tại New York Runway đã phát triển một mô hình video tổng hợp Gen-2, có thể tạo ra một video tổng hợp cao từ một mô tả đơn giản. Các công ty khác cũng đã tham gia, chẳng hạn như Text2Video-Zero, Video-P2P và TemporalNet do nền tảng chỉnh sửa hình ảnh PiscArt đưa ra và Chuyển văn bản thành video do Ali phát triển. Video tạo văn bản cũng có thể tham gia vào cuộc cạnh tranh khốc liệt trong tương lai gần .sân khấu.

Deepfakes: AI thay đổi khuôn mặt video

Deepfakes hiện đồng nghĩa với các video do AI tổng hợp. Microsoft đã ra mắt FaceShifter, có thể xử lý hình ảnh gốc mờ thành hình ảnh giả rõ ràng và đáng tin cậy; Disney và ETH Zurich đã cùng nhau phát triển và tung ra công cụ sản xuất video Deepfakes ở cấp độ megapixel và trong sê-ri "Chiến tranh giữa các vì sao" trong phim, Deepfakes là được sử dụng để đưa các diễn viên quá cố trở lại màn ảnh rộng.

Tuy nhiên, những rủi ro bảo mật do điều này gây ra cũng lần lượt đến, đối với một số video có độ phân giải cao và ánh sáng cực kỳ tự nhiên, ngay cả thuật toán Deppfakes tinh vi nhất cũng không thể xác định chính xác.

Do đó, ngay từ cuộc bầu cử Hoa Kỳ năm 2020, Facebook đã tuyên bố cấm hoàn toàn việc sử dụng Deepfakes trên nền tảng này và YouTube và TikTok cũng không ngoại lệ, nghiêm cấm rõ ràng việc sử dụng bất hợp pháp công nghệ Deepfakes trong video. "Bộ luật dân sự" sẽ được thực thi ở quốc gia của tôi vào năm 2021 cũng chỉ ra rằng các nền tảng video lớn cần hạn chế nghiêm ngặt nội dung của các video thay đổi khuôn mặt bằng AI và chúng không được tùy tiện sử dụng khi chưa được phép.

Runway Gen-2: Tạo phim bom tấn trong 30 giây

Gen-2 là một kiểu máy biến áp đầu cuối do công ty mới thành lập Runway tung ra, người dùng có thể sử dụng hình ảnh và văn bản làm điều kiện để tạo video gốc theo phong cách chậm từ đầu.

Độ phân giải video mà nó tạo ra cao tới 1280 × 720 và thời lượng khoảng 30-60 giây, hiện tại có thể thực hiện các chức năng sau: tạo video, tạo hình ảnh, mở rộng hình ảnh không giới hạn theo lời nhắc văn bản, trộn các kiểu hình ảnh , đào tạo mô hình AI, Xóa phần tử trong video, xóa phông, v.v.

Gần đây, Runway đã ra mắt ứng dụng di động đầu tiên của mình, sử dụng mô hình Gen-1, người dùng có thể tải lên văn bản, hình ảnh hoặc video trên điện thoại di động và để mô hình biến đổi phong cách của video theo nội dung.

Liên kết web:

Make-A-Video: chuyển văn bản thành video trực tiếp

Vào tháng 9 năm 2022, Meta ra mắt phần mềm chuyển văn bản thành video "Make-A-Video" của riêng mình, sau khi người dùng nhập một vài từ mô tả đơn giản, phần mềm sẽ tạo ra một video không có tiếng.

Trong video trình diễn chính thức, người dùng có thể nhận được một video dài vài giây bằng cách nhập các mô tả văn bản như "một cặp vợ chồng trẻ đang đi dạo dưới cơn mưa lớn" và "một chú gấu bông đang vẽ chân dung". Ngoài ra, Make-A-Video cũng có thể tạo hiệu ứng động cho các hình ảnh tĩnh, dựa trên công nghệ "sơ đồ Vincent".

Vị quan chức này cho biết, mô hình được đào tạo bằng cách sử dụng dữ liệu tổng hợp hình ảnh và video chưa gắn nhãn, sau khi học, mô hình có thể "dự đoán" điều gì sẽ xảy ra bên cạnh hình ảnh, nó sẽ di chuyển đến đâu và di chuyển đến vị trí nào của hình ảnh đó. thời lượng ngắn.Vị trí xuất hiện để tạo thành một đoạn phim ngắn.

Liên kết web:

Shangtang Zhiying: hiện vật kho báu chuyên gia video ngắn

SenseTime đã ra mắt nền tảng tiếp thị và quảng cáo một cửa cho SenseTime, bao gồm công cụ tạo video ngắn "SenseTime", có thể tạo các video ngắn sáng tạo chỉ bằng một cú nhấp chuột, bao gồm tạo tập lệnh, thay thế nền, thay thế màn hình ngang và dọc và phụ đề thế hệ. Dịch vụ sản xuất video quảng cáo đa dạng có thể giúp nhà quảng cáo tiết kiệm chi phí sản xuất nội dung quảng cáo.

Dịch vụ "Phân tích phần tử video" có trong SenseTime có thể phân tích và trích xuất thông tin như thời lượng, cảnh, cảnh, nhân vật, đạo cụ và lời thoại của từng cảnh quay trong một video ngắn thông qua công nghệ cấu trúc video AI và tự động tạo kịch bản cảnh quay rất nhiều giảm thời gian viết kịch bản và hỗ trợ hiệu quả người sáng tạo trong quá trình tạo thứ cấp.

Ngoài ra, nền tảng này cũng cung cấp một số lượng lớn các kịch bản video phổ biến để cung cấp cho người sáng tạo nguồn cảm hứng sáng tạo.

Liên kết web:

Decoherence: Tạo video chỉ bằng một cú nhấp chuột vào hình ảnh

Decoherence là một công cụ để tạo video AI, nơi người dùng có thể chọn từ nhiều phong cách AI khác nhau.

Liên kết web:

Tencent Zhiying: hiện vật tạo video ngắn

"Tencent Zhiying" chủ yếu nhắm đến những người tạo video ngắn và các chức năng nổi bật của nó là tài liệu bản quyền chính hãng và chương trình phát sóng kỹ thuật số của con người. Người dùng có thể tạo video kỹ thuật số về con người bằng cách tải ảnh và văn bản lên. Người dùng cũng có thể sử dụng nó với chức năng lồng tiếng AI thông minh để chọn các âm sắc khác nhau cho con người kỹ thuật số.

Liên kết web:

05. Công cụ văn phòng AIGC: AI+OA nhận ra "từ đầu" bằng một cú nhấp chuột

Vào ngày 17 tháng 3, Microsoft đã chính thức phát hành Microsoft 365 Copilot, tích hợp các khả năng của GPT-4 và ChatGPT vào các công cụ Office, đồng thời ra mắt chức năng Business Chat tích hợp dữ liệu Office 365, giúp cải thiện mức độ văn phòng kỹ thuật số và giúp nhân viên không làm việc hiệu quả, Giải phóng từ lao động lặp đi lặp lại.

Kingsoft Office, với tư cách là công ty hàng đầu trong lĩnh vực văn phòng cộng tác trong nước, cũng đã ra mắt nền tảng văn phòng chung "WPS AI" với khả năng mô hình ngôn ngữ lớn chỉ trong một tháng, trở thành ứng dụng giống ChatGPT đầu tiên trong lĩnh vực văn phòng cộng tác trong nước. Ngoài ra, các công ty như Baidu, ByteDance và DingTalk đã liên tiếp ra mắt các công cụ văn phòng cộng tác AI của riêng họ.

Hệ thống ứng dụng OA (Office Automation) dần phát triển và trưởng thành, là cầu nối giữa nhân viên và doanh nghiệp, có thể trở thành lối vào của mô hình ngôn ngữ lớn trong hệ sinh thái B-end trong tương lai.

Ngoài lĩnh vực văn phòng cộng tác, các công cụ AI cũng có thể được áp dụng trong nhiều tình huống theo chiều dọc hơn và kết hợp với các nhu cầu thực tế hơn, chẳng hạn như "AI + học ngôn ngữ" có DuolinguoMax và "AI + giao hàng thương mại điện tử" đã tạo ra một phiên bản thông minh của thương mại điện tử. Trang web thương mại điện tử Shopify, công cụ tiếp thị thương mại điện tử eCommerce s, v.v. "Lập trình AI+" giúp GitHub Copilot X trở thành trợ lý đắc lực cho các nhà phát triển và "AI+ sơ đồ tư duy" có Chatmind, có thể tạo sơ đồ tư duy với một câu mô tả.

1. Microsoft 365 Copilot: Phiên bản Gpt-4 của Microsoft Family Bucket

Microsoft 365 Coplilot nối tiếp GPT-4 vào sáng sớm ngày 17 tháng 3 và tất cả phần mềm văn phòng bao gồm Word, Excel, Powerpoint, Outlook, Teams, v.v. đã được ra mắt với các chức năng AI tổng quát.

Trong Word, Copilot chỉ cần một lời nhắc đơn giản để tạo bản nháp đầu tiên và cũng có thể điều chỉnh giọng điệu của bài viết theo nhu cầu của người dùng, chẳng hạn như chuyên nghiệp và nghiêm túc, nhiệt tình và giản dị, v.v., và có thể tự động xóa cùng một chỗ trong bài viết, để đơn giản hóa hơn nữa.

Copillot trong Excel có thể giúp người dùng phân tích dữ liệu, phân tích trực tiếp xu hướng dữ liệu và trực quan hóa kết quả phân tích dữ liệu.

Điều tuyệt vời hơn nữa là Powerpoint đã có thể trực tiếp tạo PPT và Copilot có thể trực tiếp chuyển đổi tài liệu hiện có thành PPT với các nguồn được đánh dấu. Nếu người dùng cảm thấy PPT quá dài, họ có thể trực tiếp sử dụng mô tả văn bản để nén, điều chỉnh bố cục hoặc định dạng văn bản bằng một cú nhấp chuột.

Copilot trong Outlook có thể giúp người dùng phân loại email theo các tiêu chí nhất định, tóm tắt và tinh chỉnh chủ đề của các email dài cũng như phiên âm một số từ khóa hoặc bản nháp thành email chính thức.

Liên kết web:

Google Workspace: công nghệ + văn phòng = hiện vật cho người lao động

Google Workspace là bàn làm việc của Google bao gồm các công cụ văn phòng như Docs, Slides, Sheet và Gmail. Google đã công bố vào tháng 3 rằng họ sẽ tích hợp AI vào các thành phần công cụ này. Sau khi truy cập mô hình AI tổng quát, người dùng sẽ có thể tạo một email, kế hoạch kinh doanh hoặc bảng phí tiếp thị quảng cáo hoàn chỉnh với sự trợ giúp của các công cụ này bằng cách nhập một đoạn mô tả văn bản ngắn.

Trong Docs, AI tổng quát có thể giúp người dùng soạn thảo bản nháp đầu tiên của văn bản, đánh bóng và chỉnh sửa văn bản, đọc lại và sửa lỗi; Gmail có thể trả lời và tóm tắt email, đánh dấu các nội dung quan trọng, v.v.; Slide có thể tự động tạo hình ảnh, âm thanh và video theo ý muốn. chủ đề và chèn chúng vào mẫu; Trang tính có thể tự động thực hiện xử lý dữ liệu, sắp xếp bảng, phân loại ngữ cảnh và thậm chí phân tích dữ liệu thô.

Hiện tại, Google áp dụng gói thanh toán linh hoạt, được chia thành phiên bản dành cho người mới kinh doanh cơ bản, phiên bản tiêu chuẩn dành cho doanh nghiệp và phiên bản dành cho doanh nghiệp Plus, cho phép người dùng đăng ký theo nhu cầu thực tế của họ.

Liên kết web:

Baidu Ruliu: Trí tuệ nhân tạo + quản lý tri thức

Baidu Ruliu đã ra mắt "Nền tảng làm việc thông minh Ruliu 2.0" cho thị trường dịch vụ doanh nghiệp vào cuối năm ngoái, bao gồm ba ma trận sản phẩm thông minh: quản lý tri thức thông minh, hội nghị thông minh và bàn làm việc thông minh.

Trong quản lý tri thức thông minh, có ba ứng dụng quản lý tri thức là "cơ sở tri thức thông minh", "công cụ kép tìm kiếm và đề xuất" và "chuỗi sao tri thức", tập hợp các tài liệu, email, ghi chú và các tệp khác rải rác ở một nơi, Nhân viên có thể tìm thấy các tài liệu, kiến thức cần thiết một cách thuận tiện nhất.

Các cuộc họp thông minh kết nối nhân viên, không gian và thiết bị một cách thông minh. Trước cuộc họp, Trợ lý hội nghị Ruliu có thể giúp bạn kiểm tra lịch trình của những người tham gia, đặt trước thời gian họp tốt nhất và gửi tài liệu cuộc họp; trong cuộc họp, Trợ lý Ruliu có thể ghi lại bài phát biểu của những người tham gia và chuyển đổi giọng nói thành văn bản trong thời gian thực , đánh dấu thông tin chính; Sau đó, trợ lý cuộc họp sẽ tự động tạo công việc cần làm trong cuộc họp, thuận tiện cho nhân viên xem lại các điểm chính của cuộc họp.

Các thẻ công việc khác nhau được thu thập trong bàn làm việc thông minh để làm cho hệ thống nhiệm vụ linh hoạt và rõ ràng hơn, đồng thời các thẻ công việc khác nhau được khớp với nhân viên ở các vị trí khác nhau. Ví dụ: bàn làm việc nhân sự được tích hợp thẻ công việc dành cho trợ lý phỏng vấn và mô-đun quản lý tuyển dụng; bàn làm việc của người quản lý bao gồm thẻ công việc ba chiều để theo dõi hiệu quả, phân tích cộng tác và quản lý quy trình, cung cấp cho người quản lý dữ liệu nhiệm vụ nhóm.

Liên kết web:

Dấu gạch chéo "/": Cây đũa thần tạo ra các applet chỉ bằng một cú nhấp chuột

Một tuần sau khi mô hình quy mô lớn của Tongyi Qianwen được phát hành, DingTalk đã công bố quyền truy cập chính thức của nó. Sau khi truy cập vào mô hình lớn Qianwen, người dùng chỉ cần sử dụng dấu gạch chéo "/" để thực hiện công việc văn phòng thông minh. Các tình huống sử dụng chính bao gồm trò chuyện nhóm, tài liệu, hội nghị truyền hình và phát triển applet.

Trong cuộc trò chuyện nhóm, những người mới tham gia chỉ cần nhập "/" vào hộp thoại để lấy các điểm theo ngữ cảnh của cuộc trò chuyện nhóm và dấu gạch chéo cũng có thể tạo các mục công việc, lên lịch cuộc hẹn và tạo biểu tượng cảm xúc cho các cuộc họp quan trọng.

Trong cuộc trò chuyện 1-1, người dùng có thể trực tiếp sử dụng dấu gạch chéo để tạo chatbot để nó tự động học kiến thức và trả lời câu hỏi.

Trong tài liệu, dấu gạch chéo có thể tự động tạo bản viết quảng cáo và áp phích theo nhiều phong cách khác nhau; trong hội nghị truyền hình, dấu gạch chéo có thể tóm tắt các điểm họp, mục công việc, v.v. chỉ bằng một cú nhấp chuột.

Ngoài ra, chức năng bất ngờ nhất của dấu gạch chéo là tạo các chương trình nhỏ bằng ngôn ngữ tự nhiên và sử dụng chúng trong nhóm dưới dạng "ứng dụng tuyệt vời Dingding".

5. Kingsoft Office WPS AI: AI viết văn bản

Cùng ngày DingTalk công bố quyền truy cập vào mô hình lớn và ra mắt trợ lý văn phòng thông minh "/", Kingsoft Office, công ty phần mềm văn phòng hàng đầu trong nước, cũng chính thức công bố ra mắt "WPS AI". Mô hình lớn cơ bản do MiniMax cung cấp, hiện bao gồm nhiều chức năng như tạo nội dung, đối thoại nhiều vòng và tối ưu hóa nội dung. Trong tương lai, mô hình này có thể phát triển thành phiên bản nội địa của "Microsoft 365 Coplilot" và được nhúng hoàn toàn vào bộ WPS.

Liên kết web:

Feishu My AI: Trợ lý hành chính phiên bản Bytedance

Vào ngày 11 tháng 4, Feishu, nền tảng văn phòng của ByteDance, cũng đã ra mắt trợ lý AI thông minh "My AI". Các chức năng của nó bao gồm tự động tóm tắt biên bản cuộc họp, tạo báo cáo, tiếp tục viết và tối ưu hóa nội dung văn bản, v.v. Trong Feishu, My AI cũng có thể giúp người dùng tạo lịch biểu và tìm kiếm cơ sở tri thức nội bộ của công ty thông qua đối thoại. Tuy nhiên, My AI vẫn đang trong quá trình hoàn thiện, phiên bản public beta và thời gian ra mắt vẫn chưa được công bố.

Liên kết web:

Shopify: AI chuyển đổi dịch vụ khách hàng thương mại điện tử trong vài giây

Ngày 1/3, sau khi ChatGPT công bố mở API, nền tảng dịch vụ thương mại điện tử xuyên biên giới Shopify đã đi đầu trong việc tích hợp. Sau khi tích hợp ChatGPT, Shopify có thể sử dụng dịch vụ khách hàng thông minh để giao tiếp với người dùng, giúp người tiêu dùng đưa ra đề xuất được cá nhân hóa và tiết kiệm thời gian mua hàng; ChatGPT cũng tiến hành phân tích dữ liệu đánh giá, tối ưu hóa tiêu đề và từ khóa, viết quảng cáo tiếp thị và lập trình phát triển trang web thông minh cho các sản phẩm nền tảng và nhiều chức năng khác giúp nâng cao hiệu quả hoạt động của website thương mại điện tử và tối ưu hóa trải nghiệm mua hàng của người tiêu dùng.

Liên kết web:

ChatGPTs thương mại điện tử: Người mách nước thương mại điện tử

Liên kết web:

GitHub Copilot X: Lập trình Xiaobai cũng có thể viết mã

Sau khi Microsoft ra mắt phiên bản mới của công cụ tìm kiếm Bing, trình duyệt Edge và nhóm Office, nền tảng lưu trữ mã GitHub của họ cũng đã phát hành Copilot X, đưa ChatGPT vào môi trường phát triển tích hợp, ngay cả người dùng không có nền tảng mã cũng có thể dựa vào "miệng của bạn " Viết ra mã.

Trong GitHub Copilot Chat, người dùng có thể gửi cho nó hướng dẫn viết mã trong cửa sổ trò chuyện, đối với những mã chạy bất thường, nó có thể trực tiếp tìm lỗi (lỗi) và sửa đổi, trong GitHub Copilot Voice, nó thậm chí có thể được triển khai. thoại thành mã trong một bước, nhà phát triển trực tiếp nói và đưa ra hướng dẫn bằng ngôn ngữ tự nhiên, đồng thời có thể tạo mã có liên quan.

Ngoài các chức năng trên, nếu người dùng không hiểu một dòng mã nào đó, chỉ cần để Copilot giải thích chức năng của mã trong Chat.

Liên kết web:

Đom đóm: biên bản cuộc họp dễ giải quyết

Liên kết web:

Feishu Miaoji: Văn bản ngàn lời, một chữ đáng giá ngàn lời

Liên kết web:

06. Công cụ cuộc sống AIGC: nấu ăn, ghi chép, làm cẩm nang du lịch

Hãy để AI trở thành người quản lý cuộc sống

Ngoài các công cụ AI có tính ứng dụng cao như tạo văn bản, chỉnh sửa âm thanh và video, nhiều sản phẩm AIGC mới đã xuất hiện trong cuộc sống hàng ngày.

Ví dụ: ChefGPT giúp tạo công thức nấu ăn cho những người dùng đau đầu mỗi ngày, Dover Autopilot, một công cụ tuyển dụng AI cung cấp hồ sơ nhân tài chất lượng cao cho các công ty săn đầu người, BibiGPT, có thể ghi chú trong khi xem video và Bedtime Story AI, có thể tạo truyện ngắn trước khi đi ngủ.WatchNow, đề xuất danh sách phim theo sở thích cá nhân, v.v., cuộc sống hoàn toàn thông minh không còn là cốt truyện chỉ có trong phim khoa học viễn tưởng và AI đã hoàn toàn đi vào cuộc sống hàng ngày của chúng ta.

BibiGPT: một công cụ thân thiện dành cho sinh viên đại học, cho phép chuyển video sang ghi chú chỉ bằng một cú nhấp chuột

Video quá dài để tóm tắt những điểm chính? Quá vội vàng để ghi chú trong khi xem video? BibiGPT, một phần mềm tóm tắt âm thanh và video được phát triển dựa trên ChatGPT, giải quyết tốt những vấn đề này. nhấp vào " "Tóm tắt bằng một cú nhấp chuột", bạn có thể nhận được ghi chú tóm tắt video.

Liên kết web:

Dover Autopilot: Phần mềm tuyển dụng AI

Dover Autopilot là một công cụ tuyển dụng tự động. Nhà tuyển dụng chỉ cần nhập một liên kết mô tả công việc đơn giản và nó có thể tìm thấy những người tìm việc phù hợp với yêu cầu công việc trong vòng vài phút thông qua các nguồn dữ liệu như LinkedIn và các trang web tìm kiếm việc làm khác. Nó cũng có thể tự động tạo email được Cá nhân hóa cho ứng viên.

Liên kết web: dover.com/start

ChefGPT: Bách khoa toàn thư về công thức nấu ăn dành cho người mới làm quen với ẩm thực

Đây là một công cụ gợi ý công thức nấu ăn bằng AI, khi người dùng nhập các nguyên liệu và công cụ hiện có trong tay cũng như thời gian nấu đã đặt trước, nó có thể đề xuất một công thức phù hợp với nhu cầu.

Có hai chế độ trong trang, một là chế độ dành cho người sành ăn và chế độ còn lại là chế độ chọn tất cả. Chế độ dành cho người sành ăn có yêu cầu cao hơn đối với quyền tự chủ của người dùng, yêu cầu người dùng chọn nguyên liệu và dụng cụ nhà bếp trước khi nhập chúng vào trang web, trong khi chế độ chọn tất cả thân thiện hơn với "những người mới làm bếp" và có thể nhận được một bản sao đáp ứng yêu cầu mà không cần sử dụng bộ não của họ.Bí quyết cho nhu cầu thực tế.

Liên kết web:

Journeai: Cẩm nang du lịch cho Tây ba lô

Journeai là một cố vấn du lịch trò chuyện dựa trên AI, nhằm mục đích tạo các lộ trình du lịch được cá nhân hóa cho người dùng. Nó có thể tạo hành trình theo sở thích của người dùng, bao gồm sắp xếp hoạt động và đối tác du lịch khám phá.

Công cụ này không chỉ phù hợp với những du khách cần tùy chỉnh sắp xếp hành trình được cá nhân hóa mà còn phù hợp để hỗ trợ các công ty du lịch cải thiện trải nghiệm người dùng.

Liên kết web:

07.

Công cụ phát hiện nội dung AIGC: AIGC giả mạo

Dẫn đầu về nhận diện nội dung

Với sự phát triển nhanh chóng của công nghệ AIGC, nó cũng đã gây ra rất nhiều thông tin sai lệch, đạo văn, gian lận học thuật, tranh chấp bản quyền và các tác động tiêu cực khác và các sự kiện tiêu cực liên quan. Tranh chấp bảo mật không xác định là không thể tránh khỏi, đòi hỏi sự phát triển của các công nghệ có liên quan để phát hiện và sàng lọc.

Mặc dù hiện tại không có nhiều công cụ phát hiện nội dung AIGC trên thị trường, nhưng chúng đã có thể phân biệt chính xác nội dung AIGC như văn bản, hình ảnh và âm thanh được tạo.Hệ thống phát hiện đạo văn CrossCheck, v.v.

1、Copyleaks：

Copyleaks hiện là một trong những công cụ phát hiện nội dung AI phổ biến nhất thế giới, ưu điểm nổi bật nhất là ngoài phát hiện nội dung tiếng Anh, nó còn có thể phát hiện nội dung viết bằng tiếng Tây Ban Nha, tiếng Pháp và các ngôn ngữ khác. Đối với các văn bản đều do AI tạo ra, Copyleaks có thể đạt được độ chính xác nhận dạng 99,99%, nhưng đối với nội dung văn bản chỉ đúng một nửa hoặc sai, nó sẽ đánh dấu đó là văn bản được tạo giả tạo.

Liên kết web:

AIGC-X: Xác định tính xác thực của văn bản tiếng Trung bằng con mắt tinh tường

Công ty công nghệ thông tin People.cn, một công ty con của People's Daily, tập trung vào kiểm soát rủi ro nội dung, đã phát triển công cụ phát hiện nội dung do AI tạo ra đầu tiên ở Trung Quốc, AIGC-X. Công cụ này có thể được sử dụng để phân biệt văn bản do máy tạo ra với giả tạo Nó có thể phát hiện và sàng lọc tin tức giả mạo, đạo văn nội dung, thư rác, v.v. và đặc biệt là cung cấp hỗ trợ kỹ thuật trong các lĩnh vực màu xám như thông tin sai lệch, gian lận học thuật và lừa đảo.

Tuy nhiên, AIGC-X hiện chỉ hỗ trợ phát hiện nội dung tiếng Trung và khả năng phát hiện nội dung hình ảnh, âm thanh và video cần được cải thiện.

Liên kết web:

DetectGPT: công cụ chống do thám, gian lận và gian lận là không thể tránh khỏi

Công cụ phát hiện zero-sample DetectGPT được phát triển bởi một nhóm nghiên cứu tại Đại học Stanford, Hoa Kỳ, chủ yếu được sử dụng để chống lại hiện tượng tạo ra giấy phổ biến trong các trường đại học. Một bài báo nghiên cứu có tựa đề "DetectGPT: Phát hiện văn bản do máy tạo bằng Zero-Shot sử dụng độ cong xác suất" đã được xuất bản trên trang web in sẵn arXiv.

Công cụ phát hiện này đề xuất một chỉ báo mới để đánh giá văn bản được tạo bởi mô hình ngôn ngữ lớn. Nó chỉ cần quét nội dung được tải lên trang web để xác định xem nội dung trong văn bản có được tạo bằng mô hình ngôn ngữ lớn hay không.

Liên kết web:

NetEase NetShield: Phát hiện chính xác các từ nhạy cảm

NetEase NetShield, dựa trên nhiều năm kinh nghiệm trong ngành của NetEase, cung cấp các mô hình đối sánh được cá nhân hóa và các giải pháp phát hiện tùy chỉnh cho các đặc điểm của thư rác văn bản. Nội dung được chuyển hướng cho bên thứ ba cũng sẽ tự động được lọc ra.

Liên kết web:

Phát hiện văn bản thông minh Sumei: xác định nhanh văn bản nguy hiểm

Sumei sử dụng công cụ nhận dạng nội dung thông minh toàn diện để xác định hiệu quả nội dung nhạy cảm, bị cấm, khiêu dâm, bạo lực, lạm dụng, chuyển hướng quảng cáo và nội dung văn bản rủi ro khác trong các tình huống khác nhau, giúp người dùng xác định thêm thông tin rủi ro. Hiện tại, Sumei đã có thể tự động phát hiện 175 ngôn ngữ nước ngoài và hỗ trợ nhận dạng nhãn rủi ro bằng 18 ngôn ngữ chính như tiếng Anh, tiếng Ả Rập, tiếng Thái và tiếng Indonesia.

Liên kết web:

08. Kết luận: AIGC tạo ra cuộc cách mạng năng suất trong mọi lĩnh vực

Trở thành phi công phụ cho người sáng tạo

Con đường AIGC đông đúc, ngoài viết, tạo hình ảnh, chỉnh sửa âm thanh và video, trợ lý văn phòng, phát hiện nội dung, v.v., còn có nhiều phân mục khác đang chờ khám phá.

Ngày nay, AI đang tiến sâu vào lĩnh vực sản xuất nội dung số, ngoài việc có thể so sánh với các chuyên gia về viết lách, hỏi đáp, vẽ tranh và các thành phố hàng thế kỷ, nó còn thể hiện khả năng hiểu biết mạnh mẽ về các mô hình ngôn ngữ lớn. Nhưng nó chỉ có thể đóng vai trò là "Copilot (đồng lái/trợ lý)" để hỗ trợ con người đưa ra quyết định, hỗ trợ người sáng tạo trong quá trình sản xuất liên tục và lặp đi lặp lại các ý tưởng và sẽ không thay thế những công việc thực sự có giá trị đó.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

2 thích

Phần thưởng
2
Bình luận
Đăng lại
Retweed

Bình luận

0/400

Không có bình luận

巴比特_

Chủ đề thịnh hànhXem thêm
#Gateperpdexislive
65.6K Phổ biến
#Joingrowthpointsdrawtowiniphone17
120.3K Phổ biến
#Cryptomarketrebound
238.3K Phổ biến
#ShowMyAlphaPoints
167.1K Phổ biến
#Fedofficialsspeakup
17.9K Phổ biến

Ghim

sơ đồ trang web