Notion AI は、執筆、編集、要約などを主な機能とするライティング アシスタントです。さまざまなシナリオのニーズを満たすために、ブログ投稿、会議スケジュール、ソーシャル メディアのコピーライティング、プレス リリース、セールス メール、詩などを自動的に生成できます。ユーザーは、Notion AI に記事の初稿を処理させて、執筆のアイデアをさらに得ることができます。また、Notion AI をエディターとして使用して、スペル、文法、翻訳の間違いをチェックすることもできます。
テキストや画像などの応用シーンに加え、音声も日常生活で幅広く接する応用シーンです。人間の声の変更、音声合成、ショートビデオのクローン作成は、アニメーション、映画、ゲームのキャラクターの吹き替えなどのオーディオ分野で AIGC が人気のある研究技術であり、現在では AI によって実行できるようになりました。 Microsoft や Google などのテクノロジー企業も、独自の Text-to-Speech (テキスト読み上げ) サービスを開始しています。
AI オーディオ ツールは、機能特性の違いに応じて 2 種類に分類できます。1 つは、So-Vits-Svc、Adobe Podcast AI Voice、Magic Sound Workshop などに代表される、AI 技術を使用して音声を修復し、オーディオを改善する音声処理ツールです。 2つ目は、MusicLM、Netease Tianyin、Aivaなどに代表される、より細分化された分野で「テキストを音楽に変換する」機能を実現できる音楽制作ツールです。
Outlook の Copilot は、ユーザーが特定の基準に従ってメールを分類したり、長いメールの件名を要約して絞り込んだり、いくつかのキーワードや下書きを公式メールに転記したりするのに役立ちます。
Webリンク:
Google Workspace: テクノロジー + オフィス = 労働者のためのアーティファクト
Google Workspace は、ドキュメント、スライド、シート、Gmail などのオフィス ツールを含む Google ワークベンチであり、Google は 3 月にこれらのツール コンポーネントに AI を統合すると発表しました。生成 AI モデルにアクセスした後、ユーザーは短いテキストの説明を入力することで、これらのツールを利用して完全な電子メール、ビジネス プラン、または広告マーケティング料金表を作成できるようになります。
ドキュメントでは、生成 AI がユーザーのテキストの初稿の下書き、推敲と修正、校正とエラーの修正を支援し、Gmail ではメールの返信と要約、重要事項のマークなどを行うことができ、スライドでは画像、音声、ビデオを自動的に生成できます。テーマを設定してテンプレートに挿入すると、シートはデータ処理、表の並べ替え、コンテキスト分類、さらには生データ分析を自動的に実行できます。
バイトダンスのオフィスプラットフォームである飛秀も4月11日、インテリジェントAIアシスタント「My AI」をローンチした。その機能には、会議議事録の自動要約、レポートの作成、テキストコンテンツの継続的な作成と最適化などが含まれます。Feishu では、My AI はユーザーが対話を通じてスケジュールを作成したり、社内のナレッジベースを検索したりすることも支援します。ただし、My AI はまだ開発中であり、パブリック ベータ版とリリース時期はまだ発表されていません。
Webリンク:
Shopify: AI が e コマースの顧客サービスを数秒で変革します
3月1日、ChatGPTがAPIの公開を発表した後、越境電子商取引サービスプラットフォームのShopifyが統合を先導した。 ChatGPT を統合した後、Shopify はインテリジェントなカスタマー サービスを使用してユーザーとコミュニケーションし、消費者がパーソナライズされた推奨事項を作成できるように支援し、購入時間を節約できます。ChatGPT はまた、レビュー データ分析、タイトルとキーワードの最適化、マーケティング コピーライティング、およびプラットフォーム製品向けのインテリジェントな Web サイト開発プログラミングも実行します。他にも、電子商取引 Web サイトの運営効率を向上させ、消費者の購買体験を最適化するための多くの機能を備えています。
Webリンク:
eコマースChatGPT: eコマース予想屋
Webリンク:
GitHub Copilot X: プログラミング Xiaobai はコードも書くことができます
Microsoft が Bing 検索エンジン、Edge ブラウザー、および Office ファミリー バケットの新バージョンを発表した後、そのコード ホスティング プラットフォーム GitHub も Copilot X をリリースしました。これにより、ChatGPT が統合開発環境に導入され、コード基盤のないユーザーでも「口を動かす」ことに頼ることができます。 「コードを書き出してください。
テキスト生成やオーディオおよびビデオ編集などの応用性の高い AI ツールに加えて、さまざまな新しい AIGC 製品が日常生活に登場しています。
たとえば、ChefGPT は毎日頭痛に悩まされているユーザー向けのレシピの生成を支援し、Dover Autopilot はヘッドハンターに高品質の人材履歴書を提供する AI 採用ツール、BibiGPT はビデオを見ながらメモを取ることができ、Bedtime Story AI は個人の好みに合わせて映画リストを推奨する WatchNow など、完全な知的生活はもはや SF 映画の中だけのプロットではなく、AI が私たちの日常生活に完全に浸透しています。
Copyleaks は現在、世界で最も人気のある AI コンテンツ検出ツールの 1 つであり、最も顕著な利点は、英語のコンテンツの検出に加えて、スペイン語、フランス語、その他の言語で書かれたコンテンツも検出できることです。すべて AI によって生成されたテキストの場合、Copyleaks は 99.99% の認識精度を達成できますが、半分本当か偽のテキスト コンテンツについては、人工的に生成されたテキストとしてマークされます。
Webリンク:
AIGC-X: 鋭い目で中国語テキストの真偽を識別します
人民日報の子会社でコンテンツ リスク管理に重点を置く People.cn Information Technology Company は、中国初の AI 生成コンテンツ検出ツール AIGC-X を開発しました。このツールは、機械生成テキストと機械生成テキストを区別するために使用できます。フェイクニュース、コンテンツ盗用、スパムなどを人為的に検出してスクリーニングすることができ、特に虚偽情報、学術詐欺、フィッシングなどのグレーゾーンの技術サポートを提供します。
ゼロサンプル検出ツール DetectGPT は、米国スタンフォード大学の研究チームによって開発され、主に大学でよく見られる論文生成現象に対処するために使用されています。 「DetectGPT: Probability Curvature を使用した Zero-Shot Machine-Generated Text Detection」と題された研究論文が、プレプリント Web サイト arXiv で公開されました。
吐血が 100 個の AIGC アーティファクトを選別し、作業員の作業がスピードアップします。コレクションを強くお勧めします!
出典: 知恵
著者 | ウー・フェイニン
編集者 | 李水清
原題:『ロールの王様が使ってる!共有できるお宝レベルの AIGC ツール 100 個。コレクションに強くお勧めします。 ! 」
AIGC ツールと言えば、まだ ChatGPT しか知りませんか?
実際、OpenAI の GPT に基づいていない AIGC アプリケーションが増えています。エンターテインメントの分野では、歌手「AIステファニー・サン」や「AIジェイ・チョウ」のカバー曲が人気となり、歌手自身も驚いた、電子商取引の分野では、AIバーチャルヒューマンがAIが生成したスクリプトを24時間365日読み上げる、企業向けに何百万もの商品を販売しました ; 特別教室では、聴覚障害者が知識を学ぶのを助けるために、仮想教師が音声コンテンツに基づいて手話コースを出力します... これらのシナリオは、大規模な自社開発モデルまたはオープンソースの着地点となっていますモデル。
Zhishi の統計によると、5 月中旬の時点で、世界には少なくとも 100 の代表的な AIGC ツールが存在します。日常のオフィスワークからソーシャルメディアまで、ゲーム制作からグラフィックデザインまで、金融規制から商品販売まで、AIGCツールの役割位置付けは、これまでの「観察+予測」から今日の「生成+意思決定」へとグレードアップし、 AIGC「奇数点」の実装」が表示されます。
テキスト ライティングの分野では、ChatGPT や Wenxinyiyan などの会話型チャットボットによって主導される AIGC ツールは、人々が情報を取得する時間とコストを節約し、一連の非効率的で反復的なタスクを対話形式で完了できます。 、テンセントウェンヨン、WPSスマートライティングなど。
画像生成の分野でも、AIGC は以前の描画方法を覆し再構築し、「Yiwen Shengtu」はクリエイターにさまざまなスタイルと無限のインスピレーションの源を提供し、デザインの分野で生産性の革命を引き起こしました。 Midjourney や DALL-E などのツールは、人々の想像力の限界を拡大し続けています。
オーディオとビデオの分野では、AI が膨大なソースデータを分析することで、あらかじめ設定されたスタイルに従ってオーディオとビデオを生成できるため、作成サイクルが短縮されるだけでなく、物理的な空間と時間の制限も突破されます。一般的に使用されるツールには、Xunfei Hearing、MusicLM、Runway Gen-2 などが含まれます。
上記の応用シナリオに加え、コラボレーションオフィス、語学学習、EC生放送、プログラミング、デジタルヒューマンバーチャルアイドルなど、より細分化されたシナリオもあり、AIGC技術は技術レベルから低い限界コストで利用でき、高効率でユーザーの個別のニーズを満たす方法。
さらに注目に値するのは、フィッシング情報やフェイクニュースがページに氾濫する現代において、AIGCコンテンツと本物のコンテンツを区別するために、NetEaseとPeople's Daily Onlineがコンテンツのリスクを制御するAIGCコンテンツ検出ツールを相次いで立ち上げたことだ。海外には、テキスト盗作検出に特化した Copyleaks や論文の盗作チェックアシスタント DetectGPT など、AIGC コンテンツ検出に関連するツールもあります。
**この記事では、7 つのセクションから 100 以上の AIGC ツールを解釈し、ユーザーの仕事の生産性向上に役立つ Web リンクを添付します。 **実際、国内外の AIGC ツールは毎日キノコのように出現しているため、この記事に含まれる 100 個の AIGC ツールは業界を完全にカバーしているわけではありませんが、カテゴリと方向性の観点から業界にある程度の参考情報を提供します。
01. AIGC 書き込みツール: ワンクリックで書き込み
ライフシーンやオフィスシーンに最適
テキスト生成は AIGC の最初の商用テクノロジーの 1 つであり、AIGC がこれまでに開発した中で最も成熟したテクノロジーでもあります。今日、AI ライティング ツールは、文脈を理解し、常識的な知識を捕捉し、長いテキストを生成し、完全かつ正確で論理的なコンテンツを生成する能力において質的飛躍を遂げています。
AI ライティング ツールの主な導入シナリオは、次の 3 つのカテゴリに大別できます。
Notion AI は、執筆、編集、要約などを主な機能とするライティング アシスタントです。さまざまなシナリオのニーズを満たすために、ブログ投稿、会議スケジュール、ソーシャル メディアのコピーライティング、プレス リリース、セールス メール、詩などを自動的に生成できます。ユーザーは、Notion AI に記事の初稿を処理させて、執筆のアイデアをさらに得ることができます。また、Notion AI をエディターとして使用して、スペル、文法、翻訳の間違いをチェックすることもできます。
現在、同ツールは「無料トライアル+有料」モデルを採用しており、新規ユーザー1人あたり20回の無料トライアル機会が提供され、回数を使い切った後はサービスを購入する必要がある。価格は10ドル/人/月である。 、68.9元に相当します。
Wenxinyiyan は、Baidu が開発したチャット ロボットで、ユーザーとの対話や対話、質問への回答、創作支援などを主な機能として、ユーザーが情報、知識、創造的なインスピレーションを得るのを支援します。利用シーンとしては、文学創作、ビジネスなどがあります。コピーライティング、数学と科学、計算、中国語解釈、マルチモーダル生成など。
Wenxinyiyan の利点には、コピーライティングに加えて、画像を作成する機能や、コピーライティングに基づいてビデオを自動的に生成する機能が含まれます。
Tongyi Qianwen は Alibaba Cloud の大規模な自社開発モデルで、現在、主に効率、生活、エンターテイメントに分類された 9 つのアプリケーションが搭載されています。
(1) 効率カテゴリには、アウトライン作成、SWOT 分析、製品説明の作成という 3 つのアプリケーションが含まれます。
(2) ライフカテゴリー。「空飛ぶレシピ」、「小学生の作文」、「そして」の 3 つのアプリケーションが含まれます。
(3) 「虹のおならの達人」、「ラブレターを書く」、「あなたに詩を書く」などのエンターテイメント カテゴリ。
現在、Tongyi Qianwen の主な機能には、コピーライティング、対話とチャット、知識の質問と回答、論理的推論、コード作成、テキストの要約、画像とビデオの理解サービスが含まれます。
Xunfei Xinghuo は、iFLYTEK が 5 月 6 日に発表した大型モデルで、テキスト生成、言語理解、知識の問答、論理的推論、数学、コード、マルチモダリティの 7 つの側面を備えており、評価と比較の結果、言語理解力と数学能力においてChatGPTを上回りました。
Xunfei Xinghuo は、マルチスタイル、マルチ言語、マルチタスクの長文生成を完了でき、英語コピーライティングの文法検出とエラー修正も実行でき、その言語理解能力は中国で測定可能な既存のシステムに劣りません。
Webリンク:
AI企業Mobvoiが立ち上げた大規模言語モデル「Sequence Monkey」は、その能力システムが言語を核とし、「知識、対話、数学、論理、推論、計画」の6つの側面をカバーし、同時にテキストをサポートすることができます。生成、画像生成、3D コンテンツ生成、音声生成、音声認識などのさまざまなタスク。
Sequence Monkey は、「湖南省と湖北省ではどちらの省都が人口が多いですか?」「天猫を運営する会社の創設者はどちらの学校を卒業しましたか?」など、自然言語の理解、知識、論理、推論の一定の能力をすでに備えています。 . さらなる検討が必要なこのような質問に対して、正確な結果を迅速に提供できるようになりました。
openapi.mobvoi.com
Wenyong Effidit (効率的でインテリジェントな編集) は、Tencent AI Lab によって開発されたインテリジェントなライティング アシスタントです。AI テクノロジーを使用して、ライターのアイデアを発散し、表現を豊かにし、テキストの編集と執筆の効率を向上させます。その機能には、インテリジェントな修正エラー、テキスト補完、テキスト書き換え、テキスト拡張、単語推奨、文推奨、生成などの機能。
7.WantQuotesの意味から文章を調べる:名言事典
これは、清華大学の研究チームによって開発されたコピーライティング処理ツールであり、最先端の AI と自然言語処理 (NLP) テクノロジーを使用して、人々が読み書き、コピーライティングの検索、有名な引用をより便利かつ迅速に処理できるようにします。 。
ユーザーは関連する主題の語彙を入力するだけで、関連する有名な言葉、詩、ことわざ、慣用句などを見つけることができます。
8.逆引き辞書WantWord:同義語・同義語辞書、別れの言葉は表現力豊かではない
逆引き辞書と意味による文章検索はどちらも清華大学の研究チームによって開発されており、与えられた単語からより適切で鮮明な同義語を見つけるのに役立ち、中国語と英語の同時翻訳や相互翻訳もサポートします。
Xiliu は、小規模な組織や個人向けのサービスの提供に重点を置いたナレッジ マネジメントおよびコラボレーション オフィス ソフトウェアです。文書作成、知識ストレージ、多次元テーブル、マインド マップなどの複数の機能を 1 つのプラットフォームに統合しています。ユーザーは大学生です。グループはメイン グループであり、総ユーザー数の 1/3 以上を占めます。
FlowUSはChatGPTにも対応しており、ユーザーはFlowUS AIを利用して、執筆、継続執筆、翻訳、推敲などの機能を自分のニーズに応じて実現できます。
WPS Smart Writing は、ユーザーの効率的な作成を支援するために Kingsoft Office が発売したインテリジェント ライティング製品で、主に自動テキスト生成、補助下書き、インテリジェントな文章補完、インテリジェントなテキスト校正の 4 つの機能が含まれています。
そのテキストデータと関連情報は、権威あるメディアや政府の公開ウェブサイトから取得されており、主題はスピーチ、要約、計画、ニュースなどのさまざまな執筆シナリオをカバーしており、金山文書と関連付けられているため、同時アップロードを実現できます。オンラインで執筆した後、ユーザーは Kingsoft Documents にアクセスして、植字などのより専門的な文書編集を実行できます。
英語のスペルチェックツールGrammarlyも、ユーザーが入力したキーワードプロンプトに基づいて電子メールの下書きを生成したり、既存の記事の口調やテキストスタイルの変更、記事の長さの調整などを支援したり、下書きを作成したりできるAIサービスGrammarlyGoを開始しました。トピック作成のアウトライン。
Volcano Writing は ByteDance が立ち上げたライティング アシスタントで、現在、全文編集のための AI スマート ライティング サービスをサポートしています。論文の校正、履歴書の推敲、留学の申請書類の作成、セルフメディアのコピーライティングなど、20 以上の作業をサポートしています。シナリオの作成、Volcano Writing をカバーできます。
ユーザーは磨き、修正したいテキスト内容を入力し、「ワンクリック最適化」をクリックすると、テキストの種類、スタイル、執筆目的を自動的に識別し、修正範囲やプラットフォームも調整できます。ワンクリックで原文に基づいて出力できるほか、英語のリライト結果はインテリジェントな誤り訂正や各種リライトなどのAI機能にも対応しており、より本格的で簡潔な言語表現となります。
Zhishi Q&A は AI テクノロジーに基づいたインテリジェントな Q&A システムで、ユーザーが Zhishi Q&A プラットフォームに質問を入力すると、システムが自動的に質問を分析して最適な回答を提供します。同時に、さまざまなユーザーのニーズを満たすために、テキスト入力、音声入力などのさまざまなインタラクティブな方法も提供します。
上記のおなじみのAIGCライティングツールに加えて、Friday AI Writing Assistant、Love Rewriting、Claude、Creator、Secret Tower Writing Cat、Subtxt、Writesonicなど、ユーザーエクスペリエンスを待っている「不人気製品」がまだたくさんあります。
02. AIGC 画像ツール: ヴィンセントの地図はミッドジャーニー以上のものです
ワンクリックで自由にペイント
2022 年は「AI ペイント元年」と言え、さまざまな AI ペイント ツールが、テキスト プロンプトの助けを借りて、優れた画像理解と生成機能を実証しました。
GPT-4 の助けにより、「ヴィンセント マップ」の分野でも競争の新たな波が始まりました。 V5 バージョンにアップデートされた Midjourney は、カップル写真がインターネット上で人気を博しており、デザイン業界のリーダーである Adobe もそれに負けず劣らずの勢いで「Adobe Firefly」のリリースを急いでいます。デザイン担当者の大多数。今日の AI 画像ツールは、商業化と芸術性の点で昨年よりも成熟し、多様性に富んでいます。
画像ツールの技術シナリオは、画像生成、画像部分変更、画像編集の 3 種類に分類できます。
2つ目は画像編集です。主な機能には、Imagen AI や Chuangketie AI Painter などの製品に代表される、インテリジェントな画像透かしの削除、スタイル フィルターの設定、画像スタイルの変更または画像の鮮明さの向上などが含まれます。
3つ目は部分的な画像修正で、代表的な製品はAdobe Fireflyです。その主な利点は、画像の一部の要素を変更したり、レイヤーごとに修正および調整したりすることに重点が置かれており、二次創作や制作後の改善に適しています。
Disco Diffusion は、Google Colab 上で動作する描画プログラムです。Google アカウントを持つユーザーはブラウザ上で直接実行できますが、ユーザーには特定のコードの知識が必要です。
ユーザーが説明文を入力すると、プログラムは対応するシーンの画像を自動的にレンダリングして生成できます。より夢のようなスタイルの抽象的な画像を生成することに優れており、現実的な表現を生成し、より多くのテキスト説明を入力する場合の効果は平均的です。
Webリンク:
Midjourney は、Discord 上で実行されている Disco Diffusion の作者の 1 人が立ち上げた AI 絵画チャットボットです。 GPT-4 の発売後、すぐに V5 バージョンに変更されました。新しいバージョンは、画像の忠実性と細部の処理の点でより洗練されており、商品化のレベルがより高く、ほぼ「本物を偽装できる」レベルに達しています。
以前のバージョンでは、生成される画像のスタイルは漫画や超現実的なものが多く、現実的な画像はほとんどありませんでしたが、V5 バージョンにアップデートした後、Midjourney は真と偽の区別が難しいカップルの写真群で急速に人気を博しました。手のクローズアップや目のクローズアップ、光と影の処理など、よりリアルな動画の質感を実現しました。
さらに、Midjourney V5 では、ユーザーがアスペクト比をカスタマイズでき、説明テキストを入力するときに、より詳細な形容詞や感情、スタイル、色合いなどの画像の詳細が必要となるため、ユーザーは画像をより積極的に制御し、より明確な想像力を発揮する必要があります。
Stable Diffusion は無料のオープンソース AI 画像生成ツールであり、現在、Stable Diffusion XL の最新バージョンが公開テストされています。
以前のバージョンと比較して、新しい SD-XL のユーザーは、画像を生成するために短い説明を使用するだけで済みます。画像の人体の構造と細部の処理は、より現実的であり、人々の美学に沿っています。生成されたポートレートは、また、より明確でより現実的です。
DALL-E 2 は、OpenAI が開発した画像生成・編集ツールで、優れた生成効果と芸術的な色彩で有名です。ユーザーは概要を入力するだけで、コンセプト、属性、スタイルの3つの要素を統合し、ユーザーのニーズに合わせたリアルな画像を生成すると同時に、次のような描画スタイルを持たせることもできます。さまざまなアーティスト。
例えば、ユーザーがコンセプト「子犬」、属性「草の上」、スタイル「ポップアーティストのアンディ・ウォーホル風」の3つの要素を入力すると、この3つの条件を満たす写真を生成することができる。このツールの機能には、画像編集、スタイルモーフィングなども含まれます。
Imagen AI は、Google が開発した Text-to-Image AI ツールで、ユーザーの手書きのプロンプトに従って、肖像写真、油絵、CGI レンダリングなどの画像を出力でき、画像の現実感が強く、言語理解の精度も高くなります。 。
Webリンク:
Adobe Firefly は、Adobe と Nvidia によって発売された AI 描画ツールで、現在、テキストから画像を生成する機能、スケッチを画像に変換する機能、ワンクリックで画像の内容を変更する機能を実現しており、自動生成された画像をレイヤーやレイヤーで変更することもできます。超高解像度レートの画像を出力します。
Wenxin Yige は、Baidu がフライングパドルと Wenxin 大型モデル技術に基づいて発売した AI ペイント製品です。ユーザーは、独自のクリエイティブ テキストを入力し、希望する画像スタイルを選択するだけで、Wenxinyige によって生成される画像を取得でき、画像の種類、画像の比率、一度に生成する画像の数も選択できます。現在、Wenxin Yige は油絵、水彩、アニメーション、リアリズムなど 10 種類以上の異なるスタイルの画像をサポートしています。
Webリンク:
Luban は、Alibaba Intelligent Design Lab が独自に開発した画像デザイン製品です。 AI画像生成技術を基に、Lubanは大量のバナー写真、ポスター写真、会場写真のデザインを短時間で完成させることができます。ユーザーは実現したいスタイルとサイズを入力するだけで、Luban は材料分析、切り抜き、カラーマッチングなどの時間と労力のかかるデザインプロジェクトを手動で置き換え、要件を満たす複数のデザインソリューションセットを生成できます。リアルタイムの要件。
2017 年の「ダブル 11」プロモーション中、Luban は 1 秒あたり 8,000 枚のポスターを生成し、その間に合計 4 億枚の製品ポスターが作成され、AI の描画能力に対する人々の理解が新たになりました。
起業家のデザインプラットフォームであるChuangketieは、人工知能ペイント製品であるAI Painterを発売し、一般的に使用される2つの機能シナリオ「Wen Sheng Tu」と「Tu Sheng Man」を開始した。
「Wen Sheng Tu」シナリオでは、ユーザーは簡単な必要なテキストを入力し、必要な絵画スタイルを選択するだけで、ワンクリックで目的の画像を生成できます。既存のスタイルには、古代スタイル、油絵、カラー絵画、コミックが含まれます、CGなど。
「Picture Man」シナリオでは、対象の画像をアップロードし、簡単なテキスト指示を入力するだけで、エッジ検出、線画着色、ポーズ検出などの機能を備えたカスタマイズされた手描き画像を取得できます。
03. AIGC オーディオ ツール: 可変サウンド、クローン作成、ノイズ リダクション
テキストや画像などの応用シーンに加え、音声も日常生活で幅広く接する応用シーンです。人間の声の変更、音声合成、ショートビデオのクローン作成は、アニメーション、映画、ゲームのキャラクターの吹き替えなどのオーディオ分野で AIGC が人気のある研究技術であり、現在では AI によって実行できるようになりました。 Microsoft や Google などのテクノロジー企業も、独自の Text-to-Speech (テキスト読み上げ) サービスを開始しています。
AI オーディオ ツールは、機能特性の違いに応じて 2 種類に分類できます。1 つは、So-Vits-Svc、Adobe Podcast AI Voice、Magic Sound Workshop などに代表される、AI 技術を使用して音声を修復し、オーディオを改善する音声処理ツールです。 2つ目は、MusicLM、Netease Tianyin、Aivaなどに代表される、より細分化された分野で「テキストを音楽に変換する」機能を実現できる音楽制作ツールです。
「AI ステファニー サン」は一夜にしてインターネット上で人気となり、彼女がカバーした「Hair Like Snow」や「Rainy Day」などの曲は Bilibili で 100 万回以上再生され、これらの曲は UP オーナーによって引き継がれています. オープンソース プロジェクト So-Vits-Svc によって作成されました。
有名な歌手の声をシミュレートすることに加えて、電話録音、ビデオ、その他の資料に基づいて多数の実際の声をシミュレートすることもでき、以前は一部の UP 所有者が故人とのコミュニケーションにこのモデルを使用していました。ただし、プロジェクトの悪用が増加しているため、作成者はプロジェクトを削除しました。
Adobe Podcast AI Voice は、AI を使用してブログの音声録音の品質を向上させる、Adobe の AI を活用したオーディオ エンハンサーです。
ユーザーが Adobe アカウントにログインした後、ノイズ低減処理が必要な音声ファイルをアップロードすると、AI が自動的に音声ファイルを処理し、満足のいく音声再生効果が得られた後、ユーザーはコンピュータに直接ダウンロードして無料で使用できます。 。
MusicLM は Google がリリースした完全真の生成 AI モデルで、テキストから直接高忠実度の音楽を生成することができます。テキストに加えて、鼻歌、歌、パーカッション、楽器演奏など、MusicLM はこれらの既存のメロディーに基づいて音楽を作成し、音楽が歪まないようにすることができます。
さらに、特定の楽器による演奏曲の生成や、演奏者の演奏レベルの設定も可能で、時代や演奏場所の特性に応じた音楽を作成することもできます。海のオルガン」。
MusicLM は、曲のスタイルや感情に関係なく、最大 280,000 時間の音楽データベースでトレーニングされています。
Webリンク:
Xunfei Hearing は、iFLYTEK のインテリジェントな音声製品であり、iFLYTEK の自然言語処理、声紋認識、音声認識およびその他の音声テクノロジーに依存しています。iFLYTEK Hearing は、さまざまなシナリオでユーザーの音声ニーズを満たすことができます。該当するシナリオは、会議の議事録などのさまざまな場面をカバーします。講演、メディアインタビュー、個人的な執筆。
また、ビデオへの二か国語字幕の追加、多言語同時通訳、ビデオ会議用の字幕生成などの優れた機能もあり、ユーザーが言語の壁を乗り越え、コミュニケーションとコラボレーションを促進するのに役立ちます。
Netease Tianyin は、Netease が開発した AI 音楽作成システムで、オンラインで AI 音楽を作成できます。最大のメリットは楽曲制作の敷居が低く、短時間でガイドラインに沿ったオリジナルアレンジ楽曲を完成させることができることです。
Tianyin のワークベンチには、ポップ、フォーク、エレクトロニック、ナショナル スタイルなど、特定の音楽スタイルが多数含まれています。ユーザーが独自のコードのセットを一から作成することをサポートし、プリセット コードを編集セクションにドラッグすることもサポートします。全体を編集するすべての編集が完了すると自動でレンダリングされ、少し待つだけで自分で作ったオリジナルアレンジが完成します。
Moyin Workshopは、AI企業Going to askが立ち上げたAI音声シリーズ製品で、ユーザーはAI音声技術を効率的かつ便利に利用して、個人の特徴を備えた現実の人の声をシミュレートし、AI音声コンテンツを作成し、テキストを現実の人間に変換することができます。クリック音。
ユーザーは、音声に合成したい記事をインターフェースに素早くインポートし、文書と同様の操作ページを通じてオンライン編集を行うことで、文書を便利に音声に変換することができます。編集ページの機能には、強勢マーク、複数発音文字、タイプミスマーク、背景音の追加、複数人混合ダビング、変速、リズムなどの機能が含まれます。
テクノロジー、金融、その他の分野を好むユーザーのために、Moyin Workshop は多くの関連企業の CEO の AI 音声モデルもバックグラウンドで追加しており、これらに精通したユーザーが自分の声を使用してオーディオ コンテンツを制作できるようにしています。
FakeYou は、ディープ フォージェリ技術を使用して、さまざまな言語や音声でテキスト読み上げを生成するテキスト読み上げオーディオ編集ツールです。ユーザーは、お気に入りのキャラクターの声を使用してオーディオを作成でき、AI テキストも提供します-音声合成機能。
ユーザーが生成したい文章を入力し、読み上げたい人を選択して「話す」ボタンをクリックすると、対象者が「話した」音声が自動生成されます。
LyricStudio は、ユーザーが自分のスタイルを模倣し、特定の単語の韻を見つけるオリジナルの歌詞を生成するのに役立つオンライン歌詞メーカーです。ユーザーはテキストの説明や音楽クリップをアップロードすると、内容に合った歌詞に変換されます。
公式ウェブサイトのデータによると、このツールは協力して 100 万曲以上の曲を作成しており、プラットフォーム上のユーザーの 15% はプロの音楽プロデューサーです。 LyricStudio は、ラッパー カーチス キングの iTunes ナンバー 1 アルバムの歌詞作成を支援しました。
Webリンク:
LALAL.AI は、音楽からボーカルと楽器をセグメント化して抽出できるオンライン音楽分離ツールです。
オンライン音楽分離技術は完全に機械学習と人工知能に基づいており、以前のバージョンでは人間の声しか分離できませんでしたが、今ではオーディオ ファイルやビデオ ファイルから人間の声、エレキギター、アコースティック ギター、ピアノ、ドラムを正確に抽出できるようになりました。 .、ベース、その他多くの楽器。
Aiva は、AI 音楽会社「Aiva」が自社開発した同名の AI 音楽ツールです。ユーザーは、AI 技術を通じてミュージシャンのオリジナル音楽の制作と作曲を支援できます。プラットフォームは、クラシックなどのさまざまなスタイルをカバーします。 、ロック、電子音楽、ポップ、ナショナル スタイル、ブルース、ヒップホップなど。自動作曲ページでは、調号、拍子、ペーシングレート、楽器、デュレーションなどを含む 11 のジャンルからユーザーが選択できます。
アイバはまた、モーツァルト、バッハ、ベートーベンなどの音楽家の代表的な作品や音楽スタイルを深層学習を通じて研究し、これらの音楽的特徴に基づいて音楽家の音楽制作を支援する学習モデルを確立しました。同時に、アイヴァは史上初の認定AI作曲家でもあり、これまでに5枚のアルバムを出版している。
Webリンク:
Supertone は、韓国の AI クリエイティブ サウンド スタジオです。音声合成とリアルタイム音声強調技術を提供し、ユーザーが芸術作品や歌などの単純なテキスト読み上げなど、さまざまな種類のサウンド コンテンツを簡単に作成できるようにします。個人情報問題への不安を軽減するために。
Supertone は、ユーザーの音声を他のユーザーの音声と区別するデジタル指紋に変換する「VoicePrint」と呼ばれる技術も提供しています。
Webリンク:
04. AIGCビデオツール:ストーリーボードの自動編集・生成機能はこちら
ヴィンセント グラフは現在 AIGC テクノロジーの主流となっていますが、テキストからビデオへの生成はまだ初期段階にあります。
ニューヨークを拠点とする AI スタートアップ Runway は、簡単な説明から高度に合成されたビデオを生成できる生成ビデオ モデル Gen-2 を開発しました。画像編集プラットフォーム PiscArt が立ち上げた Text2Video-Zero、Video-P2P、TemporalNet、Ali が開発した Text-to-video など、他の企業も参入しており、テキスト生成ビデオも近い将来熾烈な競争に参入する可能性があります。 .ステージ。
ディープフェイクは今やAI合成動画の代名詞となっている。マイクロソフトは、ぼやけたオリジナル画像を鮮明で信頼できる偽造画像に加工できる FaceShifter を発表、ディズニーとスイス連邦工科大学チューリッヒ校はメガピクセルレベルのディープフェイク動画制作ツールを共同開発、発売し、「スター・ウォーズ」シリーズの映画ではディープフェイクが登場しました。亡くなった俳優を大画面に呼び戻すために使用されました。
しかし、これに起因するセキュリティリスクも次々と発生しており、一部の高精細で極めて自然光の高い動画については、最も高度な Deppfakes アルゴリズムでも正確に識別できない場合があります。
その結果、2020年の米国選挙の早い段階で、Facebookはプラットフォーム上でのディープフェイクの使用を完全に禁止すると発表し、YouTubeとTikTokも例外ではなく、動画でのディープフェイク技術の違法使用を明示的に禁止した。 2021年に我が国で施行される予定の「民法」でも、主要な動画プラットフォームはAIによる顔を変える動画のコンテンツを厳しく制限する必要があり、許可なく勝手に使用してはならないと指摘している。
Gen-2は、スタートアップ企業Runwayが提供するエンドツーエンドのTransformerモデルで、写真やテキストを条件としてオリジナルのスロースタイルビデオをゼロから生成することができます。
生成されるビデオの解像度は 1280×720 と高く、再生時間は約 30 ~ 60 秒で、現在、ビデオの生成、画像の生成、テキスト プロンプトに応じた無制限の画像の拡大、画像スタイルの混合などの機能が実現できます。 、AI モデルのトレーニング、ビデオ内の要素の削除、背景の減算など。
最近、Runway は Gen-1 モデルを使用した最初のモバイル アプリケーションをリリースしました。ユーザーは携帯電話でテキスト、写真、ビデオをアップロードし、モデルがコンテンツに応じてビデオのスタイルを変換できるようにします。
Webリンク:
Meta は 2022 年 9 月に、独自のテキストをビデオに変換するソフトウェア「Make-A-Video」をリリースしました。ユーザーがいくつかの簡単な単語の説明を入力すると、ソフトウェアはサイレントビデオを作成します。
公式デモ動画では、「大雨の中を歩く若いカップル」「似顔絵を描いているテディベア」などのテキスト説明を入力すると、数秒間の動画を取得できる。さらに、Make-A-Video は、「Vincent ダイアグラム」テクノロジーに基づいて、静止画像をアニメーション化することもできます。
関係者によると、モデルは画像合成データとラベルのないビデオを使用してトレーニングされ、学習後、モデルは画像の次に何が起こるか、どこに移動するかを「予測」し、画像が存在する場所に移動することができます。短い時間. 短いビデオを形成しているように見える場所。
Webリンク:
センスタイムは、スクリプト生成、背景差し替え、横画面・縦画面差し替え、字幕などクリエイティブなショートビデオをワンクリックで生成できるショートビデオ作成エンジン「SenseTime」を含む、SenseTimeのワンストップ広告・マーケティングプラットフォームを開始動画広告制作のためのさまざまなサービスは、広告主が広告コンテンツ制作コストを節約するのに役立ちます。
SenseTimeに含まれる「ビデオ要素分析」サービスは、AIビデオ構造化技術によりショートビデオの各ショットの長さ、シーン、シーン、キャラクター、小道具、セリフなどの情報を分析・抽出し、大幅にAショットスクリプトを自動作成することができます。脚本作成時間を短縮し、クリエイターの二次創作を効果的に支援します。
さらに、このプラットフォームはクリエイターにクリエイティブなインスピレーションを提供する人気のビデオスクリプトも多数提供します。
Webリンク:
Decoherence は、ユーザーがさまざまな AI スタイルから選択できる AI ビデオを作成するためのツールです。
Webリンク:
「Tencent Zhiying」は主にショートビデオクリエイターを対象としており、その特徴的な機能は本物の著作権素材とデジタルヒューマンブロードキャストです。ユーザーは写真とテキストをアップロードすることでデジタル ヒューマン ビデオを生成できます。また、インテリジェントAIダビング機能と組み合わせて、デジタルヒューマンに合わせてさまざまな音色を選択することもできます。
Webリンク:
05. AIGCオフィスツール:AI+OAで「ゼロから」ワンクリックを実現
3月17日、マイクロソフトはGPT-4とChatGPTの機能をOfficeツールに統合した「Microsoft 365 Copilot」を正式リリースし、Office 365のデータを統合したビジネスチャット機能を開始したことで、デジタルオフィスのレベルを向上させ、従業員を非効率な作業から解放した。反復的な労働から。
また、Kingsoft Office は、国内コラボレーション オフィス分野のリーディング カンパニーとして、大規模な言語モデル機能を備えた生成オフィス プラットフォーム「WPS AI」をわずか 1 か月でリリースし、国内コラボレーション オフィス トラック初の ChatGPT ライク アプリケーションとなりました。さらに、Baidu、ByteDance、DingTalk などの企業が、独自の AI コラボレーション オフィス ツールを次々と発表しています。
OA(オフィスオートメーション)アプリケーションシステムは徐々に発展、成熟し、従業員と企業をつなぐ架け橋として、将来的にはBエンドエコロジーにおける大きな言語モデルの入り口となる可能性があります。
AI ツールは、コラボレーション オフィスの分野に加えて、より垂直的なシナリオにも適用でき、より現実的なニーズと組み合わせることができます。たとえば、「AI + 言語学習」には DuolinguoMax があり、「AI + e コマース配信」には、 eコマースのスマート版、eコマースサイトShopify、eコマースマーケティングツールeCommerceなど 「AI+プログラミング」ではGitHub Copilot Xを開発者向けの強力なアシスタントとし、「AI+マインドマップ」ではマインドマップを生成できるChatmindを搭載文章説明付き。
3月17日早朝、GPT-4に続いてMicrosoft 365 Coplilotが登場し、Word、Excel、Powerpoint、Outlook、Teamsなどすべてのオフィスソフトに生成AI機能が搭載された。
Word では、Copilot は初稿を作成するための簡単なプロンプトを必要とするだけで、プロフェッショナルと真剣、熱心とカジュアルなど、ユーザーのニーズに応じて記事のトーンを調整したり、同じ場所を自動的に削除したりすることもできます。さらに簡略化するために、この記事では、
Excel の Copilot は、ユーザーがデータを分析し、データ傾向を直接分析し、データ分析結果を視覚化するのに役立ちます。
さらに驚くべきことは、Powerpoint は既に PPT を直接生成でき、Copilot は既存の文書をマークされたソースを含む PPT に直接変換できることです。ユーザーが PPT が長すぎると感じる場合は、テキストの説明を直接使用して、ワンクリックでテキストの圧縮、レイアウトの調整、書式設定を行うことができます。
Outlook の Copilot は、ユーザーが特定の基準に従ってメールを分類したり、長いメールの件名を要約して絞り込んだり、いくつかのキーワードや下書きを公式メールに転記したりするのに役立ちます。
Google Workspace は、ドキュメント、スライド、シート、Gmail などのオフィス ツールを含む Google ワークベンチであり、Google は 3 月にこれらのツール コンポーネントに AI を統合すると発表しました。生成 AI モデルにアクセスした後、ユーザーは短いテキストの説明を入力することで、これらのツールを利用して完全な電子メール、ビジネス プラン、または広告マーケティング料金表を作成できるようになります。
ドキュメントでは、生成 AI がユーザーのテキストの初稿の下書き、推敲と修正、校正とエラーの修正を支援し、Gmail ではメールの返信と要約、重要事項のマークなどを行うことができ、スライドでは画像、音声、ビデオを自動的に生成できます。テーマを設定してテンプレートに挿入すると、シートはデータ処理、表の並べ替え、コンテキスト分類、さらには生データ分析を自動的に実行できます。
現在、Google は柔軟な支払いプランを採用しており、ベーシック ビジネス初心者バージョン、ビジネス 標準バージョン、ビジネス プラス バージョンに分かれており、ユーザーは実際のニーズに応じて購読できます。
Baidu Ruliu は昨年末、エンタープライズ サービス市場向けに、インテリジェント ナレッジ マネジメント、インテリジェント カンファレンス、インテリジェント ワークベンチという 3 つのインテリジェント製品マトリックスを含む「Ruliu Intelligent Work Platform 2.0」を発表しました。
インテリジェントナレッジマネジメントには、「インテリジェントナレッジベース」、「検索およびレコメンデーションデュアルエンジン」、「ナレッジスターチェーン」の3つのナレッジマネジメントアプリケーションがあり、分散した文書、電子メール、メモ、その他のファイルを1か所に収集し、従業員が検索できるようになります。必要な書類や知識を最も便利な方法で入手できます。
さまざまなワークカードがスマートワークベンチに収集され、タスクシステムがより柔軟かつ明確になり、さまざまなポジションの従業員に応じてさまざまなワークカードが照合されます。たとえば、HR ワークベンチには、面接アシスタント用のジョブ カードと採用管理モジュールが組み込まれており、マネージャー ワークベンチには、効率の追跡、共同分析、プロセス管理のための 3 次元ワーク カードが含まれており、マネージャーにチーム タスク データを提供します。
Webリンク:
Tongyi Qianwen の大型モデルがリリースされてから 1 週間後、DingTalk は正式なアクセスを発表しました。 Qianwen ラージ モデルにアクセスした後、ユーザーは「/」スラッシュを使用するだけでインテリジェントなオフィス作業を実行できます。主な使用シナリオには、グループ チャット、ドキュメント、ビデオ会議、アプレット開発などがあります。
グループ チャットでは、新規参加者はダイアログ ボックスに「/」を入力するだけで、グループ チャットのコンテキスト ポイントを取得できます。また、スラッシュを使用して To Do 項目を生成したり、予定をスケジュールしたり、重要な会議の絵文字を作成したりすることもできます。
1 対 1 のチャットでは、ユーザーはスラッシュを直接使用してチャットボットを作成し、知識を自動的に学習して質問に回答することができます。
ドキュメントでは、Slash はさまざまなスタイルのコピーライティングとポスターを自動的に生成でき、ビデオ会議では、Slash はワンクリックで会議のポイントや ToDo 項目などを要約できます。
さらに、スラッシュの最も予期せぬ機能は、自然言語で小さなプログラムを生成し、それを「ディンディン クール アプリケーション」の形でグループ内で使用することです。
DingTalkが大型モデルへのアクセスとスマートオフィスアシスタント「/」の発売を発表したのと同じ日に、国内オフィスソフト大手のキングソフトオフィスも「WPS AI」の発売を正式に発表した。基盤となる大規模モデルは MiniMax によって提供されており、現在はコンテンツ生成、マルチラウンド ダイアログ、コンテンツ最適化などの複数の機能が含まれていますが、将来的には国内版の「Microsoft 365 Coplilot」に進化し、完全に組み込まれる可能性があります。 WPS スイート。
Webリンク:
バイトダンスのオフィスプラットフォームである飛秀も4月11日、インテリジェントAIアシスタント「My AI」をローンチした。その機能には、会議議事録の自動要約、レポートの作成、テキストコンテンツの継続的な作成と最適化などが含まれます。Feishu では、My AI はユーザーが対話を通じてスケジュールを作成したり、社内のナレッジベースを検索したりすることも支援します。ただし、My AI はまだ開発中であり、パブリック ベータ版とリリース時期はまだ発表されていません。
3月1日、ChatGPTがAPIの公開を発表した後、越境電子商取引サービスプラットフォームのShopifyが統合を先導した。 ChatGPT を統合した後、Shopify はインテリジェントなカスタマー サービスを使用してユーザーとコミュニケーションし、消費者がパーソナライズされた推奨事項を作成できるように支援し、購入時間を節約できます。ChatGPT はまた、レビュー データ分析、タイトルとキーワードの最適化、マーケティング コピーライティング、およびプラットフォーム製品向けのインテリジェントな Web サイト開発プログラミングも実行します。他にも、電子商取引 Web サイトの運営効率を向上させ、消費者の購買体験を最適化するための多くの機能を備えています。
Webリンク:
Webリンク:
Microsoft が Bing 検索エンジン、Edge ブラウザー、および Office ファミリー バケットの新バージョンを発表した後、そのコード ホスティング プラットフォーム GitHub も Copilot X をリリースしました。これにより、ChatGPT が統合開発環境に導入され、コード基盤のないユーザーでも「口を動かす」ことに頼ることができます。 「コードを書き出してください。
GitHub Copilot Chat では、ユーザーはチャット ウィンドウでコードを書くように指示を送信でき、異常に実行されたコードについては、バグ (エラー) を直接見つけて修正することができ、GitHub Copilot Voice では実装することもできます。音声をワンステップでコードに変換することで、開発者が直接話し、自然言語で指示を与え、関連するコードを生成できます。
上記の機能に加えて、ユーザーがコードの特定の行を理解できない場合は、Copilot にチャットでコードの機能を説明させます。
Webリンク:
Webリンク:
06. AIGC の生活ツール: 料理、メモを取る、旅行ガイドの作成
AI を生活の管理者にしましょう
テキスト生成やオーディオおよびビデオ編集などの応用性の高い AI ツールに加えて、さまざまな新しい AIGC 製品が日常生活に登場しています。
たとえば、ChefGPT は毎日頭痛に悩まされているユーザー向けのレシピの生成を支援し、Dover Autopilot はヘッドハンターに高品質の人材履歴書を提供する AI 採用ツール、BibiGPT はビデオを見ながらメモを取ることができ、Bedtime Story AI は個人の好みに合わせて映画リストを推奨する WatchNow など、完全な知的生活はもはや SF 映画の中だけのプロットではなく、AI が私たちの日常生活に完全に浸透しています。
重要なポイントを要約するにはビデオが長すぎますか?ビデオを見ながらメモを取るには急いでいませんか? ChatGPT に基づいて開発されたオーディオとビデオの要約ソフトウェアである BibiGPT は、これらの問題をうまく解決します。Bilibili と Youtube のビデオの場合、BibiGPT はワンクリックで重要なコンテンツを要約できます。ユーザーは、訪問したビデオのリンクを検索ボックスに貼り付けるだけで済み、 「ワンクリックまとめ」をクリックすると、動画のまとめノートを取得できます。
Webリンク:
Dover Autopilot は自動採用ツールです。採用担当者は簡単な求人説明リンクを入力するだけで、LinkedIn やその他の求人 Web サイトなどのデータ ソースを通じて、数分以内に求人要件に一致する求職者を見つけることができます。また、パーソナライズされた電子メールを自動的に生成することもできます候補者にとって。
ウェブリンク: dover.com/start
AIレシピレコメンドツールで、ユーザーが手元にある食材や道具、予約調理時間を入力すると、ニーズに合ったレシピをレコメンドしてくれる。
このページには 2 つのモードがあり、1 つはグルメ モード、もう 1 つは全選択モードです。グルメ モードでは、ユーザーの自主性に対する要件が高く、Web ページに入力する前にユーザーが材料や調理器具を選択する必要がありますが、全選択モードは「キッチン初心者」にとってよりフレンドリーであり、要件を満たすコピーを取得することができます。本当のニーズに応えるレシピ。
Journeai は、ユーザー向けにパーソナライズされた旅行ルートを作成することを目的とした AI ベースのチャット トラベル アドバイザーで、アクティビティの手配や旅行パートナーなど、ユーザーの好みに応じて旅程を生成できます。
Webリンク:
AIGC コンテンツ検出ツール: 偽造 AIGC
コンテンツ識別の先頭に立つ
AIGC テクノロジーの開発が急速に進むにつれて、多くの誤った情報、テキストの盗用、学術詐欺、著作権紛争、その他の悪影響や関連するマイナスの出来事も引き起こされています。未知のセキュリティ紛争は避けられないため、検出とスクリーニングのための関連技術の開発が必要です。
AIGC コンテンツ検出ツールは現在市場に多くはありませんが、すでに生成されたテキスト、画像、音声などの AIGC コンテンツを正確に識別することができ、盗作検出システム CrossCheck などがあります。
1、コピーリーク:
Copyleaks は現在、世界で最も人気のある AI コンテンツ検出ツールの 1 つであり、最も顕著な利点は、英語のコンテンツの検出に加えて、スペイン語、フランス語、その他の言語で書かれたコンテンツも検出できることです。すべて AI によって生成されたテキストの場合、Copyleaks は 99.99% の認識精度を達成できますが、半分本当か偽のテキスト コンテンツについては、人工的に生成されたテキストとしてマークされます。
Webリンク:
人民日報の子会社でコンテンツ リスク管理に重点を置く People.cn Information Technology Company は、中国初の AI 生成コンテンツ検出ツール AIGC-X を開発しました。このツールは、機械生成テキストと機械生成テキストを区別するために使用できます。フェイクニュース、コンテンツ盗用、スパムなどを人為的に検出してスクリーニングすることができ、特に虚偽情報、学術詐欺、フィッシングなどのグレーゾーンの技術サポートを提供します。
ただし、AIGC-X は現在中国語コンテンツの検出のみをサポートしており、画像、音声、ビデオ コンテンツの検出能力を向上させる必要があります。
Webリンク:
ゼロサンプル検出ツール DetectGPT は、米国スタンフォード大学の研究チームによって開発され、主に大学でよく見られる論文生成現象に対処するために使用されています。 「DetectGPT: Probability Curvature を使用した Zero-Shot Machine-Generated Text Detection」と題された研究論文が、プレプリント Web サイト arXiv で公開されました。
この検出ツールは、大規模言語モデルによって生成されたテキストを判断するための新しい指標を提案しており、Web ページにアップロードされたコンテンツをスキャンするだけで、テキスト内のコンテンツが大規模言語モデルを使用して生成されているかどうかを判断できます。
NetEase NetShield は、NetEase の業界での長年の経験に基づいて、テキスト スパムの特性に合わせてパーソナライズされたマッチング モデルとカスタマイズされた検出ソリューションを提供し、第三者に流用されたコンテンツも自動的にフィルタリングされます。
Webリンク:
Sumei は、フルスタックのインテリジェントなコンテンツ認識エンジンを使用して、機密、禁止、ポルノ、暴力、虐待、広告転用、その他の危険なテキスト コンテンツをさまざまなシナリオで効果的に識別し、ユーザーが危険な情報をさらに識別できるようにします。現在、Sumei は 175 の海外言語を自動的に検出でき、英語、アラビア語、タイ語、インドネシア語などの 18 の主流言語でのリスクラベル識別をサポートしています。
クリエイターの副操縦士になる
AIGC トラックは混雑しており、執筆、画像生成、オーディオおよびビデオ編集、オフィス アシスタント、コンテンツ検出などに加えて、さらに多くのサブディビジョンが探索を待っています。
現在、AI はデジタル コンテンツ制作の分野に進出しており、文章、質疑応答、絵画、百年の歴史を持つ都市などにおいて専門家に匹敵するだけでなく、大規模な言語モデルの強力な理解能力も実証しています。しかし、それは人間の意思決定を支援したり、クリエイターの継続的な制作や反復的なアイデアを支援したりする「コパイロット(副操縦士/アシスタント)」としての役割しか果たせず、本当に価値のある仕事に取って代わるものではありません。