生成AIとは、人間が手作業で行うような創造的な作業を自動化するAIの一種です。画像やテキスト、動画、音声など、さまざまなものを生成することができます。
生成AIの種類は、生成する対象によって大きく分けて4つに分けることができます。
画像生成AIは、文字や画像などの入力情報から、新しい画像を生成するAIです。
クリエイティブなコンテンツの制作や、画像の加工・編集などに活用されています。
クリエイティブなコンテンツの制作
画像生成AIは、イラストや写真、動画など、さまざまなクリエイティブなコンテンツを制作するために活用されています。例えば、DALL-E2は、テキストからイラストを生成することができるサービスです。
画像の加工・編集
画像生成AIは、画像の加工・編集にも活用されています。例えば、CLIPは、画像の特徴をテキストで表現することができるサービスです。
VAEは、画像の特徴量を潜在変数として表現し、その潜在変数から画像を生成することで、画像を生成するAIです。
代表的なサービスとしては、OpenAIの「DALL-E2」やGoogle AIの「Imagen」などが挙げられます。
GANは、生成器と識別器という2つのAIを競わせることで、画像を生成するAIです。
代表的なサービスとしては、OpenAIの「CLIP」やGoogle AIの「StyleGAN」などが挙げられます。
テキスト生成AIは、文字や画像などの入力情報から、新しいテキストを生成するAIです。
文章の作成や、翻訳、要約などに活用されています。
文章の作成
テキスト生成AIは、記事やブログ、書籍など、さまざまな文章の作成に活用されています。例えば、GPT-3は、文章の要約や、新しい文章の生成など、さまざまな文章作成の支援を行うことができます。
翻訳
テキスト生成AIは、言語の翻訳にも活用されています。例えば、DeepLは、自然な翻訳を行うことができる翻訳サービスです。
要約
テキスト生成AIは、長い文章の要約にも活用されています。例えば、Summlyは、短時間で文章の要約を行うことができるサービスです。
GPT-3は、OpenAIが開発した大規模言語モデルであり、テキスト生成AIとしても利用することができます。
ChatGPTは、OpenAIが開発したチャットボットであり、テキスト生成AIとしても利用することができます。
動画生成AIは、文字や画像などの入力情報から、新しい動画を生成するAIです。
動画の作成や、編集などに活用されています。
動画の作成
動画生成AIは、アニメやCM、映画など、さまざまな動画の作成に活用されています。例えば、VQGAN+CLIPは、テキストから動画を生成することができるサービスです。
編集
動画生成AIは、動画の編集にも活用されています。例えば、StyleGAN2は、動画の背景を合成することができるサービスです。
VQGAN+CLIPは、GANとCLIPを組み合わせた動画生成AIです。
StyleGAN2は、GANをベースとした動画生成AIです。
音声生成AIは、文字や画像などの入力情報から、新しい音声を生成するAIです。
音声の合成や、翻訳、ナレーションや音声アシスタントの音声などに活用されています。
WaveNetは、Google AIが開発した音声合成技術であり、音声生成AIとしても利用することができます。
Congvoxは、中国のAI企業であるChongqing Congvox Technologyが開発した音声合成技術であり、音声生成AIとしても利用することができます。
ぞくぞくと新しい分野でAIツールが誕生しています。
必要な作業に応じて利用していきましょう。