第2章 生成AI(ジェネレーティブAI)
ChatGPT
ChatGPTに新しく追加された機能についての用語が追加されている。
Code Interpreter
ChatGPTのCode Interpreterは、ユーザーがプログラムコードを入力し、
その結果を即座に確認できる機能。
Pythonなどのプログラミング言語をサポートし、
データ分析、計算、シミュレーションなどのタスクを実行できる。
これにより、ユーザーはコードの動作をリアルタイムで確認し、迅速にフィードバックを得ることができる。
GPTs
ChatGPTのGPTsは、ユーザーが特定の目的に合わせてカスタマイズした、
オリジナルのChatGPTツールを作成・共有できる機能。
プログラミングスキルが不要で、手軽にカスタマイズでき、誰でも公開し、収益化も可能。
GPTsは、2023年11月にOpenAIが発表した新機能で、特にビジネスや教育など多くの分野で注目されている。
GPT4o
GPT-4o(GPT-4 Omni)は、OpenAIが開発した最新のマルチモーダルAIモデル。
テキスト、音声、画像、動画など、複数の形式のデータを処理し、リアルタイムで応答する。
GPT-4oは、従来のモデルに比べて応答速度が速く、精度も向上している。
特に音声認識や画像生成の性能が優れており、
ビジネスや教育など多岐にわたる分野での応用が期待されている。
第3章 現在の生成AI(ジェネレーティブAI)の動向
生成AIが出来ることと主なサービス
ChatGPT以外の自然言語生成AIサービス、画像生成AIサービス、動画生成AIサービスが追加されている。
Claude
Claudeは、Anthropic社が開発した次世代AIアシスタント。
安全性、正確性、セキュリティを重視して設計されており、
文書作成、コード生成、データ分析など多岐にわたるタスクをサポートする。
最新バージョンのClaude 3は、GPT-4を超える性能を持ち、自然な言語生成と高い信頼性が特徴。
Gemini
Geminiは、Googleが開発した最新の生成AI。
テキスト、画像、音声、動画など、複数のデータ形式を処理できる点が特徴。
2023年末に発表され、創造力や生産性を向上させるために設計されている。
Geminiは、Google Workspaceと統合され、ビジネス向けのツールとしても利用可能。
特に、文章作成、計画立案、学習支援など、多岐にわたるタスクに対応する。
Stable Diffusion
Stable Diffusionは、Stability AIが開発したオープンソースの画像生成AI。
ユーザーが入力したテキストプロンプトに基づいて、
高品質でフォトリアルな画像を生成する。
このAIは、深層学習と生成モデルを組み合わせており、複雑なプロンプトにも対応可能。
2022年8月にリリースされ、多くのクリエイターやデザイナーに利用されている。
DALL・E
DALL・Eは、OpenAIが開発した画像生成AIシステム。
ユーザーが入力したテキストプロンプトに基づいて、高品質でリアルな画像を生成する。
最新バージョンのDALL・E3は、より詳細で正確な画像生成が可能で、
ChatGPTやCopilotと統合されており、プロンプトの作成や画像の微調整が簡単に行える。
このAIは、クリエイティブなプロジェクトやデザイン作業に広く利用されている。
Midjourney
Midjourneyは、テキストプロンプトから高品質な画像を生成するAIツール。
2022年に公開され、アートやデザイン分野で広く利用されている。
Midjourneyは、ユーザーが入力したテキストに基づいて、
フォトリアルな画像から抽象的なアートまで多様なスタイルの画像を生成する。
最新バージョンのMidjourney V6.1は、さらに精度が向上し、よりリアルな画像生成が可能。
Flux
Fluxは、Stability AIが開発した高度な画像生成AI。
テキストプロンプトから高品質でリアルな画像を生成する能力があり、
特にクリエイティブなプロジェクトやデザイン作業に適している。
Fluxは、オープンソースモデルとして公開されており、開発者や企業が自由にカスタマイズ可能。
その性能は、Midjourneyを超えると評価されており、リアリティのある詳細な描写が特徴。
Sora
Soraは、OpenAIが開発した最新の動画生成AI。
テキストプロンプトからリアルで高品質な動画を生成する能力を持ち、最大1分間の動画を作成できる。
Soraは、物理的な動きや複雑なシーンを正確に再現し、
クリエイティブなプロジェクトや映像制作に革新をもたらしている。
2024年2月に発表され、現在は一部のアーティストやデザイナーに限定して提供されている。
Runway Gen-3
Runway Gen-3は、Runway AIが開発した最新の動画生成AIモデル。
Gen-2に比べて、画質や一貫性、動きの精度が大幅に向上している。
テキストプロンプトから高品質な動画を生成し、クリエイティブなプロジェクトに革命をもたらしている。
特に、シネマティックなシーンや複雑な動きを含む動画の生成が得意。
Luma Dream Machine
Luma Dream Machineは、Luma AIが開発した高度な動画生成AI。
テキストや画像から高品質でリアルな動画を迅速に生成する。
このAIは、物理的に正確で一貫性のある映像を作成するために、
直接動画をトレーニングデータとしている。
Dream Machineは、スケーラブルで効率的なトランスフォーマーモデルを使用し、
創造力を最大限に引き出すツールとして注目されている。
次のページへ
次のページから「第4章 情報リテラシー・基本理念とAI社会原則」の用語の説明。
コメント