業界/資格

Google最新AI「Gemini」とは？種類や特徴などを徹底解説

2024年02月19日

AI IT技術

はじめに

Gemini（ジェミナイ）の特徴は、ハイレベルな推論能力・マルチモーダル性能・ハイクオリティなコード生成が可能
「Gemini Ultra」は、非常に複雑なタスクに対応する高性能かつ最大のモデル
「Gemini Pro」は、パフォーマンスを維持しつつもコストを押えて最適化された中規模のモデル
「Gemini Nano」は、デバイス単体で稼働できるようコンパクトにしたモデル
「英語版Bard」「API」「Google pixel pro8」で使用可能

Googleはアメリカ時間の2023年12月6日、最新AI「Gemini(ジェミナイ)」を発表しました。Gemini（ジェミナイ）は文章・画像・動画を扱えるマルチモーダル性能であること、またMMLUでも高評価を獲得しています。そのパフォーマンスの高さに世界中から注目が集まっています。今話題のGoogleの最新AI「Gemini（ジェミナイ）」について、気になる特徴や3つのモデルの種類を解説していきます。また、安全性や使用方法もご紹介していますので、ぜひ参考にしてください。

Gemini（ジェミナイ）とは

Googleの最新AI「Gemini（ジェミナイ）」とは一体どういったものなのでしょうか。Gemini（ジェミナイ）について解説していきます。

AIとは？技術開発の流れ｜身近な技術や応用・将来性まで

AIの進歩が目まぐるしい現代です。そもそも人工知能（AI）とはどのようなものか、AI技術が開発され…

続きはこちら

Google最新Ai「Gemini」

Gemini（ジェミナイ）は、Googleの新しいAIモデルです。文章だけでなく画像や動画、音声も理解できます。
マルチモーダル性能なことから、複雑な数学・物理学などの分野の要求も簡単に実行できます。そして、さまざまなプログラミング言語でコードを理解および生成することもできると発表されています。

Gemini（ジェミナイ） 3つのモデル

Gemini（ジェミナイ）には、３つの種類があります。

Gemini Ultra
Gemini Pro
Gemini Nano

以下で各モデルの性能について解説していきます。

Gemini Ultra

Gemini（ジェミナイ）の最も優れたモデルが、Gemini Ultraです。複雑なタスクに対応できる高性能かつ、Geminiシリーズのなかで最大のモデルです。文章・画像・音声・動画・コードなど、多くの種類の情報をすばやく理解できるように開発されています。Googleは、信頼性や安全性のチェックをした後にGemini Ultraを公開すると発表しています。

Gemini Pro

Gemini Proは、応答時間が短縮されるほか、複雑な処理要求に対応できます。強力なパフォーマンスを維持しつつ、コストを押えて最適化された中規模のモデルです。
企業や開発者は2023年12月13日から、Google AI StudioやGoogle Cloud Vertex AIのGemini APIを通じて利用が可能になりました。

Gemini Nano

Gemini Nanoは、デバイス単体で稼働できコンパクトなモデルです。Google pixel8 proに搭載され、ユーザはGemini Nanoを利用することができます。現在は英語のみの対応で、日本語対応は今のところ未定です。

Gemini（ジェミナイ）の特徴とは

Gemini（ジェミナイ）には、3つの特徴があります。

ハイレベルな推論能力
マルチモーダル性
ハイクオリティなコード生成

参考元：Google.japan｜最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに

ハイレベルな推論能力

Gemini（ジェミナイ）のハイレベルな推論能力は、文字情報や視覚からの情報を理解するのに大変役立ちます。莫大な量のデータから、識別が難しい情報を発見することができます。
このハイレベルな推論能力は、科学から金融までの多くの分野においてデジタル技術の進化による新たな飛躍をもたらすのに役立つと期待されています。

マルチモーダル性

マルチモーダルとは、多くのデータを同時に扱うことができるAIのスキルです。
Gemini（ジェミナイ）は、テキスト・画像・音声などを同時に理解することができます。
とくに、物理・数学などの難解な内容でも細かい意味合いを汲み取り、難易度の高い問題や質問に対応できます。

ハイクオリティなコード生成

Gemini（ジェミナイ）は、Python、Java、C++、Goなどのプログラミング言語を理解・説明することができます。そして、コード生成ツールとしても非常に優秀で、指示通りにコードを生成することができます。
また、コードのデバック作業もGemini（ジェミナイ）で自動化が可能で、エラー内容を丁寧に説明してくれます。

Gemini（ジェミナイ）のパフォーマンス

Googleの調査によると、Gemini Ultraのパフォーマンスは画像の理解から数学的推論・音声・動画の理解まで広く利用されている32項目の業界ベンチマークのうち、30項目の既存の最高水準を上回ったと報告されています。

特に、MMLU（大規模マルチタスク言語理解）では90%を記録し、人間の専門家を上回る結果を示したのです。ちなみに、MMLUとは、大規模マルチタスク言語理解(Massive Multi-task Language Understanding)の略称です。MMLUを解かせることで、人間の知能と比較することができます。平均的な人間の評価水準は34.5%で、専門家集団の平均は89.8%と推定されています。

以下は、Googleが発表しているGemini（ジェミナイ）でのベンチマークのスコアです。

引用元：最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに

Gemini（ジェミナイ）を使うには？

Gemini（ジェミナイ）は以下のサービス・媒体で使用できます。

Bard
API
Google pixel8 pro

【Bard】

現在Bardでは、英語版のChromeでのみGemini Proを使用できます。Googleアカウントを作成すれば、誰でも無料で使用できるサービスです。

【API】

APIでは、アメリカ時間12月13日にGeminiのAPIが公開されました。APIを使用して、Gemini ProまたはGemini Pro visionの２つのモデルへアクセスすることができます。

【Google pixel8 pro】

Google pixel8 proでは、Googleが販売するスマートフォンGoogle pixel8 proにおいてGemini Nanoが使用できると発表しています。

Gemini（ジェミナイ）の安全性は？

Googleの発表によると、Gemini（ジェミナイ）はGoogleのAI原則と製品全体のポリシーに基づき、安全性や倫理性に欠ける指示や質問に対しては応答を一切行わないようになっていると発表しています。

参考：Google.japan｜Google AI 私たちの理念

Gemini（ジェミナイ）これからの展望

Gemini（ジェミナイ）は、現在まだ幅広く利用できる状態にはなっていませんが、これから利用できるサービスや媒体はますます広がっていくことでしょう。自然に人間と対話することのできるGemini（ジェミナイ）の登場によって、これからの私たちの生活は、さらに便利になっていくと期待されています。

Gemini（ジェミナイ）が切り開く未来

Gemini （ジェミナイ）の登場は、これからのAI技術に大きな影響を与えると注目されています。

テクノロジーの面では、Gemini（ジェミナイ）を活用することでAI技術を加速させ、より良い製品やサービスの開発を可能にします。ビジネスの面でも、新たなビジネスモデルの創出やビジネス自体の効率化を支援することができるようになります。
テクノロジーやビジネス、私たちが生活していく社会の多くの面でGemini（ジェミナイ）は新たな可能性を開くことでしょう。

シンギュラリティとは？AIがヒトと社会に与える影響

シンギュラリティとは「やがてAIはヒトの知性を超えるだろう」という仮説です。シンギュラリティは「近…

続きはこちら

まとめ

今回は、Googleの最新AIモデル「Gemini」の特徴や３つのモデル、そのパフォーマンス力や安全性、使用方法まで解説してきました。Gemini（ジェミナイ）の特徴は、ハイレベルな推論能力、マルチモーダル性能、ハイクオリティなコードの生成です。そして、「Gemini Ultra」「Gemini Pro」「Gemini Nano」の３つのモデルがあり、MMLUでは90%を記録し、人間の専門家を上回る素晴らしいパフォーマンス力があると判明しました。

Gemini（ジェミナイ）は、これからGoogle製品やサービスに搭載されていくと予想されています。有効利用していきながら、業務の生産性効率をさらに高めていきましょう。