- ビジネスハック
- 更新日:
米Googleは米国時間2024年2月8日に、「Gemini Ultra 1.0」の提供開始とGeminiアプリの登場、さらに同社の生成AI(人工知能)のモデル・サービス名称を「Gemini」に統一する旨を発表しました。したがって同日から、従来「Bard」の名称で提供されていた対話型AIのサービス名もGeminiに変更されています。
また米国時間2024年5月14日には、Geminiモデルファミリーに新しい軽量モデル「Gemini 1.5 Flash」が加わったことも発表されています。
今回は、Google社が開発した最先端のマルチモーダル大規模言語モデル「Gemini」について解説します。Geminiの特徴や使い方、料金プランなどを紹介しているのでぜひ参考にしてください。
Geminiとは?
Gemini(ジェミニ)とは、Google社が開発した高性能な生成AIモデルです。
複数の種類のデータ(モダリティ)を一度に処理できるマルチモーダルAIであり、テキスト、画像、音声、動画、コード、数値などさまざまな形式の情報を理解することができます。文章やリストの作成、画像生成なども可能です。
また、同社のモデルで最も柔軟性が高く、データセンターからモバイルデバイスまであらゆるプラットフォームで実行できます。
米国時間2023年12月6日に発表されて以来、既に最上位バージョンのリリースや新たなバージョンへのアップデートをおこなうなど急速な進歩を遂げています。それまで最先端のAIモデルを代表していたOpenAI社開発のGPT-4のライバルとして、大きな注目を集めているAIモデルです。
モデルサイズは「Ultra」「Pro」「Flash」」「Nano」の4種類
Geminiは幅広い実行環境に対応できるよう、下記4種類のモデルサイズを展開しています。
Gemini Ulrla | Gemini最大のモデル。超高性能な最先端のパフォーマンスにより、非常 に複雑なタスクに対しても高品質な出力を提供する。 |
---|---|
Gemini Pro | 汎用性の高い中規模の最良モデル。広範囲のタスクにおいて、コストや品 質がバランス良く最適化されたパフォーマンスを実現する。 |
Gemini Flash | Gemini最速の軽量モデル。大規模かつ高頻度なタスク向けに、品質の高 さを維持しながら速度と効率が最適化されている。 |
Gemini Nano | デバイス上での実行向けに開発された、最も効率的なモデル。データ通信 の有無に関わらず迅速な応答を提供する。 |
最初のバージョンであるGemini 1.0では「Ultla、Pro、Nano」の3サイズの発表でしたが、2024年2月に「Gemini 1.5 Pro」を発表し、2024年5月にはGemini 1.5 Proの改良とともに新たなモデルサイズとして「Gemini 1.5 Flash」を発表しています。
専門家・最先端を上回るパフォーマンスを記録
Geminiはさまざまなベンチマークにおいて高いパフォーマンスを記録しています。
下記のグラフは、実際にGoogleがGeminiの公式HPに掲載しているレポートです。
能力 | 基準 | 説明 | ジェミニ 1.0 プロ |
ジェミニ 1.0 ウル トラ |
ジェミニ 1.5 プロ (2024年2 月) |
ジェミニ 1.5 フ ラッシュ |
ジェミニ 1.5 プロ (2024年5 月) |
---|---|---|---|---|---|---|---|
General | MMLU | 57 科目の質問を表現 (STEM、人文科学、そ の他を含む) |
71.8% | 83.7% | 81.9% | 78.9% | 85.9% |
Code | Natural 2Code |
Python コードの生成。 HumanEval のような データセットを公開し たが、ウェブ上には漏 洩しなかった |
69.6% | 74.9% | 77.7% | 77.2% | 82.6% |
Math | MATH | 難しい数学の問題(代 数、幾何学、微積分学 などを含む) |
32.6% | 53.2% | 58.5% | 54.9% | 67.7% |
Reasoning | GPQA (メイン) |
生物学、物理学、化学 の各分野の専門家に よって書かれた、挑戦 的な質問のデータセット |
27.9% | 35.7% | 41.5% | 39.5% | 46.2% |
Big-Bench Hard | 多段階の推論を必要と する多様な挑戦的なタ スク |
75.0% | 83.6% | 84.0% | 85.5% | 89.2% | |
Multilingual | WMT23 | 言語翻訳 | 71.7 | 74.4 | 75.2 | 74.1 | 75.3 |
Image | MMMU | 多分野にわたる大学レ ベルの推論問題 |
47.9% | 59.4% | 58.5% | 56.1% | 62.2% |
MathVista | 視覚的なコンテキスト での数学的推論 |
46.6% | 53.0% | 54.7% | 58.4% | 63.9% | |
Audio | FLEURS (55言語) |
自動音声認識(単語エ ラー率に基づき、低い ほど良い) |
6.4% | 6.0% | 6.6% | 9.8% | 6.5% |
Video | EgoSchema | 動画での質疑応答 | 55.7% | 61.5% | 65.1% | 65.7% | 72.2% |
なかでもUltlaは、各分野の人間の専門家や生成AIの最先端である「GPT-4」を上回るパフォーマンスを示した最初のモデルです。
引用:
最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに|Google Japan Blog
アップデートが進んでいる現在では、最新モデルの1.5 FlashがUltraと同等のパフォーマンス、改良された1.5 ProがUltraを上回るパフォーマンスを記録しています。
ちなみにOpen AIは生成AIのトレンドの先駆者ともいえる企業であり、生成AIはOpen AIによる「ChatGPT」のリリースを契機に大きな話題を呼ぶようになりました。
下記記事では、ChatGPTの概要や基本的な使い方について詳しくまとめているので、気になる方はぜひご覧ください。
>>ChatGPTとは?できることやアカウント開設の方法・仕組みを解説
Googleの生成AIモデルはBardからGeminiへ
Google社はもともと、ChatGPTに対抗するべく2023年2月に対話型AI「Bard」を発表していましたが、あまりインパクトを残せずにいました。(下記記事参照)
>>Google Bardとは?使用感やChat GPT・Bingとの性能を比較!
Bardは、2024年2月のGemini Ultraの発表と同時に、同社製品に搭載する生成AIのモデル・サービス名称を統一するとして「Gemini」の名称へと変更になっています。
Googleは今回のリブランディングに関して、同社の最も高性能なAIモデル「Gemini」はBardがベースとなっていることを広く訴求するための判断であった旨を伝えています。
Genimiの3つの特徴
- マルチモダリティに対応
- 推論能力が高い
- コードの生成能力が高い
マルチモダリティに対応
最先端のマルチモーダル大規模言語モデルであるGeminiは、マルチモダリティに対応しています。テキストや画像、音声などさまざまな形式の情報を同時に処理できるため、ニュアンスを含んだ情報の理解や複雑な質問への回答が可能です。
とくに、数学や物理学の推論の説明に優れた性能を発揮します。
推論能力が高い
Geminは複雑な文字情報・視覚情報の理解や、膨大な量のデータから識別困難な知識を発見することに長けています。そのため、情報の読み取り・フィルタリング・理解に加えてその洞察を数十万もの文書から抽出することが可能です。
このような高度な推論能力は、科学から金融までの多くの分野の飛躍に役立つと期待されています。
コードの生成能力が高い
Geminiは高度なコーディングシステムのエンジンとしても使用できます。
Python、Java、C++、Goなど世界で広く利用されている複数のプログラミング言語の理解・説明・コード生成が可能です。Googleによってコーディングベンチマークがおこなわれた際には他のAIよりも優れた結果を示し、その能力の高さが証明されています。
高度な推論能力に加えて複数の言語を超えて機能するため、世界でも先進的なコーディング基盤モデルです。
Genimiの使い方
GeminiはGoogleアカウントを持っていれば、以下の手順で簡単に利用できます。
1.Googleアカウントを作成する
(既にアカウントを持っている方は不要の手順です。)
2.GeminiのWebサイトを訪問する
3.「Geminiを試す」のボタンをクリックする
4.利用規約に同意してGeminiに登録する
5.「Geminiへようこそ」の表記とともにメッセージが表示されるので、必要であればメール配信希望の欄をチェックし、画面右下の「続ける」をクリックする
6.チャット画面が表示された後プロンプトを入力する
Geminiは何ができる?主な機能や活用例を紹介
Geminiは自然言語での対話が可能であり、チャット形式でユーザーの質問に答えたりプロンプトに入力されたタスクを処理したりします。実際にGeminiができることとして以下の機能が挙げられます。
- 文章やリストの作成
- 情報の検索
- アイデア出し
- 画像の認識、解析、解説、
- テキストの要約、翻訳、校正
- 論文や数学など問題の解説
- 音声入力
- 画像生成
- コード生成
- Googleアプリとの連携
ビジネスシーンやモバイルアプリにおけるこれらの機能の活用例を紹介します。
ビジネスシーンでの活用例
ビジネスシーンでは、Geminiを活用することで作業効率の向上が期待できます。
例えば、画像解析機能を活用してスライド資料の内容をテキストにまとめたり、要約機能を活用して指定したURLの表記内容をまとめたりすることで、これまで読み取り・要約・テキスト入力にかけていた時間を短縮することが可能です。また、Geminiは音声情報も読み取れるため、録音した会議の内容をもとに議事録の作成を依頼することもできます。
他にも、情報や動画の検索、企画や実装コードの提案など幅広いタスクを依頼できるため、大幅な工数削減に役立ちます。
モバイルアプリでの活用例
Geminiはモバイルアプリでの提供もおこなわれており、アンドロイドの場合は「Geminiアプリ」をインストール、iPhoneの場合はGoogleアプリからGeminiを検索することで利用できます。
PCと同様テキスト・画像・音声を使ってチャットすることが可能です。チャット画面から文章を入力したり、Geminiアプリからカメラを起動して写真を撮ったり、「OK、グーグル」と話しかけたりすることでGeminiを起動でき、トピックや質問に対する対話や回答、リスト・表の作成などを依頼できます。特定のニーズを伝えることで、旅行プランを自動で作成することも可能です。
アンドロイドではGeminiをモバイルアシスタントとして活用することができます。アラーム・タイマーの設定、通話の発信、メッセージの送信・音読、スマートホームデバイスとの連携・操作、カレンダーの予定作成、リマインダーの設定などをサポートしてもらえるため、日常的な操作の効率化に役立ちます。
Genimiの料金プラン
Geminiは基本的に無料で利用できます。Googleの無料アカウントを持っていれば登録・利用が可能です。
ただし有料プランやビジネス・開発向けのサービスも用意されているため、この章ではそれらの料金について紹介します。
Genimi Advancedは「月額2,900円」
Geminiの上位版「Gemini Advanced」を利用する場合は、月額2,900円の「Google One AIプレミアム」への加入が必要です。
Google One AIプレミアムでは、無料版に比べて利用できる機能が増えるとともに、2TBのストレージ容量がセットになっています。
Google Oneのストレージ2TBプランは月額1,300円のため、既にGoogleのオンラインステージを利用している方は差額の月額1,600円でGemini Adbancedの利用が可能です。
ビジネス向けの料金プラン
ビジネス向けとしては「Gemini Business」が用意されています。
このプランは年間契約で、グーグルの業務ツール群「Google Workspace」に追加して月額20ドルの費用がかかります。Gemini Ultraを利用でき、AIチャットだけでなくGoogleドキュメントやGmail、スライドなど他のアプリケーション内でもGeminiの利用が可能です。セキュリティ面にも配慮されており、入力データは学習に活用されません。
また、ビジネス向けのプランとしては「Duet AI for Workspace Enterprise」の後継となる「Gemini Enterprise」も用意されており、年間契約で月額30ドルの料金プランです。
開発者向けの料金プラン
開発者向けとしては、「Gemini API」を通してGemini Proを利用することができます。料金体系は特殊のため、下記の表を参考にしてください。
処理方法 | 料金 |
---|---|
テキスト入力 | 0.00025ドル(約0.035円)/ 1,000文字 |
画像入力 | 0.0025ドル(約0.35円)/ 1画像 |
テキスト出力 | 0.0005ドル(約0.071円)/ 1,000文字 |
まとめ
今回は、Googleの開発した最新の生成AIモデル「Gemini」について紹介しました。
Geminiは、従来提供していた対話型AI「Bard」が核となって開発されたものであり、同社で最も高性能なAIモデルです。現在では、Bardをはじめとした同社の生成AIモデル・サービスの名称はGeminiへ変更されています。
すでに数回のアップデートを重ねているGeminiは、生成AIの可能性を広げる存在として注目されており、今後さらなる利便性の向上が期待されています。
Webに関するお悩みごとはデジタルアイデンティティへ!
現在、様々な企業がWebサイトを活用して、デジタルマーケティングに取り組んでいます。
しかし、以下のようなお悩みがあるご担当者様も多いのではないでしょうか?
デジタルマーケティングに関するこんなお悩みはありませんか?
- 広告やSEOを始めたいがやり方がわからない…
- 自社に最適な広告媒体・施策を提案してほしい…
- 最新の広告手法も取り入れた提案をしてほしい…
- 短い期間で最速で成果に繋げたい…
- 目標設定・アクセス分析・サイト改善など、全部丸投げで対応してほしい…
株式会社デジタルアイデンティティは、Webの総合広告代理店です。
数ある施策の中からお客様にとって最適な施策のご提案と、企画・提案から実施・改善まで一気通貫で確かな実行力で、お客様のビジネス目標達成を強力にサポートいたします。
デジタルアイデンティティの強み
- お客様に最適なマーケティング手法をご提案
Google、Yahooなどのリスティング広告をはじめ、Facebook、Instagram、LINE、tiktok、PinterestなどのSNS広告、ニュースやゲームなどの各種アプリへの広告配信、インフルエンサーマーケティングなど、あらゆる手法から最適な施策をご提案 - 全ての施策を一気通貫で対応可能
ブランディングからアクセス分析、SEO・MEO対策、LPO、EFO、Webサイト制作、バナー・動画などのクリエイティブ制作まで、一気通貫で対応可能 - 高速PDCAでお客様の目標達成を最短で実現
デジタルマーケティングでは施策実施後のPDCAが欠かせません。施策ごとにスピーディなPDCAを回すことにより、最適化・効率化を進めて成果を最大化
ご興味がある方は、ぜひ一度、弊社のサービス資料をご覧ください!