最終更新日:2024/6/23

GPT-4oの特徴や使い方、実際の利用例まで徹底解説

「GPT-4oの特徴や性能を知りたい」

「GPT-4oを実際に使ってみたい」

このようにお考えではありませんか?

今回は、OpenAIから新たに発表されたAIモデル「GPT-4o」の特徴や利用方法、実際の利用例まで解説します。

また、本記事ではGPT-4oが発表される直前(2024年4月)に話題となった謎のAIモデル「GPT2 chatbot」とGPT-4oとの関係についても詳しく解説しております。

なお、弊社が提供するSEOに強いAIライティングツール「トランスコープ」も、ChatGPTの技術を応用しております。

GPT-4oとは?

GPT-4oとは、OpenAIが2024年5月13日に発表した新しいAIモデルのことです。

GPT-4oの「o」は「omni(オムニ)」からきており、omniには「すべての」という意味があります。

今までのモデル「GPT-4」にもマルチモーダル機能は備わっていましたが、GPT-4oではマルチモーダル機能がより強化されています。

GPT-4oでは、テキスト・画像・音声・ビデオといった多様な形式の組み合わせで入力でき、テキスト・画像・音声の組み合わせで出力が可能です。

GPT-4oの特徴

GPT-4oの特徴は、以下の5つです。

  1. 音声認識能力の向上
  2. 画像生成機能の向上
  3. ベンチマークテストのスコア向上
  4. 応答速度の向上
  5. 言語能力の向上

それぞれ解説します。

1.音声認識能力の向上

GPT-4oは、音声認識の精度が飛躍的に向上しています。

GPT-4でも音声認識機能は利用できましたが、「応答に時間がかかる」「聞き間違いが生じる」など、実際に利用するには性能が足りない部分もありました。

しかし、GPT-4oはテキスト・画像・音声・動画をひとつのニューラルネットワークで入出力できるように改善されたため、精度が上がった上に音声入力に対する応答速度が最短232ミリ秒(平均320ミリ秒)に向上しています。

GPT-4oの音声入力に対する応答は、人間の会話と同じくらいの速さといえます。

2.画像生成機能の向上

GPT-4oは画像生成機能も強化されており、高品質な画像を作成可能です。

一例として、画像の中に文字を入れ込む能力も向上しており、画像の中に描かれた紙や看板に完成度の高い文章を入れられます。

ただし、今はまだ日本語の文章を入れるよう指示しても英語で記載されたり、文字化けしたような記号が記載されたりするため、今後の日本語への対応に期待が高まります。

3.ベンチマークテストのスコア向上

GPT-4oは、ベンチマークテストでもスコアを伸ばしています。

引用:OpenAI

GPT-4oはMMLUやGPQAを含む5つのタスクにおいて、GPT-4TだけでなくClaude 3 Opus、Gemini Pro 1.5といった主要なAIモデルを超える高いスコアをマークしています。

また、GPT-4oは音声やビジョンなどの分野でも優れた性能を発揮しており、とくに音声認識・翻訳・視覚理解で高い評価を受けています。

Claude 3について詳しく知りたい方は、Claude3とは?概要や利用例、ChatGPTとの違いを解説もあわせてご覧ください。

Geminiについては、Google Gemini発表!概要やGPT-4との違いを解説もご参考ください。

4.応答速度の向上

OpenAIの公式サイトによると、GPT-4oの応答速度はGPT-4 Turboの2倍の速さであり、大きく向上していることがわかります。

今までChatGPTは、回答の精度に定評があるものの、応答速度では他社モデルに押されている印象がありました。

しかし、今回応答速度が改善されたことで、高精度かつスピーディな回答が可能になりました。

実際にGPT-4oを使ってみると、スピーディな応答を体感できるでしょう。

5.言語能力の向上

GPT-4oは言語能力が向上しており、さらに、翻訳機能も改善しています。

音声認識機能に加え、言語能力と翻訳機能が向上したことにより、GPT-4oを活用したより効率的なグローバルコミュニケーションが可能になるでしょう。

また、日本語を含む複数の言語で大幅にトークン数を削減しており、トークン効率も大きく向上しています。

GPT-4oの使い方

GPT-4oは、OpenAIの公式サイトからアカウントを作成すると誰でも利用できます。

アカウントはメールアドレスの他、Googleアカウントを利用しても登録可能です。

ChatGPTには以下の3つのプランがありますが、GPT-4oは無料プランと有料プランの両方で利用できます。

  • 無料プラン:無料
  • ChatGPT Plus:$20ドル/月
  • ChatGPT Team:$25/月1人あたり

個人で利用するのであれば、使用頻度や使う内容に合わせて無料プランか、有料のChatGPT Plusを選びましょう。

■無料プランの場合

無料プランの場合は、何かプロンプトを送信した後、回答の下に表示されるアイコン部分からモデルを切り替えるとGPT-4oを利用できます。

引用:ChatGPT

ただし、無料版は一定時間内に入力できるプロンプトの数が有料ユーザーの1/5程度に制限されています。

制限回数を超えるとGPT-4oは利用できなくなり、所定の時間が経過するまではGPT-3.5しか使えません。

■有料プランの場合

有料版では、ChatGPTホーム画面の左上にあるメニューからGPT-4oを選択できます。

引用:ChatGPT

ChatGPT Plusは月に約3,000円の費用がかかりますが、無料プランと比べて5倍のプロンプトを送信可能です。

GPT-4oの利用料

GPT-4oは、OpenAIの公式サイトから無料または有料で利用が可能です。

  • 無料プラン:無料
  • ChatGPT Plus:$20ドル/月
  • ChatGPT Team:$25/月1人あたり

他にも、開発者や企業向けにAPIアクセスも提供されており、APIの価格は以下のとおりです。

参考:OpenAI

GPT-4oはAPI料金がGPT-4 Turboの半額に設定されており、よりコストを抑えて高機能なモデルを利用できます。

GPT-4oの利用例

GPT-4oの5つの利用例とプロンプトの出力結果を紹介します。

  1. 情報の収集と分析
  2. コードの作成
  3. コラムの作成
  4. 画像をもとにしたアドバイス
  5. ラフ画をもとに画像生成

それぞれ解説します。

1.情報の収集と分析

GPT-4oは、情報の収集や分析に活用できます。

プロンプト

先週1週間の日経平均の推移を、グラフ付きで解説してください。

GPT-4oを活用するとデータの収集・表への整理・グラフ化まで一度に済むため、大幅に作業を効率化できます。

また、GPT-4oおよびGPT-4ではウェブ検索が可能なため、最新の情報も取得可能です。

ただし、GPT-4oの学習データは2023年10月まであり、2023年10月以降の情報はWeb検索での取得元に依存します。

過去の情報と比べると情報が制限されるため、複数の信頼できる情報源と照らし合わせ、慎重に検証することが重要です。

2.コードの作成

GPT-4oはコーディング能力が高く、以下のような簡単なコードであれば数秒で作成できます。

プロンプト

オセロのコードをPythonで作成してください。

また、エラーの検出やコードの改善にもGPT-4oは活用可能です。

3.コラムの作成

GPT-4oは文章作成の精度も上がっており、より自然な日本語でコンテンツを作成できます。

プロンプト

「快適な睡眠のコツ」というコラムを作成してください。文字数は400文字でお願いします。

また、コンテンツそのもののほか、ペルソナ設定や記事の構成作成などにもGPT-4oは活用できます。

ライティングに便利なGPTsについては、ライティングに使えるOpenAIのオススメGPTs10選もあわせてご覧ください。

4.画像をもとにしたアドバイス

GPT-4oの画像認識能力を利用して、画像をもとにアドバイスも受けられます。

プロンプト

(画像を添付)
このペンの芯を変えたいです。対応する商品と、交換方法を教えてください。

このように知りたいものの情報を画像で添付すると、画像から情報を読み取って必要な情報を提示してくれます。

5.ラフ画をもとに画像生成

GPT-4oの画像認識能力は、画像生成の際にも活用できます。

たとえば、以下のように手書きのラフ画を添えて指示を出すと、ラフ画をもとに画像を生成してくれます。

プロンプト

(画像を添付)
添付のイラストをもとに、画像を作成してください。背景は黒、物体の色は青色で、透明感のある素材です。写真に見えるようなリアルな画像でお願いします。

ラフ画で意図を伝えられれば、文章で伝えるのが難しい細かなニュアンスも画像作成に反映できるでしょう。

GPT-4oとGPT2 chatbotの関係は?

GPT-4oが発表される直前(2024年4月)に話題となった謎のAIモデル「GPT2 chatbot」とGPT-4oとの関係について、以下のポイントに沿って解説します。

  1. GPT2 chatbotが謎のAIモデルとして話題に
  2. 「GPT-2」とは別物
  3. 「GPT-4o」のテストモデルであることが明かされる

それぞれ解説します。

1.GPT2 chatbotが謎のAIモデルとして話題に

2024年4月29日、LLMを評価するプラットフォーム「Chatbot Arena」に現れたAIモデル「gpt2-chatbot」が、GeminiやClaude、GPT-4より高性能だと話題になりました。

その後、gpt2-chatbotは一時姿を消しましたが、2024年5月6日に再び「im-a-good-gpt2-chatbot」「im-also-a-good-gpt2-chatbot」としてChatbot Arenaに出現しています。

2つのモデルが再登場する直前に、OpenAI CEOのサム・アルトマンが「im-a-good-gpt2-chatbot」とXに投稿したことや、gpt2-chatbotの受け答えがGPT-4と似ていることなどから「gpt2-chatbotはChatGPTの新しいモデルでは?」などOpenAIとの関係を推測する声が多数上がり話題となりました。

参考:https://twitter.com/sama/status/1787222050589028528

2.「GPT-2」とは別物

名前が似ていることから、GPT2 chatbotはOpenAIが2019年に発表した「GPT-2」と混同されることがありますが、別物です。

GPT-2は現在リリースされているモデルの古いバージョンであり、GPT-3.5やGPT-4と比べるとかなり精度が低いモデルです。

一方、Chatbot Arenaで見られるgpt2-chatbotの性能はGPT-4に劣らないものであり、GPT-2とは別物だといえます。

3.「GPT-4o」のテストモデルであることが明かされる

2024年5月14日にOpenAIの研究員により、謎のAIモデルとして注目されたgpt2-chatbotは

「GPT-4o」のテストモデルであることが明かされました。

参考:https://twitter.com/LiamFedus/status/1790064963966370209

Xの投稿では、im-also-a-good-gpt2-chatbotと他の主要なAIモデルの実力を評価したデータも公開されています。

引用:X

グラフの左端に位置するim-also-a-good-gpt2-chatbotは最も高いEloレーティングを示しており、他のモデルに比べて高いパフォーマンスを発揮していることがわかります。

GPT2 chatbotの使い方

GPT2 chatbotは、Chatbot Arenaで利用可能です。

引用:Chatbot Arena

Chatbot ArenaのArena(battle)では、プロンプトを入力すると2つのLLMが選ばれて回答します。

ただし、2つの使用モデルはランダムに選ばれ、出力後どちらの生成結果が優れていたか評価の選択が完了するまではどのモデルを使用したのかわかりません。

そのため、GPT2 chatbotを試したい場合は偶然に頼るほかなく、GPT2 chatbotが登場するまでプロンプトの入力を繰り返す必要があります。

引用:Chatbot Arena

GPT2 chatbotを使ってみたい方は、GPT2 chatbotが選ばれるまで何度も繰り返しプロンプトを送信しましょう。

GPT2 chatbotの利用料

Chatbot Arenaはアカウント不要で、誰でも無料で利用できるため、GPT2 chatbotも無料で試せます。

ただし、GPT2 chatbotを指定して利用はできないため、ランダムに表示されるAIモデルにGPT2 chatbotが選ばれるまで何度も挑戦する必要があります。

GPT2 chatbotを実際に使用した例

実際にGPT2 chatbotを使用した例を紹介します。

  1. 知識を問う質問
  2. コードの作成
  3. コラムの作成
  4. しりとり
  5. 論理問題

それぞれ紹介します。

1.知識を問う質問

GPT2 chatbotに知識を問う質問をすると、非常に精度の高い情報が返ってきます。

プロンプト

日本で2番目に高い山について教えて。

「日本で2番目に高い山」を問うと、GPT-3.5でも「剣岳」など間違った回答をすることがありますが、GPT2 chatbotは正しく回答できています。

2.コードの作成

GPT2 chatbotに以下のような簡単なコードの作成を依頼すると、わずか数秒で作成できます。

プロンプト

電卓のコードをPythonで作成して

3.コラムの作成

GPT2 chatbotは、テーマに沿ったコラムも自然な日本語で作成可能です。

プロンプト

「人生を楽しむコツ」というテーマで、コラムを作成してください。文字数は500文字でお願いします。

きちんと見出しも立てており、読みやすいコラムが作成できています。

4.しりとり

GPT2 chatbotはルールをきちんと理解した上で、しりとりもできます。

プロンプト

「り」から始めて、しりとりを続けてください。10回まで続けてください。

他のAIモデルではそもそもルールを理解していなかったり、「ん」で終わる単語や存在しない単語を出してしまったりするケースが多いですが、GPT2 chatbotはきちんとしりとりが成り立っています。

5.論理問題

GPT2 chatboは、間違えやすい論理問題にも正確に答えられます。

プロンプト

明後日の3日前は日曜日でした。今日は何曜日でしょうか?

上記の質問に対して他のAIモデルでは誤答が目立ちましたが、GPT2 chatboは正しい解答が可能です。

OpenAIとChatGPTの今後の動向に注目!

今回は、2024年5月13日にOpenAIからリリースされたGPT-4oについて、特徴や利用方法、GPT2 chatbotとの関係とあわせて、実際の利用例まで紹介しました。

GPT-4oは、視覚と音声の理解力がとくに向上しており、応答速度も2倍に改善しています。

複雑な対話の理解も進んでおり、今後のさらなるアップデートに注目が集まっています。

また、GPT-4oのほかにもAIツールは多く発表されています。

下記のコラムでは話題のAIツールについて詳しく解説しておりますので、是非ご覧ください。

Llama(ラマ)3の使い方やChatGPTとの違いを徹底解説

Grokの特徴や使い方は?ChatGPTとの違いから事例まで解説

【決定版】ChatGPTのプロンプトテンプレート集279選

OpenAIのMy GPTsの作り方を徹底解説!使い方も紹介

なお、弊社が提供しているSEOに強いAIライティングツール「トランスコープ」は、SEOライティングや社内文書ライティングにご活用いただけます。

トランスコープについては、以下の動画で詳しく紹介しています。

AIでSEOに強いブログ記事作成!SEOに強いAIライティングツール「トランスコープ」とは?

さらに、【トランスコープの評判・導入事例】では、実際にトランスコープを取り入れた企業の導入事例を掲載しています。

ぜひご確認ください。

トランスコープは、無料で体験ができます。

ご興味がございましたら、お気軽にお試しください。

■SEOに強いAIライティングツール「トランスコープ」

https://transcope.io/

最終更新日:2024/6/23

シェアモル株式会社 代表取締役

齋藤 康輔

大学在学中に半導体のシミュレーションを専攻する傍ら、人材会社にてインターン。
インターン中に人材会社向け業務システムを開発し、大学卒業後の2007年3月に上記システム「マッチングッド」を販売する会社、マッチングッド株式会社を設立。
12年の経営の後、2019年1月に東証プライム上場企業の株式会社じげんに株式譲渡。
売却資金を元手に、シェアモル株式会社を設立。
AIを利用したM&A・事業承継の仲介サービス「シェアモルM&A」SEOに強い文章をAIが作成する「トランスコープ」を展開中。

Contact

以下から登録またはX(旧Twitter)をフォローすると
お役立ち情報を無料で受け取れます!

SEOに強いAIライティングツールAIならトランスコープ

© Transcope.