最終更新日:2024/6/23
「GPT-4oの特徴や性能を知りたい」
「GPT-4oを実際に使ってみたい」
このようにお考えではありませんか?
今回は、OpenAIから新たに発表されたAIモデル「GPT-4o」の特徴や利用方法、実際の利用例まで解説します。
また、本記事ではGPT-4oが発表される直前(2024年4月)に話題となった謎のAIモデル「GPT2 chatbot」とGPT-4oとの関係についても詳しく解説しております。
なお、弊社が提供するSEOに強いAIライティングツール「トランスコープ」も、ChatGPTの技術を応用しております。
GPT-4oとは、OpenAIが2024年5月13日に発表した新しいAIモデルのことです。
GPT-4oの「o」は「omni(オムニ)」からきており、omniには「すべての」という意味があります。
今までのモデル「GPT-4」にもマルチモーダル機能は備わっていましたが、GPT-4oではマルチモーダル機能がより強化されています。
GPT-4oでは、テキスト・画像・音声・ビデオといった多様な形式の組み合わせで入力でき、テキスト・画像・音声の組み合わせで出力が可能です。
GPT-4oの特徴は、以下の5つです。
それぞれ解説します。
GPT-4oは、音声認識の精度が飛躍的に向上しています。
GPT-4でも音声認識機能は利用できましたが、「応答に時間がかかる」「聞き間違いが生じる」など、実際に利用するには性能が足りない部分もありました。
しかし、GPT-4oはテキスト・画像・音声・動画をひとつのニューラルネットワークで入出力できるように改善されたため、精度が上がった上に音声入力に対する応答速度が最短232ミリ秒(平均320ミリ秒)に向上しています。
GPT-4oの音声入力に対する応答は、人間の会話と同じくらいの速さといえます。
GPT-4oは画像生成機能も強化されており、高品質な画像を作成可能です。
一例として、画像の中に文字を入れ込む能力も向上しており、画像の中に描かれた紙や看板に完成度の高い文章を入れられます。
ただし、今はまだ日本語の文章を入れるよう指示しても英語で記載されたり、文字化けしたような記号が記載されたりするため、今後の日本語への対応に期待が高まります。
GPT-4oは、ベンチマークテストでもスコアを伸ばしています。
引用:OpenAI
GPT-4oはMMLUやGPQAを含む5つのタスクにおいて、GPT-4TだけでなくClaude 3 Opus、Gemini Pro 1.5といった主要なAIモデルを超える高いスコアをマークしています。
また、GPT-4oは音声やビジョンなどの分野でも優れた性能を発揮しており、とくに音声認識・翻訳・視覚理解で高い評価を受けています。
Claude 3について詳しく知りたい方は、Claude3とは?概要や利用例、ChatGPTとの違いを解説もあわせてご覧ください。
Geminiについては、Google Gemini発表!概要やGPT-4との違いを解説もご参考ください。
OpenAIの公式サイトによると、GPT-4oの応答速度はGPT-4 Turboの2倍の速さであり、大きく向上していることがわかります。
今までChatGPTは、回答の精度に定評があるものの、応答速度では他社モデルに押されている印象がありました。
しかし、今回応答速度が改善されたことで、高精度かつスピーディな回答が可能になりました。
実際にGPT-4oを使ってみると、スピーディな応答を体感できるでしょう。
GPT-4oは言語能力が向上しており、さらに、翻訳機能も改善しています。
音声認識機能に加え、言語能力と翻訳機能が向上したことにより、GPT-4oを活用したより効率的なグローバルコミュニケーションが可能になるでしょう。
また、日本語を含む複数の言語で大幅にトークン数を削減しており、トークン効率も大きく向上しています。
GPT-4oは、OpenAIの公式サイトからアカウントを作成すると誰でも利用できます。
アカウントはメールアドレスの他、Googleアカウントを利用しても登録可能です。
ChatGPTには以下の3つのプランがありますが、GPT-4oは無料プランと有料プランの両方で利用できます。
個人で利用するのであれば、使用頻度や使う内容に合わせて無料プランか、有料のChatGPT Plusを選びましょう。
無料プランの場合は、何かプロンプトを送信した後、回答の下に表示されるアイコン部分からモデルを切り替えるとGPT-4oを利用できます。
引用:ChatGPT
ただし、無料版は一定時間内に入力できるプロンプトの数が有料ユーザーの1/5程度に制限されています。
制限回数を超えるとGPT-4oは利用できなくなり、所定の時間が経過するまではGPT-3.5しか使えません。
有料版では、ChatGPTホーム画面の左上にあるメニューからGPT-4oを選択できます。
引用:ChatGPT
ChatGPT Plusは月に約3,000円の費用がかかりますが、無料プランと比べて5倍のプロンプトを送信可能です。
GPT-4oは、OpenAIの公式サイトから無料または有料で利用が可能です。
他にも、開発者や企業向けにAPIアクセスも提供されており、APIの価格は以下のとおりです。
参考:OpenAI
GPT-4oはAPI料金がGPT-4 Turboの半額に設定されており、よりコストを抑えて高機能なモデルを利用できます。
GPT-4oの5つの利用例とプロンプトの出力結果を紹介します。
それぞれ解説します。
GPT-4oは、情報の収集や分析に活用できます。
先週1週間の日経平均の推移を、グラフ付きで解説してください。
GPT-4oを活用するとデータの収集・表への整理・グラフ化まで一度に済むため、大幅に作業を効率化できます。
また、GPT-4oおよびGPT-4ではウェブ検索が可能なため、最新の情報も取得可能です。
ただし、GPT-4oの学習データは2023年10月まであり、2023年10月以降の情報はWeb検索での取得元に依存します。
過去の情報と比べると情報が制限されるため、複数の信頼できる情報源と照らし合わせ、慎重に検証することが重要です。
GPT-4oはコーディング能力が高く、以下のような簡単なコードであれば数秒で作成できます。
オセロのコードをPythonで作成してください。
また、エラーの検出やコードの改善にもGPT-4oは活用可能です。
GPT-4oは文章作成の精度も上がっており、より自然な日本語でコンテンツを作成できます。
「快適な睡眠のコツ」というコラムを作成してください。文字数は400文字でお願いします。
また、コンテンツそのもののほか、ペルソナ設定や記事の構成作成などにもGPT-4oは活用できます。
ライティングに便利なGPTsについては、ライティングに使えるOpenAIのオススメGPTs10選もあわせてご覧ください。
GPT-4oの画像認識能力を利用して、画像をもとにアドバイスも受けられます。
(画像を添付) このペンの芯を変えたいです。対応する商品と、交換方法を教えてください。
このように知りたいものの情報を画像で添付すると、画像から情報を読み取って必要な情報を提示してくれます。
GPT-4oの画像認識能力は、画像生成の際にも活用できます。
たとえば、以下のように手書きのラフ画を添えて指示を出すと、ラフ画をもとに画像を生成してくれます。
(画像を添付) 添付のイラストをもとに、画像を作成してください。背景は黒、物体の色は青色で、透明感のある素材です。写真に見えるようなリアルな画像でお願いします。
ラフ画で意図を伝えられれば、文章で伝えるのが難しい細かなニュアンスも画像作成に反映できるでしょう。
GPT-4oが発表される直前(2024年4月)に話題となった謎のAIモデル「GPT2 chatbot」とGPT-4oとの関係について、以下のポイントに沿って解説します。
それぞれ解説します。
2024年4月29日、LLMを評価するプラットフォーム「Chatbot Arena」に現れたAIモデル「gpt2-chatbot」が、GeminiやClaude、GPT-4より高性能だと話題になりました。
その後、gpt2-chatbotは一時姿を消しましたが、2024年5月6日に再び「im-a-good-gpt2-chatbot」「im-also-a-good-gpt2-chatbot」としてChatbot Arenaに出現しています。
2つのモデルが再登場する直前に、OpenAI CEOのサム・アルトマンが「im-a-good-gpt2-chatbot」とXに投稿したことや、gpt2-chatbotの受け答えがGPT-4と似ていることなどから「gpt2-chatbotはChatGPTの新しいモデルでは?」などOpenAIとの関係を推測する声が多数上がり話題となりました。
参考:https://twitter.com/sama/status/1787222050589028528
名前が似ていることから、GPT2 chatbotはOpenAIが2019年に発表した「GPT-2」と混同されることがありますが、別物です。
GPT-2は現在リリースされているモデルの古いバージョンであり、GPT-3.5やGPT-4と比べるとかなり精度が低いモデルです。
一方、Chatbot Arenaで見られるgpt2-chatbotの性能はGPT-4に劣らないものであり、GPT-2とは別物だといえます。
2024年5月14日にOpenAIの研究員により、謎のAIモデルとして注目されたgpt2-chatbotは
「GPT-4o」のテストモデルであることが明かされました。
参考:https://twitter.com/LiamFedus/status/1790064963966370209
Xの投稿では、im-also-a-good-gpt2-chatbotと他の主要なAIモデルの実力を評価したデータも公開されています。
引用:X
グラフの左端に位置するim-also-a-good-gpt2-chatbotは最も高いEloレーティングを示しており、他のモデルに比べて高いパフォーマンスを発揮していることがわかります。
GPT2 chatbotは、Chatbot Arenaで利用可能です。
Chatbot ArenaのArena(battle)では、プロンプトを入力すると2つのLLMが選ばれて回答します。
ただし、2つの使用モデルはランダムに選ばれ、出力後どちらの生成結果が優れていたか評価の選択が完了するまではどのモデルを使用したのかわかりません。
そのため、GPT2 chatbotを試したい場合は偶然に頼るほかなく、GPT2 chatbotが登場するまでプロンプトの入力を繰り返す必要があります。
GPT2 chatbotを使ってみたい方は、GPT2 chatbotが選ばれるまで何度も繰り返しプロンプトを送信しましょう。
Chatbot Arenaはアカウント不要で、誰でも無料で利用できるため、GPT2 chatbotも無料で試せます。
ただし、GPT2 chatbotを指定して利用はできないため、ランダムに表示されるAIモデルにGPT2 chatbotが選ばれるまで何度も挑戦する必要があります。
実際にGPT2 chatbotを使用した例を紹介します。
それぞれ紹介します。
GPT2 chatbotに知識を問う質問をすると、非常に精度の高い情報が返ってきます。
日本で2番目に高い山について教えて。
「日本で2番目に高い山」を問うと、GPT-3.5でも「剣岳」など間違った回答をすることがありますが、GPT2 chatbotは正しく回答できています。
GPT2 chatbotに以下のような簡単なコードの作成を依頼すると、わずか数秒で作成できます。
電卓のコードをPythonで作成して
GPT2 chatbotは、テーマに沿ったコラムも自然な日本語で作成可能です。
「人生を楽しむコツ」というテーマで、コラムを作成してください。文字数は500文字でお願いします。
きちんと見出しも立てており、読みやすいコラムが作成できています。
GPT2 chatbotはルールをきちんと理解した上で、しりとりもできます。
「り」から始めて、しりとりを続けてください。10回まで続けてください。
他のAIモデルではそもそもルールを理解していなかったり、「ん」で終わる単語や存在しない単語を出してしまったりするケースが多いですが、GPT2 chatbotはきちんとしりとりが成り立っています。
GPT2 chatboは、間違えやすい論理問題にも正確に答えられます。
明後日の3日前は日曜日でした。今日は何曜日でしょうか?
上記の質問に対して他のAIモデルでは誤答が目立ちましたが、GPT2 chatboは正しい解答が可能です。
今回は、2024年5月13日にOpenAIからリリースされたGPT-4oについて、特徴や利用方法、GPT2 chatbotとの関係とあわせて、実際の利用例まで紹介しました。
GPT-4oは、視覚と音声の理解力がとくに向上しており、応答速度も2倍に改善しています。
複雑な対話の理解も進んでおり、今後のさらなるアップデートに注目が集まっています。
また、GPT-4oのほかにもAIツールは多く発表されています。
下記のコラムでは話題のAIツールについて詳しく解説しておりますので、是非ご覧ください。
・Llama(ラマ)3の使い方やChatGPTとの違いを徹底解説
・Grokの特徴や使い方は?ChatGPTとの違いから事例まで解説
・【決定版】ChatGPTのプロンプトテンプレート集279選
・OpenAIのMy GPTsの作り方を徹底解説!使い方も紹介
なお、弊社が提供しているSEOに強いAIライティングツール「トランスコープ」は、SEOライティングや社内文書ライティングにご活用いただけます。
トランスコープについては、以下の動画で詳しく紹介しています。
AIでSEOに強いブログ記事作成!SEOに強いAIライティングツール「トランスコープ」とは?
さらに、【トランスコープの評判・導入事例】では、実際にトランスコープを取り入れた企業の導入事例を掲載しています。
ぜひご確認ください。
トランスコープは、無料で体験ができます。
ご興味がございましたら、お気軽にお試しください。
■SEOに強いAIライティングツール「トランスコープ」
最終更新日:2024/6/23
シェアモル株式会社 代表取締役
齋藤 康輔
大学在学中に半導体のシミュレーションを専攻する傍ら、人材会社にてインターン。
インターン中に人材会社向け業務システムを開発し、大学卒業後の2007年3月に上記システム「マッチングッド」を販売する会社、マッチングッド株式会社を設立。
12年の経営の後、2019年1月に東証プライム上場企業の株式会社じげんに株式譲渡。
売却資金を元手に、シェアモル株式会社を設立。
AIを利用したM&A・事業承継の仲介サービス「シェアモルM&A」とSEOに強い文章をAIが作成する「トランスコープ」を展開中。
Contact
© Transcope.