最終更新日:1/14/2025
最先端技術の進化は、常に私たちの想像を超えるものです。
この度のOpenAI DevDayで発表された「GPT-4 Turbo」は、最新の例と言えるでしょう。
SEOに強いAIライティングツールのトランスコープのように、AI技術を応用した便利なサービスも増え続けています。
本記事では、GPT-4 Turboの特徴やOpenAIの最新動向について深堀りします。
「GPT-4 Turboは何がすごい?」
「他の最新情報についても、分かりやすく説明してほしい」
上記のような、ChatGPTの最新機能について知りたい方向けに、本記事を読めば理解できるよう整理しました。
今回を期にChatGPTをスタートする方は、初心者向けChatGPTの始め方:ログインURLからアプリまでを参考にしてください。
OpenAIが提案する技術によって、私たちにどのような影響を与えるのか、一緒に探っていきましょう。
GPT−4 Turboとは、OpenAIによって開発された最新のAIモデルです。
GPT-4のアップグレード版であり、6つの特徴が発表されました。
また、GPT-4 Turboと同時に発表された以下についても解説します。
それぞれの詳細を見ていきましょう。
この度のバージョンアップで、一度に扱える情報の量がGPT−4の32k(32,000)トークンから、128k(128,000)トークンまで入力できるようになりました。
日本語だと約10万文字のボリュームとなり、バージョンアップ前後の差は約4倍です。
トークン数がアップしたけれど精度は落ちていない、とOpenAI側は説明しています。
また、トークン数拡大によって、300ページ以上のテキストを理解して、長文の生成や要約・翻訳が可能です。
ビジネスでは、長文で複雑な問い合わせにも対応できるなど、活用の幅が広がるでしょう。
しかし、一般ユーザーではそこまで大量の入力をすることが少ないため、変化を実感しにくいかもしれません。。
レート制限の引き上げによって、以下のメリットがあります。
今までと比べて、1分間に2倍のリクエストを送れるようになり、結果的に処理が速くなりました。
また、アプリケーションやサービスなど一度に多くのデータを処理できるようになるため、ユーザー体験(UX)が向上します。
さらに開発者にとっては、アプリケーションのスケールアップが容易になり、より大規模なプロジェクトや高負荷の状況にも対応しやすくなります。
つまり、利用者も開発者も、スムーズにOpenAIのサービスを利用できるようになりました。
バージョンアップで便利になった一方で、APIの利用価格が引き下げられたのは、嬉しい変更点です。
利用価格について、OpenAIブログを参考にまとめた表は以下のとおりです。
上記は、すべて1,000トークンあたりの価格です。
GPT−4とGPT−4 Turboでは、入力トークンが従来の約1/3、出力トークンは従来の半額の値段となりました。
開発者にとって、同じコストでより多くのリクエストを処理できるようになり、APIを活用したアプリケーションの開発と運用がしやすくなるでしょう。
今回、学習情報のアップデートも行われました。
学習データが2023年4月に更新されたことによって、比較的最近の情報も扱うことが可能になりました。
実際に、どのような回答をするか見てみましょう。
2023年4月の出来事をリストアップしてください。
回答内容が正しいか確認したところ、6つ中全て正しい情報でした。
なお、ChatGPTの無料版であるGPT-3.5に同じプロンプトを入力したところ、2022年1月までの学習データであると回答がありました。
GPT-4 Turbo with visionとは、GPT−4 TurboのAPIで、画像を入力として扱う機能を有しています。
GPT-4Vのようにテキストだけでなく画像情報も解析し、それに基づいた回答を生成可能です。
GPT-4Vについては以下の記事をご参考ください。
ChatGPT新機能「GPT-4V」とは?使い方・料金などを解説
たとえば、GPT-4 Turbo with visionでは以下のタスクが行えます。
また、GPT-4 Turbo with visionの他に発表されたAPIとして、画像生成のDALL-E3や音声合成機能のTTS(Text to speech)があります。
GPT-4 Turbo with visionと音声合成機能のTTSを組み合わせることにより、目の不自由な人が商品を見分けたり、問題の解決に役立てたりできるようになるでしょう。
TTSに関しては、OpenAIブログ内でサンプルが用意されています。
画像生成のDALL-E3については、無料画像生成AIのDALL-E3。商用利用や著作権を徹底解説のコラムで詳しく解説しておりますので、ぜひご覧ください。
さらに、文字起こし機能であるWhisper v3が先日リリースされており、将来的にAPIとしてサポートされる予定です。
従来の文字起こし機能であるWhisper(ウィスパー)についてはOpenAIのWhisperでAI文字起こし!価格・使い方を解説で紹介しておりますので、ぜひ参考にしていただけると幸いです。
今回発表された新APIであるGPT-4 Turbo with vision、DALL-E3、TTSの料金を以下の表にまとめました。
まもなくGPT-4のファインチューニングに、参加可能となることが発表されました。
ファインチューニングとは、既存の言語モデルに追加学習させることで、既存の言語モデルと追加学習されたデータが活用された、特定のタスクに適したモデルのために、生成結果を調整する手法のことです。
少し前にGPT-3.5のファインチューニングが可能となっていましたが、GPT-4でも導入されます。
これにより、自分の望む回答を得やすくなるメリットがあり、自社データを学習させると、自社データについて回答できるようになると注目されています。
GPT−4 Turboに加えて、GPT-3.5 Turboが高性能化しました。
コンテキストが16k(160,000)トークンで、改良された以下をサポートします。
開発者はAPIより「gpt-3.5-turbo-1106」 を呼びだすことで、新モデルにアクセス可能です。
gpt-3.5-turboを使用しているアプリは、12月11日に新モデルへ自動アップグレードされます。
費用については本記事の「API利用価格引き下げ」の表をご覧ください。
Function callingの性能が向上したことによって、データの分析や計算といった、複雑なタスクをより正確に処理できるようになりました。
たとえば「〇〇して」「△△して」と1つずつ出していた指示が、「〇〇をした後に、その結果を利用して△△して」とまとめて指示ができ、〇〇した後の結果が不正の場合はエラーにすることが可能なため、より正確な処理ができるようになりました。
GPTに与える変数を定義して、正確な処理をされたい人にとっては、非常に便利になったといえるでしょう。
今回のアップデートで、「GPT-4 All Tools」が使えるようになりました。
GPT-4 All Toolsが使えるようになったことで、事前にGPT-4VやDALL-E3のような画像生成などの専用機能に切替えしなくても、プロンプトのみで自動的に画像生成などを行えるようになりました。
また、GPT-4 All Toolsに画像やPDFなどを直接読み込ませてチャットができるようになりました。
今まではGPT-4VやDALL-E3の使用時に、ChatGPT上でどの機能を使用するか選択する必要がありましたが、これからは1つのChatGPTのUIで全ての機能が使用可能です。
実際にどのように生成されるか紹介します。
あなたはブロガーです。ライティングに便利なショートカットキーをおすすめする記事を書いてください。また、記事の内容に合った画像も生成してください。
文章の生成までで終了してしまい、どうやら画像は同時に生成できないようです。
続けて、
画像が生成されていません。上記の内容に合った画像を生成してください
とプロンプトを送信しました。
ショートカットキーから連想される、キーボードのような画像が提示されました。
わざわざ画像生成のために、DALL-E3のモードに変更しなくても良くなった点は、非常に使いやすいです。
DALL-E3やGPT-4Vなどの使用頻度が高かった人にとって、今後の作業効率化に役立つでしょう。
自分好みのGPTにカスタマイズ可能な「GPTs」がリリースされ、大きな話題となっています。
ライティングやデザインなど、特定の機能に特化したボットを作って業務を効率化できます。
ChatGPTの画面左側「Explore」を選択すると、「Create a GPT」より作成可能です。
実際に、ブログのライティングサポートを目的としたGPTを、作成した様子について紹介します。
「Create a GPT」をクリックすると、設定画面が表示されます。
日本語でのやり取りを希望する場合は、初めにプロンプトに「日本語で」と指示しておきましょう。
まず、どのようなサポートを目的とするか設定します。
今回は
ブログ記事を執筆したい
と送信しました。
続いて、GPTsのアイコンを設定しますが、ここでは自動提案を採用しました。
また、どのようなサポートが良いか指定できます。
「明確なアドバイス提供型」「アイデア支援型」など、サポートの範囲も設定できるため、自分のニーズに合わせると良いでしょう。
基本的には、GPTsからの質問に答えていけば初期設定は完了します。
なお、決定した設定項目は設定画面上部の「Configure」を選択すると確認可能です。
作成完了すると、ChatGPT上でアイコンと名前が表示されるようになり、使用可能となります。
あとは作成したGPTsのチャット欄で、これまでと同様にプロンプトを送信すれば良いだけです。
カンタンな設定で、自分好みのGPTをカスタマイズでき、OpenAIの技術進歩を実感しました。
そして、GPTsに並んで注目されているのが「GPT Store」の解禁です。
App Storeのように、GPTsで作成した独自のチャットボットを共有・公開できるようになり、他のユーザーが作成したGPTも使用できます。
さらに自分のGPTが使われると、収益が発生する仕組みもあると情報が出ていますが、詳細は未発表です。
GPT Storeは11月末頃に使用可能とのことです。
GPTsとGPT Storeの詳細は、OpenAIブログでも確認できます。
Assistants APIとは、自身が使用するアプリにAIアシスタントをカンタンに追加できる機能のことです。
Code InterpreterやRetrieval、関数呼び出しなどの新機能を提供するAPIで、高品質のAIアプリを構築できます。
自社の情報を利用するために、Retrievalを利用したカスタマーサポートなどに、Assistants APIを活用できると想定されています。
開発者にとって、非常に役立つ機能だといえるでしょう。
Code Interpreterは現在「Advanced Data Analysis」の名称となっており、【2025年版】Advanced Data Analysisの活用方法10選のコラムにて解説しています。
最後に、著作権シールドの情報について説明します。
こちらは、OpenAIがシステムに組み込まれた著作権セーフガードで、ユーザーを保護することを約束するものです。
もしも、著作権侵害に関する法的な請求に直面した場合、OpenAIはユーザーを守り発生した費用を支払うとOpenAIブログに記載されています。
生成AIの著作権問題が徐々に明らかになるにあたって、著作権保護を強化したと考えられます。
ChatGPTの著作権侵害問題については、以下の記事も参考になるでしょう。
ChatGPTの商用利用は問題ない?著作権侵害問題を避ける方法
本記事では、この度発表されたGPT-4 Turboの特徴や、OpenAIの最新動向について深堀りしました。
ChatGPTのリリースから1年、OpenAI社によるAIの進化は目覚ましいです。
ネット上でも「11月7日は革命が起きた」「AIの歴史が動いた」と話題となっています。
ビジネスにおいても、AIを活用できるかどうかで、効率面や収益の最大化などに差が広がるでしょう。
弊社が提供しているSEOに強いAIライティングツール「トランスコープ」でも、ChatGPTの技術を応用しております。
トランスコープの詳細は、AIでSEOに強いブログ記事作成!SEOに強いAIライティングツール「トランスコープ」とは?の動画にて紹介しております。
またDevDayの発表内容を受けて、ChatGPTをよりビジネスに活用したい方は、【決定版】ChatGPTのプロンプトテンプレート集279選がお役に立てるでしょう。
下記公式サイトより、トランスコープの無料体験も可能です。
ぜひお試しいただけますと、幸いです。
最終更新日:1/14/2025
シェアモル株式会社 代表取締役
齋藤 康輔
大学在学中に半導体のシミュレーションを専攻する傍ら、人材会社にてインターン。
インターン中に人材会社向け業務システムを開発し、大学卒業後の2007年3月に上記システム「マッチングッド」を販売する会社、マッチングッド株式会社を設立。
12年の経営の後、2019年1月に東証プライム上場企業の株式会社じげんに株式譲渡。
売却資金を元手に、シェアモル株式会社を設立。
AIを利用したM&A・事業承継の仲介サービス「シェアモルM&A」とSEOに強い文章をAIが作成する「トランスコープ」を展開中。
Contact
© Transcope.