2022年11月に登場したChatGPTは、わずか2カ月で登録者数1億人を突破するなど、驚異的なほどの注目を集めました。ほぼ間違いなく、2023年は我々の生活にAIが急速に溶け込んでいことになるだろうと思われます。
ChatGPTが採用している大規模言語モデルは GPT-3.5 でしたが、その開発元であるOpenAIは、GPT-3.5を超える大規模言語モデル GPT-4を 2023年3月15日に一般公開しました。
現時点では一部のユーザーが対象のようですが、近いうちに日本でも使えるようになるでしょう。
そこで今回は、GPT-4に関するポイントをざっくりと解説しておきたいと思います。
GPT-4とは

GPTは、「Generative Pre-training Transformer」の略称で、大量のテキストデータを学習し、自然な文章を生成することができる大規模言語モデルであり、2018年にOpenAIが開発しました。
GPTは1,2,3と進化を遂げており、GPT-4はそのシリーズの最新作として、過去のGPTシリーズよりも多様なデータセット、大量のパラメータ、そして多彩な機能を備えており、2023年の春に登場する予定です。
GPT-4は2023年3月15日に正式公開されましたが、ChatGPTの有料プラン(ChartGPT Pro)に加入されている方のみ利用可能です。また、4時間毎に100メッセージまでという上限が限定されています。
ただ、マイクロソフトのBingに搭載されているBING AIは、このGPT-4をベースに検索エンジンと融合するようカスタマイズされたものであるため、Bing AIユーザーは、既にGPT-4を体験していることになります。

GPT-3とGPT-4の違い

GPT-3とGPT-4の違いは、学習に使うデータ量とデータの種類になります。
GPT-3は非営利団体「CommonCrawl」が集めたWebのクロールデータ、及びWikiペディアのテキストを使って学習しているのに対し、GPT-4はそれらに加えて、音楽、動画、画像、Twitter、ニュースなど、多種多様のデータ(マルチモーダルなデータ)を使って学習しています。

項目 | GPT-3 | GPT-4 |
---|---|---|
パラメータ数 | 1750億個 | 2000億~1兆個(未公開につき数値は不明) |
学習データ | 少なくとも570GB以上 (未公開につき数値は不明) | 30~160TB (未公開につき推定) |
モデルサイズ | 数百GB (未公開につき推定) | 数百GB~数TB (未公開につき推定) |
データセット | インターネット上のテキストデータ | インターネット上のテキストデータに加えて、 画像や音楽や動画などを含む様々な種類のデータ |
機能 | テキスト生成や要約、翻訳、質問応答など の自然言語処理タスク | テキストだけでなく、画像や音楽や動画などの生成 や編集、自然言語処理タスクに加えて推論や予測、 分析などの知識推論 |
利用可能性 | OpenAIが提供するChatGPIやAPIを 通じて利用 | OpenAIが提供するChatGPIやAPIを 通じて利用 尚、Microsoft Bingでは既に搭載済み |
下記のグラフはOpenAIの公式ページに掲載されているGPT-3.5とGPT-4 の性能を比較したグラフです。
英語なので分かり難いかもしれませんが、横軸に模擬試験のタイトルが書かれていて、それぞれに対してGPT-3.5とGPT-4の成績が棒グラフで表されています。

公式ページのグラフの下には、横軸に記載されている模擬試験のタイトルごとの成績が一覧表示されていますが、全体的に点数が上がっていることが分かります。

GPT-4で出来ること

GPT-4では、様々な種類のデータを、しかも大量に学習することにより、出来ることが大幅に増えています。以下は、GPT-3と比較した結果です。
用途 | GPT-3 | GPT-4 |
---|---|---|
テキスト生成 | 〇 | 〇 |
画像生成 | × | 〇 |
音声生成 | × | 〇 |
コード生成 | △ | 〇 |
質問応答 | △ | 〇 |
要約・翻訳 | △ | 〇 |
推論・予測・分析 | × | 〇 |
ゲーム・教育・エンターテイメントなどの インタラクティブなアプリケーション | × | 〇 |
GPT-3においてもコード生成、質疑応答、要約・翻訳は行えますが、GPT-4は更に複雑な内容を高精度で行う事ができます。
また、GPT-4は、GPT-3では未対応だった画像生成、音声生成のほか、データ分析や予測にも対応するようです。
2023年3月15日において、公開されたばかりで詳細が不明な点も多いのですが、もしかすると作曲したり歌ったりすることが出来るのかもしれませんね。
GPT-4で期待される用途

GPT-4の用途について、簡単ですが以下の通り纏めてみました。
- テキストやコード、画像などの生成や編集
GPT-4は、自然言語生成やコード生成などのタスクでより高度な性能が期待されています。また、GPT-4がより大きなトレーニングデータを使用することで、画像生成や画像編集などのタスクにも応用が可能になると考えられます。 - 質問応答や要約、翻訳などの自然言語処理
GPT-4は、自然言語処理タスクにおいても、GPT-3よりも高度な性能が期待されています。より高度な質問応答や要約、翻訳の性能により、より正確で自然な自然言語処理が可能になります。 - 推論や予測、分析などの知識推論
GPT-4は、より高度な知識推論にも対応することが期待されています。より高度な推論や予測、分析により、より正確な結果が得られるようになります。 - ゲームや教育、エンターテイメントなどのインタラクティブなアプリケーション
GPT-4の高度な自然言語処理能力により、ゲームや教育、エンターテイメントなどのアプリケーションにおいて、より自然で臨場感のある対話が実現できるようになると期待されています。
GPT-4に関する噂はデタラメ
OpenAIのCEOであるSam Altmanは、ネット上で書かれたGPT-4の噂話は、まったくのデタラメとコメントしています。
原文はニューヨーク州のシラキュース大学の教授であるShelly Palmerの公式サイト「GPT-4 is Still a Rumor」に記載されていますが、以下がその部分です。

StrictlyVCとのインタビューで、OpenAIのCEOであるSam Altmanは、GPT-4に関する噂について答えた。いつ利用可能になるかは全く分からないという。GPT-3(1750億)とGPT-4(100兆)のパラメータ数を比較したとされる虚偽のチャートを「完全なでたらめ」と一蹴した。GPT-4に関する噂はばかげているし、期待外れになるだろうと述べた。また、多くの領域で人間と同等の能力を持つAIシステムを作ることはまだ遠いとも言及した。これは一般的に人工汎用知能(AGI)と呼ばれるものだ。
Sam AltmanがAIについて話すときはよく聞くべきだ。私たちはGPT 3.5やChatGPTが可能にした生産性の向上に驚嘆しているが、GPT-4の能力について憶測するのは愚かだ。分かったら分かったでいい。
私のアドバイス?既存のモデルを自分の利益に活用する方法を学ぶことだ。それが次に来るものを最大限に活用する助けになるだろう。
引用元:Shelly Palmer
開発者向けOpenAのデモ動画
OpenAIの公式ページには、GPT-4のデモンストレーション動画が大きく表示されています。興味のある方は、ブラウザ上で再生してみてください。全て英語ですが、YouTubeの字幕機能を使えば、ある程度内容は理解できるかと思います。

OpenAIからは開発者向けのデモ動画も公開していて、こちらも英語なのですが、下記のYouTuberが動画について詳しく解説してくれています。GPT-4を知る上での参考になると思いますので、興味のあるかたはご覧下さい。
まとめ
今回は、OpenAIが開発したGPTシリーズの最新版 GPT-4 について、ざっくりと概要とGPT-3とGPT-4との違い、GPT-4で出来ること、期待される用途、そして最後にネット上で話題になっているGPT-4の噂話の真相について解説しました。
ネット上にも不確定なことしか記載されおらず、あくまでも憶測の域を出ませんが、ざっくりと理解するには役立つのではないかと思います。
実際に登場したら、この記事を更新していきたいと思いますので、またよければ覗いてみて下さい。