2023年2月、最近やたらとメディアに取り上げられているチャットGPT(Chat GPT)。
Google検索でのキーワード需要が急激に伸びていることから、みなさんの関心の高さがうかがえます。
一般的な説明については「【実験】チャットGPT(ChatGPT)に直接インタビューしてみた結果を公開します。」の記事でチャットGPTとの質問形式でまとめていますので、本記事ではもう少し技術的な情報について紹介したいと思います。
チャットGPT(Chart GPT)の概要

チャットGPTの公式サイトは下記URLから訪問できます。この記事を読んだ後は、実際に触ってお試しください。

詳しい手順は「【スクショで解説】チャットGPT(Chat GPT)のアカウント作成~ログイン&使い方の解説」に記載していますので、併せてご利用下さい。
チャットGPTとは
ChatGPTは、サンフランシスコの非営利団体「OpenAI」によって開発された自然言語生成モデルです。
GPTとは、Generative Pretrained Transformer(生成的な事前学習トランスフォーマー)の略なのですが、大量のテキストデータの学習を行い、人間のような自然な文章を生成することが可能です。
特に、質問応答タスクや対話タスクに特化してトレーニングされており、人間と対話するような会話形式で回答を返してくれます。
しかし、学習データがWebに存在する大量のテキストであり、これらの中には間違った情報が含まれている可能性があり、すべての質問に対して正しい回答が保証されません。
つまり、質問をする側もチャットGPTが出した回答を鵜吞みにするのではなく、何らかの裏付けや検証によって正確か否かを判定するスキルが求められます。
ただ、人間との会話形式でやり取りできる点は今までにないメリットであり、チャットボットはもとのり検索エンジンとしての需要にも注目されています。今までのキーワード羅列型の検索スタイルから、対話形式の検索スタイルへ進化を遂げるのは、もうすぐかもしれません。
OpenAIとは

OpenAIは、人工知能に関する研究と開発を目的とする非営利組織として、2015年にサンフランシスコで設立されました。
設立者には、ElonMusk(イーロン・マスク)、SamAltman(サム・アルトマン)、GregBrockman(グレグ・ブロックマン)、IlyaSutskever(イリア・サツケーヴァー)、WojciechZaremba(ボイチェフ・ザレンバ)、JohnSchulman(ジョン・シュールマン)らの著名な技術者やビジネスマンが名を連ねています。
OpenAIの目的は、人工知能を安全かつ適切に利用することを通じて、人類の未来を改善することです。そのために、人工知能に関連する研究、開発、教育、普及活動などを行っています。
OpenAIは、GPTやDALL-E、GPT-3などの大規模な言語モデルを開発し、人工知能技術の一層の発展に貢献しています。また、人工知能に関連する政策や倫理、法律の問題にも取り組んでおり、人工知能の普及と利用に関する社会的な議論を促進しています。
現在、OpenAIの時価総額3兆8千億円であり、これはキャノンや富士通の時価総額に相当します。
チャットGPTの使い方(UI、API)
チャットGPTの利用方法として一番手軽なのは、公式サイトのチャット画面から質疑応答することです。現在、OpenAIのウェブサイト、Slack、Discord から簡単に利用することが可能です。
しかし、本来の使い方は Web API を通じて質疑応答することです。
OpenAIのウェブサイトからAPI Key(有料) を入手し、それを使って質問を投げ、回答を受信します。
チャットGPTはテキストでやり取りするのですが、音声認識と音声合成を前後に挟んであげることで、発話での質疑応答も可能です。
このように、API化されていることにより今後様々なサプリやサービスでチャットGPTが利用されることになりますので、「知らない間にチャットGPTを使っていた」というケースはそう遠くないでしょう。
他のチャットボットとの違い、特徴について
従来のチャットボットは、特定の業務に関する質問と回答を対にして学習させることで、対話を実現させていました。
言い換えると、チャットボットの内部には学習によって得られた質疑応答のリストがあり、これを使って回答を返しているだけです。
今でこそ多少曖昧な表現でも回答を得られるようにはなりましたが、それは曖昧な質問内容が、質疑応答リストのどれに該当するかを見分ける能力が向上したに過ぎません。
一方、チャットGPTは、入力されたテキストから次の単語を予測するという手法で文章を生成していくため、特定の業務に特化することなく、幅広い質問に対する回答を得られるようになっています。
チャットGPTの特長として、次のものが挙げられます。
ちなみに、回答の矛盾に気が付いて指摘すると、非を認めて謝罪してくれました。
- 同じ質問に対して、毎回ニュアンスや表現を変えてくる
- これまでの会話内容(履歴)を前提として、新たな質問に回答してくれる
- 自分の回答に対して間違いを指摘されると、それを認めて謝罪する。
- 正しくない前提があれば、意義を唱える
- 倫理的、道徳的に不適切なリクエストには応じない
いずれも従来のチャットボットでは実現し得なかったものばかりです。
以下は、チャットGPTに矛盾を指摘した時の反応です。

チャットGPTが返す回答の課題
ChatGPTは、Web上にある約1TB文のテキストを学習した大規模な言語モデルであるため、多様なトピックに関して回答を生成することが可能です。しかし、学習データの全てが正しいものとは限らないため、以下の課題があります。
- 正確性: 学習データの中には誤った情報も含まれており、特に最新情報や事実に関しては情報が不足気味であるため、誤った回答があたかも正しいように返される可能性があります。従って、最終的な判断は常に自分で行うことが重要です。
- 偏向性: 学習データの中には特定の人種、国、宗教に関する偏った情報が含まれている可能性があるため、ChatGPTが出す回答も何かに偏っている(偏向している)可能性があります。
- 倫理的な問題: 学習データの中には人種、性別、宗教などに関して倫理的に反する意見や問題が含まれている可能性があるため、返される答えも時には倫理に反しているかもしれません。
従って、ChatGPTの回答を活用する場合は、他の情報源とも照らし合わせて、正確な情報を確認であるかを自ら判断する力が求められます。
もっとも、現在の検索エンジンを使った検索結果を活用する場合も同じことが言えるのですが、ことAIがそれらしい回答を返してくるので、受け取り側もついつい信じてしまいがちです。
利用料金

2023年2月時点では、無料と有料の2種類となります。より低価格なプランや企業向けプランも現在検討中なので、プランの種類は今後増えていくと思われます。
無料プラン | 有料プラン | |
---|---|---|
費用 | 0円 | 20ドル/月(約2600円/月) |
ピーク時間帯の利用 | △ (利用制限あり) | 〇 (優先的に提供) |
レスポンス時間 | △ | 〇 |
新機能と改善の提供 | △ | 〇 (優先的に提供) |
登場までの歴史

チャットGPTの歴史は浅く、2018年に今の原型となるGPT-1がリリースされています。以降、現在に至るまでの歴史を振り返ってみましょう。
2015年 | サム・アントルマン、イーロンマスクらによってOpenAI設立 |
2018年 | 最初のGPTモデル、GPT-1をリリース |
2019年 | GPT-2をリリース マイクロソフトとMatthew Brown Companiesが10億米ドル (約1300億円)を投資 |
2020年 | GPT-3をリリース |
2022年 | 12月に対話型チャットAI「ChatGPT」をリリース リリース後1週間以内にユーザー数100万人を突破 |
2023年 | 1月にマイクロソフトが100億ドル(約1.3兆円)の追加投資を表明 |
採用されているアルゴリズム

GPT (Generative Pretrained Transformer) は、Transformer と呼ばれる深層学習アルゴリズムをベースに改良されたものです。
Transformerは、文書の分類、意味的な文章生成、翻訳、質疑応答、サマリー生成など、いわゆる自然言語処理(Natural Language Processing, NLP)を目的としたモデルで、2017年にGoogleによって提唱されました。
GPTは、このTransformerに手を加えて、文書生成に特化させています。具体的には、入力された文書に対して、次に来る単語を予測できるようにしました。

ディープラーニングでは、投入する学習データに正解となるデータを付加した、いわゆる「教師データ」を用いて学習させることが多いのですが、文書の次に来る単語を予測させる場合は、インプットとなるテキストデータに正解データが含まれています。
従って、あとは大量のテキストを与えるだけで、勝手に学習が進んでいくことになります。
このようにして作られたGPTに、「GPT自身が予測した結果に対しても次の単語を予測させる」という事を行わせると、次々と長い文章が生成できるようになります。

かなり大雑把な説明になりますが、このような仕組みでGPTは文書を生成していきます。
更に詳しい仕組みについてお知りになりたい方は、技術系サイト “Qiita” の「話題爆発中のAI「ChatGPT」の仕組みにせまる!」が参考になるかと思います。
学習データと学習方法

現時点のGPT-3 は、ネット上に存在する2021年時点のテキストデータを学習データとして用いています。
GPTはGPT2、GPT3への進化を遂げていますが、これはTransformer モデルのレイヤー数やユニット数、及び学習データを増やすことで実現しています。
ちなみに、学習用テキストデータとパラメータ数について、他の多くのサイトでは 45TBのテキストデータと1750億のパラメータが使われているとの記載がありました。
チャットGPTに確認したところ、テキストーデータが560GB~960GB、パラメータ数は175億個との回答でした。
ちなみに、1週間後に再度確認したところ、テキストデータは数百テラバイト、パラメータ数は1.75兆個との回答が返ってきました。
事の真意は不明ですが、下記のグラフはチャットGPTの1回答を尊重?して記載しています。どちらにせよ、今までに無い膨大なデータとパラメータ数であることは間違いありません。
モデル | 学習用テキストデータ容量 | パラメータ数 |
---|---|---|
GPT-1 | 40 GB | 1億5千万個 |
GPT-2 | 45 GB | 1億5千万個 |
GPT-3 | 1回目の回答:960 GB 2回目の回答:数百TB | 1回目の回答:175億個 2回目の回答:1.75兆個 |

<1回目の質疑応答結果>

<2回目の質疑応答結果>

社会への影響

アメリカでは、教育(先生)やジャーナリズム(記事、編集)がチャットGPTに置き換わるのではないか、フィッシングメールやフィッシングサイトに悪用されたり、チャットGPTの誤った回答によるフェイクニュースが広がるのではないかと懸念されています。
また、教育現場においても、宿題や試験でチャットGPTが利用されるケースが増えており、構内からチャットGPTへのアクセスを禁止する学校も出てきています。
その一方、不動産業者が物件情報の作成に利用したり、飲食店への口コミに対して、自動で返信してくれるシステムが登場するなど、急速にチャットGPTの利用シーンが拡大しています。
日テレNEWSの記事「チャットGPT]で近未来はどう変わる?アメリカで注目の技術者に聞く」に動画が掲載されているので、興味のある方は是非ご覧ください。
今後の動向

OpenAIは以前からマイクロソフトとの付き合いがあり、自社の検索エンジン「Bing」にチャットGPTの機能を取り入れようとしています。
これに対抗するようにGoogleは、一部の利用者にテスト公開していた独自AIサービス「Bard」を、より広範囲に提供しようとしています。
これからはチャットGPTに対抗するGoogleのAIが台頭してくると思われ、現時点で主流となっているキーワードによるWeb検索が、対話形式に進化することになるでしょう。
また、チャットGTP(又はGoogleのAI)をフロントとして、背後の音声認識、画像認識、音声合成、画像生成などのAIと連携し、様々なサービスが展開されていくものと思われます。
正直、これによって我々の仕事がどうなっていくのか分かりません。
しかし、この変化に対して柔軟に対応し、AIをうまく活用していける人材がこれから生き残っていくことになるのでしょう。
参考書籍
もうすでに参考書籍がいくつか登場しています。いずれもアマゾンの電子書籍(Kindle)ですが、いづれも試し読みができます。興味のある方はどうぞ。
ちなみに、Kindle unlimited会員なら無料で読めます。
まとめ
今回は、2022年12月に登場し、わずか1週間でユーザー数100万人を突破、さまざまなメディアでに取り上げられ注目されているチャットGPTについて解説しました。
チャットGPTは「OpenAI」が開発した自然言語生成モデルで、対話形式で質疑応答が出来るチャットボットです。そして、この対話による質疑応答はAPIとして利用できるため、様々なシステムに組み込まれ、新たなサービスが登場してきています。
また、これに対抗する形でGoogleのBardも登場しつつあります。
近いうちに、マイクロソフトやGoogleの検索エンジンはこれらのAIに置き換わり、キーワード羅列の検索スタイルから、対話形式の検索スタイルへチェンジしていくことになります。
また、チャットGPTやBardは、音声や画像系のAIと連携し、より高度なものへと進化していくものと思われます。
様々なSF映画に登場するシーンのように、音声でコンピュータと会話し、家電や自動車を操る時代がようやく到来しました。これからが本当に楽しみですね。