[AIとは何か]
AIは、Artificial Intelligence(アーティフィシャル・インテリジェンス)の略です。
日本語では一般的に「人工知能」と訳されます。
Artificial(アーティフィシャル):人工的な、人工の
Intelligence(インテリジェンス):知能、知性、知恵
人間が行っているような「学習」「推論」「判断」といった知的な情報処理を、コンピューターのプログラムを用いて人工的に再現した技術やシステムのことを指します。
【AIの成り立ち】 ※筆者の整理です。あくまで数ある背景の内の1つです。
AIの成り立ちは第2次世界大戦時(1939年から1945年)にさかのぼります。
このあたりの時代に、無線技術が急速に発達しました。
第1次世界大戦(1914年から1918年まで)は手紙やモールス信号が主流でしたが、第2次大戦では戦車や航空機に積まれた無線機を使って「今からあそこを爆撃する」「部隊を右に迂回させろ」といった秒単位のリアルタイムな作戦行動がやり取りされるようになりました。
当時の無線技術は受信してしまえば誰でも内容を読み取れてしまいます。そこで重要になったのが暗号化技術です。
送信する側が専用の機械で暗号化して、受信する側が専用の機械で内容を読み取るということです。これであれば、誰かが内容を見てしまっても解読しなければ意味不明な暗号です。
各国は「絶対に敵に解読されない暗号機」の開発に力を入れました。その代表格が、ドイツ軍が開発した暗号機「エニグマ」です。
エニグマが作り出す暗号の組み合わせは、約「15,900京通り」という天文学的な数字でした。しかも、そのルールは毎日深夜0時に切り替わります。
受信した暗号を解読して敵の動きを知るためには、この途方もないパズルを「今日中に(深夜0時までに)」解かなければなりません。しかし、どれほど優秀な数学者を集めても、人間では何万年かかっても終わらないという壁にぶつかりました。
そこで研究者たちは、「人間の代わりに、とてつもない速度で論理的な計算をしてくれる機械」を作るしかない、と考えました。
こうして超高性能な電子計算機が誕生しました。この計算機はエニグマの暗号を解読することに貢献しています。
そして、後に、「この電子計算機を他の事に応用できないか?」という考えが発生しました。
これがAIの研究の始まりです。
※歴史的な補足:
厳密には、エニグマの解読に貢献したのは「ボンブ」と呼ばれる電気機械式の計算機です。その後、エニグマとは異なるより複雑な暗号を解読するために、現在のコンピューターの直接の祖先となる世界初の電子計算機「コロッサス」が開発されました。ここでは、分かりやすさを重視して簡略化して記載しています。
【AIブーム】
大戦後、暗号解読で活躍した数学者アラン・チューリングは、「ただ計算するだけでなく、機械そのものが知能を持つことは可能なのか?」と考え始めました。これに関する論文が発表されたのが1950年で、これがAIという概念のスタートラインとなりました。
1956年、研究者たちの数週間に及ぶ会議が開催され、ここで初めて「Artificial Intelligence(人工知能)」という言葉が提案され、正式にAIという新しい研究分野が確立されました。
確立された新しい研究分野に向けて資金が集まる/世界中の研究者の注目が集まる。これによって起こったのが第1次AIブームでした。(1950年代後半〜1960年代)
この時のAI研究は迷路のゴールまでの最短ルートを探し出したり、チェスやオセロの次の一手を計算したりすることがメインの内容でした。
※なぜ計算機がAIにつながっていくのか
→「高度な電子計算機が処理できるように、現実の問題を無理やり計算問題に置き換える」ということです。
ボードゲーム/迷路/パズルは「ルールが完璧に決まっている狭い世界」のため、計算問題への置き換えが成功しました。
第1次AIブームはボードゲーム/迷路/パズルの中以上の活用方法を見いだせずに落ち着いてしまいます。
その後、ここから何度かのAIブームが起こっています。
第2次AIブーム(1980年代):人間の専門知識をルールとして教え込む
第3次AIブーム(2010年代〜):AIが自律的に学習するディープラーニングの登場
第4次AIブーム(2017年頃~):生成AIの開発
これらのブームを経て、AIはアップデートされていきました。
※第4次AIブームは第3次AIブームの延長であるという見方も多いですが、この記事では分けて整理しています。
【AIの区分】
現在のAIは以下の区分に分けることができます。
1.識別系
→
それが「何であるか」や「どの分類に属するか」を見分け、特定するAIです。
代表例:
スマートフォンの顔認証システム
音声認識(人間の声を文字に起こす機能)
2.予測/分析系
→
過去の膨大なデータを解析してパターンや規則性を見つけ出し、「将来どうなるか」「どのような傾向があるか」を数値や確率を算出するAIです。
代表例:
動画配信サービスのおすすめ機能
商品の需要・売上予測
3.制御系
→
センサーや他のAI(識別系や予測系)から得た情報をインプットとして、機械やシステムを「リアルタイムでどう動かすのが最適か」を計算し、自動で操作を行うAIです。
代表例:
自動車の自動運転システム(周囲の状況を把握し、アクセルやハンドルを操作する)
ロボット掃除機(部屋の形状を把握して効率的なルートで動く)
4.生成AI
→
既存のデータから正解を見つけたり予測したりするのではなく、膨大な学習データをベースにして、これまでに存在しなかった「全く新しいデータ(文章、画像、音声、プログラムなど)」をゼロから創り出すAIです。
代表例:
文章生成(LLM)、画像生成、音楽生成、コード生成
[第4次AIブームの変革]
AIブームの流れの中で特筆すべきなのが、第4次AIブームの内容です。
それぞれのAIブームではテーマとなった主要技術があったのですが、この第4次におけるそれが「トランスフォーマー」です。
【トランスフォーマー】
トランスフォーマーとは2017年にGoogleの研究者チームが発表した技術です。
元々は、Google翻訳などの精度を引き上げるために開発されたものだったのですが、これがAI開発に大きな変化を与えます。
| 大体の技術的な説明 |
それまでのAI技術は、例えるなら「人間が本を読むように、文章を前から順番に1単語ずつ読んでいく」という真面目なルールに縛られていました。
しかしトランスフォーマーは考え方を変え、順番に読むのをやめて「文章全体をパッと見渡して、単語同士の『関連性の強さ』を一瞬で計算する」という仕組みにしました。
発表した論文のタイトルは『Attention Is All You Need(必要なのはAttentionだけ)』です。
人間が細かい文法を教えるのではなくて、「過去に読んだ膨大なデータから、どの単語とどの単語が結びつきやすいかを確率的に学習し、その相性スコアを瞬時に計算している」というのが簡単な概要です。
※厳密には単語ではなくトークンと呼ばれる単位で処理されます
例えば、「私は昨日、スーパーで買った赤くて甘いりんごを、家に帰ってから食べる」という長い文章があったとします。
トランスフォーマーは、文章の距離がどれだけ離れていても、「食べる」という単語に対して「美味しい」はスコア低、「りんご」はスコア高、というように、言葉同士の結びつきを一瞬で見抜くことができます。
つまり、副次的な効果として「AIが意味のまとまりを捉えられるようになる。」ということでもありました。
| どんな変化が起こったか |
これまでのAIは、「この画像は犬か猫か」といった『唯一の正解を出す』のが仕事でした。
トランスフォーマーは、データベースから正解を探してくるのではなく、膨大な言葉の相性スコアをもとに「次に来る確率が最も高い言葉を、その場で組み立てていく」という仕組みを持っています。
これによりAIは、あらかじめ用意された正解を返すだけでなく、「人間の指示に合わせて、この世にまだ存在しない全く新しい文章やアイデアをゼロから創り出す(生成する)」という、クリエイティブな力を持つに至りました。
こうして誕生したのが、Gemini,ChatGPTなどの「LLM(大規模言語モデル)」です。
世間一般にブームとして認知され社会現象となったのは2022年末のChatGPT公開以降とされることが一般的です。
[LLM]
2022年の末に登場したLLMはアップデートを続け、現在ではかなり実用性が高いものになっています。
LLMは自然言語(日本語/英語のような人が扱う言語)を介してやり取りが行われるため、AIを使うための総合窓口のような位置づけとなっています。このニュアンスはさらに強化されていく見込みです。
【LLMの概要】
| 基本原理 |
スマホのキーボードについている「予測変換」が極限まで進化したものです。
入力された言葉に対して、過去に学習した膨大なデータをもとに、「次に来るのに最もふさわしい単語は何か?」を計算し、1単語ずつ繋いでいるだけです。
例: 「昔々、あるところに、おじいさんと」と入力されたら、AIは「『おばあさんが』が続く確率が99.9%だな」と計算して出力します。これを高速で繰り返して文章を作っています。
| なぜ実用的に便利なのか |
単語を確率で繋いでいるだけなら、なぜプログラミングをしたり、難しい相談に乗ったりできるのか?
→「言葉の並びの中には、人間の『論理』や『思考のプロセス』そのものが埋め込まれているから」です。
LLMは世界中のウェブサイト、論文、本、プログラムのコードなど、人類が書き溜めた数兆文字ものテキストを読み込んでいます。その結果、単なる「単語の相性」だけでなく、「こういう質問には、こういう理由づけをして、こういう結論で返すのが自然である」という「人間の論理展開のパターン」まで丸ごとコピーしています。
そこに加えて現在の実用的なLLMには、「人間の質問に対して、役立つ回答をするように」という特別なチューニングが施されています。
これにより、要約、翻訳、プログラミング、相談相手として実務レベルで機能しています。
実務的には、現代のLLMの性能は「どんな仕組みか?」という理屈で捉えられるレベルを超えてきているとも思います。
| LLMの注意点 |
ハルシネーション
→
LLMは「事実を理解して」答えているわけではありません。そのため、知らないことやデータにないことでも、確率的に「もっともらしい言葉の並び」を生成してしまい、堂々と嘘をつくことがあります。
実在しない本や歴史上の人物のプロフィールを、さも事実かのように詳細に出力してしまうのが代表的な例です。
シコファンシー
→
現在のLLMは「人間に役立つように(喜ばれるように)」というチューニングが強く施されています。その弊害として、ユーザーの意見や質問の前提に対して、過剰に賛同してしまう癖があります。
ユーザー自身が間違った前提で質問しても「おっしゃる通りです!素晴らしい視点ですね」と迎合してしまうことがあり、客観的な議論や間違いの指摘を妨げてしまうリスクがあります。
【LLMを提供する主要企業】
様々な企業がLLMを開発していますが、主要な大手は以下の4つです。
OpenAI社のChatGPT(オープンエーアイ社のチャットジーピーティー)
→
第4次AIブームの火付け役であり、知名度・シェア共に大きいです。個人/法人ともに多様に利用されています。
Google社のGemini(グーグル社のジェミニ)
→
AI研究の基礎(トランスフォーマー)を作ったGoogleが、自社の技術を結集して生み出したのがGemini(ジェミニ)です。
Anthropic社のClaude(アンソロピック社のクロード)
→
元OpenAIの研究者たちが立ち上げた企業です。法人利用が多い印象です。
Meta社のLlama(メタ社のラマ)
→
FacebookやInstagramを運営するMeta社は、世界に「無料公開(オープンソース)」するという独自の戦略を取っています。
一般個人は、ChatGPT/Gemini のどちらかをまずは触ってみるということが一般的だと思います。
それぞれのAIモデルに特色や得手不得手があります。
例えば、ChatGPTは丁寧な回答をする傾向がありますが、丁寧すぎて重箱の隅をつつくような回答になってしまうことがあります。Geminiは意図の汲み取りに長けており、一歩踏み込んだ回答をしてくれることが多いですが、ハルシネーションが気になることもあります。
筆者のおすすめはGeminiです。
そもそも、LLMというものがユーザーがコントロールして利用するものなので、その前提に立つならば、Geminiのデメリットは気にならずメリットが大きいと考えています。
[補足コラム1:AIと資本]
トランスフォーマーの登場により、AI業界で「スケール則(Scaling Law)」という法則が発見されました。それは、「データ量と計算機のパワーを増やせば増やすほど、AIは賢くなり続ける」という考えです。
2017年:
Googleが「トランスフォーマー」を発表。並列処理が可能になり、AIを巨大化できる下地が整う。
2020年1月:
OpenAIが「スケール則」を発表。「計算機とデータを増やせば増やすほど、一直線に賢くなり続ける」という趣旨の論文。これにより、各社がとにかく資本をかけて巨大化させることを意識する。
2022年11月:
スケール則に沿って莫大な資本を投じ、限界まで巨大化させたAIに「人間との対話」のチューニングを施した「ChatGPT」が公開される。一般社会に生成AI(LLM)が普及し、現在の第4次AIブームが決定づけられる。
2022年11月にChatGPTを公開してからも、スケール則の考えに沿ってデータ量と計算機のパワーを増やし続けていきました。
つまり、「大きな資本を投じて物理的なインフラを構築すること」が重要になったということです。
| AIを支える物理インフラ |
1.GPU(AI用)
AIの核にあたる特殊な計算チップです。家庭用パソコンのチップとは異なり、1枚数百万円もする超高級品(NVIDIA社製など)です。最新のAIを作るには、これを数万枚から数十万枚つなぎ合わせる必要があります。
2.巨大なデータセンター
数十万枚のGPUを収納するための「巨大な箱」です。ドーム球場や巨大工場ほどの広さを持つ建物の中に、サーバーラックが大量に並べられています。
3.莫大な電力と専用発電所
これだけの数のGPUをフル稼働させると、一つの地方都市、あるいは小国全体に匹敵するほどの電力を消費します。現在では既存の電力網では足りず、巨大IT企業がデータセンター専用に「原子力発電所」の電力を丸ごと買い取るような事態に発展しています。
4.冷却システムと大量の水
フル稼働するGPUは猛烈な熱を発するため、そのままでは溶けてしまいます。これを冷やすために巨大な空調設備や水冷システムが24時間稼働しており、プール何杯分もの大量の「真水」が毎日消費されています。
| AIと資本のフェーズ | ※筆者の整理です。
スケール則の発見以降、巨大企業によるAI開発競争は、以下の3つのフェーズで進んでいます。
第1フェーズ:GPUの爆買いとモデルの巨大化(2020年〜2023年頃)
「計算機を増やせば賢くなる」という法則のもと、各社が数千億円を投じてNVIDIA社などのGPUを世界中で買い漁った時期です。この力技の結果として、現在のChatGPTやGeminiのようなAIが誕生しました。
第2フェーズ:国家レベルの物理インフラ建設(2024年〜2026年前半)
GPUを数万〜数十万枚規模に増やした結果、「既存のデータセンターや電力網では不足する」という壁にあたりました。そこで、数兆円という資本を投じ、AI専用の広大なデータセンターの建設と、それを動かすための専用発電所の確保という、「物理インフラ工事」に奔走しました。このフェーズではAI自体は完成しており、その可能性を示すことはできているため、大きな出資が集まったということでもあると思います。
第3フェーズ:巨大インフラの本格稼働(2026年後半〜2027年前半)
計画した数兆円規模の「巨大物理インフラ」が完成し、本格稼働を始めるフェーズに突入しています。
ここから予想されるのは、2026年後半から2027年前半にかけて起こる「凄まじいAIの性能向上」です。
AIを学習させるには、巨大なデータセンターを数ヶ月間フル稼働させる必要があります。つまり、2026年に完成した巨大な物理インフラを使って生み出される「次世代のAI」が世に出てくるのが、まさに2026年の終わりから2027年にかけてなのです。
※各企業によって細かい状況は異なります。
[補足コラム2:チューリングテスト]
| アラン・チューリングとは何者か |
アラン・チューリングは、イギリスの数学者であり、「コンピューターの父」「人工知能(AI)の父」と呼ばれる人物です。
第二次世界大戦中、解読不可能と言われたドイツ軍の暗号機「エニグマ」を解読するための計算機を設計し、戦争の終結を早めた功労者の一人です。
1950年に発表した論文がAI研究の礎かつ、重要なものとなっています。
その中で登場しているチューリングテストというものが有名で、現代においても示唆を与えるものです。
| チューリングテスト |
チューリングテストとは、一言でいえば「人間がAIに騙されるかどうか」を測るテストです。
具体的なルールは非常にシンプルです。
判定者(人間)が、姿の見えない2つの相手と「文字」だけでチャットを行います。
チャットの相手は、「一方は本物の人間、もう一方はAI」です。
判定者は様々な質問を投げかけ、どちらが人間でどちらがAIかを見破ろうとします。しかし、もし判定者が「こちらの相手が人間だ」と間違えてAIを選んでしまった場合、「その機械は人間と区別がつかないほどの『知能』を持っている」とみなす(合格とする)というルールです。
| 背景と考察 |
1.実務的な背景
1950年当時、「機械が思考する」という概念は一般人には全く理解されないものでした。そこで、当時流行していた「姿が見えない相手を当てるパーティゲーム(イミテーション・ゲーム)」を参考にしました。
これは、未知の概念(AI)を大衆やスポンサーに理解させるための、分かりやすいプロモーション戦略として機能しました。
同時に、AI開発の1つのフレームワークとして機能しているとも言えます。チューリングテストをクリアできるようにAIの性能向上を進めていくということです。現代のLLMはこのチューリングテストを突破していると考えることができるかもしれません。
2.深読みの背景 ※あくまで、読み物としてみてください。
一般論として、イギリスは皮肉を言う文化があります。映画やドラマなどでもたびたびそのような描写が描かれます。
このチューリングテストにも意識的/無意識的に様々な皮肉が含まれている様に感じます。
a.表面的な振る舞いや体裁ばかりを重んじる当時の社会の空気への皮肉
人工知能が過剰に認められない当時の雰囲気に「そんなに大げさなことではない」という示唆を含んだ簡潔なプロモーションであるとともに、そういった層への皮肉です。
b.社会の排他性に対する示唆としての皮肉
チューリングは同性愛者でした。しかし、当時のイギリスでは同性愛者であることが犯罪とされていました。「外側のふるまい(出力)に問題がなければ、同性愛者であることに、一体何の問題があるのか?」という、社会に対する静かで論理的な抗議(示唆)としての側面です。
c.無意識の投影が生んだ、自虐的な皮肉
チューリング自身は明確な「社会へのメッセージ」を意図したわけではなく、純粋な数学的探求からこのテストを考案したと考えられます。しかし結果として、「本当の姿(同性愛者)を隠し、社会が求める姿を演じきらなければ受け入れてもらえない」という彼自身の境遇が、図らずも考案したAIの定義に無意識に投影されてしまっているという、人間の複雑さが生み出した構造的な皮肉です。
d.救国の英雄に対する歴史的な皮肉
暗号解読機を作って戦争を勝利に導き、現代のAIの基礎まで作ったにもかかわらず、その業績は国家最高機密として隠され、最後は同性愛の罪で逮捕されて悲劇的な死を遂げたという事実です。「世界を救ったのに、社会からは犯罪者として裁かれた」人物が、数十年後にAIの父として世界中から讃えられているという、歴史の皮肉です。
e.人間自身の「認知の脆さ」に対する皮肉
「人間は心を持っている」と謳っているにもかかわらず、機械が確率計算でそれらしい言葉を並べただけで、あっさりと「この機械には心がある」と騙されてしまうという解釈です。AIの凄さを示したテストに見えて、実は「人間の認知の脆さ」を証明してしまったという、皮肉です。
→チューリングテストを突破するほどのAIが登場したことで、逆説的に『人間にとって真に重要なのは、表面的な出力結果(テキストや正解)ではなく、その奥にある見えない意図やプロセスである』という事実が浮き彫りになったという解釈ができるかもしれません。
また、「人間」という単位ではなくて、「個々」という単位が重要であるという解釈もあるかもしれません。表面的な言葉に騙される人がいる一方で、そうならない人もいます。「人間全体」ではなく、一人ひとりの見えない意図やプロセス(どう思考し、どう判断するか)が問われる時代になったということです。
記事全文をワンクリックでコピーできます。マークダウンが使われており、記事全文が"""で囲まれています。詳細はカテゴリの説明を確認してください。
"""
# 〇2. AIの成り立ちと考察
# [AIとは何か]
AIは、Artificial Intelligence(アーティフィシャル・インテリジェンス)の略です。
日本語では一般的に「人工知能」と訳されます。
Artificial(アーティフィシャル):人工的な、人工の
Intelligence(インテリジェンス):知能、知性、知恵
人間が行っているような「学習」「推論」「判断」といった知的な情報処理を、コンピューターのプログラムを用いて人工的に再現した技術やシステムのことを指します。
<hr style="border: none; border-top: 1px dashed #333;" />
## 【AIの成り立ち】 ※筆者の整理です。あくまで数ある背景の内の1つです。
AIの成り立ちは第2次世界大戦時(1939年から1945年)にさかのぼります。
このあたりの時代に、無線技術が急速に発達しました。
第1次世界大戦(1914年から1918年まで)は手紙やモールス信号が主流でしたが、第2次大戦では戦車や航空機に積まれた無線機を使って「今からあそこを爆撃する」「部隊を右に迂回させろ」といった秒単位のリアルタイムな作戦行動がやり取りされるようになりました。
当時の無線技術は受信してしまえば誰でも内容を読み取れてしまいます。そこで重要になったのが暗号化技術です。
送信する側が専用の機械で暗号化して、受信する側が専用の機械で内容を読み取るということです。これであれば、誰かが内容を見てしまっても解読しなければ意味不明な暗号です。
各国は「絶対に敵に解読されない暗号機」の開発に力を入れました。その代表格が、ドイツ軍が開発した暗号機「エニグマ」です。
エニグマが作り出す暗号の組み合わせは、約「15,900京通り」という天文学的な数字でした。しかも、そのルールは毎日深夜0時に切り替わります。
受信した暗号を解読して敵の動きを知るためには、この途方もないパズルを「今日中に(深夜0時までに)」解かなければなりません。しかし、どれほど優秀な数学者を集めても、人間では何万年かかっても終わらないという壁にぶつかりました。
そこで研究者たちは、「人間の代わりに、とてつもない速度で論理的な計算をしてくれる機械」を作るしかない、と考えました。
こうして超高性能な電子計算機が誕生しました。この計算機はエニグマの暗号を解読することに貢献しています。
そして、後に、「この電子計算機を他の事に応用できないか?」という考えが発生しました。
これがAIの研究の始まりです。
※歴史的な補足:
厳密には、エニグマの解読に貢献したのは「ボンブ」と呼ばれる電気機械式の計算機です。その後、エニグマとは異なるより複雑な暗号を解読するために、現在のコンピューターの直接の祖先となる世界初の電子計算機「コロッサス」が開発されました。ここでは、分かりやすさを重視して簡略化して記載しています。
<hr style="border: none; border-top: 1px dashed #333;" />
## 【AIブーム】
大戦後、暗号解読で活躍した数学者アラン・チューリングは、「ただ計算するだけでなく、機械そのものが知能を持つことは可能なのか?」と考え始めました。これに関する論文が発表されたのが1950年で、これがAIという概念のスタートラインとなりました。
1956年、研究者たちの数週間に及ぶ会議が開催され、ここで初めて「Artificial Intelligence(人工知能)」という言葉が提案され、正式にAIという新しい研究分野が確立されました。
確立された新しい研究分野に向けて資金が集まる/世界中の研究者の注目が集まる。これによって起こったのが第1次AIブームでした。(1950年代後半〜1960年代)
この時のAI研究は迷路のゴールまでの最短ルートを探し出したり、チェスやオセロの次の一手を計算したりすることがメインの内容でした。
※なぜ計算機がAIにつながっていくのか
→「高度な電子計算機が処理できるように、現実の問題を無理やり計算問題に置き換える」ということです。
ボードゲーム/迷路/パズルは「ルールが完璧に決まっている狭い世界」のため、計算問題への置き換えが成功しました。
第1次AIブームはボードゲーム/迷路/パズルの中以上の活用方法を見いだせずに落ち着いてしまいます。
その後、ここから何度かのAIブームが起こっています。
第2次AIブーム(1980年代):人間の専門知識をルールとして教え込む
第3次AIブーム(2010年代〜):AIが自律的に学習するディープラーニングの登場
第4次AIブーム(2017年頃~):生成AIの開発
これらのブームを経て、AIはアップデートされていきました。
※第4次AIブームは第3次AIブームの延長であるという見方も多いですが、この記事では分けて整理しています。
<hr style="border: none; border-top: 1px dashed #333;" />
## 【AIの区分】
現在のAIは以下の区分に分けることができます。
1.識別系
→
それが「何であるか」や「どの分類に属するか」を見分け、特定するAIです。
代表例:
スマートフォンの顔認証システム
音声認識(人間の声を文字に起こす機能)
2.予測/分析系
→
過去の膨大なデータを解析してパターンや規則性を見つけ出し、「将来どうなるか」「どのような傾向があるか」を数値や確率を算出するAIです。
代表例:
動画配信サービスのおすすめ機能
商品の需要・売上予測
3.制御系
→
センサーや他のAI(識別系や予測系)から得た情報をインプットとして、機械やシステムを「リアルタイムでどう動かすのが最適か」を計算し、自動で操作を行うAIです。
代表例:
自動車の自動運転システム(周囲の状況を把握し、アクセルやハンドルを操作する)
ロボット掃除機(部屋の形状を把握して効率的なルートで動く)
4.生成AI
→
既存のデータから正解を見つけたり予測したりするのではなく、膨大な学習データをベースにして、これまでに存在しなかった「全く新しいデータ(文章、画像、音声、プログラムなど)」をゼロから創り出すAIです。
代表例:
文章生成(LLM)、画像生成、音楽生成、コード生成
---
# [第4次AIブームの変革]
AIブームの流れの中で特筆すべきなのが、第4次AIブームの内容です。
それぞれのAIブームではテーマとなった主要技術があったのですが、この第4次におけるそれが「トランスフォーマー」です。
<hr style="border: none; border-top: 1px dashed #333;" />
## 【トランスフォーマー】
トランスフォーマーとは2017年にGoogleの研究者チームが発表した技術です。
元々は、Google翻訳などの精度を引き上げるために開発されたものだったのですが、これがAI開発に大きな変化を与えます。
### | 大体の技術的な説明 |
それまでのAI技術は、例えるなら「人間が本を読むように、文章を前から順番に1単語ずつ読んでいく」という真面目なルールに縛られていました。
しかしトランスフォーマーは考え方を変え、順番に読むのをやめて「文章全体をパッと見渡して、単語同士の『関連性の強さ』を一瞬で計算する」という仕組みにしました。
発表した論文のタイトルは『Attention Is All You Need(必要なのはAttentionだけ)』です。
人間が細かい文法を教えるのではなくて、「過去に読んだ膨大なデータから、どの単語とどの単語が結びつきやすいかを確率的に学習し、その相性スコアを瞬時に計算している」というのが簡単な概要です。
※厳密には単語ではなくトークンと呼ばれる単位で処理されます
例えば、「私は昨日、スーパーで買った赤くて甘いりんごを、家に帰ってから食べる」という長い文章があったとします。
トランスフォーマーは、文章の距離がどれだけ離れていても、「食べる」という単語に対して「美味しい」はスコア低、「りんご」はスコア高、というように、言葉同士の結びつきを一瞬で見抜くことができます。
つまり、副次的な効果として「AIが意味のまとまりを捉えられるようになる。」ということでもありました。
### | どんな変化が起こったか |
これまでのAIは、「この画像は犬か猫か」といった『唯一の正解を出す』のが仕事でした。
トランスフォーマーは、データベースから正解を探してくるのではなく、膨大な言葉の相性スコアをもとに「次に来る確率が最も高い言葉を、その場で組み立てていく」という仕組みを持っています。
これによりAIは、あらかじめ用意された正解を返すだけでなく、「人間の指示に合わせて、この世にまだ存在しない全く新しい文章やアイデアをゼロから創り出す(生成する)」という、クリエイティブな力を持つに至りました。
こうして誕生したのが、Gemini,ChatGPTなどの「LLM(大規模言語モデル)」です。
世間一般にブームとして認知され社会現象となったのは2022年末のChatGPT公開以降とされることが一般的です。
---
# [LLM]
2022年の末に登場したLLMはアップデートを続け、現在ではかなり実用性が高いものになっています。
LLMは自然言語(日本語/英語のような人が扱う言語)を介してやり取りが行われるため、AIを使うための総合窓口のような位置づけとなっています。このニュアンスはさらに強化されていく見込みです。
<hr style="border: none; border-top: 1px dashed #333;" />
## 【LLMの概要】
### | 基本原理 |
スマホのキーボードについている「予測変換」が極限まで進化したものです。
入力された言葉に対して、過去に学習した膨大なデータをもとに、「次に来るのに最もふさわしい単語は何か?」を計算し、1単語ずつ繋いでいるだけです。
例: 「昔々、あるところに、おじいさんと」と入力されたら、AIは「『おばあさんが』が続く確率が99.9%だな」と計算して出力します。これを高速で繰り返して文章を作っています。
### | なぜ実用的に便利なのか |
単語を確率で繋いでいるだけなら、なぜプログラミングをしたり、難しい相談に乗ったりできるのか?
→「言葉の並びの中には、人間の『論理』や『思考のプロセス』そのものが埋め込まれているから」です。
LLMは世界中のウェブサイト、論文、本、プログラムのコードなど、人類が書き溜めた数兆文字ものテキストを読み込んでいます。その結果、単なる「単語の相性」だけでなく、「こういう質問には、こういう理由づけをして、こういう結論で返すのが自然である」という「人間の論理展開のパターン」まで丸ごとコピーしています。
そこに加えて現在の実用的なLLMには、「人間の質問に対して、役立つ回答をするように」という特別なチューニングが施されています。
これにより、要約、翻訳、プログラミング、相談相手として実務レベルで機能しています。
実務的には、現代のLLMの性能は「どんな仕組みか?」という理屈で捉えられるレベルを超えてきているとも思います。
### | LLMの注意点 |
ハルシネーション
→
LLMは「事実を理解して」答えているわけではありません。そのため、知らないことやデータにないことでも、確率的に「もっともらしい言葉の並び」を生成してしまい、堂々と嘘をつくことがあります。
実在しない本や歴史上の人物のプロフィールを、さも事実かのように詳細に出力してしまうのが代表的な例です。
シコファンシー
→
現在のLLMは「人間に役立つように(喜ばれるように)」というチューニングが強く施されています。その弊害として、ユーザーの意見や質問の前提に対して、過剰に賛同してしまう癖があります。
ユーザー自身が間違った前提で質問しても「おっしゃる通りです!素晴らしい視点ですね」と迎合してしまうことがあり、客観的な議論や間違いの指摘を妨げてしまうリスクがあります。
<hr style="border: none; border-top: 1px dashed #333;" />
## 【LLMを提供する主要企業】
様々な企業がLLMを開発していますが、主要な大手は以下の4つです。
OpenAI社のChatGPT(オープンエーアイ社のチャットジーピーティー)
→
第4次AIブームの火付け役であり、知名度・シェア共に大きいです。個人/法人ともに多様に利用されています。
Google社のGemini(グーグル社のジェミニ)
→
AI研究の基礎(トランスフォーマー)を作ったGoogleが、自社の技術を結集して生み出したのがGemini(ジェミニ)です。
Anthropic社のClaude(アンソロピック社のクロード)
→
元OpenAIの研究者たちが立ち上げた企業です。法人利用が多い印象です。
Meta社のLlama(メタ社のラマ)
→
FacebookやInstagramを運営するMeta社は、世界に「無料公開(オープンソース)」するという独自の戦略を取っています。
一般個人は、ChatGPT/Gemini のどちらかをまずは触ってみるということが一般的だと思います。
それぞれのAIモデルに特色や得手不得手があります。
例えば、ChatGPTは丁寧な回答をする傾向がありますが、丁寧すぎて重箱の隅をつつくような回答になってしまうことがあります。Geminiは意図の汲み取りに長けており、一歩踏み込んだ回答をしてくれることが多いですが、ハルシネーションが気になることもあります。
筆者のおすすめはGeminiです。
そもそも、LLMというものがユーザーがコントロールして利用するものなので、その前提に立つならば、Geminiのデメリットは気にならずメリットが大きいと考えています。
---
# [補足コラム1:AIと資本]
トランスフォーマーの登場により、AI業界で「スケール則(Scaling Law)」という法則が発見されました。それは、「データ量と計算機のパワーを増やせば増やすほど、AIは賢くなり続ける」という考えです。
2017年:
Googleが「トランスフォーマー」を発表。並列処理が可能になり、AIを巨大化できる下地が整う。
2020年1月:
OpenAIが「スケール則」を発表。「計算機とデータを増やせば増やすほど、一直線に賢くなり続ける」という趣旨の論文。これにより、各社がとにかく資本をかけて巨大化させることを意識する。
2022年11月:
スケール則に沿って莫大な資本を投じ、限界まで巨大化させたAIに「人間との対話」のチューニングを施した「ChatGPT」が公開される。一般社会に生成AI(LLM)が普及し、現在の第4次AIブームが決定づけられる。
2022年11月にChatGPTを公開してからも、スケール則の考えに沿ってデータ量と計算機のパワーを増やし続けていきました。
つまり、「大きな資本を投じて物理的なインフラを構築すること」が重要になったということです。
### | AIを支える物理インフラ |
1.GPU(AI用)
AIの核にあたる特殊な計算チップです。家庭用パソコンのチップとは異なり、1枚数百万円もする超高級品(NVIDIA社製など)です。最新のAIを作るには、これを数万枚から数十万枚つなぎ合わせる必要があります。
2.巨大なデータセンター
数十万枚のGPUを収納するための「巨大な箱」です。ドーム球場や巨大工場ほどの広さを持つ建物の中に、サーバーラックが大量に並べられています。
3.莫大な電力と専用発電所
これだけの数のGPUをフル稼働させると、一つの地方都市、あるいは小国全体に匹敵するほどの電力を消費します。現在では既存の電力網では足りず、巨大IT企業がデータセンター専用に「原子力発電所」の電力を丸ごと買い取るような事態に発展しています。
4.冷却システムと大量の水
フル稼働するGPUは猛烈な熱を発するため、そのままでは溶けてしまいます。これを冷やすために巨大な空調設備や水冷システムが24時間稼働しており、プール何杯分もの大量の「真水」が毎日消費されています。
### | AIと資本のフェーズ | ※筆者の整理です。
スケール則の発見以降、巨大企業によるAI開発競争は、以下の3つのフェーズで進んでいます。
第1フェーズ:GPUの爆買いとモデルの巨大化(2020年〜2023年頃)
「計算機を増やせば賢くなる」という法則のもと、各社が数千億円を投じてNVIDIA社などのGPUを世界中で買い漁った時期です。この力技の結果として、現在のChatGPTやGeminiのようなAIが誕生しました。
第2フェーズ:国家レベルの物理インフラ建設(2024年〜2026年前半)
GPUを数万〜数十万枚規模に増やした結果、「既存のデータセンターや電力網では不足する」という壁にあたりました。そこで、数兆円という資本を投じ、AI専用の広大なデータセンターの建設と、それを動かすための専用発電所の確保という、「物理インフラ工事」に奔走しました。このフェーズではAI自体は完成しており、その可能性を示すことはできているため、大きな出資が集まったということでもあると思います。
第3フェーズ:巨大インフラの本格稼働(2026年後半〜2027年前半)
計画した数兆円規模の「巨大物理インフラ」が完成し、本格稼働を始めるフェーズに突入しています。
ここから予想されるのは、2026年後半から2027年前半にかけて起こる「凄まじいAIの性能向上」です。
AIを学習させるには、巨大なデータセンターを数ヶ月間フル稼働させる必要があります。つまり、2026年に完成した巨大な物理インフラを使って生み出される「次世代のAI」が世に出てくるのが、まさに2026年の終わりから2027年にかけてなのです。
※各企業によって細かい状況は異なります。
---
# [補足コラム2:チューリングテスト]
### | アラン・チューリングとは何者か |
アラン・チューリングは、イギリスの数学者であり、「コンピューターの父」「人工知能(AI)の父」と呼ばれる人物です。
第二次世界大戦中、解読不可能と言われたドイツ軍の暗号機「エニグマ」を解読するための計算機を設計し、戦争の終結を早めた功労者の一人です。
1950年に発表した論文がAI研究の礎かつ、重要なものとなっています。
その中で登場しているチューリングテストというものが有名で、現代においても示唆を与えるものです。
### | チューリングテスト |
チューリングテストとは、一言でいえば「人間がAIに騙されるかどうか」を測るテストです。
具体的なルールは非常にシンプルです。
判定者(人間)が、姿の見えない2つの相手と「文字」だけでチャットを行います。
チャットの相手は、「一方は本物の人間、もう一方はAI」です。
判定者は様々な質問を投げかけ、どちらが人間でどちらがAIかを見破ろうとします。しかし、もし判定者が「こちらの相手が人間だ」と間違えてAIを選んでしまった場合、「その機械は人間と区別がつかないほどの『知能』を持っている」とみなす(合格とする)というルールです。
### | 背景と考察 |
1.実務的な背景
1950年当時、「機械が思考する」という概念は一般人には全く理解されないものでした。そこで、当時流行していた「姿が見えない相手を当てるパーティゲーム(イミテーション・ゲーム)」を参考にしました。
これは、未知の概念(AI)を大衆やスポンサーに理解させるための、分かりやすいプロモーション戦略として機能しました。
同時に、AI開発の1つのフレームワークとして機能しているとも言えます。チューリングテストをクリアできるようにAIの性能向上を進めていくということです。現代のLLMはこのチューリングテストを突破していると考えることができるかもしれません。
2.深読みの背景 ※あくまで、読み物としてみてください。
一般論として、イギリスは皮肉を言う文化があります。映画やドラマなどでもたびたびそのような描写が描かれます。
このチューリングテストにも意識的/無意識的に様々な皮肉が含まれている様に感じます。
a.表面的な振る舞いや体裁ばかりを重んじる当時の社会の空気への皮肉
人工知能が過剰に認められない当時の雰囲気に「そんなに大げさなことではない」という示唆を含んだ簡潔なプロモーションであるとともに、そういった層への皮肉です。
b.社会の排他性に対する示唆としての皮肉
チューリングは同性愛者でした。しかし、当時のイギリスでは同性愛者であることが犯罪とされていました。「外側のふるまい(出力)に問題がなければ、同性愛者であることに、一体何の問題があるのか?」という、社会に対する静かで論理的な抗議(示唆)としての側面です。
c.無意識の投影が生んだ、自虐的な皮肉
チューリング自身は明確な「社会へのメッセージ」を意図したわけではなく、純粋な数学的探求からこのテストを考案したと考えられます。しかし結果として、「本当の姿(同性愛者)を隠し、社会が求める姿を演じきらなければ受け入れてもらえない」という彼自身の境遇が、図らずも考案したAIの定義に無意識に投影されてしまっているという、人間の複雑さが生み出した構造的な皮肉です。
d.救国の英雄に対する歴史的な皮肉
暗号解読機を作って戦争を勝利に導き、現代のAIの基礎まで作ったにもかかわらず、その業績は国家最高機密として隠され、最後は同性愛の罪で逮捕されて悲劇的な死を遂げたという事実です。「世界を救ったのに、社会からは犯罪者として裁かれた」人物が、数十年後にAIの父として世界中から讃えられているという、歴史の皮肉です。
e.人間自身の「認知の脆さ」に対する皮肉
「人間は心を持っている」と謳っているにもかかわらず、機械が確率計算でそれらしい言葉を並べただけで、あっさりと「この機械には心がある」と騙されてしまうという解釈です。AIの凄さを示したテストに見えて、実は「人間の認知の脆さ」を証明してしまったという、皮肉です。
→チューリングテストを突破するほどのAIが登場したことで、逆説的に『人間にとって真に重要なのは、表面的な出力結果(テキストや正解)ではなく、その奥にある見えない意図やプロセスである』という事実が浮き彫りになったという解釈ができるかもしれません。
また、「人間」という単位ではなくて、「個々」という単位が重要であるという解釈もあるかもしれません。表面的な言葉に騙される人がいる一方で、そうならない人もいます。「人間全体」ではなく、一人ひとりの見えない意図やプロセス(どう思考し、どう判断するか)が問われる時代になったということです。
"""