LLM(大規模言語モデル)
超物知りな「しりとり名人」?
ChatGPTなどの登場で一気に有名になった「LLM」。日本語では「大規模言語モデル」と呼びますが、一体なぜ彼らは人間のように自然な会話ができるのでしょうか?
LLMは「次に来る言葉」を当てる天才
LLMの仕組みを一言でいうと、強烈に頭の良い 「次に来る単語の予測マシン」 です。
例えば、「昔々、あるところに……」と言われたら、次に続く言葉は「おじいさんと」や「お姫様が」だと予想がつきますよね?LLMは、インターネット上の膨大な文章を読み込むことで、「この言葉の後には、この言葉が来る確率が高い」というパターンを完璧に学習しています。
この「次を当てる」という作業を何千回、何万回と高速で繰り返すことで、まるで人間が考えて書いているような長い文章を作り出しているのです。
なぜ「大規模」なの?
名前に「大規模」と付いているのは、主に2つの理由があります。
- 学習データの量: 図書館の全ての本、インターネット上のニュース、SNS、プログラムのコードなど、人間が一生かけても読み切れないほどのデータを学習しています。
- パラメーター数: AIの「脳のシワ」のような設定値(パラメーター)が、数千億から数兆個という桁違いの規模になっています。
この規模が大きくなればなるほど、AIは単なる単語のつながりだけでなく、文脈やニュアンス、さらには「常識」に近いものまで理解できるようになります。
まとめ
- check_circle LLMは「次に続く確率が高い言葉」を選んで文章を作るAI。
- check_circle 膨大なデータ(大規模)を学ぶことで、知的な会話が可能になった。
- check_circle ChatGPTやGeminiなど、今の対話型AIの心臓部。
sell タグ
book 関連用語
bookmark 続けて読みたい記事
CATEGORY: AI
ハルシネーションとは? AIがつく「もっともらしい嘘」の正体
AIが事実と異なる情報を生成してしまう「ハルシネーション(幻覚)」について、なぜ起こるのか、どう対策すべきかを世界一やさしく解説します。
arrow_forwardCATEGORY: バックエンド
APIとは? ソフトウェア同士をつなぐ「窓口」
「API」の正式名称や、アプリ同士がつながる仕組みを「レストランの注文」に例えて世界一わかりやすく解説します。
arrow_forwardCATEGORY: インフラ
クラウドって何のこと? 「買う」から「借りる」への大変身
「クラウドって結局なに?」という疑問を、身近な例え話でスッキリ解決。インターネットの向こう側にある便利な仕組みを、初心者の方に向けて分かりやすく解説します。
arrow_forward