ITパスポートに出る!生成AI・基盤モデル・ハルシネーションをわかりやすく解説

目次

ITパスポートに生成AIが登場!出題意図と背景とは?

ITパスポートの勉強をしていたら、いきなり出てくる生成AIに関する問題。

でも、仕組みがまったくわからない!

そんなふうに戸惑った人、多いのではないでしょうか。

実は生成AIは、令和6年度(2024年)からITパスポート試験に新しく追加されたばかりのテーマです。

最近の参考書や問題集でないと情報が載っておらず、なんとなく聞いたことがある、程度の人も多いはず。

今回の記事では、生成Aiの基礎知識ついて初心者にもわかりやすく解説していきます!


ITパスポートの勉強は、この2冊から始めるのがおすすめです。

いちばんやさしい ITパスポート 絶対合格の教科書+出る順問題集
(はじめてでも読みやすい、定番の1冊)

キタミ式イラストIT塾 ITパスポート
(イラスト多めで、理解を深めたい人に)

どちらも実際に使って「わかりやすい!」と感じました!初学者でも安心して使えるテキストです。

ChatGPTや画像生成など、ビジネスにも広がる「生成AI」

ここでいう生成AIとは、文章・画像・プログラムなどの「コンテンツ」を、AIが自動で作り出してくれる技術のことです。

たとえばこんなツールが代表例です。

・ChatGPTのようなチャットAI
・Midjourneyなどの画像生成AI
・Excelのマクロやコードを自然文から作ってくれるツール など

こうした生成AIは、SNSだけでなくビジネスや開発現場でも急速に活用され始めています

なぜ今、試験に出るようになったのか

ITパスポートは「ITを使うすべての人」が知っておくべき基本知識を問う試験です。

そして、生成AIはまさにその「使う人」の理解が必要な分野

たとえば、生成AIには便利な面がある一方で、こんなリスクもあります。

・本当っぽいウソをもっともらしく出力する(いわゆるハルシネーション)
・情報の出典がわかりにくく、検証が難しい
・悪用されるとフェイクニュースやなりすましにつながる

だからこそ、今のITパスポートでは「AIを正しく使うために知っておくべきこと」が問われているのです。

難しく考えなくてOK。必要なのは「使う人としての理解」

試験で出る内容は、技術者向けの専門知識ではありません。

大事なのは、

・どんな仕組みで動いているのか(ざっくりでOK)
・何に使えるのか、どんな事例があるのか
・どんなリスクがあるのか

といった基本的なイメージです。

みやこ

この記事では、初心者の人でも「なんとなくわかったかも」と感じられるように、やさしく、順を追って解説していきます。

生成AIって何?仕組みと特徴をざっくりやさしく解説

「生成AI(Generative AI)」がそもそもどういうものか、ちゃんと説明できる人は意外と少ないかもしれません。

このセクションでは、生成AIの基本的な考え方と、どんな特徴があるのかを、やさしく整理していきます。

文章や画像など、「何かを生み出す」のが生成AI

まず、AI(人工知能)にはいろんな種類がありますが、生成AIの最大の特徴はその名前のとおり、「何かを作り出す」こと。

たとえば:

・文章を自動で書く(ChatGPTなど)
・画像を描く(画像生成AI)
・プログラムコードを出力する(GitHub Copilotなど)
・音楽や音声を生成する など

これまで人が手で作っていたものを、AIが自動で生成してくれる。

これが、生成AIのすごいところです。

何がすごいの?従来のAIとの違い

ここで、これまでの「AI」と、生成AIの違いを比べてみましょう。

従来のAI(識別・予測)生成AI(創造・生成)
主な役割判別する・予測する作り出す・書く・描く
スパムを判別する、天気を予測する小説の続きを書く、人物の画像を描く
入力画像、数値、テキストなど自然文の指示(プロンプト)
出力分類結果、数値など文章、画像、コードなどのコンテンツ

これまでは「判断」や「予測」が得意だったAIに対して、
生成AIは「創造」が得意なAIといえます。

基盤モデルとは?ChatGPTでイメージする生成AIの「頭脳」

生成AIがここまで賢くなった理由のひとつが、「基盤モデル(ファウンデーションモデル)」と呼ばれる巨大なAIの土台にあります。

一言でいうと、「幅広いデータをもとに事前に訓練されたなんでも屋」的なAIのベースです。

このモデルを土台にすることで、あとからいろんな分野に応用できるAIを作れるようになります。

ChatGPTで考えると…

ChatGPTは、OpenAIという会社が開発したAIチャットサービスですが、
その中身として動いているのが「GPT-4」や「GPT-3.5」と呼ばれる基盤モデルです。

つまり、

  • ChatGPTというアプリ=人と会話するための見た目(画面や入力欄など)
  • GPTというモデル=裏側で言葉を考えたり、回答を組み立てたりする「頭脳

という関係です。

このGPTシリーズは、ネット上の文章や書籍など何十億単語ぶんものテキストデータを使って訓練されています。

その訓練には、数ヶ月〜数年、そして数百億円ものコストがかかるとも言われています。

どんなことに使えるの?

基盤モデルがすごいのは、ひとつのことだけに特化せず、あとから幅広い用途に使えること。

具体的には、以下のようなことができます。

・文章の生成や要約
・質問への回答
・プログラムコードの出力
・画像の説明や内容の補完 など

そして、使い道に合わせて追加で学習(ファインチューニング)することで、

・医療の相談に特化したAI
・法律の文書に詳しいAI
・企業内マニュアルを覚えた社内AI

といった具合に、「何にでもなれるAI」として進化していきます。

試験で押さえておきたいポイントは?

ITパスポートでは、この「基盤モデル」について次のような視点で問われます。

  • 大量で広範囲のデータをもとに事前学習されている
  • いろいろな分野に応用できる(汎用性)
  • ファインチューニングで目的別に調整可能
  • ChatGPTなど、身近な生成AIサービスの土台になっている

つまり、基盤モデルとは「生成AIのエンジン部分」であり、
文章・画像・音声・コードなど、何を生成するかは、その上に何を乗せるか次第というわけです。


この基盤モデルをもとに、さまざまなAIサービスが生まれ、世の中に広がっています。

では、こうしたAIを実際に使うときに気をつけるべき点は何か?

次のセクションでは、生成AIが起こしやすい「思わぬ落とし穴」=ハルシネーションについて見ていきましょう。

生成AIの注意点 ハルシネーションやバイアスに気をつけよう

便利で万能に見える生成AIですが、実は使ううえで気をつけたいポイントもあります。

ITパスポートでは、こうした「AIのリスク」や「限界」もよく出題されます。

このセクションでは、試験でよく問われるキーワードをやさしく整理していきます。

ハルシネーション(hallucination)とは?

それっぽいウソを、平気で出してくる。
生成AIの代表的なリスクがこの「ハルシネーション」です。

これは、事実と異なる情報や、関係ない内容を、もっともらしく生成してしまう現象のこと。

英語の「hallucination」は「幻覚」や「妄想」という意味。

まさに、「本当じゃないのに、本人(AI)は正しいと思い込んで話している」というニュアンスです。

こんな例があります

  • 実在しない参考文献を、それっぽい著者名とタイトルで紹介してくる
  • 実際には発表されていない制度や法律を、あたかも決まったかのように説明する
  • 知らないトピックなのに、自信たっぷりで誤情報を答えてしまう

AIの言葉は自信満々に見えるので、人間がうっかり信じてしまいやすいのも怖いポイントです。

どうしてハルシネーションが起こるの?

理由はひとつではありません。
以下のような複数の要因が絡み合っています。


【1】学習期間が限られている(最新の情報は知らない)

AIは、訓練に使われた時点までの情報しか知りません。
ChatGPTの無料版(GPT-3.5)は2021年、GPT-4も2023年までの知識で止まっています。

そのため、最近の出来事や法改正、流行などを聞くと、それっぽく作り話をしてしまうことがあります。

※ウェブ閲覧機能(ブラウジング)やファイル参照機能があるモードであれば、現在の情報を取得・理解することは可能です。


【2】学習していないトピックには対応できない

どんなに高性能なAIでも、「見たことがないもの」は当然わかりません。

でも生成AIは「知らない」と言うのではなく、あくまで予測ベースで回答を作ろうとするため、
結果として、関係のない知識を組み合わせた誤情報が出てしまいます。


【3】事実とフィクションを区別していない

AIは「これは真実」「これはウソ」と分類して学んでいるわけではありません。

あくまで言葉と言葉のつながり(パターン)を学んでいるだけなので、
出力結果にどれだけ自信があっても、それが正しい保証にはならないのです。


【4】あいまいな指示や質問にも、なんとか答えようとする

人間同士なら「それってどういう意味?」と聞き返すところを、
AIは「なんとなくそれっぽく」答えてしまう傾向があります。
特に質問の文脈があいまいだったり、意味が不明確だったりすると、ウソをつくリスクが高まります。

例えると…「優秀だけどプライドが高く、知ったかぶりの新入社員」

生成AIは、知識が豊富で会話もうまい新人くん
でも…

  • 聞かれて分からないことがあっても「分かりません」とは言えない
  • なんとなくそれっぽいことを自信満々に答えてくる
  • 間違ってても堂々としてるから、上司も「あ、そうなんだ」って信じてしまいそう

──そんな、「プライドの高い知ったか新入社員タイプ」が、ハルシネーションを起こすAIのイメージです。

なぜハルシネーションを知っておくべきなのか?

一番大事なのは、生成AIは全知全能ではないという前提を持っておくことです。

  • 正しく見える文章でも、うのみにしない
  • 出力結果は必ず人間がチェックする
  • 誤情報が混じる前提で使う

この「ちょっと疑って使う」姿勢こそが、生成AIと上手につきあう第一歩です。

試験でもよく出るポイント

  • ハルシネーションとは「生成AIが、事実と異なることをもっともらしく出力してしまう現象」
  • 学習データや期間に限界があるため、ウソが混じることがある
  • AIの回答は必ず人の目で確認する必要がある

こうした姿勢や考え方は、ITパスポートでも問われる視点です。

バイアス(偏り)にも注意

AIは人間が作ったデータを学習するため、もともとのデータに偏りがあると、AIの判断にも偏りが出ることがあります。

たとえば、ある職業に男性ばかり登場する文章ばかり学習すると、その職業に対して性別のイメージが固定されてしまうことも。

これは「AIが勝手に差別している」というより、学習させた人間社会の偏りをそのまま映してしまっているということなんです。

試験では、「AIの出力に含まれるかもしれないバイアスに注意すること」という出題がされる可能性もあるので覚えておきましょう。

AI開発の方法 アノテーション/教師あり学習/教師なし学習

アノテーションとは、学習用のデータに正解ラベルをつけることです。

たとえば、猫の写真には「これは猫」、犬の写真には「これは犬」といったように、
AIが正しく学習できるように、目印をつける作業を指します。

AI開発の現場では、大量のデータにアノテーションをつけるのは地味だけどとても重要な工程で、
この「正しいラベル付きデータ」がないと、AIはうまく学習できません。

教師あり学習と教師なし学習って何?

AIがデータから学ぶ方法には、大きく分けて「教師あり学習」と「教師なし学習」があります。
それぞれの違いを理解しておくと、「アノテーションってなぜ必要なのか?」がよくわかるようになります。

教師あり学習(Supervised Learning)

これは、「正解がわかっているデータ」を使って学習する方法です。
たとえば、猫と犬の画像にあらかじめ「これは猫」「これは犬」とラベルが付いているような状態です。

このように、

  • 正解付きのデータ(=ラベル付きデータ)
  • → AIが「これは猫」「これは犬」と分類できるように学習
  • → 正しい答えと見比べながら修正を繰り返す

という学習スタイルです。

ここで必要になるのが「アノテーション」。
画像やテキストに、正解のラベルをつける作業が不可欠です。

教師なし学習(Unsupervised Learning)

こちらは、「正解のラベルがついていないデータ」だけを使って、AIが自力でパターンを探す学習方法です。

たとえば、商品購入履歴のデータから

  • 「この人とこの人は、よく似た買い物をしている」
  • 「このグループはよく同じ時間帯に来店している」

といった、<グループ化>や<傾向>をAIが自分で見つけるのが教師なし学習の特徴です。

試験対策ポイント

用語意味特徴試験で問われる視点
教師あり学習正解付きデータで学ぶアノテーションが必要ラベル・分類・回帰
教師なし学習正解なしデータで学ぶクラスタリングが主グループ化・傾向抽出

どっちが生成AIなの?

生成AI(ChatGPTなど)は、厳密には「教師あり」だけでは説明できないのですが、
事前に大量のテキストを使って自己学習する過程があり、さらに人の手による微調整(ファインチューニング)も行われているため、

  • 教師なし+教師あり+強化学習(RLHF)のミックス型
    という理解が近いです。

なので、試験ではあくまで
教師あり学習ではラベルが必要
教師なし学習はパターン発見」という基本を押さえておけばOKです。

振り返り:用語の整理

用語意味試験で問われる視点
ハルシネーションもっともらしい誤情報を出力してしまう現象生成AIのリスク、注意点
バイアス学習データに含まれる偏りが出力に影響すること公平性、差別、信頼性
アノテーションデータに「これは○○」というラベルをつける作業教師あり学習で必要、ラベル付けの重要性
教師あり学習正解ラベル付きのデータで学習する方法ラベル、分類・回帰、アノテーションと関連
教師なし学習ラベルのないデータからパターンや構造を見つける学習方法クラスタリング、傾向抽出、グループ分け

実践!生成AIの知識で過去問を解いてみよう

ここまで学んだ「基盤モデル」「ハルシネーション」「アノテーション」などの内容が、実際にどんなふうにITパスポート試験で問われるのかを確認してみましょう。

今回は、過去問(令和7年度春期)から2問をピックアップしてご紹介します。

【過去問1】生成AIの活用における課題に関する問題

問題:
生成AIの活用における課題に関する記述として、最も適切なものはどれか。

A:生成AIによって作成された文章や画像は、著作権の対象にはならない。

B:生成AIは、正解を明示して学習する教師あり学習の技術のみを用いて構築されている。

C:生成AIは、既存の著作物をそのままコピーして出力するため、情報漏えいや著作権侵害には該当しない。

D:生成AIは、もっともらしく見えるが事実とは異なる内容を出力することがあるため、出力された内容の正確性を確認する必要がある。
(ITパスポート・令和7年春・問47)


正解: D

解説:

選択肢Dが正解です。これはまさに、ハルシネーションの説明そのもの。

生成AIは、内容が正しそうに見えても、事実と異なる誤情報を生成することがあるため、
出力結果を鵜呑みにせず、人間がチェックする必要があるとされています。

【他の選択肢の間違いポイント】

  • A:生成AIで作ったコンテンツでも、創作性があれば著作権の対象になる可能性がある(権利者がAIの場合の扱いは議論中)。
  • B:生成AIは教師あり学習だけでなく、教師なし学習+強化学習なども組み合わせて作られている
  • C:既存の著作物を丸写しすることがあれば、著作権侵害に該当する可能性があるまた、情報漏えいのリスクもゼロではない。

【過去問2】AIの学習手法に関する問題

問題:
AIの学習に関する記述として、最も適切なものはどれか。

A:教師あり学習では、データに対する正解をAI自身が決定しながら学習する。

B:教師なし学習では、与えられたデータに対して、それが正解かどうかを判定しながら学習する。

C:教師あり学習では、正解が分かっているデータを使って、AIが入力と出力の関係を学習する。

D:教師なし学習では、あらかじめ用意された正解ラベルを使って分類する。
(ITパスポート・令和7年春・問48)


正解: C

解説:

選択肢Cが正解。これは教師あり学習の基本的な仕組みを正しく説明しています。

  • 正解ラベル付きのデータ(例:「これは犬」「これは猫」など)を使って、入力と出力の関係を学ぶのが教師あり学習です。

【他の選択肢の間違いポイント】

  • A:AI自身が正解を決めるわけではありません。正解は人間がラベル付けします(アノテーション)
  • B:これは教師なし学習の説明ではありません。教師なしではそもそも正解が与えられません
  • D:これは教師あり学習の説明に近く、教師「なし」とは矛盾します。

過去問からわかること

この2問からわかることは、

  • 生成AIのリスク(ハルシネーション、著作権など)を理解しているか?
  • AIの学習手法(教師あり/なし)やその意味を区別できるか?

ということが問われている、ということです。

「基盤モデル」「学習方法」「リスク」などの基本ワードを正しく押さえておけば、十分対応できます!

まとめ:生成AIの仕組みと注意点を、イメージで理解しよう

ITパスポートで2024年度から本格的に出題され始めた「生成AI」に関する問題。

一見すると難しそうですが、ポイントを押さえれば怖くありません。

この記事で紹介したように、生成AIには次のような構造と注意点があります。

● 基盤モデルとは?

  • 文章や画像など幅広いデータを使って、土台となるAIモデルを先に学習しておく仕組み
  • ChatGPTにおける「GPT-4」などがその例
  • 用途に応じて微調整(ファインチューニング)されることで、医療、法律、業務特化のAIなどに展開できる

● 生成AIのリスク

  • ハルシネーション(幻覚):もっともらしく間違った情報を出してしまう
  • バイアス(偏り):学習データの偏りが、AIの判断にも影響を与えることがある
  • 必ず人間が最終確認をすることが大切!

● 学習方法にも注目

  • 教師あり学習:正解付きデータを使う(アノテーションが必要)
  • 教師なし学習:正解なしのデータから傾向を見つける
  • 生成AIではこれらが複合的に使われている(例:ChatGPTでは自己教師あり+微調整など)

最後にひとこと

生成AIは、使い方を間違えなければとても強力なツールです。

でも、「なんでも正しく答えてくれる魔法の箱」ではないということを、
ITパスポートの学びを通じてしっかり理解しておきましょう。

この分野は今後ますます出題が増える可能性があります。
今のうちに、基礎の言葉を「なんとなくでも理解」しておくことが合格への一歩です!

学習、おつかれさまでした!


ITパスポートの関連記事を分野別にまとめました!


「そろそろ本腰入れて取り組みたい…!」という方は、通信講座もぜひチェックしてみてください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次