このページは以下の「ITパスポート シラバス6.3」学習用コンテンツです。
◆大分類:7.基礎理論
◆中分類:13.基礎理論
◆小分類 | ◆見出し | ◆学習すべき用語 |
---|---|---|
35.情報に関する理論 | (5) AI(Artificial Intelligence:人工知能)の技術 | 自然言語処理(NLP) — ルールベース 特徴量 機械学習(教師あり学習,教師なし学習,強化学習) ニューラルネットワーク バックプロパゲーション 活性化関数 過学習 ディープラーニング 事前学習 ファインチューニング 転移学習 畳み込みニューラルネットワーク(CNN) リカレントニューラルネットワーク(RNN) 敵対的生成ネットワーク(GAN) 大規模言語モデル(LLM) プロンプトエンジニアリング |
AI(Artificial Intelligence:人工知能)の技術は多様な技術、データ、コンピューターリソース(計算能力)の集合体のようなものです。
以下の生成AI技術相関イメージ(ver1.0)で全体像を掴みながら学習しましょう。
以下は「ベン図版」です。両方を見比べたりしながら全体像を掴んでおきましょう。
自然言語処理、機械学習、深層学習、LLM、大規模言語モデルなどの関係性は割と曖昧に使われていることも多いのでしっかり関係性を把握しておきたいとことです。
自然言語処理(NLP)
自然言語処理(Natural Language Processing、NLP)は、人間の言語をコンピュータが理解、解析、生成するための技術です。この技術はAI(人工知能)の一分野であり、音声認識、機械翻訳、感情分析、チャットボットなど、さまざまな応用分野があります。
NLPはテキストデータの構造化、意味理解、文脈処理などの課題に取り組むために統計的手法や機械学習モデル、特にディープラーニングが活用されます。
自然言語処理に関する学習用問題
問題
自然言語処理の主な応用分野として適切でないものはどれですか?
- 画像認識
- 機械翻訳
- 感情分析
%%replace6%%
正解
1 画像認識
解説
画像認識は視覚情報を処理する技術でありNLPとは異なります。
一方、機械翻訳や感情分析は自然言語処理の典型的な応用分野です。したがって、画像認識はNLPの応用分野には該当しません。
問題
自然言語処理に関連する技術として正しいものはどれですか?
- 畳み込みニューラルネットワーク(CNN)
- 再帰型ニューラルネットワーク(RNN)
- 決定木
%%replace6%%
正解
2 再帰型ニューラルネットワーク(RNN)
解説
再帰型ニューラルネットワーク(RNN)は時系列データやシーケンスデータの処理に優れており、自然言語処理に広く用いられています。
畳み込みニューラルネットワーク(CNN)は主に画像認識に使用され、決定木は分類や回帰分析に用いられる手法でNLPとは直接の関連は薄いです。
問題
自然言語処理における形態素解析の目的として適切なものはどれですか?
- テキストを音声に変換する
- 文を構成する単語や要素に分解する
- 画像データから特徴を抽出する
%%replace6%%
正解
2 文を構成する単語や要素に分解する
解説
形態素解析はテキストデータを単語や文法的要素に分解するプロセスであり、自然言語処理において基本的な処理ステップとなります。
音声変換や画像データの特徴抽出はそれぞれ異なる技術分野に属します。
ルールベース
ルールベースとはあらかじめ定義されたルールに基づいてシステムが動作する方式です。
ルールは条件とその条件が満たされたときに実行される処理を定めたものであり、主にエキスパートシステムや単純な自動化タスクに利用されます。
ルールベースシステムは透明性が高く、ルールが明確に定義されているため、結果が予測しやすいのが特徴です。しかし、複雑な問題や変化する環境に対応するのが難しく、メンテナンスコストが高くなることがあります。
ルールベースに関する学習用問題
問題
ルールベースの特徴として正しいものはどれですか?
- あらかじめ定義されたルールに基づいて動作する
- 大量のデータを使ってパターンを学習する
- 学習によって自動的にルールを生成する
%%replace6%%
正解
1 あらかじめ定義されたルールに基づいて動作する
解説
ルールベースはあらかじめ定義されたルールに従ってシステムが動作します。
選択肢2や3は、機械学習の特徴であり、ルールベースの特徴ではありません。
問題
ルールベースシステムが適している場面として最もふさわしいものはどれですか?
- 動的に変化する環境での意思決定
- 明確なルールが存在する単純なタスクの自動化
- 複雑なパターン認識を伴う画像解析
%%replace6%%
正解
2 明確なルールが存在する単純なタスクの自動化
解説
ルールベースシステムは明確なルールが存在する単純なタスクの自動化に適しています。
動的に変化する環境や複雑なパターン認識には適していません。
問題
ルールベースシステムの課題として適切でないものはどれですか?
- 複雑な問題への対応が難しい
- ルールの明確性により結果が予測しやすい
- ルールの維持管理が難しくなることがある
%%replace6%%
正解
2 ルールの明確性により結果が予測しやすい
解説
ルールベースシステムはルールが明確であるため、結果が予測しやすい点が利点です。
選択肢1と3は、ルールベースシステムの課題として挙げられる点です。
特徴量
特徴量とは機械学習モデルがデータから学習する際に利用するデータの属性や指標のことです。データセットから重要な情報を抽出し、機械学習モデルが予測や分類を行うための入力とします。
特徴量の選択とエンジニアリングがモデルの精度に大きく影響するため、特徴量の質を高めることが機械学習において重要です。代表的な特徴量には数値データやカテゴリデータ、テキストデータから生成されるものがあります。
特徴量に関する学習用問題
問題
機械学習モデルの精度に最も影響を与える要因として適切なものはどれですか?
- 特徴量の選択とエンジニアリング
- モデルの学習アルゴリズムの選択
- データセットのサイズ
%%replace6%%
正解
1 特徴量の選択とエンジニアリング
解説
機械学習モデルの精度は特徴量の選択とエンジニアリングによって大きく左右されます。
学習アルゴリズムやデータセットのサイズも重要ですが、特徴量が最も影響を与えます。
問題
特徴量エンジニアリングとは何を指すか正しいものはどれですか?
- モデルの学習過程を最適化する作業
- データから重要な特徴を抽出し加工する作業
- モデルのパラメータを調整する作業
%%replace6%%
正解
2 データから重要な特徴を抽出し加工する作業
解説
特徴量エンジニアリングとはデータから重要な特徴を抽出し、モデルが学習しやすい形に加工する作業を指します。
選択肢1や3は特徴量エンジニアリングとは異なります。
問題
特徴量として使用されるものとして適切でないものはどれですか?
- 数値データ
- ラベルデータ
- テキストデータ
%%replace6%%
正解
2 ラベルデータ
解説
特徴量には数値データやテキストデータが含まれますが、ラベルデータはモデルの出力を指すため特徴量には該当しません。
機械学習(教師あり学習、教師なし学習、強化学習)
機械学習はデータからパターンや規則性を見つけ出し、その知見をもとに予測や分類を行う技術です。機械学習には教師あり学習、教師なし学習、強化学習の三つの主要なタイプがあります。
教師あり学習はラベル付きデータを用いて学習し、教師なし学習はラベルのないデータから構造を見つけます。強化学習は行動と報酬を通じて最適な行動方針を学習します。これらの手法は、タスクやデータの種類に応じて使い分けられます。
機械学習に関する学習用問題
問題
教師あり学習の特徴として適切なものはどれですか?
- ラベル付きデータを用いる
- データの構造を自動的に発見する
- 報酬を通じて学習する
%%replace6%%
正解
1 ラベル付きデータを用いる
解説
教師あり学習はラベル付きデータを使用してモデルを学習します。
選択肢2は教師なし学習の特徴であり、選択肢3は強化学習に関するものです。
問題
強化学習の特徴として正しいものはどれですか?
- データのクラス分けを行う
- 報酬を基に最適な行動を学習する
- データ間の類似性を基にクラスタリングを行う
%%replace6%%
正解
2 報酬を基に最適な行動を学習する
解説
強化学習は報酬を基に最適な行動方針を学習する手法です。
クラス分けやクラスタリングはそれぞれ教師あり学習と教師なし学習の特徴です。
問題
教師なし学習に関する説明として最も適切なものはどれですか?
- ラベル付きデータを使用して学習する
- データの隠れた構造を見つけ出す
- 報酬を基に行動を最適化する
%%replace6%%
正解
2 データの隠れた構造を見つけ出す
解説
教師なし学習はラベルのないデータから構造やパターンを発見する手法です。
選択肢1と3はそれぞれ教師あり学習と強化学習に関する説明です。
ニューラルネットワーク
ニューラルネットワークは生物の脳神経回路を模倣して作られた計算モデルです。
多数のノード(ニューロン)とそれらを結ぶエッジ(シナプス)から構成され、入力から出力へと情報を伝達しながら処理を行います。
ニューラルネットワークは多層にわたるネットワーク構造を持ち、特にディープラーニングにおいては非常に複雑なパターン認識を可能にします。この技術は画像認識、音声認識、自然言語処理など多くのAIアプリケーションに応用されています。
ニューラルネットワークに関する学習用問題
問題
ニューラルネットワークにおけるノードの役割として正しいものはどれですか?
- 入力データの受け取りと単純な計算を行う
- データのクラスタリングを行う
- 報酬を基に最適な行動を学習する
%%replace6%%
正解
1 入力データの受け取りと単純な計算を行う
解説
ノードはニューラルネットワーク内で入力データを受け取り、加重和と活性化関数を使って次の層にデータを渡します。クラスタリングや報酬学習は他の手法の特徴です。
問題
ニューラルネットワークの構造として適切でないものはどれですか?
- 入力層
- 隠れ層
- 正規化層
%%replace6%%
正解
3 正規化層
解説
ニューラルネットワークは通常、入力層、隠れ層、出力層から構成されます。
正規化層は一般的には存在せず、正規化は他の手法や過程で行われます。
問題
ニューラルネットワークの主要な用途として適切でないものはどれですか?
- 画像認識
- 音声認識
- ルールベースシステムの自動化
%%replace6%%
正解
3 ルールベースシステムの自動化
解説
ニューラルネットワークは複雑なパターン認識を得意とし、画像認識や音声認識などに用いられますが、ルールベースシステムの自動化には一般的に使用されません。
バックプロパゲーション
バックプロパゲーション(Back propagation:誤差逆伝播)はニューラルネットワークの学習過程において誤差を逆伝播させ、各ノードの重みを調整するアルゴリズムです。
入力データがネットワークを通過する際に出力された結果と正解との差を誤差として計算し、その誤差が最小になるように重みを更新していくことでネットワーク全体の性能が向上し、より正確な予測や分類が可能になります。バックプロパゲーションはディープラーニングの成功に不可欠な技術です。
バックプロパゲーションに関する学習用問題
問題
バックプロパゲーションの主な目的として正しいものはどれですか?
- データのクラスタリングを行う
- 誤差を最小化するために重みを調整する
- データセットを拡張する
%%replace6%%
正解
2 誤差を最小化するために重みを調整する
解説
バックプロパゲーションは誤差を最小化するために、ネットワーク内の重みを調整することを目的としています。
クラスタリング(特徴などでのグルーピング)やデータ拡張は他の手法の目的です。
問題
バックプロパゲーションの過程で計算されるものとして適切なものはどれですか?
- 各ノードの誤差
- 各データのラベル
- 各層の入力データ
%%replace6%%
正解
1 各ノードの誤差
解説
バックプロパゲーションでは各ノードでの誤差が計算され、それに基づいて重みが更新されます。
ラベルや入力データは、バックプロパゲーション自体の過程では直接計算されません。
問題
バックプロパゲーションにおける誤差逆伝播の流れとして適切でないものはどれですか?
- 出力層から入力層へと誤差が伝播する
- 隠れ層で計算された誤差が次の層へ伝播する
- 入力層で誤差が計算される
%%replace6%%
正解
3 入力層で誤差が計算される
解説
バックプロパゲーションでは誤差は出力層から逆方向に隠れ層を経て入力層へと伝播されます。入力層では誤差が計算されません。
活性化関数
活性化関数はニューラルネットワークにおいて各ノードが次の層に出力する値を決定するために用いられる関数です。
活性化関数を用いることで、線形ではない複雑な関係性をモデルに学習させることが可能になります。
代表的な活性化関数には、シグモイド関数、ReLU(Rectified Linear Unit)、およびソフトマックス関数などがあります。適切な活性化関数を選択することが、ニューラルネットワークの性能に大きな影響を与えます。
活性化関数に関する学習用問題
問題
活性化関数の役割として最も適切なものはどれですか?
- ネットワーク内のノード間の重みを更新する
- ノードの出力を次の層に伝える際に変換する
- データセットを正規化する
%%replace6%%
正解
2 ノードの出力を次の層に伝える際に変換する
解説
活性化関数は各ノードの出力を次の層に伝達する際に、非線形変換を施す役割を果たします。
重みの更新やデータの正規化は活性化関数の役割ではありません。
問題
活性化関数として一般的に使用されないものはどれですか?
- シグモイド関数
- ソフトマックス関数
- クラスタリング関数
%%replace6%%
正解
3 クラスタリング関数
解説
シグモイド関数やソフトマックス関数は一般的な活性化関数ですが、クラスタリング関数は活性化関数として使用されません。
問題
ReLU(Rectified Linear Unit)に関する説明として正しいものはどれですか?
- ネガティブな入力をゼロに置き換える
- 入力データの範囲を[0, 1]に正規化する
- 入力データを指数関数的に変換する
%%replace6%%
正解
1 ネガティブな入力をゼロに置き換える
解説
ReLUは入力がネガティブであればゼロに置き換え、それ以外の場合はそのまま出力します。
正規化や指数関数変換は他の関数の役割です。
過学習
過学習とは機械学習モデルが訓練データに対して過度に適合し、汎用性が低下してしまう現象を指します。
過学習が起きると訓練データに対しては高い精度を発揮しますが、未知のデータに対しては性能が著しく低下します。
過学習を防ぐためには適切なデータの量や正則化、クロスバリデーションの実施が重要です。また、モデルの複雑さを抑えることも有効です。
過学習に関する学習用問題
問題
過学習の症状として適切なものはどれですか?
- 訓練データに対して高精度だがテストデータで性能が低下する
- 訓練データとテストデータの両方に対して高精度を維持する
- モデルが訓練データを十分に学習できない
%%replace6%%
正解
1 訓練データに対して高精度だがテストデータで性能が低下する
解説
過学習はモデルが訓練データに過度に適応し、新しいデータに対して性能が著しく低下する現象です。
選択肢2や3は過学習の症状ではありません。
問題
過学習を防ぐための方法として最も適切なものはどれですか?
- 訓練データの量を増やす
- モデルの複雑さを増加させる
- テストデータを使用しない
%%replace6%%
正解
1 訓練データの量を増やす
解説
過学習を防ぐためには訓練データの量を増やすことが有効です。また、モデルの複雑さを抑え、クロスバリデーションを活用することも効果的です。
選択肢2や3は過学習を防ぐ方法ではありません。
問題
過学習が発生した場合、最も考えられる原因はどれですか?
- 訓練データが少なすぎる
- モデルが過度に複雑である
- テストデータのラベルが間違っている
%%replace6%%
正解
2 モデルが過度に複雑である
解説
過学習はモデルが過度に複雑である場合に発生しやすくなります。
データの量が少ないことも要因ですが、ラベルの間違いは過学習の直接的な原因ではありません。
ディープラーニング
ディープラーニングはニューラルネットワークを用いた機械学習の一分野であり、多層のニューラルネットワークを通じて複雑なパターンを学習します。
大量のデータと高性能なコンピューティング資源を活用することで、画像認識、音声認識、自然言語処理などの分野で顕著な成果を上げています。
ディープラーニングは、特にビッグデータを扱う際にその性能を発揮し、人工知能の発展に大きく寄与しています。
ディープラーニングに関する学習用問題
問題
ディープラーニングの特徴として最も適切なものはどれですか?
- 少数のデータで高精度なモデルを構築できる
- 複数の層を持つニューラルネットワークを使用する
- 単一の層でパターンを学習する
%%replace6%%
正解
2 複数の層を持つニューラルネットワークを使用する
解説
ディープラーニングは複数の層を持つニューラルネットワークを用いて、複雑なパターンを学習します。
少数のデータや単一の層での学習は、ディープラーニングの特徴とは異なります。
問題
ディープラーニングが適用される分野として適切でないものはどれですか?
- 画像認識
- 音声認識
- 単純なルールベースのタスク
%%replace6%%
正解
3 単純なルールベースのタスク
解説
ディープラーニングは画像認識や音声認識などの複雑なタスクに適用されますが、単純なルールベースのタスクには適していません。
問題
ディープラーニングが成功を収めている理由として適切でないものはどれですか?
- 大量のデータを処理する能力
- 単純なルールベースでの処理
- 高性能なコンピューティング資源の活用
%%replace6%%
正解
2 単純なルールベースでの処理
解説
ディープラーニングが成功している要因には、大量のデータを扱う能力や高性能なコンピューティング資源の活用がありますが、単純なルールベースでの処理はその要因ではありません。
事前学習
事前学習とは機械学習モデルを特定のタスクに対して学習させる前に、別のタスクであらかじめ学習しておくプロセスを指します。モデルが基本的な特徴をすでに学習しているため、ターゲットタスクでの学習が効率化されます。
特にディープラーニングにおいて大規模データセットを活用する際に効果的であり、ファインチューニングと組み合わせることで高いパフォーマンスを引き出すことができます。
事前学習に関する学習用問題
問題
事前学習の利点として適切なものはどれですか?
- 訓練データが少ない場合でも効果的に学習できる
- すべてのタスクにおいて無条件で高精度が得られる
- モデルがすでに学習したタスクに再適用される
%%replace6%%
正解
1 訓練データが少ない場合でも効果的に学習できる
解説
事前学習は訓練データが少ない場合でも、別のタスクで得られた知識を活用して効果的に学習を進めることができます。
選択肢2や3は事前学習の利点ではありません。
問題
事前学習が特に有効でないシチュエーションとして適切なものはどれですか?
- 大量のデータが存在しない場合
- タスクが事前学習されたタスクと類似していない場合
- タスクが同じデータセットで繰り返される場合
%%replace6%%
正解
2 タスクが事前学習されたタスクと類似していない場合
解説
事前学習はターゲットタスクが事前に学習されたタスクと類似している場合に特に有効ですが、全く異なるタスクではその効果が限定的になります。
選択肢1や3は事前学習が有効である場合です。
問題
事前学習と深い関連のある技術として正しいものはどれですか?
- ファインチューニング
- クラスタリング
- サポートベクターマシン
%%replace6%%
正解
1 ファインチューニング
解説
事前学習はファインチューニングと密接に関連しており、事前学習されたモデルを特定のタスクに最適化するプロセスです。
クラスタリングやサポートベクターマシンは別の手法です。
ファインチューニング
ファインチューニングとは事前学習済みのモデルを特定のタスクに合わせて再学習させるプロセスです。事前学習により基本的な特徴が学習されているため、ターゲットタスクでの学習は効率的に進行します。
ファインチューニングは少量のデータや特定の領域での高精度な予測が必要な場合に特に有効です。この手法により、事前学習モデルの強みを活かしつつ、特定のニーズに応じた最適なモデルを構築できます。
ファインチューニングに関する学習用問題
問題
ファインチューニングの主な利点として最も適切なものはどれですか?
- 全く新しいタスクに適用する際に必要なデータ量を大幅に削減できる
- ランダムに初期化されたモデルと比較して学習が早く進む
- モデルのすべての層を完全に再学習することができる
%%replace6%%
正解
2 ランダムに初期化されたモデルと比較して学習が早く進む
解説
ファインチューニングはランダムに初期化されたモデルと比較して、事前学習済みのモデルを使用することで学習が迅速に進行します。
選択肢1や3はファインチューニングの利点としては正しくありません。
問題
ファインチューニングが最も適している状況として適切なものはどれですか?
- 事前学習済みモデルを新しいドメインに適用したい場合
- 大量のデータを使って一からモデルを学習する場合
- モデルの初期パラメータをランダムに設定する場合
%%replace6%%
正解
1 事前学習済みモデルを新しいドメインに適用したい場合
解説
ファインチューニングは事前学習済みモデルを新しいドメインやタスクに適用したい場合に最も適しています。
一から学習する場合や初期パラメータをランダムに設定する場合はファインチューニングを使用しません。
問題
ファインチューニングが特に有効でない場合として最も適切なものはどれですか?
- 少量のドメイン固有データを使用する場合
- 既存のタスクから大きく異なるタスクに適用する場合
- 事前学習済みモデルの上に新しい層を追加する場合
%%replace6%%
正解
2 既存のタスクから大きく異なるタスクに適用する場合
解説
ファインチューニングは既存のタスクと大きく異なるタスクに適用する場合、その効果が限定的になることがあります。
選択肢1や3はファインチューニングが有効な場合です。
転移学習
転移学習とは既存のモデルや学習済みの知識を新しいタスクに再利用する機械学習の技術です。この手法により、少量のデータや限られた計算資源でも高いパフォーマンスを引き出すことができます。
転移学習は特に関連性のあるタスク間で効果を発揮し、画像認識や自然言語処理など多くの分野で広く利用されています。既存のモデルを新しい状況に適応させるための効率的な方法として、ディープラーニングと組み合わせて使われることが多いです。
転移学習に関する学習用問題
問題
転移学習の利点として適切なものはどれですか?
- 完全に異なるタスクに容易に適用できる
- 少量のデータで高精度なモデルを構築できる
- 最初からすべてのモデルパラメータを再学習する
%%replace6%%
正解
2 少量のデータで高精度なモデルを構築できる
解説
転移学習は少量のデータでも高精度なモデルを構築するのに有効です。
完全に異なるタスクへの適用は難しく、すべてのパラメータを再学習するわけではありません。
問題
転移学習が特に有効でない場合として適切なものはどれですか?
- 元のタスクと新しいタスクが類似している場合
- 新しいタスクにおいて大量のデータが既に存在する場合
- モデルを一から学習させる必要がある場合
%%replace6%%
正解
3 モデルを一から学習させる必要がある場合
解説
転移学習は既存の知識を再利用することで効率的に学習を行いますが、一からすべてを学習させる場合にはその利点が少ないです。
選択肢1や2は転移学習が有効な状況です。
問題
転移学習に関連する技術として適切なものはどれですか?
- クラスタリング
- ファインチューニング
- 正規化
%%replace6%%
正解
2 ファインチューニング
解説
転移学習はファインチューニングと組み合わせることで、既存のモデルを新しいタスクに適応させることができます。
クラスタリングや正規化は転移学習とは直接的な関連がありません。
畳み込みニューラルネットワーク(CNN)
畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)は、画像や動画の処理に特化したニューラルネットワークの一種です。
CNNは畳み込み層とプーリング層を組み合わせることで、画像の特徴を効果的に抽出し、分類や認識に利用します。特に、画像認識、物体検出、顔認識などの分野で広く使用されています。
CNNの構造はデータの空間的関係を保ちながら学習を行うため、従来の全結合層のみを用いたネットワークよりも高い精度を実現します。
画像の小さな部分(フィルタやカーネルと呼ばれます)を全体に「重ね合わせて」いく、数学的な「畳み込み(convolution)」という操作を行うことから「畳み込みニューラルネットワーク」という名称になっています。
畳み込みニューラルネットワーク(CNN)に関する学習用問題
問題
畳み込みニューラルネットワーク(CNN)の特徴として適切なものはどれですか?
- 画像や動画の処理に特化している
- データの時系列分析に優れている
- 主にテキストデータの処理に使用される
%%replace6%%
正解
1 画像や動画の処理に特化している
解説
畳み込みニューラルネットワーク(CNN)は画像や動画の処理に特化して設計されており、物体認識や画像分類などで高い精度を発揮します。
時系列分析やテキストデータの処理には主に他のネットワークが使用されます。
問題
CNNにおける「畳み込み層」の役割として正しいものはどれですか?
- データの次元を圧縮する
- 画像の特徴を抽出する
- データの順序を保つ
%%replace6%%
正解
2 画像の特徴を抽出する
解説
畳み込み層は画像の特徴を抽出するために使用されます。
次元の圧縮はプーリング層で行われ、データの順序保護は時系列データに関連するタスクで重要です。
問題
畳み込みニューラルネットワーク(CNN)が特に効果的でない分野として適切なものはどれですか?
- 画像分類
- 音声認識
- 自然言語処理
%%replace6%%
正解
3 自然言語処理
解説
畳み込みニューラルネットワーク(CNN)は画像分類や音声認識において効果的ですが、自然言語処理には主にリカレントニューラルネットワーク(RNN)が用いられます。
リカレントニューラルネットワーク(RNN)
リカレントニューラルネットワーク(RNN:Recurrent Neural Network)は時系列データやシーケンスデータを処理するために設計されたニューラルネットワークの一種です。
RNNは過去の情報を保持しつつ、現在の入力に影響を与えることができるため、音声認識、文章生成、翻訳などのタスクに適しています。
RNNの構造では各層が自分自身に再帰的に接続されており、これによりデータの時間的な依存関係を捉えることが可能になります。
「Recurrent」は何度も繰り返す、循環する、回帰性といった意味です。
リカレントニューラルネットワーク(RNN)に関する学習用問題
問題
リカレントニューラルネットワーク(RNN)の特徴として適切なものはどれですか?
- 時系列データを処理できる
- 主に画像の特徴を抽出する
- データの順序を無視する
%%replace6%%
正解
1 時系列データを処理できる
解説
リカレントニューラルネットワーク(RNN)は時系列データやシーケンスデータを処理するのに適しており、過去の情報を保持しながら現在の入力に反映させます。
画像の特徴抽出はCNNの役割であり、データの順序はRNNで重要な要素です。
問題
RNNが特に適しているタスクとして適切なものはどれですか?
- 画像分類
- 音声認識
- 構造化データの分析
%%replace6%%
正解
2 音声認識
解説
RNNは時系列データを扱う音声認識や文章生成などのタスクに特に適しています。
画像分類にはCNNが、構造化データの分析には他の手法が一般的に用いられます。
問題
RNNの構造として特徴的でないものはどれですか?
- 時間的依存関係を捉えるための再帰的接続
- データの順序を無視する接続
- 過去の情報を保持するためのメモリ効果
%%replace6%%
正解
2 データの順序を無視する接続
解説
RNNはデータの時間的な順序を重要視し、それを捉えるために再帰的な接続を持ちます。
データの順序を無視することはRNNの特徴ではありません。
敵対的生成ネットワーク(GAN)
敵対的生成ネットワーク(GAN)は「生成モデル」と「識別モデル」という二つのニューラルネットワークを競わせることで、リアルなデータを生成する技術です。
生成モデルは偽のデータを生成し、識別モデルはそれが本物か偽物かを判別します。この競争の過程で、生成モデルはよりリアルなデータを作り出す能力を向上させます。GANは、画像生成、映像合成、データ補完など多様な分野で応用されており、その能力はAI分野で大きな注目を集めています。
敵対的生成ネットワーク(GAN)に関する学習用問題
問題
敵対的生成ネットワーク(GAN)の主な構成要素として正しいものはどれですか?
- 生成モデルと識別モデル
- 畳み込み層とプーリング層
- 入力層と出力層
%%replace6%%
正解
1 生成モデルと識別モデル
解説
敵対的生成ネットワーク(GAN)は生成モデルと識別モデルという二つのネットワークで構成されます。
畳み込み層やプーリング層はCNNの構成要素であり、入力層と出力層は一般的なニューラルネットワークの構成要素です。
問題
GANの主な応用分野として適切でないものはどれですか?
- 画像生成
- テキスト分類
- データ補完
%%replace6%%
正解
2 テキスト分類
解説
GANは画像生成やデータ補完などの生成タスクに適しており、テキスト分類は主に別の手法で行われます。
問題
敵対的生成ネットワーク(GAN)の識別モデルの役割として適切なものはどれですか?
- データの生成を行う
- 本物のデータと偽物のデータを識別する
- データの特徴を圧縮する
%%replace6%%
正解
2 本物のデータと偽物のデータを識別する
解説
GANの識別モデルは本物のデータと生成された偽物のデータを識別する役割を持ちます。
データの生成や特徴の圧縮は識別モデルの役割ではありません。
大規模言語モデル(LLM)
大規模言語モデル(LLM)は非常に多くのパラメータを持ち、大量のテキストデータから学習して自然言語処理を行うモデルです。
これらのモデルは、文の生成、翻訳、質問応答など多様なタスクに高い精度で対応できることが特徴です。特に、BERTやGPTなどのモデルが代表例として知られ、テキストの意味理解や自然な文生成において優れた性能を示しています。LLMはその性能の高さゆえに、さまざまな分野での応用が進んでいます。
大規模言語モデル(LLM)に関する学習用問題
問題
大規模言語モデル(LLM)の主な特徴として正しいものはどれですか?
- 少量のテキストデータから高精度な文生成を行う
- 大量のテキストデータから学習し多様なタスクに対応する
- 主に数値データの分析に用いられる
%%replace6%%
正解
2 大量のテキストデータから学習し多様なタスクに対応する
解説
大規模言語モデル(LLM)は大量のテキストデータから学習し、文生成や翻訳、質問応答など多様なタスクに対応できます。
少量のデータや数値データの分析はLLMの主な特徴ではありません。
問題
LLMに該当しないモデルとして適切なものはどれですか?
- BERT
- GPT
- KNN
%%replace6%%
正解
3 KNN
解説
KNN(k近傍法)は、機械学習の分類手法の一つであり、大規模言語モデル(LLM)には該当しません。
BERTやGPTは、代表的な大規模言語モデルです。
問題
LLMが主に用いられるタスクとして適切でないものはどれですか?
- 文生成
- 翻訳
- クラスタリング
%%replace6%%
正解
3 クラスタリング
解説
LLMは文生成や翻訳などの自然言語処理タスクに用いられますが、クラスタリングは主に他の手法で行われます。
プロンプトエンジニアリング
プロンプトエンジニアリングとは大規模言語モデル(LLM)に対して適切な指示(プロンプト)を与えることで、期待する出力を得るための技術です。
プロンプトの設計次第でモデルの出力内容や品質が大きく変わるため、この技術はLLMの効果的な利用に不可欠です。プロンプトエンジニアリングはLLMの多様なタスクへの応用を可能にし、特定のタスクに対してより適切な応答を生成するために使用されます。
プロンプトエンジニアリングに関する学習用問題
問題
プロンプトエンジニアリングの主な目的として正しいものはどれですか?
- モデルのパラメータを調整する
- 期待する出力を得るためにプロンプトを設計する
- データの前処理を行う
%%replace6%%
正解
2 期待する出力を得るためにプロンプトを設計する
解説
プロンプトエンジニアリングはLLMに対して適切なプロンプトを設計し、期待する出力を得ることを目的としています。
パラメータの調整やデータの前処理は他の工程に属します。
問題
プロンプトエンジニアリングが特に有効でない場合として適切なものはどれですか?
- 特定のタスクに対する精度を向上させたい場合
- 汎用的な応答が求められる場合
- モデルの出力を制御したい場合
%%replace6%%
正解
2 汎用的な応答が求められる場合
解説
プロンプトエンジニアリングは特定のタスクにおいて精度を高めたり、モデルの出力を制御するのに有効ですが、汎用的な応答が求められる場合にはその効果が限定的です。
問題
プロンプトエンジニアリングが活用される分野として最も適切なものはどれですか?
- データの正規化
- 大規模データベースの管理
- 大規模言語モデル(LLM)の出力制御
%%replace6%%
正解
3 大規模言語モデル(LLM)の出力制御
解説
プロンプトエンジニアリングは大規模言語モデル(LLM)の出力を制御するために使用されます。
データの正規化やデータベースの管理は別の分野に関連します。
生成AIを生み出す技術や背景といった要素は思ったより多岐に渡っており、一つ一つを単純に暗記するのではなく、全体構成をこのページ先頭の図解で掴んでおくことで理解がしやすく、また覚えやすくなる近道です。