【ITパスポート練習問題 6.3対応】① データの種類及び前処理

正解数: 0/0 (0%)

データの種類及び前処理

ビジュアル表現と多様なデータ利活用が導く業務改善のヒントとは？

現代のビジネスシーンでは、組織内に蓄積される膨大な情報やSNSや調査企業が提供するデータをいかに扱うかが重要です。業務を正しく把握するビジュアル表現と、幅広い視点でデータを収集・分析する視点を組み合わせることで、問題の早期発見や新たな価値創造につながりやすくなります。

たとえば、調査データや実験データ、人の行動ログデータ、機械の稼働ログデータ、GISデータなど、様々な情報源を量的データ・質的データの視点で分類する取り組みが挙げられます。

さらに、1次データ・2次データやメタデータの特徴を知り、構造化データ・非構造化データを整理する手法も欠かせません。加えて、時系列データやクロスセクションデータを分析する際は、データのサンプリングや名寄せ、外れ値・異常値・欠損値の処理、アノテーションなどの前処理を活用することで、より精度の高い考察が可能になります。

的確な意思決定を進める上でデータの利活用は重要です。このような基礎力を高めることで就職・転職やキャリアアップの場面でも、データを活かした改善提案ができる人材への期待値は高いと言えます。

学習ポイントをチェック

なぜ多種多様なデータを区別する必要があるのか？
データの特性に応じた分析設計を行い、業務改善につなげやすくするため
ビジュアル表現を用いる意義
フローチャートやグラフを活用し、業務の流れや課題を一目で把握できるようにする
前処理が重要視される理由
外れ値や欠損値を適切に扱い、分析結果の信頼性と業務への応用度を高める
OR・IE手法の活用メリット
既存の業務プロセスを多角的に見直し、生産性やコストの面で改善策を打ち出しやすくする

これらの視点を押さえておくことで、現場での課題を見つけやすくなり、データ活用に強い人材としての可能性も広がるでしょう。用語解説と練習問題に取り組み、理解をさらに深めてみてください。

全体のどこを学習しているのか把握しながら進めましょう。IPAシラバス原本PDFはこちら

このページは以下の「ITパスポートシラバス6.3」学習用コンテンツです。

◆大分類：1.企業と法務
◆中分類：1.企業活動

◆小分類	◆見出し	◆学習すべき用語
2.業務分析・データ利活用	(3) データ利活用 ① データの種類及び前処理	調査データ実験データ人の行動ログデータ機械の稼働ログデータ GISデータ量的データ質的データ 1次データ 2次データメタデータ構造化データ非構造化データ時系列データクロスセクションデータ【活用例】データのサンプリングデータの名寄せデータの外れ値・異常値・欠損値の処理アノテーションデータの季節調整・移動平均

見出し

調査データ

調査データとは特定の目的のために収集されたデータのことです。アンケート調査やインタビュー、観察などの方法で取得され、定量的または定性的な情報を含みます。

ビジネスや学術研究において、仮説検証や市場分析などに活用され、意思決定を支える重要な基盤となります。データ収集時にはバイアスの排除が重要です。

調査データに関する学習用問題

調査データの特徴として適切なものはどれですか？

1. 事前に加工されたデータを利用する 2. 収集目的に応じて新たに取得される 3. 常に政府機関から提供される公式データ

以下の中で調査データの例として最も適切なものはどれですか？

1. 既存の政府統計資料 2. 実験によって得られた測定結果 3. アンケート調査から収集された回答結果

実験データ

実験データは研究や試験の結果として得られるデータです。設定された条件下で計測や観察を行い、得られた数値や観察記録が含まれます。

科学的研究や製品開発において重要で、因果関係の検証や性能評価に利用されます。信頼性の高い結果を得るため、実験条件の管理が重要です。

実験データに関する学習用問題

実験データの主な特徴として適切なものはどれですか？

1. 自然環境下で偶然得られる 2. 特定の条件下で収集される 3. 常に大量のデータが必要である

次のうち、実験データの活用例として適切なものはどれですか？

1. 自然観察レポート 2. 新製品の性能テスト結果 3. 政府統計報告書の分析

人の行動ログデータ

人の行動ログデータとは個人の行動履歴を記録したデータのことです。オンライン上のクリック履歴、スマートフォンの位置情報、購買履歴などが含まれ、マーケティングやユーザー分析に活用されます。

プライバシー保護やデータの適切な管理が必要不可欠です。

人の行動ログデータに関する学習用問題

人の行動ログデータの主な活用例として適切なものはどれですか？

1. ウェブサイト訪問者の閲覧履歴の分析 2. 実験室での化学反応の測定値記録 3. 統計データの公的機関からの収集

人の行動ログデータの管理において最も重要な点はどれですか？

1. データの公開範囲を広げる 2. データ形式を統一する 3. プライバシーの保護を徹底する

機械の稼働ログデータ

機械の稼働ログデータは機械や装置の稼働状況を記録するデータです。製造業やITインフラ管理において、保守点検や障害予測のために活用されます。

機械の動作記録を継続的に収集することで、運用効率の向上やコスト削減が可能です。

機械の稼働ログデータに関する学習用問題

機械の稼働ログデータの活用例として最も適切なものはどれですか？

1. スマートフォンのユーザー位置情報の収集 2. 工場の生産ラインの動作監視 3. 市場調査のためのアンケート収集

機械の稼働ログデータの利点として適切なものはどれですか？

1. 機械の動作状況を自動的に記録できる 2. 調査対象者の行動を追跡できる 3. データの収集が常に手作業で行われる

GISデータ

GIS（Geographic Information System）データは地理情報を扱うデータです。地図情報、位置情報、地形データなどが含まれ、都市計画、災害対策、物流管理などの分野で幅広く利用されます。

位置情報の可視化や地理的分析が可能で、社会インフラの発展に貢献します。

GISデータに関する学習用問題

GISデータの活用例として最も適切なものはどれですか？

1. 製品の市場シェア分析 2. 配送ルートの最適化 3. 機械の稼働状況の記録

GISデータの利点として適切なものはどれですか？

1. 地理的な位置情報の分析が可能 2. 調査対象者の詳細な行動がわかる 3. 機械の動作記録を保存できる

量的データ

量的データとは数値で表現できるデータのことです。計測や数値集計が可能なため、統計分析や数値モデルの構築に適しています。身長や売上、温度など、物理的な量や規模を示すデータが該当します。

数学的な演算が可能で、平均値や標準偏差などの統計指標を計算できます。

量的データに関する学習用問題

次のうち、量的データの例として最も適切なものはどれですか？

1. 顧客の評価コメント 2. 従業員の年齢 3. 製品のブランド名

量的データに関する記述として適切なものはどれですか？

1. カテゴリや属性を表すデータ 2. 質的分析に適したデータ 3. 数値で計測可能なデータ

質的データ

質的データとは数値では表現できないデータで、カテゴリや属性を示します。例えば、製品の色、顧客の満足度、職業などが含まれます。

主に分類やグルーピング、頻度分析などで用いられ、数値計算には適しませんが、属性ごとの比較には有用です。

質的データに関する学習用問題

次のうち、質的データの例として適切なものはどれですか？

1. 製品の重量 2. 従業員の名前 3. 売上の増加率

質的データの特徴として最も適切なものはどれですか？

1. 数値による計算が可能である 2. 必ず測定機器が必要である 3. カテゴリや属性の分類に適する

1次データ

1次データとは特定の目的のために自ら収集した生のデータです。アンケート結果や実験記録、観察データなどが含まれ、収集者が直接取得するため、精度と信頼性が高い特徴があります。

一方で、収集には手間とコストがかかります。

1次データに関する学習用問題

1次データの主な利点として適切なものはどれですか？

1. 収集コストが低い 2. 必要な情報を直接得られる 3. 常に公式機関から提供される

次のうち、1次データの例として最も適切なものはどれですか？

1. 独自に実施したアンケートの結果 2. 市販の統計データの購入 3. 図書館で見つけた研究論文

2次データ

2次データとは他者が収集・加工した既存のデータのことです。統計データ、企業の財務報告書、研究資料などが含まれ、収集コストが低い反面、目的に完全には合わない可能性があります。

必要な情報を素早く得られるため、初期の調査段階でよく活用されます。

2次データに関する学習用問題

次のうち、2次データの例として最も適切なものはどれですか？

1. 自社製品の販売実績データ 2. 顧客との面談結果のメモ 3. 政府が公表する統計資料

2次データの主な利点として最も適切なものはどれですか？

1. 常に最新の情報が得られる 2. 収集にかかる手間が少ない 3. 個別のニーズに完全に応えられる

メタデータ

メタデータとはデータの属性や構造に関する情報を表すデータです。ファイルの作成日時、著者名、ファイルサイズなどが該当します。データの管理や検索を効率化し、コンテンツの意味を明確にします。

たとえば、画像ファイルのメタデータには解像度や撮影日時が含まれ、データ利活用の基盤を支えます。

メタデータに関する学習用問題

メタデータの役割として最も適切なものはどれですか？

1. データそのものの内容を直接表す 2. データの属性や構造を記述する 3. データの処理結果を保存する

次のうち、メタデータに該当する情報はどれですか？

1. 写真の撮影日時 2. 写真に写っている風景の説明 3. 写真の画質の劣化具合

構造化データ

構造化データとは特定のフォーマットや規則に従って整理されたデータのことです。データベースの表形式データが代表例で、行と列で構成され、容易に検索・集計できます。

製品管理システムの在庫リストや顧客管理システムの顧客情報など、企業運営に欠かせないデータ形式です。

構造化データに関する学習用問題

構造化データの特徴として適切なものはどれですか？

1. 自由な形式で保存される 2. 表形式など決まった構造に従う 3. 様々な形式のメディアデータを含む

次のうち、構造化データの例として適切なものはどれですか？

1. 顧客のインタビュー音声記録 2. SNS投稿のテキスト内容 3. 製品在庫を管理するデータベースの表

非構造化データ

非構造化データとは決まった形式を持たず、データベースのような整理された形で保存されないデータのことです。テキスト、画像、音声、動画などが含まれ、ビッグデータ解析やAI処理で多く利用されます。

構造化データとは異なり、データの検索や管理には特別な処理が必要です。

非構造化データに関する学習用問題

非構造化データの例として最も適切なものはどれですか？

1. 商品在庫管理データベース 2. SNS投稿のテキスト内容 3. 売上記録の月次報告表

非構造化データの管理に必要な技術として適切なものはどれですか？

1. 関係データベース管理システム 2. テキストマイニングや画像認識技術 3. 表計算ソフト

時系列データ

時系列データとは時間の経過に伴って変化するデータを指します。株価の変動、気温の推移、センサーの記録データなどが含まれます。

時間の順序が重要で、トレンド分析、予測、異常検知などに広く活用されます。統計的手法や機械学習モデルを用いて分析されることが多いです。

時系列データに関する学習用問題

時系列データの特徴として適切なものはどれですか？

1. 特定の時間に依存しないデータ 2. 地理的な位置情報を含むデータ 3. 時間の順序に従って記録されるデータ

次のうち、時系列データの例として最も適切なものはどれですか？

1. 製品の型番リスト 2. 毎日の気温記録 3. 顧客の氏名一覧

クロスセクションデータ

クロスセクションデータとは特定の時点において、複数の対象に関するデータを収集したものです。例えば、ある年の国ごとのGDP、顧客ごとの購買履歴などが該当します。

時間の変化を追うのではなく、一時点での比較や分析に適しています。

クロスセクションデータに関する学習用問題

次のうち、クロスセクションデータの特徴として適切なものはどれですか？

1. 時間の推移に沿ってデータが記録される 2. 連続するデータが収集される 3. 特定の時点での多くの対象を比較する

次のうち、クロスセクションデータの例として最も適切なものはどれですか？

1. 毎月の売上推移 2. ある日付の各店舗の売上額一覧 3. 温度センサーの連続測定データ

データのサンプリング

データのサンプリングとは全体のデータ集合から一部を選び出す作業を指します。調査や分析に必要な範囲を効率的に把握するために行われ、ランダムサンプリング、層別サンプリングなどの手法があります。

適切なサンプリングにより、調査結果の信頼性が向上します。

データのサンプリングに関する学習用問題

データのサンプリングの目的として最も適切なものはどれですか？

1. 全データの内容をそのまま記録する 2. データのすべてを収集する必要を無くす 3. データの一部を抜き出して効率的に分析する

次のうち、適切なサンプリング手法として最も基本的なものはどれですか？

1. データの一部を無作為に抽出する 2. 偶然に選ばれたデータを除外する 3. データをすべて手作業で収集する

データの名寄せ

データの名寄せとは異なるデータソースから集めたデータを統合し、重複や不一致を解消する作業です。同一人物や同一企業に関するデータを一つにまとめることで、データの正確性や一貫性が向上します。

顧客管理システムやマーケティング施策で広く利用され、効果的なデータ活用に欠かせません。

データの名寄せに関する学習用問題

データの名寄せの目的として最も適切なものはどれですか？

1. データの一部をランダムに削除する 2. 重複データを統合し、データの整合性を高める 3. データのすべてを暗号化する

次のうち、データの名寄せが必要な場面として最も適切なものはどれですか？

1. 顧客の情報が異なるデータベース間で重複している場合 2. 機械の動作ログを記録する際 3. 天候データの予測を行う場合

データの外れ値・異常値・欠損値の処理

データの外れ値・異常値・欠損値の処理とは、データ分析において信頼性を向上させるための前処理です。

外れ値は通常の範囲から外れた値、異常値は明らかに誤った値、欠損値はデータが存在しない部分を指します。これらのデータは削除、補完、修正などの処理が行われます。

データの外れ値・異常値・欠損値の処理に関する学習用問題

データの外れ値処理において適切な方法はどれですか？

1. 外れ値をそのまま残して分析を進める 2. すべてのデータをランダムに変更する 3. 明らかに不自然な値を除去する

次のうち、データの欠損値処理の例として適切なものはどれですか？

1. 欠損値をすべて0にする 2. 欠損値の行全体を削除する 3. 欠損値の存在を無視する

アノテーション

アノテーションとはデータに対して補足情報やラベルを付ける作業です。画像認識、テキスト分析、音声認識などの分野で、AIモデルの学習用データを作成する際に重要な工程です。

ラベル付けの精度がAIモデルの性能に大きく影響します。

アノテーションに関する学習用問題

アノテーションの主な目的として最も適切なものはどれですか？

1. データに意味付けやラベルを追加する 2. データの保存形式を変更する 3. データのセキュリティを強化する

次のうち、アノテーションが必要な場面として最も適切なものはどれですか？

1. ネットワークの接続速度を計測する場合 2. AIモデルに画像認識のデータを提供する場合 3. 統計データの平均値を求める場合

データの季節調整・移動平均

データの季節調整とは特定の時期に発生する周期的な変動要因を除去する統計処理です。販売データや気温データなどに用いられ、長期的な傾向を明確にする目的があります。

一方、移動平均はデータの変動を滑らかにする方法で、一定期間の平均値を算出して変動のトレンドを捉えます。

データの季節調整・移動平均に関する学習用問題

データの季節調整を行う主な目的として適切なものはどれですか？

1. データのすべてを削除する 2. 短期的な変動要因を強調する 3. 一定の周期で発生する変動を取り除く

移動平均の利点として最も適切なものはどれですか？

1. データの詳細な変動を見つけやすくする 2. データの変動を滑らかにし、トレンドを捉えやすくする 3. データの標準偏差を計算する

アンケート結果の概要はこちら

全ページ一覧

ITパスポート試験シラバス6.3を全面網羅した分類一覧です。体系的に全体を俯瞰しながら学習することで頭の中に知識の地図を作っていきましょう。

カテゴリ		内容

◆ストラテジ系◆

1.経営・組織論
		(1) 企業活動と経営資源 – 1
		(1) 企業活動と経営資源 – 2
		➀ 経営管理とは
		② ヒューマンリソースマネジメント – 1
		② ヒューマンリソースマネジメント – 2
		(3) 経営組織
		① ITの進展とそれに伴う社会の変化
		② 企業活動及び社会生活における IT 利活用の動向
2.業務分析・データ利活用
		(1) 業務の把握
		① 業務分析手法
		② 図表，グラフによるデータ可視化
		② 図表，グラフによるデータ可視化 – 2
		① データの種類及び前処理
		② データ分析における統計情報の活用
		③ データサイエンス，ビッグデータ分析
		(4) 意思決定
		(5) 問題解決手法
3.会計・財務
		① 売上と利益の関係
		② 財務諸表の種類と役割
		③ その他税関連
4.知的財産権
		4.知的財産権
		(4) ソフトウェアライセンス
5.セキュリティ関連法規
		5.セキュリティ関連法規
6.労働関連・取引関連法規
		(1) 労働関連法規
		(2) 取引関連法規
7.その他の法律・ガイドライン・情報倫理
		(1) コンプライアンス
		(2) 情報倫理
		(3) コーポレートガバナンス
8.標準化関連
		8.標準化関連
		(3) 標準化団体と規格
9.経営戦略手法
		(1) 経営情報分析手法
		(2) 経営戦略に関する用語 – 1
		(2) 経営戦略に関する用語 – 2
10.マーケティング
		(1) マーケティングの基礎 – 1
		(1) マーケティングの基礎 – 2
		(2) マーケティング手法
		(3) Web マーケティング
		(4) 価格設定手法
11.ビジネス戦略と目標・評価
		11.ビジネス戦略と目標・評価
12.経営管理システム
		12.経営管理システム
13.技術開発戦略の立案・技術開発計画
		13.技術開発戦略の立案・技術開発計画 – 1
		13.技術開発戦略の立案・技術開発計画 2
14.ビジネスシステム
		(1) 代表的なビジネス分野におけるシステム
		(2) 行政分野におけるシステム
		(3) 代表的なソフトウェアパッケージ
		① AI 利活用の原則及び指針
		② AI の活用領域及び活用目的
		③ AI を利活用する上での留意事項
15.エンジニアリングシステム
		15.エンジニアリングシステム
16.e-ビジネス
		① 電子商取引の特徴
		② 電子商取引の分類 ③ 電子商取引の利用
		(2) 電子商取引の留意点
17.IoTシステム・組込みシステム
		(1) IoTを利用したシステム – 1
		(1) IoTを利用したシステム – 2
		(2) 組込みシステム
18.情報システム戦略
		18.情報システム戦略
19.業務プロセス
		19.業務プロセス
		(2) 業務改善及び問題解決
		① システム化による業務効率化
		② コミュニケーションのためのシステム利用
20.ソリューションビジネス
		20.ソリューションビジネス
21.システム活用促進・評価
		21.システム活用促進・評価
22.システム化計画
		22.システム化計画
23.要件定義
		23.要件定義
24.調達計画・実施
		24.調達計画・実施

◆マネジメント系◆

25.システム開発技術
		(1) システム開発のプロセス
		(1) システム開発のプロセス – 2
		(2) ソフトウェアの見積り
26.開発プロセス・手法
		(1) 主なソフトウェア開発手法
		(2) 主なソフトウェア開発モデル
		(3) アジャイル
		(4) 開発プロセスに関するフレームワーク
27.プロジェクトマネジメント
		27.プロジェクトマネジメント
28.サービスマネジメント
		28.サービスマネジメント
29.サービスマネジメントシステム
		(1) サービスマネジメントシステムの概要
		(1) サービスマネジメントシステムの概要 – 2
		(2) サービスデスク（ヘルプデスク）
30.ファシリティマネジメント
		30.ファシリティマネジメント
31.システム監査
		(1) 監査業務
		(2) システム監査
32.内部統制
		32.内部統制

◆テクノロジ系◆

33.離散数学
		(3) 論理演算
34.応用数学
		② 統計の概要
		(2) 数値計算，数値解析，数式処理
		(3) グラフ理論
35.情報に関する理論
		(3) 文字の表現
		(4) 論理的な記述
		(5) AI（Artificial Intelligence：人工知能）の技術
36.データ構造
		(1) データ及びデータ構造
37.アルゴリズムとプログラミング
		(2) アルゴリズムの表現方法
		(3) 代表的なアルゴリズム
38.プログラム言語
		(1) プログラム言語
		(2) コーディング標準やプログラム構造
39.その他の言語
		(1) マークアップ言語
40.プロセッサ
		(1) コンピュータの構成
		(2) プロセッサの基本的な仕組み
41.メモリ
		(1) メモリの種類と特徴
		(3) 記憶階層
42.入出力デバイス
		(1) 入出力インタフェース
		(2) IoT デバイス
43.システムの構成
		(1) 処理形態
		(2) システム構成
		(3) 利用形態
44.システムの評価指標
		(1) システムの性能
		(2) システムの信頼性
		(3) システムの経済性
46.ファイルシステム
		(1) ファイル管理
48.オープンソースソフトウェア
		(1) オープンソースソフトウェア
49.ハードウェア(コンピュータ・入出力装置)
		49.ハードウェア(コンピュータ・入出力装置)
50.情報デザイン
		(1) 情報デザインの考え方や手法
		(2) ユニバーサルデザイン
51.インタフェース設計
		(1) ヒューマンインタフェース
		(2) GUI
		(4) Web デザイン
52.マルチメディア技術
		(1) マルチメディア
		(2) 音声処理
		(3) 静止画処理
		(4) 動画処理
		(5) 情報の圧縮と伸張
53.マルチメディア応用
		(1) グラフィックス処理
		(2) マルチメディア技術の応用
54.データベース方式
		(2) データベース管理システム
55.データベース設計
		(1) データ分析
		(2) データの設計
57.トランザクション処理
		(1) 同時実行制御（排他制御）
		(2) 障害回復
58.ネットワーク方式
		(2) ネットワークの構成要素 – 1
		(2) ネットワークの構成要素 – 2
		(3) IoT ネットワークの構成要素
59.通信プロトコル
		① OSI 基本参照モデル
		② TCP/IP 階層モデル
		(2) 通信プロトコル
60.ネットワーク応用
		(1) インターネットの仕組み
		(2) インターネットサービス
		(3) 通信サービス – 1
		(3) 通信サービス – 2
61.情報セキュリティ
		(1) 情報セキュリティの概念
		① 人的脅威の種類と特徴
		② 技術的脅威の種類と特徴
		④ 脆弱性
		(4) 攻撃手法 – 1
		(4) 攻撃手法 – 2
		(4) 攻撃手法 – 3
62.情報セキュリティ管理
		(1) リスクマネジメント
		(2) 情報セキュリティ管理
		(3) 個人情報保護
		(4) 情報セキュリティ組織・機関
		(5) 各種の基準・ガイドライン
63.情報セキュリティ対策・情報セキュリティ実装技術
		① 人的セキュリティ対策
		② 技術的セキュリティ対策
		③ 物理的セキュリティ対策
		(2) 暗号技術
		(3) 認証技術
		(4) 利用者認証
		(5) 生体認証（バイオメトリクス認証）
		(6) 公開鍵基盤
		(7) アプリケーションソフトウェア・IoT システムのセキュリティ