データベーススペシャリスト試験対策テキスト＆問題集

本書の特徴と使い方

データベーススペシャリスト試験の合格を目指す皆様へ。本書は、データベーススペシャリスト試験の広範な出題範囲を網羅し、初心者の方から経験者の方まで、誰もが理解できるように丁寧かつ詳細に解説することを目的としています。複雑な概念も、平易な言葉と豊富な図表（Mermaid形式含む）を用いて視覚的に分かりやすく説明しています。

本書が目指すもの

完全網羅: ダイジェストではなく、試験範囲の全てを詳細に解説します。
分かりやすさ: 「サルでも合格できるように」を目標に、専門用語も噛み砕いて説明します。
実践的アプローチ: 午後試験対策に重点を置き、実際の業務シナリオに即した考え方を養います。
問題演習: 各章の終わりには、理解度を確認するための豊富な問題を用意しました。

本書の使い方

目次で全体像を把握: まずは本書の目次をざっと眺め、試験範囲全体の構造を把握してください。
各章のテキストを熟読: 各章のテキストを丁寧に読み込み、基本的な知識と概念を理解してください。Mermaid形式の図は、視覚的な理解を深めるのに役立ちます。
問題集で理解度をチェック: 各章のテキストを読み終えたら、対応する問題集に挑戦してください。解答だけでなく、解説もしっかりと読み込み、なぜその答えになるのか、関連する知識は何かを深掘りしてください。
午後試験対策の章を活用: 第4章と第5章は午後試験対策に特化しています。実際の試験でどのように知識を応用すべきか、解答のテクニックをここで学びましょう。
業務知識で実践力を養う: 第6章の業務知識は、午後Ⅱ問題で求められる業務理解力とデータモデリング能力の基礎となります。実際の業務をデータモデルとしてどう表現するかを学び、実践的な力を養いましょう。
繰り返し学習: 一度で全てを完璧にする必要はありません。理解が及ばない部分は、何度も読み返し、問題集を繰り返し解くことで、着実に実力をつけていきましょう。

本書が、皆様のデータベーススペシャリスト試験合格への強力な一助となることを願っています。

データベーススペシャリスト試験対策テキスト＆問題集
- 本書の特徴と使い方
  - 本書が目指すもの
  - 本書の使い方
- 目次
第0章受験のススメ
第1章 SQL
第1章 SQL 問題集 (20問)
第2章 DBMS
第2章 DBMS 問題集 (20問)
第3章設計
- 3.1 概念設計
- 3.2 論理設計
第3章設計問題集 (20問)
第4章午後試験対策物理設計
第4章午後試験対策物理設計問題集 (20問)
第5章午後試験対策論理設計
第5章午後試験対策論理設計問題集 (20問)
第6章業務知識
- 6.1 販売管理
- 6.2 生産管理
第6章業務知識問題集 (20問)

第0章受験のススメ

0.1 試験の概要

0.1.1 データベーススペシャリスト試験とは

データベーススペシャリスト試験（DB）は、情報処理推進機構（IPA）が実施する情報処理技術者試験の一つであり、高度情報処理技術者試験に分類されます。この試験は、企業活動における大量のデータを効率的かつ安全に管理・活用するための、データベースに関する専門知識とスキルを問うものです。

試験の目的と対象者

この試験は、データベースに関する深い知識と実践的な能力を持つ人材を育成し、評価することを目的としています。具体的には、以下のような役割を担う方を主な対象としています。

データベース管理者（DBA）: データベースシステムの設計、構築、運用、保守、セキュリティ管理などを行う専門家。
データベース設計者: 業務要件に基づき、最適なデータベース構造（論理設計、物理設計）を策定する専門家。
システムアーキテクト: システム全体の設計において、データベースとの連携やデータ活用戦略を策定する専門家。

現代のビジネスにおいて、データは「石油に代わる21世紀の資源」とも言われるほど重要性が増しています。データベーススペシャリストは、この重要なデータを適切に扱い、企業の競争力向上に貢献する、まさになくてはならない存在です。

試験のレベルと位置づけ

情報処理技術者試験の中では、最高レベルのスキルを認定する「高度試験」の一つに位置づけられています。基本情報技術者試験や応用情報技術者試験で問われる基礎的な知識に加え、より専門的で実践的な知識、そして問題解決能力が求められます。

具体的には、リレーショナルデータベース（RDB）の概念から、SQL、トランザクション処理、正規化、データモデリング、パフォーマンスチューニング、障害回復、セキュリティ、最新のデータベース技術（NoSQL、分散データベースなど）に至るまで、幅広い分野からの出題があります。

この資格を取得することで、データベースに関する深い専門知識と、それを実務に適用できる高度なスキルを持っていることを客観的に証明できます。これにより、IT業界でのキャリアアップや専門家としての信頼性向上に大きく寄与するでしょう。

0.1.2 試験の詳細

データベーススペシャリスト試験は、年に1回、通常は秋期（10月の第3日曜日）に実施されます。試験は4つの区分に分かれており、1日で全ての試験を受験します。

graph TD
    subgraph "試験全体"
        A["午前Ⅰ"] --> B["午前Ⅱ"] --> C["午後Ⅰ"] --> D["午後Ⅱ"]
    end

    style A fill:#f9f,stroke:#333,stroke-width:2px
    style B fill:#f9f,stroke:#333,stroke-width:2px
    style C fill:#ccf,stroke:#333,stroke-width:2px
    style D fill:#ccf,stroke:#333,stroke-width:2px

各試験区分の概要

試験区分	試験時間	出題形式	出題数	解答数	基準点
午前Ⅰ	50分	多肢選択式（4択）	30問	30問	60点/100点
午前Ⅱ	40分	多肢選択式（4択）	25問	25問	60点/100点
午後Ⅰ	90分	記述式	3問	2問	60点/100点
午後Ⅱ	120分	記述式	2問	1問	60点/100点

合格基準（ノックダウン方式）

この試験の最大の特徴は「ノックダウン方式」が採用されている点です。これは、いずれかの試験区分で基準点（60点）に満たない場合、その時点で不合格となる厳しい採点方式です。

例えば、午前Ⅰで58点を取ってしまった場合、その後の午前Ⅱ、午後Ⅰ、午後Ⅱがたとえ満点であっても採点されることなく不合格となります。全ての試験区分で、安定して6割以上の得点を取る実力が求められます。

graph LR
    Start("受験開始") --> AM1{"午前Ⅰ"};
    AM1 -- "基準点以上" --> AM2{"午前Ⅱ"};
    AM1 -- "基準点未満" --> Fail("不合格");
    AM2 -- "基準点以上" --> PM1{"午後Ⅰ"};
    AM2 -- "基準点未満" --> Fail;
    PM1 -- "基準点以上" --> PM2{"午後Ⅱ"};
    PM1 -- "基準点未満" --> Fail;
    PM2 -- "基準点以上" --> Pass("最終合格");
    PM2 -- "基準点未満" --> Fail;

    style Fail fill:#fdd,stroke:#f00
    style Pass fill:#ddf,stroke:#00f

午前Ⅰ試験の免除制度

以下のいずれかの条件を満たすことで、その後2年間、午前Ⅰ試験が免除されます。

応用情報技術者試験（AP）に合格する。
いずれかの高度情報処理技術者試験（DBを含む）に合格する。
いずれかの高度情報処理技術者試験の午前Ⅰ試験で基準点以上（60点以上）の成績を修める。

多くの受験者はこの免除制度を活用し、専門分野である午前Ⅱと午後試験の対策に集中します。

0.2 学習の計画

データベーススペシャリスト試験の合格を勝ち取るためには、戦略的な学習計画が不可欠です。特に、各試験区分で基準点を超える必要がある「ノックダウン方式」を意識し、バランスの取れた学習を心がける必要があります。

学習期間は、個人の経験や知識レベルによって異なりますが、一般的には3ヶ月〜6ヶ月が目安とされています。

6ヶ月前から: データベースの基礎知識に不安がある場合。まずは応用情報技術者試験レベルの知識を固める。
3ヶ月前から: データベースに関する実務経験や基礎知識が十分にある場合。過去問演習を中心に学習を進める。

本セクションでは、各試験区分に応じた具体的な学習計画を提案します。

0.2.1 午前Ⅰ試験の学習計画

対象者: 午前Ⅰ試験の免除資格がない、または免除期間が切れてしまった方。

学習の要点: 「広く浅く」、そして**「過去問至上主義」**で乗り切ること。

午前Ⅰ試験は、全ての高度試験で共通して出題されるIT全般の知識を問う試験です。テクノロジ系、マネジメント系、ストラテジ系と範囲が非常に広く、全ての分野を完璧に理解しようとすると時間がいくらあっても足りません。

幸いなことに、午前Ⅰ試験は過去に出題された問題が形を変えて繰り返し出題される傾向が非常に強いです。そのため、最も効率的な対策は過去問演習に尽きます。

具体的な学習ステップ:

直近5年分の過去問を入手する: IPAの公式サイトや、Web上の学習サイト（通称「過去問道場」など）を活用しましょう。
時間を計らずに1回分解いてみる: まずは自分の現在地を把握します。何割くらい解けるか、どの分野が苦手かを確認します。
間違えた問題と、正解したが自信がなかった問題を徹底的に復習する:
- なぜその選択肢が正解なのか、他の選択肢はなぜ不正解なのかを理解します。
- 解説を読んでも理解できない用語は、Webで検索して概要を掴みます。深追いは禁物です。「この単語はこういう意味か」と分かる程度で十分です。
2〜3を繰り返す: 複数の年度の過去問を解くうちに、頻出の問題や分野が見えてきます。
試験直前は、何度も間違える問題だけをまとめたノートを見返す: 最終的には、コンスタントに7割〜8割の正答率を達成できる状態を目指します。

午前Ⅰ試験は、あくまで午前Ⅱ以降の専門試験に進むための「通行手形」です。完璧を目指さず、効率的に60点の壁を突破することだけを考えて学習を進めましょう。

0.2.2 午前Ⅱ試験の学習計画

学習の要点: 「狭く深く」、そして**「理屈を自分の言葉で説明できるレベル」**を目指すこと。

午前Ⅱ試験は、データベーススペシャリストとしての専門知識が問われる、この試験の核となる部分です。出題範囲はデータベース技術に特化しており、ここでの知識が午後試験の土台となります。午前Ⅰとは対照的に、単なる暗記ではなく、各技術や概念の本質的な理解が求められます。

重点学習分野:

SQL: SELECT文の高度な使い方、GROUP BY, HAVING, 副問合せ、結合、ウィンドウ関数など。
DBMSのアーキテクチャ: トランザクション管理（ACID特性）、同時実行制御（排他制御、MVCC）、障害回復（ログ、チェックポイント）、索引（B+木など）。
データベース設計: 正規化（第1〜第3、ボイスコッド）、関数従属性、E-R図。
パフォーマンス: 実行計画の読み方、索引の効果的な使い方、統計情報。
セキュリティ: GRANT/REVOKE、SQLインジェクション対策。

具体的な学習ステップ:

体系的な知識のインプット:
- まずは本書のような参考書を1冊通読し、データベース技術の全体像と各技術要素のつながりを把握します。
- 特に、正規化やトランザクション管理などの概念は、図を描いたり、自分で具体例を作ったりしながら、人に説明できるレベルまで理解を深めることが重要です。
過去問演習と徹底的な復習:
- 午前Ⅰと同様に過去問演習が中心となりますが、取り組み方が異なります。
- 正解の選択肢を選ぶだけでなく、他の選択肢がなぜ不正解なのかを明確に説明できるようになることを目指します。
- 例えば、「この状況で悲観的ロックではなく楽観的ロックが適しているのはなぜか？」といった問いに、自分の言葉で答えられるように訓練します。
- 計算問題（例：I/O回数の見積もりなど）は、必ず自力で最後まで計算し、プロセスを理解します。
苦手分野の特定と克服:
- 過去問を複数年分解くと、自分の苦手な分野（例：分散データベース、SQLの特定構文など）が明らかになります。
- 苦手分野については、参考書に戻って該当箇所を熟読したり、Webで専門的な解説記事を探したりして、集中的に補強します。

午前Ⅱで高得点（目標は8割以上）を安定して取れるようになれば、午後試験を解くための強固な基礎知識が身についた証拠です。焦らずじっくりと、一つ一つの概念を自分のものにしていきましょう。

0.2.3 午後試験の学習計画

学習の要点: 「国語力と論理的思考力」 を駆使し、**「問題文に隠されたヒントを読み解く」**訓練を積むこと。

午後試験は、データベーススペシャリスト試験の天王山です。膨大な問題文の中から、要件、制約、課題を正確に読み取り、午前Ⅱで培った知識を応用して、記述式で解答する総合力が問われます。知識があるだけでは合格できません。

午後試験の出題傾向:

午後Ⅰ (3問中2問選択): 物理設計、パフォーマンスチューニング、SQLの最適化、トランザクション設計など、技術的な側面が強い問題が多い。
午後Ⅱ (2問中1問選択): 業務要件の分析から概念データモデル（E-R図）を作成し、関係スキーマに落とし込む、論理設計が中心の問題が多い。

具体的な学習ステップ（5段階演習法）:

【第1段階】時間を計って解く（シミュレーション）
- まずは本番と同じ時間（午後Ⅰ: 1問あたり45分、午後Ⅱ: 120分）で過去問に挑戦します。
- 目的は、時間内に問題を解き切ることの難しさ、どの部分に時間がかかるのかを体感することです。現時点では6割解けなくても全く問題ありません。
【第2段階】時間無制限で解き直す（熟考）
- 次に、時間を気にせず、参考書やWebを参照しながら、もう一度じっくりと問題を解き直します。
- 問題文の全ての文章、全ての図に意味があると考え、マーカーを引いたり、図の関連性をメモしたりしながら、隅々まで読み込みます。
- 「この一文は何を意図しているのか？」「この制約は何のためのものか？」と考え抜くプロセスが非常に重要です。
【第3段階】解答例との比較・分析（ギャップ分析）
- 自分の解答と、IPAが公開している公式の解答例や市販の解説書を徹底的に比較します。
- ここが最も重要です。 以下の観点で分析しましょう。
  - キーワード: 模範解答に含まれているが、自分の解答にない「キーワード」は何か？
  - 論理展開: 模範解答はどのような論理でその結論に至っているか？
  - 問題文の根拠: 模範解答の根拠は、問題文のどの部分に対応しているか？
- なぜ間違えたのか、なぜ解答が浅かったのかを言語化し、「気づきノート」として記録しておきましょう。
【第4段階】知識の再インプット（知識補強）
- ギャップ分析で見つかった知識不足の分野（例：特定のSQL構文、正規化の考え方など）を、本書の該当箇所に戻って復習します。
- 必要であれば、午前Ⅱの過去問に戻って関連問題を解き直すのも効果的です。
【第5段階】要約と再説明（定着）
- 最後に、その問題の「肝」は何だったのか、どのような知識があれば解けたのかを、自分の言葉で要約します。
- これを複数の過去問で繰り返すことで、問題の「型（パターン）」が見えるようになり、初見の問題にも対応できる応用力が身についていきます。

この5段階のプロセスを最低でも5年分の過去問に対して行えば、合格は目前です。時間はかかりますが、最も着実に実力がつく方法です。

0.3 解答のテクニック

知識を蓄え、過去問演習を積んでも、試験本番で実力を100%発揮できなければ意味がありません。ここでは、限られた時間の中で1点でも多く得点するための、実践的な解答テクニックを紹介します。

0.3.1 午前試験の解答テクニック

午前Ⅰ・午前Ⅱは、1問あたり約1分半で解答する必要があるスピード勝負です。迷いを断ち切り、効率的に解答を進めるテクニックを身につけましょう。

時間配分を厳守する
- **「1問2分以上かけない」**と心に決めておきましょう。
- 少しでも迷う問題、知らない用語が出てきた問題は、深く考え込まずにチェックマークを付けて次の問題に進む「勇気ある撤退」が重要です。
- 全ての問題を解き終えてから、残った時間でチェックした問題に戻りましょう。焦って1問に時間をかけるよりも、解ける問題を確実に拾う方が得策です。
消去法を徹底活用する
- 4つの選択肢の中から「絶対的に正しいもの」を一つ見つけるのは難しい場合があります。
- 逆に、**「絶対に間違っているもの」**を見つけて消していく方が、正解にたどり着きやすいことが多いです。
- 例えば、「〜は常に有効である」といった極端な表現や、「〜とは関係ない」といった断定的な表現は、不正解である可能性が高いです。
- 2つまで選択肢を絞り込めれば、正答率は50%になります。自信がなくても、空欄にするより遥かに良い結果が期待できます。
問題文のキーワードに注目する
- 問題文中の「〜でないものはどれか」「〜として不適切なものはどれか」といった否定形の問いには、大きく印を付けて見落としを防ぎましょう。焦っていると、つい「適切なもの」を選んでしまいがちです。
- 計算問題では、単位（ビット、バイト、秒、ミリ秒など）に注意しましょう。選択肢が巧妙に単位違いで用意されていることがあります。
常識で判断する
- 特に午前Ⅰのマネジメント系やストラテジ系の問題では、ITの専門知識がなくとも、一般的なビジネス常識で考えれば明らかに不自然な選択肢が見つかることがあります。
- 「担当者の独断で決定する」「利用者の意見は聞かない」といった選択肢は、常識的に考えて不正解の可能性が高いです。
迷ったら最初の直感を信じる
- 一通り解き終わり、見直しの時間になった際に、迷った問題の答えを安易に変更するのは危険です。
- 最初の直感が正しかった、というケースは統計的にも多いと言われています。明確な間違いに気づいた場合を除き、最初の答えを尊重しましょう。

0.3.2 午後試験の解答テクニック

午後試験の鉄則はただ一つ、**「答えは全て問題文の中にある」**です。自分の経験や知識だけで暴走せず、問題文という地図を正確に読み解くテクニックを身につけましょう。

最初の10分で問題を選び、戦略を立てる
- 問題選択が合否を分けると言っても過言ではありません。
- 午後Ⅰ（90分）・午後Ⅱ（120分）の開始後、まず5〜10分を使って全ての問題にざっと目を通します。
- 選択基準:
  - 得意なテーマか: 論理設計（E-R図）か、物理設計（性能改善）か、SQLか。
  - 読みやすいか: 問題の舞台設定（業務内容）がイメージしやすいか。
  - 設問の難易度: 設問を軽く見て、答えの筋道が見えやすいか。
- 解く問題を決めたら、午後Ⅰであれば残り時間を2等分（1問約40分）、午後Ⅱは残り時間全て（約110分）をその問題に投下する、という時間配分を最初に決めます。
問題文は「多色ボールペンで書き込みながら」読む
- ただ目で追うだけでは、膨大な情報を見落とします。手を動かし、問題文を自分だけの設計書に変えましょう。
- 色分けの例:
  - 赤: 制約条件、ルール（例：「〜は必須」「〜はできない」）
  - 青: 性能要件、課題（例：「〜の応答時間を1秒以内に」）
  - 緑: データ項目、エンティティ名、属性名
  - 下線: 設問で直接問われている部分
- 図や表にも、エンティティ間の関連やデータの流れを矢印で書き込むなど、積極的に情報を追加します。
設問を先に読み、解答の「型」を意識する
- 問題文を熟読する前に設問に目を通すことで、「何を探しながら読めば良いか」という目的意識を持って読解できます。
- 解答の型:
  - 「なぜか」: 「〜だから。」「〜という問題があるから。」（理由）
  - 「何をすべきか」: 「〜を〜する。」（具体的な操作・変更）
  - 「何字以内で述べよ」: まずキーワードを列挙し、それらを指定文字数内で繋ぎ合わせる作文を行う。
  - SQLの穴埋め: 前後の構文をヒントに、WHERE句の条件、JOINのキー、GROUP BYの列などを特定する。
解答は「聞かれたことに」「過不足なく」答える
- 問われていること以上のことを書いてはいけません。 例えば「追加すべき制約名を答えよ」と聞かれているのに、その理由まで長々と書く必要はありません（加点対象にならないばかりか、時間と解答欄の無駄です）。
- 逆に、「〜の理由を述べよ」とあれば、必ず「〜だから。」という形式で締めくくるなど、設問の要求に100%応えることを意識します。
- 困ったら問題文の言葉を借りる。優れた解答は、問題文中の言葉や表現をうまく使って構成されています。オリジナリティは不要です。
部分点を確実に取りにいく
- 満点を狙う必要はありません。6割の得点を目指す試験です。
- 難しい設問に時間を溶かすくらいなら、確実に答えられる設問に時間を使い、丁寧な解答を心がけましょう。
- 全く分からなくても、諦めて空欄にするのは最悪の選択です。問題文のどこかにヒントがあるはずです。関連しそうなキーワードだけでも書いておけば、部分点がもらえる可能性がゼロではありません。

0.4 日々の勉強のアドバイス

長期間にわたる試験勉強は、知識だけでなく、モチベーションの維持や学習の習慣化が同じくらい重要になります。最後に、合格まで走り抜くための心構えをいくつか紹介します。

学習を「習慣」にする
- 週末にまとめて8時間勉強するより、毎日30分でも学習を続ける方が、知識は定着しやすくなります。
- **「スキマ時間」**を最大限に活用しましょう。通勤電車の中、昼休み、寝る前の15分など、スマートフォンで午前問題の過去問を解いたり、暗記カードを見返したりするだけで、大きな差が生まれます。
- 「朝起きたらまず10問解く」「夕食後に30分参考書を読む」など、生活リズムの中に学習を組み込んでしまうのが理想です。
仕事や実務と結びつけて考える
- 学習した内容を、机上の知識で終わらせないようにしましょう。
- 例えば、「正規化」を学んだら、職場のデータベース設計を見直してみる。「索引」を学んだら、自分が使っているシステムのクエリがなぜ遅いのか、実行計画を想像してみる。
- こうすることで、学習内容が単なる暗記ではなく、**「使えるスキル」**として血肉になり、記憶にも強く残ります。
モチベーションを管理する
- 合格を公言する: 家族や同僚、友人に「データベーススペシャリスト試験を受ける」と宣言してみましょう。適度なプレッシャーが、学習を続ける力になります。
- SNSを活用する: X（旧Twitter）などで、「#データベーススペシャリスト試験」といったハッシュタグを検索すると、多くの仲間が学習に励んでいる様子がわかります。孤独な戦いではないと感じることができ、良い刺激になります。
- 学習記録をつける: 手帳やカレンダーに、勉強した時間を記録していきましょう。学習の成果が可視化されることで、達成感が得られ、モチベーションに繋がります。
- 完璧を目指さない: 勉強ができない日があっても、自分を責めないでください。燃え尽きてしまうのが一番の敵です。休むことも大切な学習の一環です。
体調管理も重要な試験対策
- 試験は、数ヶ月にわたる準備期間と、当日の長丁場を乗り切るための体力も必要です。
- 特に試験直前期は、一夜漬けのような無茶はせず、十分な睡眠時間を確保することを最優先してください。睡眠不足の脳では、持っている力の半分も発揮できません。
- 試験当日は、エネルギーに変換されやすい朝食をとり、長時間の休憩時間でリフレッシュできるような軽食や飲み物を持参すると良いでしょう。

さあ、準備は整いました。次の章から、データベーススペシャリストになるための本格的な知識を学んでいきましょう！

第1章 SQL

1.1 テーブル作成

データベースにおけるテーブル作成は、データを格納するための「箱」の設計図を作る作業に例えられます。どのような種類のデータを、どのように整理して格納するかを定義する、データベース設計の基礎となる重要なステップです。

SQL（Structured Query Language）におけるテーブル作成は、DDL（Data Definition Language: データ定義言語）の一つであるCREATE TABLE文を用いて行います。

テーブルを作成する際には、以下の要素を定義します。

テーブル名: 作成するテーブルの名前
カラム（列）名: テーブルが持つ各項目の名前
データ型: 各カラムに格納できるデータの種類（数値、文字列、日付など）
制約: 各カラムやテーブル全体に適用されるルール（重複禁止、NULL不可など）

1.1.1 データ型

データ型は、テーブルのカラムに格納できるデータの種類を定義するものです。適切なデータ型を選択することは、データの整合性を保ち、記憶領域を効率的に使用し、クエリのパフォーマンスを向上させる上で非常に重要です。

以下に代表的なデータ型とその特徴を説明します。データベースシステム（DBMS）によって、利用できるデータ型やその名称、詳細な挙動には違いがありますが、基本的な考え方は共通しています。

1. 文字列型 (Character String Types)

CHAR(n): 固定長文字列。nバイト（または文字）の固定長でデータを格納します。指定した長さより短い文字列を格納しても、残りの領域は空白で埋められます。例：CHAR(10)
VARCHAR(n) / VARCHAR2(n): 可変長文字列。nバイト（または文字）までの可変長でデータを格納します。指定した長さより短い文字列を格納した場合、実際に格納されたデータ長に応じた領域のみを使用します。一般的にこちらが推奨されます。例：VARCHAR(255)
TEXT / CLOB: 大容量のテキストデータを格納する場合に利用します。記事の本文やコメントなど、長さが不定で非常に長い文字列に適しています。

2. 数値型 (Numeric Types)

INT / INTEGER: 整数値を格納します。多くのDBMSで符号付き32ビット整数を指しますが、範囲はDBMSに依存します。例：INT
SMALLINT: INTよりも小さい範囲の整数値を格納します。
BIGINT: INTよりも大きい範囲の整数値を格納します。
DECIMAL(p, s) / NUMERIC(p, s): 固定小数点数を格納します。pは桁数（精度）、sは小数点以下の桁数を指定し、正確な計算が求められる通貨や金銭データなどに使用されます。例：DECIMAL(10, 2)（全体で10桁、小数点以下2桁）
FLOAT / REAL / DOUBLE PRECISION: 浮動小数点数を格納します。概数として扱われるため、厳密な精度が不要な科学技術計算などに使用されます。

3. 日付/時間型 (Date/Time Types)

DATE: 日付（年、月、日）のみを格納します。例：'2026-02-23'
TIME: 時間（時、分、秒）のみを格納します。例：'10:30:00'
DATETIME: 日付と時間（年、月、日、時、分、秒）を格納します。
TIMESTAMP: DATETIMEと同様に日付と時間を格納しますが、多くのDBMSではタイムゾーン情報や更新日時自動記録などの機能を持つ場合があります。

4. 真偽値型 (Boolean Types)

BOOLEAN: 真（TRUE）または偽（FALSE）のいずれかの値を格納します。DBMSによっては、TRUEを1、FALSEを0としてTINYINTなどで代用する場合もあります。

テーブル作成例

以下は、様々なデータ型を用いた簡単なテーブル作成の例です。

CREATE TABLE Products (
    product_id   INT PRIMARY KEY,              -- 製品ID (整数、主キー)
    product_name VARCHAR(100) NOT NULL,        -- 製品名 (可変長文字列、NULL不許可)
    price        DECIMAL(10, 2),               -- 価格 (固定小数点数)
    stock_quantity INT DEFAULT 0,              -- 在庫数 (整数、デフォルト値0)
    release_date DATE,                         -- 発売日 (日付)
    is_available BOOLEAN                       -- 販売中かどうか (真偽値)
);

1.1.2 NULL

データベースにおけるNULLは、**「値が存在しない」「不明である」「適用できない」**といった状態を表す特殊な値です。数値の0や空文字''、または真偽値のFALSEとは明確に異なります。NULLは「未定義」の状態を示すものであり、データが存在しないことそのものを意味します。

NULLの特性

NULLが絡む演算や比較は、一般的な値とは異なる振る舞いをします。この特性を理解していないと、意図しないクエリ結果を招く可能性があるため、注意が必要です。

算術演算: NULLを含む算術演算（+, -, *, /など）の結果は、常にNULLとなります。
```
-- 例: 5 + NULL は NULL となる
SELECT 5 + NULL;
```
これは、「不明な値に何かを加えても、結果はやはり不明である」という考え方に基づきます。
比較演算: NULLと他の値を=や!=（または<>）、<、>などの比較演算子で比較した場合、結果は真（TRUE）でも偽（FALSE）でもなく、UNKNOWN（不明）となります。
```
-- 例: 1 = NULL や 'A' = NULL は UNKNOWN となる
SELECT product_name FROM Products WHERE price = NULL; -- 意図した結果にならない
```
WHERE句でUNKNOWNと評価された行は、結果セットに含まれません。このため、WHERE price = NULLという条件では、priceがNULLの行は取得できません。

NULL値の検索方法 (`IS NULL`, `IS NOT NULL`)

NULLを正しく検索するためには、専用の演算子IS NULLまたはIS NOT NULLを使用します。

IS NULL: そのカラムの値がNULLである行を検索します。
IS NOT NULL: そのカラムの値がNULLではない行を検索します。

-- priceがNULLの製品を検索
SELECT product_name, price FROM Products WHERE price IS NULL;

-- priceがNULLではない製品を検索
SELECT product_name, price FROM Products WHERE price IS NOT NULL;

NOT NULL制約

テーブルのカラム定義において、そのカラムにNULL値の格納を許可しないように設定できるのが**NOT NULL制約**です。これはデータの整合性を保つ上で非常に重要な制約となります。

NOT NULL制約が設定されたカラムには、必ず何らかの値を挿入する必要があります。NULLを挿入しようとするとエラーが発生します。

-- 製品テーブルの定義例（再掲、product_nameにNOT NULL制約）
CREATE TABLE Products (
    product_id   INT PRIMARY KEY,
    product_name VARCHAR(100) NOT NULL, -- ここにNOT NULL制約
    price        DECIMAL(10, 2),
    stock_quantity INT DEFAULT 0,
    release_date DATE,
    is_available BOOLEAN
);

-- product_nameに値を指定しないINSERTはエラーになる
-- INSERT INTO Products (product_id, product_name) VALUES (1, NULL); -- これはエラー！
INSERT INTO Products (product_id, product_name) VALUES (1, '新しい製品A'); -- OK

デフォルト値とNULL

NOT NULL制約とDEFAULT句を組み合わせることで、カラムに値が明示的に指定されなかった場合に、自動的にデフォルト値が挿入されるようにできます。これにより、常に値が存在することを保証しつつ、挿入時の手間を省くことが可能です。

-- stock_quantityにDEFAULT 0とNOT NULL制約を追加する例
CREATE TABLE Products (
    product_id   INT PRIMARY KEY,
    product_name VARCHAR(100) NOT NULL,
    price        DECIMAL(10, 2),
    stock_quantity INT NOT NULL DEFAULT 0, -- NOT NULL と DEFAULT の組み合わせ
    release_date DATE,
    is_available BOOLEAN
);

-- stock_quantityを省略してINSERTしても、自動的に0が挿入される
INSERT INTO Products (product_id, product_name, price, release_date, is_available)
VALUES (2, '新しい製品B', 19.99, '2026-03-01', TRUE);
-- この場合、stock_quantityは0となる

1.2 問合せ

データベースに格納されたデータは、必要に応じて取り出し、加工して利用されます。この「データの取り出しと加工」を行うのが**問合せ（クエリ）**です。SQLでは、主にDML（Data Manipulation Language: データ操作言語）のSELECT文を使ってデータ問合せを行います。

SELECT文は、データベースから特定の条件に合致するデータを抽出し、指定した形式で結果を返すための最も基本的な、しかし最も強力なコマンドです。

ここでは、SELECT文の基本的な使い方から、データの絞り込み、並べ替え、集計といった応用的な問合せ方法について学習していきます。

1.2.1 SELECT

SELECT文は、テーブルからデータを検索し、その結果を取得するために使用します。基本的な構文は以下の通りです。

SELECT
    カラム名1, カラム名2, ...
FROM
    テーブル名;

より具体的な例を見るために、以下のProductsテーブルにデータを挿入しておきます。

-- Productsテーブルの定義 (再掲)
-- CREATE TABLE Products (
--     product_id   INT PRIMARY KEY,
--     product_name VARCHAR(100) NOT NULL,
--     price        DECIMAL(10, 2),
--     stock_quantity INT NOT NULL DEFAULT 0,
--     release_date DATE,
--     is_available BOOLEAN
-- );

-- テストデータ挿入
INSERT INTO Products (product_id, product_name, price, stock_quantity, release_date, is_available) VALUES
(1, 'ラップトップPC', 1200.00, 50, '2025-01-15', TRUE),
(2, 'ワイヤレスマウス', 25.50, 200, '2025-02-01', TRUE),
(3, 'メカニカルキーボード', 75.00, 100, '2025-01-20', TRUE),
(4, 'USBハブ', 12.00, 300, '2025-03-10', TRUE),
(5, '外付けSSD 1TB', 90.00, 70, '2025-02-28', TRUE),
(6, 'Webカメラ', 49.99, 80, '2025-01-05', FALSE),
(7, 'ゲーミングヘッドセット', 60.00, 40, '2025-03-15', TRUE),
(8, 'モニター 27インチ', 250.00, 30, '2025-02-10', FALSE),
(9, 'タブレットスタンド', 15.00, 150, '2025-03-20', TRUE),
(10, 'ポータブル充電器', 35.00, 120, '2025-01-25', TRUE);

全てのカラムと行を取得する (`SELECT *`)

テーブル内の全てのカラム、全ての行を取得するには、SELECTの後にアスタリスク（*）を指定します。

SELECT * FROM Products;

実務では、必要なカラムだけを指定するのが良いとされています。SELECT *は手軽ですが、不要なデータを取得することでネットワーク負荷やDBの処理負荷が増える可能性があるため、注意が必要です。

特定のカラムだけを取得する

必要なカラム名をカンマ（,）で区切って指定します。

SELECT product_name, price FROM Products;

重複行を除外する (`DISTINCT`)

特定カラムの値の重複を除いて、一意な値だけを取得したい場合はDISTINCTキーワードを使用します。

SELECT DISTINCT price FROM Products;

DISTINCTは、指定したカラムの組み合わせに対して適用されます。

カラムに別名をつける (`AS`句)

取得したカラム名が長く読みにくい場合や、複数のテーブルを結合する際にカラム名が重複する場合などに、一時的に別名（エイリアス）をつけることができます。ASキーワードは省略可能です。

SELECT product_name AS "商品名", price AS 価格 FROM Products;

演算結果をカラムとして表示する（計算フィールド）

SELECT句には、カラム名だけでなく、定数や演算式を指定することもできます。

-- 価格に消費税10%を加算した「税込価格」を表示
SELECT product_name, price, price * 1.10 AS "税込価格" FROM Products;

1.2.2 WHERE

WHERE句は、取得するデータの行を絞り込むための条件を指定します。SELECT文で最も重要な句の一つです。

SELECT カラム名 FROM テーブル名 WHERE 条件式;

比較演算子

演算子	意味
`=`	等しい
`<>` or `!=`	等しくない
`>`	より大きい
`<`	より小さい
`>=`	以上
`<=`	以下

-- 価格が100ドル以上の製品を検索
SELECT product_name, price FROM Products WHERE price >= 100.00;

論理演算子

複数の条件を組み合わせるためにAND、OR、NOTを使用します。

AND: 両方の条件が真の場合に真
OR: いずれかの条件が真の場合に真
NOT: 条件が偽の場合に真

ANDはORよりも優先順位が高いため、意図しない結果を避けるために括弧()を使うことが推奨されます。

-- 価格が50ドル以上かつ在庫が100個未満の製品
SELECT product_name, price, stock_quantity FROM Products
WHERE price >= 50.00 AND stock_quantity < 100;

-- 価格が20ドル未満、または在庫が200個以上の製品
SELECT product_name, price, stock_quantity FROM Products
WHERE price < 20.00 OR stock_quantity >= 200;

その他の便利な演算子

BETWEEN A AND B: AからBの範囲内（AとBを含む）
IN (A, B, C): A、B、Cのいずれかと一致
LIKE: 文字列の部分一致検索（%: 0文字以上の任意の文字列, _: 任意の1文字）
IS NULL / IS NOT NULL: 値がNULLかどうか

-- 価格が50ドルから100ドルの範囲にある製品
SELECT product_name, price FROM Products WHERE price BETWEEN 50.00 AND 100.00;

-- 製品IDが1, 3, 5の製品
SELECT product_id, product_name FROM Products WHERE product_id IN (1, 3, 5);

-- 製品名に「PC」が含まれる製品
SELECT product_name FROM Products WHERE product_name LIKE '%PC%';

1.2.3 ORDER BY

ORDER BY句は、取得した結果を特定のカラムの値に基づいて並べ替えるために使用します。

ASC: 昇順（小さい順、A→Z）。デフォルト。
DESC: 降順（大きい順、Z→A）。

-- 価格が高い順に製品を並べ替え
SELECT product_name, price FROM Products ORDER BY price DESC;

-- 発売日の新しい順、同じ発売日の場合は価格の安い順に並べ替え
SELECT product_name, release_date, price FROM Products ORDER BY release_date DESC, price ASC;

1.3 副問合せ

**副問合せ（サブクエリ）**とは、SQL文の中に入れ子で記述されるSELECT文のことです。WHERE句やFROM句、SELECT句など、様々な場所で使用でき、より複雑な問合せを実現します。

1.3.1 一般的な副問合せ

副問合せが返す行数や列数によって、いくつかの種類に分けられます。

スカラ副問合せ: 1行1列の単一の値を返す副問合せ。WHERE句で単一の値と比較する場合などに使います。

-- 平均価格より高い価格の製品を検索
SELECT product_name, price FROM Products
WHERE price > (SELECT AVG(price) FROM Products);

複数行副問合せ: 複数行1列の値を返す副問合せ。IN, ANY, ALL演算子と共に使います。

-- 後述するCategoriesテーブルに属する製品IDを検索
SELECT product_name FROM Products
WHERE product_id IN (SELECT product_id FROM OrderDetails WHERE quantity >= 10);

インラインビュー: FROM句の中に記述される副問合せ。結果が一時的なテーブルのように扱われます。

-- 各カテゴリの平均価格を計算し、それを基に製品情報を結合する
SELECT p.product_name, p.price, avg_cat.avg_price
FROM Products p
JOIN (SELECT category_id, AVG(price) as avg_price FROM Products GROUP BY category_id) AS avg_cat
ON p.category_id = avg_cat.category_id;

1.3.2 相関副問合せ

相関副問合せは、内側の副問合せが外側の主問合せのカラムを参照するタイプの副問合せです。主問合せの行が1行処理されるたびに、その行の値を参照して副問合せが実行されます。

普通の副問合せ: 内側の問合せが単独で実行可能。 相関副問合せ: 内側の問合せが外側の値に依存するため、単独では実行不可。

-- 各製品カテゴリ内で、そのカテゴリの平均価格よりも高い製品を検索
-- (Productsテーブルにcategory_idカラムが存在すると仮定)
SELECT product_name, price, category_id
FROM Products AS p1
WHERE price > (
    SELECT AVG(p2.price)
    FROM Products AS p2
    WHERE p2.category_id = p1.category_id -- 外側のp1を参照
);

この例では、外側のp1テーブルのcategory_idを、内側のp2テーブルの絞り込み条件に使っています。これにより、「自分と同じカテゴリの平均価格」を計算し、比較することが可能になります。

1.4 グループ化

1.4.1 集約関数

集約関数は、複数の行をまとめて一つの結果を返す関数です。GROUP BY句と組み合わせて使うことが多いですが、単独でも使用できます。

関数	説明
`COUNT()`	行数を数える。`COUNT(*)`は全行、`COUNT(カラム名)`はNULL以外の行を数える。
`SUM()`	数値の合計を計算する。
`AVG()`	数値の平均を計算する。
`MAX()`	最大値を求める。
`MIN()`	最小値を求める。

-- 製品の総数、価格の合計、平均価格を計算
SELECT COUNT(*), SUM(price), AVG(price) FROM Products;

1.4.2 グループ化した後に絞り込みを行う (`GROUP BY`, `HAVING`)

GROUP BY句は、特定カラムの値が同じ行をグループにまとめ、各グループに対して集約関数を適用します。

HAVING句は、GROUP BYで作成されたグループに対して条件を指定し、結果を絞り込むために使います。WHERE句が行を絞り込むのに対し、HAVING句はグループを絞り込むという違いがあります。

-- 各カテゴリIDごとの製品数と平均価格を計算
-- (Productsテーブルにcategory_idカラムが存在すると仮定)
SELECT category_id, COUNT(product_id), AVG(price)
FROM Products
GROUP BY category_id;

-- 上記の結果から、製品数が3つ以上あるカテゴリのみを抽出
SELECT category_id, COUNT(product_id) AS product_count, AVG(price)
FROM Products
GROUP BY category_id
HAVING COUNT(product_id) >= 3; -- HAVINGでグループを絞り込み

重要: WHERE句はグループ化の前に評価され、HAVING句はグループ化の後に評価されます。

1.5 関係代数

関係代数は、リレーショナルデータベースの操作を数学的に体系化したもので、SQLの理論的な基盤となっています。集合論に基づいており、和 差 積 直積 商などの演算があります。

1.5.1 和 (UNION)

2つのSELECT文の結果を結合し、重複行を除外して表示します。重複行を含めたい場合はUNION ALLを使用します。

SELECT product_id, product_name FROM Products WHERE price > 100
UNION
SELECT product_id, product_name FROM Products WHERE stock_quantity < 50;

1.5.2 差 (EXCEPT / MINUS)

最初のSELECT文の結果から、2番目のSELECT文の結果に含まれる行を除外します。

SELECT product_id, product_name FROM Products WHERE price > 50
EXCEPT
SELECT product_id, product_name FROM Products WHERE stock_quantity < 100;

1.5.3 積 (INTERSECT)

両方のSELECT文の結果に共通して存在する行のみを返します。

SELECT product_id, product_name FROM Products WHERE price > 50
INTERSECT
SELECT product_id, product_name FROM Products WHERE stock_quantity < 100;

1.5.4 直積 (CROSS JOIN)

2つのテーブルの全ての行の組み合わせを返します。CROSS JOINキーワードまたはFROM句でテーブルをカンマ区切りにすることで実現できます。

SELECT p.product_name, c.category_name
FROM Products p CROSS JOIN Categories c;

1.5.5 商

「テーブルAの特定の属性値に紐づく全ての値が、テーブルBに存在する」ような行をテーブルAから見つけ出す演算です。SQLには直接の演算子はありませんが、NOT EXISTSなどを駆使して実現します。これは非常に高度な概念であり、試験でも難問として出題されることがあります。

1.6 結合

複数のテーブルを、関連するカラムをキーにして連結し、一つの結果として取得する操作です。結合を理解するために、Categoriesテーブルを新しく定義し、Productsテーブルを更新します。

-- Categoriesテーブル作成
CREATE TABLE Categories (
    category_id   INT PRIMARY KEY,
    category_name VARCHAR(50) NOT NULL
);
INSERT INTO Categories VALUES (1, 'PC本体'), (2, 'PC周辺機器'), (3, 'その他');

-- Productsテーブルにcategory_idカラムを追加
ALTER TABLE Products ADD COLUMN category_id INT;
UPDATE Products SET category_id = 1 WHERE product_id IN (1, 8);
UPDATE Products SET category_id = 2 WHERE product_id IN (2, 3, 4, 5, 6, 7, 9);
UPDATE Products SET category_id = 3 WHERE product_id = 10;

graph TD
    Categories -- "1対多" --> Products;

1.6.1, 1.6.2 内部結合 (INNER JOIN)

両方のテーブルに存在する、結合キーの値が一致する行だけを返します。

SELECT
    p.product_name,
    c.category_name
FROM
    Products AS p
INNER JOIN
    Categories AS c ON p.category_id = c.category_id;

1.6.3 外部結合 (LEFT/RIGHT OUTER JOIN)

LEFT JOINは左側のテーブルの行を全て返し、右側のテーブルに一致する行がない場合はNULLを返します。RIGHT JOINはその逆です。OUTERは省略可能です。

-- 全ての製品とそのカテゴリ名を表示（カテゴリ未設定の製品も表示）
SELECT p.product_name, c.category_name
FROM Products AS p
LEFT JOIN Categories AS c ON p.category_id = c.category_id;

1.6.4 全外部結合 (FULL OUTER JOIN)

両方のテーブルの全ての行を返し、一致する行がない場合は互いにNULLを返します。

SELECT p.product_name, c.category_name
FROM Products AS p
FULL OUTER JOIN Categories AS c ON p.category_id = c.category_id;

1.7 追加、更新、削除

1.7.1 INSERT

テーブルに新しい行を追加します。

INSERT INTO Categories (category_id, category_name) VALUES (4, 'ソフトウェア');

1.7.2 UPDATE

既存の行のデータを更新します。WHERE句を忘れると全ての行が更新されるため、絶対に忘れないでください。

UPDATE Products SET price = price * 0.9 WHERE release_date < '2025-02-01';

1.7.3 DELETE

既存の行を削除します。WHERE句を忘れると全ての行が削除されるため、絶対に忘れないでください。

DELETE FROM Products WHERE is_available = FALSE;

1.8 整合性制約

データの矛盾や不正を防ぎ、整合性を保つためのルールです。テーブル作成時や変更時に定義します。

1.8.1 非NULL制約 (NOT NULL): カラムがNULLになることを防ぐ。（既出）
1.8.2 検査制約 (CHECK): カラムが満たすべき条件を定義する。 price DECIMAL(10, 2) CHECK (price >= 0)
1.8.3 UNIQUE制約: カラムの値がテーブル内で一意であることを保証する。
1.8.4 主キー制約 (PRIMARY KEY): UNIQUEとNOT NULLを組み合わせたもの。行を一意に識別するためのキー。

1.8.5 参照制約 (FOREIGN KEY): あるテーブルのカラムが、別のテーブルの主キーを参照するように設定する制約。テーブル間の関連を定義します。

CREATE TABLE Products (
    product_id INT PRIMARY KEY,
    category_id INT,
    ...
    FOREIGN KEY (category_id) REFERENCES Categories(category_id) -- 参照制約
        ON DELETE SET NULL -- 親が消えたらNULLにする
        ON UPDATE CASCADE -- 親が更新されたら子も追随する
);

1.9 ビュー

ビューは、一つ以上のテーブルから作られる仮想的なテーブルです。SELECT文をデータベースに保存し、名前を付けたものと考えることができます。

利点:

複雑なクエリの簡略化: 長いSELECT文を簡単なビュー名で呼び出せる。
セキュリティ: ユーザーに見せたいデータだけ（特定の行や列）をビューとして公開できる。
論理的データ独立性: 元のテーブル構造が変更されても、ビューの定義を修正すれば、ビューを使うアプリケーションへの影響をなくせる場合がある。

CREATE VIEW V_AvailableProducts AS
SELECT product_name, price, category_name
FROM Products p
JOIN Categories c ON p.category_id = c.category_id
WHERE p.is_available = TRUE;

-- ビューを通常のテーブルのように使用
SELECT * FROM V_AvailableProducts WHERE price > 50;

1.9.1 更新可能ビュー

特定の条件を満たすビューは、INSERT, UPDATE, DELETEが可能です。 主な条件:

単一テーブルから定義されている
集約関数（COUNTなど）、DISTINCT、GROUP BYなどを含まない

1.10 ユーザと権限

1.10.1 ユーザ

データベースにアクセスする主体。CREATE USERで作成します。

CREATE USER 'gemini_user'@'localhost' IDENTIFIED BY 'password';

1.10.2 権限

ユーザがデータベースやそのオブジェクトに対して何ができるかを定義します。GRANTで権限を付与し、REVOKEで剥奪します。

-- gemini_userにProductsテーブルのSELECT権限を付与
GRANT SELECT ON database_name.Products TO 'gemini_user'@'localhost';

-- 全ての権限を付与
GRANT ALL PRIVILEGES ON database_name.* TO 'gemini_user'@'localhost';

-- SELECT権限を剥奪
REVOKE SELECT ON database_name.Products FROM 'gemini_user'@'localhost';

1.11 ストアドプロシージャ

一連のSQL処理をまとめてデータベースに保存し、名前を付けて呼び出せるようにしたものです。

利点:

パフォーマンス向上: 事前にコンパイルされるため高速。
ネットワーク負荷軽減: 複数のSQL文を1回の呼び出しで実行できる。
再利用性と保守性: 共通処理をまとめられる。
セキュリティ向上: アプリケーションに複雑なロジックを公開せず、プロシージャの実行権限だけを与えられる。

-- 特定の価格以上の製品を検索するプロシージャ
DELIMITER //
CREATE PROCEDURE GetProductsByPrice(IN min_price DECIMAL(10,2))
BEGIN
    SELECT product_name, price FROM Products WHERE price >= min_price;
END //
DELIMITER ;

-- プロシージャの呼び出し
CALL GetProductsByPrice(100.00);

第1章 SQL 問題集 (20問)

問題 1 (データ型)

ある製品の価格を「9999.99」のように、小数点以下2桁まで正確に格納する必要があります。この場合、価格を格納するカラムに最も適したデータ型は次のうちどれか。

ア. FLOAT
イ. INT
ウ. VARCHAR(10)
エ. DECIMAL(6, 2)

解答と解説

解答: エ

解説:
DECIMAL(p, s)またはNUMERIC(p, s)は、p（精度）で指定された総桁数を持ち、そのうちs（スケール）で指定された桁数が小数点以下となる、正確な数値を格納するためのデータ型です。通貨のような誤差が許されない値の格納に最適です。

アのFLOATは浮動小数点数であり、近似値のため誤差が生じる可能性があります。
イのINTは整数しか格納できません。
ウのVARCHARは文字列型であり、数値計算には不向きです。

問題 2 (NULL)

SQL文 SELECT 100 * NULL; を実行した結果として正しいものはどれか。

ア. 0
イ. 100
ウ. NULL
エ. エラーが発生する

解答と解説

解答: ウ

解説:
NULLは「不明」を表す特殊な値です。NULLを含む算術演算（+, -, *, /など）の結果は、常にNULLになります。「不明な値」に何を掛けても、結果は「不明」であるという考え方に基づきます。

問題 3 (WHERE句)

Productsテーブルから、priceが100以上で、かつis_availableがTRUEである製品を抽出するSQL文のWHERE句として正しいものを完成させなさい。

SELECT product_name, price FROM Products WHERE [ ______ ];

解答と解説

解答: price >= 100 AND is_available = TRUE

解説:
「AかつB」という条件は、AND演算子を用いて表現します。それぞれの条件式をANDで結合することで、両方の条件を満たす行のみを絞り込むことができます。

問題 4 (ORDER BY)

Productsテーブルの製品を、stock_quantity（在庫数）の多い順に並べ、在庫数が同じ場合はproduct_name（製品名）のアルファベット昇順（A→Z）に並べ替えるORDER BY句を完成させなさい。

SELECT product_name, stock_quantity FROM Products ORDER BY [ ______ ];

解答と解説

解答: stock_quantity DESC, product_name ASC

解説:
ORDER BY句では、複数のカラムをカンマで区切って指定することで、複数のキーで並べ替えが可能です。最初のキー（stock_quantity）で並べ替え、値が同じ行グループ内で次のキー（product_name）で並べ替えます。DESCは降順（多い順）、ASCは昇順（A→Z）を指定します。ASCはデフォルトなので省略可能です。

問題 5 (集約関数)

Productsテーブルの全製品の平均価格をavg_priceという別名で取得するSQL文として正しいものはどれか。

ア. SELECT AVG(price) FROM Products AS avg_price;
イ. SELECT AVG(price) AS avg_price FROM Products;
ウ. SELECT price AS avg_price FROM Products GROUP BY price;
エ. SELECT TOTAL(price) AS avg_price FROM Products;

解答と解説

解答: イ

解説:
平均値を求めるには集約関数AVG()を使用します。カラムの別名はAS句を用いて指定します。

アはテーブルに別名をつけており、構文として誤りです。
ウは平均を計算していません。
エのTOTAL()は標準SQLの集約関数ではありません。

問題 6 (GROUP BY / HAVING)

Productsテーブルをcategory_idでグループ化し、グループ内の製品数が2つ以上あるカテゴリIDとその製品数を取得するSQL文を完成させなさい。

SELECT category_id, COUNT(product_id)
FROM Products
GROUP BY category_id
HAVING [ ______ ];

解答と解説

解答: COUNT(product_id) >= 2

解説:
GROUP BY句で作成したグループに対して条件を指定するにはHAVING句を使用します。WHERE句はグループ化の前に個々の行をフィルタリングするのに対し、HAVING句はグループ化の後に集約関数の結果などを用いてグループをフィルタリングします。

問題 7 (副問合せ)

Productsテーブルにおいて、製品ID 4 (USBハブ) の価格と同じ価格の、USBハブ以外の製品名を取得するSQL文を完成させなさい。

SELECT product_name FROM Products
WHERE price = (SELECT price FROM Products WHERE product_id = 4)
  AND [ ______ ];

解答と解説

解答: product_id <> 4

解説:
副問合せ (SELECT price FROM Products WHERE product_id = 4) を使って、USBハブの価格（12.00）を取得します。主問合せでは、その価格と一致し、かつ製品IDが4ではない（USBハブ自身を除く）という条件を指定します。

問題 8 (JOIN)

INNER JOINとLEFT JOINの主な違いは何か。簡潔に説明しなさい。

解答と解説

解答:
INNER JOINは両方のテーブルに結合キーが一致する行だけを返すのに対し、LEFT JOINは左側のテーブルの行をすべて返し、右側のテーブルに一致する行がない場合はNULLとして返す。

解説:
INNER JOINは両方のテーブルに共通のデータのみ、LEFT JOIN（外部結合）は片方のテーブルのデータを全て残す、という点が根本的な違いです。

問題 9 (関係代数)

2つのSELECT文の結果セットの共通部分（両方に存在する行）のみを返すSQLの集合演算子は何か。

ア. UNION
イ. EXCEPT (または MINUS)
ウ. INTERSECT
エ. CROSS JOIN

解答と解説

解答: ウ

解説:

UNION: 和集合（重複除く）
EXCEPT / MINUS: 差集合
INTERSECT: 積集合（共通部分）
CROSS JOIN: 直積

問題 10 (DML)

Productsテーブルからproduct_idが6の行を削除するSQL文として正しいものはどれか。

ア. DROP FROM Products WHERE product_id = 6;
イ. DELETE FROM Products WHERE product_id = 6;
ウ. UPDATE Products WHERE product_id = 6;
エ. REMOVE FROM Products WHERE product_id = 6;

解答と解説

解答: イ

解説:
テーブルから行を削除するにはDELETE文を使用します。DROPはテーブルそのものを削除するDDL文です。REMOVEは標準SQLにはありません。

問題 11 (制約)

Productsテーブルのpriceカラムに「価格は0以上でなければならない」というルールを追加したい。テーブル作成時にこのルールを定義する制約は何か。

ア. UNIQUE
イ. PRIMARY KEY
ウ. FOREIGN KEY
エ. CHECK

解答と解説

解答: エ

解説:
CHECK制約は、カラムが満たすべき条件式を定義するためのものです。CHECK (price >= 0)と記述することで、0未満の価格が挿入・更新されるのを防ぐことができます。

問題 12 (ビュー)

ビュー（VIEW）を使用する利点として、適切でないものはどれか。

ア. 複雑な問合せを単純化できる。
イ. ユーザーごとに見せるデータを制限し、セキュリティを向上できる。
ウ. 元のテーブルへのデータ更新速度を大幅に向上させる。
エ. 元のテーブル構造の変更が、ビューを利用するアプリケーションに影響を与えにくくする。

解答と解説

解答: ウ

解説:
ビューは保存されたSELECT文であり、それ自体がデータ更新を高速化するわけではありません。むしろ、複雑なビューに対する問合せは、パフォーマンスが低下することさえあります。ア、イ、エはビューの代表的な利点です。

問題 13 (権限)

sales_userというユーザーに、Productsテーブルのデータを更新する権限のみを与えたい。正しいSQL文はどれか。

ア. GRANT UPDATE ON Products TO sales_user;
イ. PERMIT UPDATE ON Products TO sales_user;
ウ. ALLOW UPDATE ON Products TO sales_user;
エ. UPDATE Products FOR sales_user;

解答と解説

解答: ア

解説:
データベースオブジェクトに対する権限をユーザーに付与するにはGRANT文を使用します。構文は GRANT 権限 ON オブジェクト TO ユーザー; となります。

問題 14 (ストアドプロシージャ)

ストアドプロシージャに関する記述として、最も適切なものはどれか。

ア. クライアント側で実行される一連のSQL手続きである。イ. 複数のSQL文を1回のネットワーク通信で実行できるため、ネットワーク負荷を軽減できる。ウ. 主にテーブル構造の定義（DDL）を目的として使用される。エ. 実行のたびにSQLがコンパイルされるため、パフォーマンスは低下する。

解答と解説

解答: イ

解説:
ストアドプロシージャはデータベースサーバ側に保存され、実行されます。事前にコンパイルされるためパフォーマンスが向上し、複数の処理を1回の呼び出し（CALL）で実行できるため、クライアントとサーバ間の通信回数が減り、ネットワーク負荷を軽減します。

問題 15 (LIKE演算子)

Productsテーブルから、product_nameが「キーボード」で終わる製品を検索するWHERE句の条件式として正しいものはどれか。

ア. product_name LIKE 'キーボード_' イ. product_name LIKE '%キーボード' ウ. product_name LIKE '_キーボード' エ. product_name LIKE 'キーボード%'

解答と解説

解答: イ

解説:
LIKE演算子で使われるワイルドカードのうち、%は「0文字以上の任意の文字列」を表します。'%キーボード'とすることで、「キーボード」という文字列で終わる全ての製品名を検索できます。

問題 16 (相関副問合せ)

相関副問合せに関する記述として、最も適切なものはどれか。

ア. 主問合せとは独立して単独で実行できる。イ. 主問合せの行ごとに繰り返し実行されるため、一般的にパフォーマンスは良くない。ウ. 主にFROM句でインラインビューとして使用される。エ. 必ずIN演算子と共に使用する必要がある。

解答と解説

解答: イ

解説:
相関副問合せは、主問合せ（外側）の行の値を参照して副問合せ（内側）が実行されます。そのため、主問合せの行数分だけ副問合せが繰り返し実行されることになり、処理対象の行数が多い場合にはパフォーマンスの低下を招くことがあります。

問題 17 (DELETEとTRUNCATE)

テーブルの全行を削除する際にDELETE文とTRUNCATE TABLE文では挙動が異なる。その違いについて簡潔に説明しなさい。

解答と解説

解答:
DELETEは行を1行ずつ削除し、その操作はトランザクションログに記録されるため、ロールバックが可能。一方、TRUNCATEはテーブルを再作成するのに近い内部動作で、高速だが操作はロールバックできないことが多い。また、DELETEではWHERE句が使えるが、TRUNCATEは全行削除しかできない。

問題 18 (主キーとUNIQUE)

PRIMARY KEY制約とUNIQUE制約の共通点と相違点を簡潔に説明しなさい。

解答と解説

解答:

共通点: どちらも指定されたカラムの値が一意（重複不可）であることを保証する。
相違点: PRIMARY KEY制約は暗黙的にNOT NULL制約を含むためNULL値を許可しないが、UNIQUE制約は（多くのDBMSで）NULL値を許可する。また、1つのテーブルにPRIMARY KEYは1つしか設定できないが、UNIQUE制約は複数設定できる。

問題 19 (SQL実行順序)

SELECT文において、WHERE句とHAVING句は、論理的にどちらが先に評価されるか。

解答と解説

解答: WHERE句

解説:
SQLの論理的な実行順序では、FROM句で対象テーブルが決定された後、WHERE句で個々の行がフィルタリングされます。その後、GROUP BY句でグループ化が行われ、最後にHAVING句でそのグループがフィルタリングされます。

問題 20 (外部結合)

Productsテーブルには存在するが、Categoriesテーブルにはまだ登録されていないcategory_idを持つ製品（例えば、category_idがNULLの製品）を見つけ出すSQL文を完成させなさい。

SELECT p.product_name, p.category_id
FROM Products p
LEFT JOIN Categories c ON p.category_id = c.category_id
WHERE [ ______ ];

解答と解説

解答: c.category_id IS NULL

解説:
LEFT JOINは左側（Products）のテーブルの行を全て返します。右側（Categories）にcategory_idが一致する行がない場合、右側のテーブルのカラム（c.category_idなど）はNULLになります。したがって、WHERE c.category_id IS NULLという条件を指定することで、カテゴリが存在しない製品を特定できます。

第2章 DBMS

2.1 索引

データベースにおける**索引（インデックス）**は、書籍の「索引」や電話帳の「見出し」のようなものです。目的のデータを探し出す時間を劇的に短縮するために使用されます。

なぜ索引が必要か？

テーブルに索引が設定されていない場合、データベースはデータを検索する際に、テーブルの全行を最初から最後まで順に読み込む必要があります（これをフルテーブルスキャンと呼びます）。データ量が少なければ問題ありませんが、数百万、数千万といった膨大なデータの中から特定の行を探し出す場合、フルテーブルスキャンでは非常に時間がかかってしまいます。

索引は、特定のカラムの値と、その値が格納されているデータ行の物理的な位置（ROWIDやポインタなど）を関連付けて管理します。これにより、目的の値を持つ行を直接見つけ出すことができるため、検索（SELECT文）のパフォーマンスが向上します。

索引のメリット・デメリット

メリット	デメリット
`SELECT`文によるデータ検索が高速化される	`INSERT`, `UPDATE`, `DELETE`が遅くなる（索引の更新）
`ORDER BY`句によるソートが高速化される	ディスク容量を消費する（索引自体のデータ）
`JOIN`操作のパフォーマンスが向上する	DBMSのメモリを消費する
`WHERE`句での条件指定が高速化される

索引を作成すべきケース

WHERE句の条件として頻繁に使用されるカラム
JOINの結合条件として使用されるカラム
ORDER BY句で並べ替えのキーとして頻繁に使用されるカラム
PRIMARY KEYやUNIQUE制約が設定されたカラム（DBMSが自動的に索引を作成することが多い）

索引の過剰な作成は避ける

メリットがあるからといって、無闇に多くの索引を作成するのは避けるべきです。索引の数が増えるほど、データの更新時に索引自体も更新する必要が生じるため、INSERT, UPDATE, DELETEのパフォーマンスが低下します。また、ディスク容量も消費します。

適切な索引設計は、データベースのパフォーマンスチューニングにおいて非常に重要な要素となります。

2.1.1 索引探索の仕組み

データベースで最も一般的に使用される索引の構造は**B-Tree（B+Tree）**です。B-Treeはバランスの取れた木構造をしており、どのようなキー値を探す場合でも、ほぼ同じ深さのノードをたどることで高速に目的のデータに到達できます。

B-Treeの構造

B-Treeは以下の要素で構成されます。

ルートノード (Root Node): 木の最上位に位置するノード。探索はここから始まります。
ブランチノード (Branch Node / Internal Node): 中間に位置するノード。キー値と、より下位のノードへのポインタを含みます。
リーフノード (Leaf Node): 木の最下位に位置するノード。実際のキー値と、そのキー値に対応するデータ行の物理的な位置（ROWIDなど）へのポインタを含みます。リーフノード同士は通常、双方向リストで連結されており、範囲検索を効率的に行えるようになっています。

graph TD
    A["ルートノード"] --> B("ブランチノード");
    A --> C("ブランチノード");
    B --> D("リーフノード");
    B --> E("リーフノード");
    C --> F("リーフノード");
    C --> G("リーフノード");

    D -- "次へ" --> E;
    E -- "次へ" --> F;
    F -- "次へ" --> G;

    subgraph "リーフノード層"
        D;
        E;
        F;
        G;
    end

索引探索のプロセス

B-Treeでの索引探索は、以下のような手順で行われます。

ルートノードの読み込み: 探索対象のキー値とルートノード内のキー値を比較し、次に参照すべきブランチノードを特定します。
ブランチノードの辿り: 1で特定されたブランチノードを読み込み、同様にキー値を比較して、さらに下位のノードへのポインタを決定します。このプロセスを繰り返して木の深さを降っていきます。
リーフノードへの到達: 最終的に、目的のキー値を含むリーフノードに到達します。
データ行の取得: リーフノード内で目的のキー値を見つけたら、そこに格納されているROWID（または物理アドレス）を使用して、テーブル本体から実際のデータ行を読み込みます。

この仕組みにより、大量のデータの中からでも、わずか数回のディスクI/O（ディスクアクセス）で目的のデータにたどり着くことが可能になります。

2.1.2 索引探索の種類

索引が実際にどのように利用されるかには、いくつかのパターンがあります。

索引一意スキャン (Index Unique Scan)
- PRIMARY KEYやUNIQUE制約が設定されたカラムに対して、WHERE句で等価条件（=）が指定された場合に発生します。
- 索引を使って目的のデータ行を直接1件特定するため、最も高速な探索方法です。
- 例: WHERE product_id = 123
索引レンジスキャン (Index Range Scan)
- WHERE句で範囲条件（BETWEEN, >, <, >=など）や、LIKE演算子による前方一致検索（LIKE 'Apple%'）が指定された場合に発生します。
- 索引のリーフノードが順序付けられているため、指定された範囲のキー値を効率的に読み込むことができます。
- 例: WHERE price BETWEEN 100 AND 200
索引フルスキャン (Index Full Scan)
- 索引全体を最初から最後まで順に読み込む方法です。
- ORDER BY句で索引のカラムが指定されており、かつWHERE句で索引が使えない場合などに、ソート処理を避けるために利用されることがあります。
- 例: SELECT MIN(product_id) FROM Products;
スキップスキャン (Index Skip Scan)
- 複合索引（複数のカラムで構成される索引）の先頭カラムがWHERE句で指定されていない場合でも、DBMSが賢く索引の一部をスキップしながら利用する探索方法です。全てのDBMSが対応しているわけではありません。
- 例: 複合索引が(category_id, product_name)の場合にWHERE product_name = 'PC'

2.1.3 索引の構造

索引の論理構造はB-Treeが一般的ですが、物理的なデータの格納方法によって、さらにいくつかの種類があります。

クラスタ化インデックス (Clustered Index)
- テーブルのデータ行が、索引のキー順に物理的に並べ替えられて格納される索引です。
- データの格納順序と索引の順序が一致するため、索引からデータへのアクセスが非常に高速です。
- しかし、1つのテーブルには1つのクラスタ化インデックスしか作成できません（物理的なデータ順序は1通りしかないため）。
- PRIMARY KEY制約を設定すると、多くのDBMSでは自動的にクラスタ化インデックスが作成されます。
非クラスタ化インデックス (Non-Clustered Index)
- 索引自体はキー順に格納されますが、テーブルのデータ行は索引とは別の順序で格納されます。
- 索引はデータ行の物理的な位置へのポインタ（ROWIDなど）を持っており、索引を検索した後、そのポインタを使ってテーブル本体のデータを読み込みます。
- 1つのテーブルに複数作成することが可能です。
複合索引 (Composite Index)
- 複数のカラムを組み合わせて作成される索引です。
- 定義したカラムの順番が重要であり、先頭カラムから利用される「前方一致」の原則が適用されます。
- 例: CREATE INDEX idx_product_cat_name ON Products (category_id, product_name);
  - WHERE category_id = 1
  - WHERE category_id = 1 AND product_name = 'PC'
  - WHERE category_id = 1 AND product_name LIKE 'P%' これらは索引が利用されますが、WHERE product_name = 'PC'では索引が利用されにくい、あるいは利用されない場合があります。
カバリングインデックス (Covering Index / 包含インデックス)
- 問合せに必要な全てのカラムが索引自体に含まれている場合、テーブル本体にアクセスすることなく、索引だけで問合せの結果を返すことができる索引です。
- テーブルへのアクセスが不要になるため、パフォーマンスが大幅に向上します。
- 例: SELECT product_id, product_name FROM Products WHERE product_id > 100; (もし(product_id, product_name)で複合索引がある場合)

2.2 トランザクション

2.2.1 トランザクションとは

トランザクションとは、データベースにおいて一連の処理を一つの論理的な単位として扱うことを指します。これは「全て実行されるか、全く実行されないか」のどちらかであり、途中で失敗した場合は全ての変更が取り消されます。

例として、銀行口座Aから口座Bへ10,000円を送金する処理を考えます。この処理は以下のステップからなります。

口座Aから10,000円を引き出す。
口座Bに10,000円を振り込む。

もし1の処理は成功したが、2の処理が失敗した場合、口座Aからはお金が減ったのに口座Bには増えないという矛盾した状態が発生します。このようなデータの不整合を防ぐためにトランザクションが利用されます。

COMMIT: トランザクション内の全ての処理が正常に完了し、変更を確定（データベースに永続的に反映）させる。
ROLLBACK: トランザクション内の途中でエラーが発生したり、何らかの理由で処理を中止したりする場合に、トランザクション開始時点の状態に戻す（変更を全て取り消す）。

graph LR
    A["トランザクション開始"] --> B{"処理1"};
    B --> C{"処理2"};
    C --> D{"全ての処理成功?"};
    D -- "はい" --> E["COMMIT 変更確定"];
    D -- "いいえ" --> F["ROLLBACK 変更破棄"];
    E --> G["トランザクション終了"];
    F --> G;

2.2.2 ACID特性

トランザクションには、その信頼性を保証するための4つの重要な特性があります。これらは頭文字を取ってACID特性と呼ばれます。

Atomicity (原子性)
- トランザクション内の処理は、全て実行されるか、全て実行されないか（どちらか一方）です。部分的に実行されることはありません。
- 先ほどの送金例であれば、引き出しと振込は両方成功するか、両方失敗（開始前の状態に戻る）するかのどちらかです。
Consistency (一貫性)
- トランザクションが完了すると、データベースは常に整合性の取れた状態を保ちます。
- つまり、トランザクション開始前のデータベースが整合性が取れていれば、トランザクション完了後も整合性が取れた状態になります。
- 例えば、合計残高が常に一致する、制約条件（PRIMARY KEY, FOREIGN KEYなど）が破られないなど。
Isolation (独立性)
- 複数のトランザクションが同時に実行された場合でも、それぞれのトランザクションは他のトランザクションの影響を受けず、あたかも単独で実行されたかのように見えます。
- これにより、並行処理によるデータの不整合を防ぎます。後述する「分離レベル」でその度合いを調整できます。
Durability (永続性)
- 一度COMMITされたトランザクションによる変更は、システム障害や電源障害などが発生しても失われることなく、データベースに永続的に保存されます。
- これは主に、更新内容をログファイルに記録することで実現されます。

2.2.3 MVCC (Multi-Version Concurrency Control)

MVCCは「Multi-Version Concurrency Control」の略で、日本語では「多版型同時実行制御」などと訳されます。複数のトランザクションが同時にデータにアクセスする際の競合を減らし、データベースの同時実行性能を高めるための技術です。

課題：読み取りと書き込みの競合

従来の排他制御（ロック）では、あるトランザクションがデータを更新している間は、他のトランザクションはそのデータを読み取ることができません（書き込み中に読み取ると不整合が発生するため）。これにより、読み取り中心のシステムでも、書き込みが頻繁に発生すると読み取り処理がブロックされ、性能が低下するという課題がありました。

MVCCの解決策

MVCCでは、データが更新される際に、元のデータを上書きするのではなく、新しいバージョンのデータを作成します。これにより、複数のバージョンのデータがデータベース内に共存することになります。

読み取りトランザクション: トランザクションが開始した時点の、古いバージョンのデータを読み取ります。これにより、更新中のデータにロックがかかっていても、読み取りトランザクションはブロックされずに処理を続行できます。
書き込みトランザクション: 常に最新のバージョンのデータを更新します。

graph LR
    A["データX バージョン1"] --> B{"T1が読み取り開始"};
    A --> C{"T2が書き込み開始"};
    C --> D["データX バージョン2を生成"];
    D --> E["T2 COMMIT"];
    B -- "バージョン1を読み取り中" --> F["T1完了"];

MVCCのメリット

高い同時実行性: 読み取りトランザクションが書き込みトランザクションによってブロックされることがほとんどなくなり、同時実行性が大幅に向上します。
リードコンシステンシー: トランザクションは常に一貫性のあるデータ（自身が開始した時点のスナップショット）を見ることができます。

MVCCのデメリット

ストレージ消費: 複数のバージョンのデータを保持するため、ストレージ容量が多く必要になります。
オーバーヘッド: 古いバージョンのデータを削除するガベージコレクション処理など、バージョン管理のためのオーバーヘッドが発生します。

PostgreSQLやOracleなどの多くのリレーショナルデータベースでMVCCが採用されています。

2.2.4 排他制御 (Concurrency Control)

排他制御は、複数のトランザクションが同時にデータベースにアクセスした際に、データの整合性を保つための仕組みです。主に**ロック（Lock）**という方法が使われます。

ロックの種類

共有ロック (Shared Lock / Sロック)
- データの読み取りを行う際にかけられるロックです。
- 複数のトランザクションが同時に同じデータに対して共有ロックをかけることができます（なので「共有」）。
- 共有ロックがかかっている間は、そのデータへの書き込みはできません。
専有ロック (Exclusive Lock / Xロック)
- データの**書き込み（更新、削除など）**を行う際にかけられるロックです。
- 一つのデータに対して専有ロックをかけられるトランザクションは一つだけです。
- 専有ロックがかかっている間は、他のトランザクションは、そのデータに対して読み取りも書き込みもできません。

graph TD
    Data["データA"] --> S1{"T1: Sロック要求 _読み取り"};
    S1 -- "Sロック取得" --> S2{"T2: Sロック要求 _読み取り"};
    S2 -- "Sロック取得" --> X1{"T3: Xロック要求 _書き込み"};
    X1 -- "ブロックされる" --> Wait["待機"];
    S2 -- "Sロック解除" --> S1解除{"T1, T2: Sロック解除"};
    S1解除 --> X1取得{"T3: Xロック取得"};

ロックの粒度

ロックは、対象となるデータの範囲（粒度）によって、以下のようになります。

行ロック: 1つのデータ行にロックをかける。最も粒度が細かく、同時実行性が高いが、ロック管理のオーバーヘッドが大きい。
ページロック: 複数の行が含まれるディスク上のページ（ブロック）単位でロックをかける。行ロックより粒度が粗く、同時実行性は下がるが、ロック管理のオーバーヘッドは小さい。
テーブルロック: テーブル全体にロックをかける。最も粒度が粗く、同時実行性は低いが、ロック管理のオーバーヘッドは最も小さい。

一般的に、粒度が細かいほど同時実行性は高まりますが、ロック管理のオーバーヘッドが増加します。DBMSは、問合せの内容やデータ量に応じて、適切な粒度のロックを自動的に選択します。

2.2.5 直列化可能 (Serializable)

直列化可能性（Serializable）とは、複数のトランザクションが並行して実行された場合でも、その結果が、あたかもそれらのトランザクションが何らかの順序で一つずつ（直列に）実行された場合と同じになるという保証のことです。これはトランザクションの独立性（Isolation）の最高レベルであり、最も厳格な整合性を保証します。

直列実行と並行実行

直列実行: トランザクションAが完全に終了してからトランザクションBが開始する、というように、一つずつ順に実行されることです。この場合、データの不整合は発生しません。
並行実行: 複数のトランザクションが同時に（または時間的に重なり合って）実行されることです。データベースシステムは通常、スループット向上のために並行実行を行います。

直列化可能性の重要性

並行実行時に直列化可能性が保証されていれば、プログラマはあたかもトランザクションが直列に実行されるかのようにアプリケーションを設計・実装できるため、並行処理による複雑な問題を考慮する必要がなくなります。これにより、アプリケーション開発の難易度が下がり、バグの発生を抑えることができます。

実現方法

直列化可能性は、主に以下の技術によって実現されます。

2相コミット (Two-Phase Locking: 2PL): トランザクションがロックを獲得する「成長フェーズ」と、ロックを解放する「縮小フェーズ」の2つのフェーズを持つロックプロトコルです。全てのロックを獲得し終えるまではロックを解放せず、全てのロックを解放し始めるまではロックを獲得しない、というルールでデッドロックのリスクを管理します。
オプティミスティック並行性制御 (Optimistic Concurrency Control): 更新時にデータのバージョンチェックを行い、競合が発生していた場合にのみトランザクションをロールバックする方法です。データ競合が少ない環境で高いパフォーマンスを発揮します。
多版型同時実行制御 (MVCC): （前述）読み取りと書き込みが異なるデータのバージョンを参照することで、ロックの競合を減らし、見かけ上、直列化可能性に近い一貫性を提供します。

2.2.6 デッドロック (Deadlock)

デッドロックとは、複数のトランザクションが互いに相手がロックしている資源の解放を待ち合い、結果としてどのトランザクションも処理を先に進められなくなる状態のことです。

デッドロックの発生例

トランザクションT1とT2が、データAとデータBのロックを要求する例で考えます。

graph TD
    T1["トランザクションT1"] -- "データAをロック" --> A("データA");
    T2["トランザクションT2"] -- "データBをロック" --> B("データB");
    A -- "データBを待機" --> T1;
    B -- "データAを待機" --> T2;

T1がデータAに排他ロックをかける。
T2がデータBに排他ロックをかける。
T1がデータBに排他ロックをかけようとするが、T2がロックしているため待機状態になる。
T2がデータAに排他ロックをかけようとするが、T1がロックしているため待機状態になる。

結果として、T1はT2がBを解放するのを待ち、T2はT1がAを解放するのを待つという無限ループに陥り、どちらのトランザクションも進行できなくなります。

デッドロックの検出と解消

ほとんどのDBMSはデッドロックを自動的に検出する機能を持っています。デッドロックを検出すると、DBMSは一方のトランザクション（これを**犠牲者（Victim）**と呼びます）を強制的に中断させ、ROLLBACKします。これにより、犠牲者トランザクションがロックしていた資源が解放され、もう一方のトランザクションは処理を続行できるようになります。犠牲者となったトランザクションは、後で再実行されることになります。

デッドロックの回避策

デッドロックの発生を完全に防ぐことは難しいですが、以下の対策を講じることで発生頻度を減らすことができます。

ロックの順序を統一する: 複数のデータにロックをかける必要がある場合、全てのトランザクションで同じ順序でロックをかけるようにする。
ロックの粒度を適切にする: 必要以上に大きな範囲にロックをかけない。
トランザクションを短くする: ロックを保持する時間を短くすることで、競合の機会を減らす。
悲観的ロックと楽観的ロックを使い分ける: 競合が少ない場合は楽観的ロック（更新時チェック）を利用するなど。

2.2.7 独立性レベル (Isolation Levels)

トランザクションの独立性（Isolation）は、複数のトランザクションが同時に実行される際に、互いの処理がどの程度影響し合うかを定義するものです。SQL標準では、以下の4つの分離レベル（Isolation Level）が定義されており、それぞれ発生しうる現象（Anomaly）を防ぐ度合いが異なります。

graph TD
    SERIALIZABLE --> REPEATABLE_READ;
    REPEATABLE_READ --> READ_COMMITTED;
    READ_COMMITTED --> READ_UNCOMMITTED;

    subgraph "独立性レベル Isolation Levels"
        SERIALIZABLE;
        REPEATABLE_READ;
        READ_COMMITTED;
        READ_UNCOMMITTED;
    end

    subgraph "発生しうる現象 Anomalies"
        DIRTY_READ["ダーティリード"];
        NON_REPEATABLE_READ["ノンリピータブルリード"];
        PHANTOM_READ["ファントムリード"];
    end

    READ_UNCOMMITTED -- "許容" --> DIRTY_READ;
    READ_COMMITTED -- "許容" --> NON_REPEATABLE_READ;
    READ_COMMITTED -- "許容" --> PHANTOM_READ;
    REPEATABLE_READ -- "許容" --> PHANTOM_READ;

発生しうる現象

ダーティリード (Dirty Read):
- あるトランザクション（T1）がまだCOMMITされていない（ROLLBACKされる可能性がある）他のトランザクション（T2）の変更を読み取ってしまう現象です。
- もしT2がロールバックされた場合、T1は存在しないはずのデータを読み取ったことになり、データの不整合を招きます。
ノンリピータブルリード (Non-Repeatable Read):
- あるトランザクション（T1）が同じデータを複数回読み取った際に、途中で他のトランザクション（T2）がそのデータを更新・コミットしたため、読み取るたびに異なる値を取得してしまう現象です。
- T1は一貫性のあるデータを見ることができません。
ファントムリード (Phantom Read):
- あるトランザクション（T1）がある条件でデータを検索し、その後、他のトランザクション（T2）がその条件に合致する新しいデータを挿入・コミットしたため、T1が同じ条件で再度検索した際に、新しい行（ファントム：幻影）が検出されてしまう現象です。
- ノンリピータブルリードが行の値の変化であるのに対し、ファントムリードは検索結果の行数の変化です。

SQL標準の分離レベル

READ UNCOMMITTED (未コミット読み取り)
- 最も低い分離レベルで、上記の3つの現象全てが発生しうる。
- ダーティリードを許容するため、データの整合性はほとんど保証されないが、ロックが最も少ないため同時実行性は最大。
READ COMMITTED (コミット済み読み取り)
- ダーティリードを防ぎます。他のトランザクションがコミットしたデータのみを読み取ります。
- 多くのDBMSでデフォルトの分離レベルとして採用されています。
- ノンリピータブルリードとファントムリードは発生する可能性があります。
REPEATABLE READ (反復可能読み取り)
- ダーティリードとノンリピータブルリードを防ぎます。
- トランザクション内で同じデータを複数回読み取っても、常に同じ値が得られることを保証します。
- ファントムリードは発生する可能性があります。
SERIALIZABLE (直列化可能)
- 最も高い分離レベルで、ダーティリード、ノンリピータブルリード、ファントムリードの全てを防ぎます。
- 並行実行されるトランザクションが、あたかも直列に実行されたかのような結果を保証します。
- 最も整合性が高い反面、ロックの競合が多くなり、同時実行性が最も低くなる可能性があります。

適切な分離レベルの選択は、アプリケーションの要件（整合性の厳密さ、パフォーマンス、同時実行性など）に基づいて慎重に行う必要があります。

2.3 障害管理

データベースシステムは、様々な障害（ハードウェア故障、ソフトウェアエラー、電力供給停止など）が発生しても、データを保護し、可能な限り早く正常な状態に復旧できる仕組みを持っています。これが**障害管理（リカバリ）**です。

2.3.1 チェックポイント (Checkpoint)

データベースは、ディスク上のデータファイルとメモリ上のバッファキャッシュ（変更されたデータが一時的に保持される領域）を持っています。更新処理はまずバッファキャッシュ上で行われ、その後非同期的にディスクに書き込まれます。

チェックポイントとは、データベースのバッファキャッシュ内の変更されたデータを強制的にディスク上のデータファイルに書き出す処理のことです。

チェックポイントの目的

復旧時間の短縮: 障害発生時、チェックポイント以降のログだけを処理すれば良いので、復旧にかかる時間を短縮できます。
ログファイルの管理: 古いログファイルを安全に削除できるようになります。

DBMSは、一定時間ごとや、特定のイベント（例えば、ログファイルのサイズが閾値を超えた時）が発生した際に、自動的にチェックポイント処理を実行します。

2.3.2 障害回復 (Recovery)

データベースシステムは、以下の要素を組み合わせて障害から回復します。

ログファイル（ジャーナル）:
- データベースに対する全ての変更（挿入、更新、削除）が時系列に記録されます。
- 主にUNDO情報（変更前のデータ）とREDO情報（変更後のデータ）が含まれます。
データファイル:
- 実際のデータが永続的に格納されるファイルです。
バックアップ:
- データファイルの完全なコピーで、メディア障害などの大規模な障害からの復旧に使用されます。

障害回復のプロセス（ロールフォワードとロールバック）

データベース障害発生時、DBMSはログファイルを利用して、データベースを整合性の取れた状態に復旧します。

ロールフォワード (Roll-Forward / REDO):
- 過去のバックアップからデータベースを復元した後、障害発生までの間にコミットされたトランザクションのREDO情報をログから読み取り、それらの変更を再度データベースに適用します。
- これにより、コミット済みだがディスクに書き込まれていなかった変更を回復します。
ロールバック (Roll-Back / UNDO):
- 障害発生時に、まだコミットされていなかった（途中で失敗した）トランザクションのUNDO情報をログから読み取り、そのトランザクションが行った変更を全て取り消し、トランザクション開始前の状態に戻します。
- これにより、未コミットの変更による不整合を防ぎます。

これらの仕組みによって、データベースは高い信頼性と可用性を提供しています。

2.4 最新データベース技術

2.4.1 NoSQL

近年、Webサービスやビッグデータの登場により、従来のリレーショナルデータベース（RDBMS）だけでは対応しきれない課題（大量のデータ、高いスケーラビリティ、柔軟なスキーマなど）が浮上しました。これに対応するために登場したのが、**NoSQL（Not only SQL）**と呼ばれる、RDBMS以外の様々なデータストア技術です。

NoSQL登場の背景

ビッグデータ: 大量のデータを扱う必要性。
高スケーラビリティ: 水平分散によるシステム拡張の要求。
柔軟なスキーマ: データ構造が固定されず、頻繁に変更される要求。
高可用性: システム停止が許されないサービスへの要求。

NoSQLの主な特徴

非リレーショナル: テーブルと行・列の関係にとらわれないデータモデル。
水平スケーラビリティ: サーバーを追加することで簡単に性能を拡張できる。
柔軟なスキーマ: スキーマ定義が不要、または動的に変更可能。
最終的な一貫性 (Eventual Consistency): 厳密なACID特性の全てを常に保証するのではなく、時間とともにデータが最終的に一貫した状態になることを許容することで、可用性やパフォーマンスを優先する（BASE特性）。

NoSQLの分類

NoSQLは、そのデータモデルによっていくつかの主要なカテゴリに分類されます。

graph TD
    NoSQL["NoSQL"] --> KV["Key-Value Store"];
    NoSQL --> Doc["Document Store"];
    NoSQL --> CF["Column-Family Store"];
    NoSQL --> Graph["Graph Database"];

    KV -- "例" --> Redis;
    KV -- "例" --> DynamoDB;
    Doc -- "例" --> MongoDB;
    Doc -- "例" --> Couchbase;
    CF -- "例" --> Cassandra;
    CF -- "例" --> HBase;
    Graph -- "例" --> Neo4j;

Key-Value Store (KVS)
- シンプルなキーと値のペアでデータを格納します。
- 非常に高速な読み書きが可能で、セッション情報やキャッシュなど、大量の単純なデータを扱うのに適しています。
- 例: Redis, Amazon DynamoDB, Apache Cassandra (一部のモード)
Document Store
- データをJSONやBSONなどのドキュメント形式で格納します。
- 柔軟なスキーマを持ち、複雑な階層構造のデータを扱うのに適しています。
- 例: MongoDB, Couchbase
Column-Family Store
- 列指向のデータモデルで、大量のデータを分散環境で高速に処理することに特化しています。
- 非常に高いスケーラビリティと可用性を持ち、ビッグデータ分析やリアルタイム処理に適しています。
- 例: Apache Cassandra, Apache HBase
Graph Database
- データとデータの関係性（エッジ）をグラフ構造で表現します。
- ソーシャルネットワークの分析やレコメンデーションシステムなど、複雑な関係性を持つデータを高速に検索・処理するのに適しています。
- 例: Neo4j

2.4.2 分散データベース (Distributed Database)

分散データベースとは、一つの論理的なデータベースが、物理的にはネットワークで接続された複数のコンピュータ（ノード）に分散して格納・管理されているシステムのことです。ユーザーからは単一のデータベースのように見えますが、内部ではデータが複数の場所に分割して保持されています。

分散データベースの目的

スケーラビリティ: 単一サーバーの性能限界を超え、システムを容易に拡張（スケールアウト）できる。
可用性: 一部のノードが障害を起こしても、システム全体が停止せず、データの利用を継続できる。
透過性: ユーザーはデータがどこに格納されているかを意識せず、単一のデータベースとしてアクセスできる。
データ局所性: データをユーザーの地理的・論理的な近くに配置することで、アクセス速度を向上させる。

分散データベースの課題

データの分散方法:
- フラグメンテーション（断片化）: テーブルを水平（行）または垂直（列）に分割して、複数のノードに配置する。
- レプリケーション（複製）: 同じデータを複数のノードに複製して配置し、可用性や読み取り性能を向上させる。
分散トランザクション管理:
- 複数のノードにまたがるトランザクションのACID特性を保証することは非常に複雑です。**2相コミット（Two-Phase Commit: 2PC）**プロトコルなどが利用されます。
分散クエリ最適化:
- 複数のノードからデータを収集・結合するクエリを、ネットワーク通信量を最小限に抑えつつ効率的に実行するための最適化が難しい。
ネットワーク障害: ネットワークの分断が発生した場合、各ノード間でのデータの一貫性維持が困難になる（CAP定理）。

CAP定理

分散システムにおける重要な概念にCAP定理があります。これは、以下の3つの特性のうち、同時に2つしか完全に満たすことはできない、というものです。

Consistency (一貫性): 全てのノードが同じ時点のデータを見ている。
Availability (可用性): 常にシステムが動作しており、リクエストに対して応答を返すことができる。
Partition tolerance (分断耐性): ネットワーク分断が発生しても、システム全体が動作を継続できる。

多くの分散データベースやNoSQLシステムは、このCAP定理のトレードオフを考慮し、特定の特性を優先するように設計されています。例えば、可用性と分断耐性を優先し、一貫性を「最終的な一貫性」とするシステムが多く存在します。

第2章 DBMS 問題集 (20問)

問題 1 (索引の役割)

データベースにおいて索引（インデックス）を使用する主な目的として、最も適切なものはどれか。

ア. データの重複を自動的に排除するため。
イ. INSERT、UPDATE、DELETEの処理速度を向上させるため。
ウ. SELECT文によるデータ検索の処理速度を向上させるため。
エ. データベースの物理的な容量を削減するため。

解答と解説

解答: ウ

解説:
索引は、特定のカラムの値をキーとしてデータ行へのポインタを管理することで、SELECT文による検索やソート処理を高速化します。データの重複排除は主にPRIMARY KEYやUNIQUE制約の役割であり、INSERT等のDML操作は索引のメンテナンスコストがかかるため遅くなります。索引自体もデータであるため、物理容量は増加します。

問題 2 (B-Tree索引)

B-Tree（B+Tree）索引の構造において、実際のデータ行へのポインタ（ROWIDなど）を格納しているのは主にどのノードか。

ア. ルートノード
イ. ブランチノード
ウ. リーフノード
エ. メタデータノード

解答と解説

解答: ウ

解説:
B-Tree索引では、ルートノードとブランチノードは探索のためのキー値と下位ノードへのポインタを保持し、リーフノードが実際のキー値とデータ行へのポインタを格納しています。リーフノードは通常、範囲検索を効率化するために相互に連結されています。

問題 3 (索引のデメリット)

索引のデメリットとして、適切でないものはどれか。

ア. 索引の作成や再構築に時間がかかる。
イ. SELECT文によるデータ検索が遅くなる。
ウ. INSERT、UPDATE、DELETEなどのデータ変更時に索引の更新が必要となる。
エ. ディスクストレージを消費する。

解答と解説

解答: イ

解説:
索引はSELECT文によるデータ検索を高速化するためのものです。データ検索が遅くなるのは索引のデメリットではありません。索引の作成、更新コスト、ストレージ消費はデメリットです。

問題 4 (クラスタ化インデックス)

クラスタ化インデックス（Clustered Index）に関する説明として、最も適切なものはどれか。

ア. 1つのテーブルに複数作成できる。
イ. 索引のキー順にテーブルのデータ行が物理的に並べ替えられて格納される。
ウ. 常に非クラスタ化インデックスよりも検索性能が優れている。
エ. VARCHAR型のカラムにのみ作成できる。

解答と解説

解答: イ

解説:
クラスタ化インデックスは、索引のキー順にデータ行が物理的に格納されるため、1つのテーブルに1つしか作成できません（アは誤り）。物理的な並び順と索引が一致するため、多くの場合高速ですが、常に非クラスタ化インデックスより優れているとは限りません（ウは誤り）。データ型の制限もありません（エは誤り）。

問題 5 (トランザクション)

データベースにおけるトランザクションの最も基本的な性質は何か。

ア. 一連の処理は必ず複数のSQL文で構成される。
イ. 処理の途中でも他のユーザーから変更結果が見える。
ウ. 一連の処理は全て成功するか、全て失敗して元の状態に戻るかのどちらかである。
エ. SELECT文だけがトランザクションの対象となる。

解答と解説

解答: ウ

解説:
トランザクションの原子性（Atomicity）とは、一連の処理が不可分な一つの単位として扱われ、全て実行されるか、全て実行されないかのどちらかであることを意味します。

問題 6 (ACID特性)

トランザクションのACID特性のうち、一度コミットされた変更は、システム障害が発生しても失われることなく永続的に保存されることを保証する特性は何か。

ア. 原子性 (Atomicity)
イ. 一貫性 (Consistency)
ウ. 独立性 (Isolation)
エ. 永続性 (Durability)

解答と解説

解答: エ

解説:
永続性（Durability）は、トランザクションが一度コミットされると、その結果は恒久的なものとなり、システム障害が発生しても失われることはない、という特性です。通常、これはログファイルへの書き込みによって保証されます。

問題 7 (MVCC)

MVCC (Multi-Version Concurrency Control) が主に解決しようとするデータベースの課題は何か。簡潔に説明しなさい。

解答と解説

解答:
読み取りと書き込みの競合を減らし、データベースの同時実行性を高めることです。MVCCでは、データ更新時に新しいバージョンを作成することで、読み取りトランザクションが更新中のデータによってブロックされるのを防ぎます。

問題 8 (排他制御 - ロックの種類)

データベースの排他制御において、あるデータに専有ロック（Xロック）がかかっている場合、他のトランザクションはそのデータに対してどのような操作が可能か。

ア. 読み取りと書き込みの両方が可能。
イ. 読み取りのみ可能。
ウ. 書き込みのみ可能。
エ. 読み取りも書き込みも不可能。

解答と解説

解答: エ

解説:
専有ロック（Xロック）は最も強力なロックであり、対象のデータへの他のトランザクションからの全てのアクセス（読み取り、書き込み）を排他します。これにより、データの一貫性が保たれます。

問題 9 (デッドロック)

デッドロックの発生を回避するための一つの方法として、「複数のデータにロックをかける必要がある場合、全てのトランザクションで同じ順序でロックをかける」というものがある。この方法が有効である理由を簡潔に説明しなさい。

解答と解説

解答:
ロックの獲得順序を統一することで、互いに相手がロックしている資源の解放を待ち合うという循環待機状態（デッドロックの必要条件の一つ）が発生するのを防ぐことができるためです。

問題 10 (分離レベル - ダーティリード)

ダーティリード（Dirty Read）とは、どのような現象か。簡潔に説明しなさい。

解答と解説

解答:
ダーティリードとは、あるトランザクション（T1）が、まだコミットされていない（ロールバックされる可能性がある）他のトランザクション（T2）によって変更されたデータを読み取ってしまう現象です。もしT2がロールバックされた場合、T1は存在しないはずのデータを読み取ったことになり、データの不整合を招きます。

問題 11 (分離レベル - ノンリピータブルリード)

READ COMMITTED分離レベルでは防ぐことができるが、REPEATABLE READ分離レベルでは防ぐことができる現象は何か。

ア. ダーティリード
イ. ノンリピータブルリード
ウ. ファントムリード
エ. デッドロック

解答と解説

解答: イ

解説:
READ COMMITTEDはダーティリードを防ぎますが、ノンリピータブルリード（同じデータを複数回読み取ったときに値が変わる現象）は防げません。REPEATABLE READはダーティリードとノンリピータブルリードの両方を防ぎます。ファントムリードはSERIALIZABLEのみが防ぎます。

問題 12 (チェックポイント)

データベースの障害回復において、チェックポイント処理の主な目的は何か。

ア. データベースの完全なバックアップを作成するため。
イ. トランザクションログに記録された全ての情報をディスクに書き出すため。
ウ. 障害発生時の復旧にかかる時間を短縮するため。
エ. ユーザーが手動でデータベースの状態を保存するため。

解答と解説

解答: ウ

解説:
チェックポイントは、メモリ上のバッファキャッシュにある変更されたデータをディスクに強制的に書き出す処理です。これにより、障害発生時にチェックポイント以降のログだけを処理すればよくなるため、復旧にかかる時間を短縮できます。

問題 13 (障害回復)

データベースの障害回復において、まだコミットされていない変更をログ情報に基づいて取り消し、トランザクション開始前の状態に戻す処理を何と呼ぶか。

ア. ロールフォワード (Roll-Forward)
イ. ロールバック (Roll-Back)
ウ. コミット (Commit)
エ. チェックポイント (Checkpoint)

解答と解説

解答: イ

解説:
ロールバック（Roll-Back）は、未コミットのトランザクションによる変更をログ（UNDO情報）に基づいて取り消し、データベースをトランザクション開始前の状態に戻す処理です。ロールフォワードはコミット済みの変更を再度適用する処理です。

問題 14 (NoSQL登場の背景)

NoSQLデータベースが登場した主な背景として、適切でないものはどれか。

ア. 膨大な量の非構造化データの処理要求。
イ. 水平スケーラビリティの実現の容易さへの要求。
ウ. 厳格なACID特性の全てを常に必要とするアプリケーションが増加したため。
エ. 柔軟なスキーマを持つデータモデルへの要求。

解答と解説

解答: ウ

解説:
NoSQLは、RDBMSが提供する厳格なACID特性を緩和することで、高い可用性やスケーラビリティ、パフォーマンス、柔軟なスキーマを実現しました。したがって、厳格なACID特性を必要とするアプリケーションが増加したことがNoSQLの背景ではありません。

問題 15 (NoSQLの種類)

JSONやBSONのようなドキュメント形式でデータを格納し、柔軟なスキーマを持つNoSQLデータベースのカテゴリは何か。

ア. Key-Value Store
イ. Document Store
ウ. Column-Family Store
エ. Graph Database

解答と解説

解答: イ

解説:
Document Store（ドキュメント指向データベース）は、JSONやBSON形式のドキュメントとしてデータを格納します。MongoDBなどが代表例です。

問題 16 (分散データベースのメリット)

分散データベースシステムの利点として、適切でないものはどれか。

ア. システムの水平スケーラビリティを高めることができる。
イ. データの局所性を高め、アクセス速度を向上させることができる。
ウ. 障害発生時のデータ復旧プロセスが常に単一のデータベースより単純になる。
エ. 特定のノードに障害が発生しても、システム全体の可用性を維持しやすい。

解答と解説

解答: ウ

解説:
分散データベースでは、データが複数のノードに分散しているため、障害発生時のデータ復旧や整合性維持のプロセスは、単一のデータベースよりもはるかに複雑になります。ア、イ、エは分散データベースの主な利点です。

問題 17 (CAP定理)

分散データベースシステムにおいて、CAP定理が示す3つの特性（Consistency, Availability, Partition tolerance）をすべて同時に満たすことはできない。この定理が意味する「Partition tolerance (分断耐性)」とは何か。

解答と解説

解答:
ネットワーク分断（一部のノード間での通信が途絶える状態）が発生しても、システム全体が停止することなく、動作を継続できる能力のことです。分散システムではネットワーク分断が必ず発生しうるため、分断耐性は必須の特性とされます。

問題 18 (カバリングインデックス)

カバリングインデックス（Covering Index / 包含インデックス）とはどのような索引か。そのメリットと共に簡潔に説明しなさい。

解答と解説

解答:
カバリングインデックスとは、問合せに必要な全てのカラムが索引自体に含まれている索引のことです。これにより、問合せの実行時にテーブル本体にアクセスする必要がなくなり、索引だけで結果を返せるため、I/Oが削減され、パフォーマンスが大幅に向上します。

問題 19 (REDOログとUNDOログ)

データベースのログファイルには、主にREDO情報とUNDO情報が記録されている。それぞれの役割について簡潔に説明しなさい。

解答と解説

解答:

REDO情報: トランザクションがコミットした変更内容（変更後のデータ）を記録したもので、障害発生後のロールフォワード（再実行）に使用されます。
UNDO情報: トランザクションが実行した変更を元に戻すための情報（変更前のデータ）を記録したもので、障害発生後のロールバック（取り消し）に使用されます。

問題 20 (直列化可能性と同時実行性)

トランザクションの独立性レベルで最も高いSERIALIZABLE（直列化可能）を選択した場合、データの整合性は最大限に保証されるが、その代償としてトレードオフになる要素は何か。

ア. ストレージ消費量
イ. ネットワーク遅延
ウ. 同時実行性
エ. 開発の複雑さ

解答と解説

解答: ウ

解説:
SERIALIZABLEレベルは、最も厳格な分離を提供するため、他のトランザクションとの競合を避けるために強力なロックを多用します。これにより、トランザクション間の待機が増え、同時に実行できるトランザクションの数が減るため、同時実行性が低下する可能性があります。

第3章設計

3.1 概念設計

データベース設計は、システムの要件を分析し、最適なデータベース構造を構築するプロセスです。このプロセスは通常、以下の3つのフェーズで進められます。

概念設計 (Conceptual Design): ユーザーの視点から、現実世界の情報を抽象化してデータモデルを作成する。
論理設計 (Logical Design): 概念設計で作成したモデルを、特定のリレーショナルデータベースモデルに変換する。
物理設計 (Physical Design): 論理設計で作成したモデルを、特定のDBMSの特性に合わせて物理的な格納構造を定義する。

概念設計は、データベース設計の最初のステップであり、最も重要なフェーズの一つです。ここでは、特定のデータベースシステム（DBMS）の種類や物理的な実装方法に依存せず、ビジネス要件やユーザーの視点から、必要なデータとその関連性を洗い出し、明確に定義することを目的とします。

目的

現実世界のモデル化: 現実世界のエンティティ（実体）、属性、リレーションシップを正確に把握し、抽象化して表現する。
ビジネス要件の把握: システムが扱うべきデータの種類、データの意味、データ間のつながりを、ユーザー部門と開発部門の間で共通認識として確立する。
DBMS非依存: 特定のDBMSの制約を受けずに、純粋な情報構造としてデータモデルを構築する。

成果物

概念設計の主要な成果物は、**E-R図（Entity-Relationship Diagram）**です。E-R図は、エンティティ、属性、リレーションシップをグラフィカルに表現したもので、データベースの「青写真」となります。

概念設計をしっかりと行うことで、後続の論理設計や物理設計がスムーズに進み、システムの要件漏れやデータ不整合を防ぐことができます。

3.1.1 E-R図

**E-R図（Entity-Relationship Diagram: エンティティ関連図）**は、データベースの概念設計において、現実世界に存在する「モノ」や「コト」、それらの「属性」、そして「モノ」や「コト」同士の「関係」を視覚的に表現するための図法です。

E-R図にはいくつかの表記法がありますが、ここでは代表的な要素とその表現方法を紹介します。

E-R図の主要な構成要素

エンティティ (Entity: 実体)
- 定義: 情報を蓄積する対象となる、識別可能な独立した「モノ」や「コト」。現実世界に存在する具体的な対象（顧客、製品、注文など）や、概念的な対象（部署、プロジェクトなど）です。
- 表記: 長方形で表し、中にエンティティ名を記述します。
属性 (Attribute: 特徴)
- 定義: エンティティが持つ具体的なデータ項目や特徴。エンティティの詳細な情報を表します。
- 表記: 楕円形で表し、エンティティに線で接続します。主キーとなる属性には下線を引くことが多いです。ただし、簡略化したE-R図では、エンティティの長方形の中に属性を直接列挙することもあります。
リレーションシップ (Relationship: 関係)
- 定義: 2つ以上のエンティティ間の意味のある関連。動詞や動詞句で表現されることが多いです。
- 表記: ひし形（菱形）で表し、関係するエンティティと線で接続します。ひし形の中にリレーションシップ名を記述します。
多重度 (Cardinality: カーディナリティ)
- 定義: リレーションシップにおいて、一方のエンティティのインスタンスが、もう一方のエンティティのインスタンスといくつ関連を持つことができるかを示すものです。
- 表記: リレーションシップとエンティティを結ぶ線の端に、記号（例：1、N、Mなど）を使って表現します。代表的な多重度には以下の種類があります。
  - 1対1 (One-to-One): 例：1つの従業員は1つの社用車を持つ。
  - 1対多 (One-to-Many): 例：1つの部署には複数の従業員が所属する。
  - 多対多 (Many-to-Many): 例：1つの製品は複数の注文に含まれ、1つの注文は複数の製品を含む。

E-R図の例 (Mermaid形式)

顧客が製品を注文し、その注文は複数の製品で構成される場合のE-R図をMermaid形式で表現します。

erDiagram
    CUSTOMER ||--o{ ORDER : "places"
    ORDER ||--o{ ORDER_DETAIL : "includes"
    PRODUCT ||--o{ ORDER_DETAIL : "is_part_of"

    CUSTOMER {
        int customer_id PK
        string customer_name
        string address
        string phone_number
    }

    ORDER {
        int order_id PK
        int customer_id FK
        date order_date
        string status
    }

    PRODUCT {
        int product_id PK
        string product_name
        decimal price
        int stock_quantity
    }

    ORDER_DETAIL {
        int order_id PK, FK
        int product_id PK, FK
        int quantity
        decimal unit_price
    }

図の解説:

CUSTOMERはORDERを「places（行う）」関係にあり、「1顧客は0以上の注文を行う」ことを示します（1対多）。
ORDERはORDER_DETAILを「includes（含む）」関係にあり、「1注文は1以上の注文明細を含む」ことを示します（1対多）。
PRODUCTはORDER_DETAILに「is_part_of（の一部である）」関係にあり、「1製品は0以上の注文明細に含まれる」ことを示します（1対多）。
ORDER_DETAILは、ORDERとPRODUCTの間の多対多の関係を解消するために導入されたエンティティです。

このE-R図は、データベースに格納すべき情報とその関係性を、誰にでも分かりやすい形で視覚化するのに役立ちます。

3.1.2 エンティティ

**エンティティ（実体）**は、E-R図を構成する最も基本的な要素であり、現実世界における「識別可能な独立したモノやコト」を表します。データベースでは、このエンティティが「テーブル」に対応します。

エンティティの特定方法

ビジネス要件やシステム化の対象となる業務を分析する際、以下の点に着目するとエンティティを特定しやすくなります。

名詞に着目する: 業務要件や会話の中で頻繁に出てくる名詞（例: 顧客、製品、注文、従業員、部署、プロジェクトなど）は、エンティティになる可能性が高いです。
情報を保持する必要があるか: その「モノ」や「コト」に関する詳細な情報をシステムが永続的に保持する必要があるか。
一意に識別可能か: その「モノ」や「コト」の各インスタンス（個体）を、他のインスタンスと区別できる識別子（主キー候補）を考えることができるか。

エンティティの分類

エンティティは、その性質によっていくつかの種類に分類できます。

独立エンティティ（主エンティティ）:
- 他のエンティティに依存せず、独立して存在できるエンティティ。自身の主キーだけで一意に識別できます。
- 例: 顧客、製品、従業員、部署
従属エンティティ（弱エンティティ）:
- 自身の存在が他のエンティティに依存しているエンティティ。自身の主キーだけでは一意に識別できず、関連する独立エンティティの主キーと組み合わせて識別されます。
- 例: 家族（従業員に従属）、部署履歴（従業員や部署に従属）
関連エンティティ（連関エンティティ）:
- 複数のエンティティ間の多対多のリレーションシップを解消するために導入されるエンティティ。複数のエンティティの主キーを結合したものを主キーとして持つことが多いです。
- 例: 注文明細（注文と製品の多対多を解消）、受講（学生と科目の多対多を解消）

主キー (Primary Key) の選定

エンティティの各インスタンスを一意に識別するための属性または属性の組み合わせを主キーと呼びます。主キーの選定は、データベースの整合性と効率に大きく影響します。

一意性: 各インスタンスを重複なく識別できること。
非NULL性: 値がNULLであってはならないこと。
不変性: 原則として、一度設定された値は変更されないこと。
簡潔性: 可能な限り短く、シンプルであること。

主キーには、現実世界の意味を持つ自然キー（例: 顧客コード、ISBNコード）と、システムが内部的に生成する意味を持たない代理キー（サロゲートキー）（例: 連番のID）があります。実務では、変更の可能性が低い連番などの代理キーを主キーとし、業務上の識別子をUNIQUE制約付きの候補キーとすることが推奨されることが多いです。

3.1.3 リレーションシップ

**リレーションシップ（関係）**は、E-R図において、エンティティ間に存在する論理的なつながりや相互作用を示します。このリレーションシップが、データベースにおけるテーブル間の関連性（FOREIGN KEY）に変換されます。

リレーションシップの特定方法

動詞に着目する: 業務要件や会話の中でエンティティ同士を結びつける動詞（例: 「顧客が注文する」「製品が注文に含まれる」「従業員が部署に所属する」など）は、リレーションシップになる可能性が高いです。

リレーションシップの多重度（カーディナリティ）

多重度は、リレーションシップの両端において、一方のエンティティの1つのインスタンスが、もう一方のエンティティのいくつのインスタンスと関連を持つことができるかを示します。これは、E-R図で最も重要な情報の1つです。

1対1 (One-to-One: 1:1)
- 一方のエンティティの1つのインスタンスが、もう一方のエンティティの1つのインスタンスとだけ関連を持つ。
- 例: 従業員と経歴情報（1人の従業員は1つの経歴情報を持つ、1つの経歴情報は1人の従業員のもの）
- データベース化する際には、通常、2つのテーブルを統合するか、どちらかのテーブルに他方のテーブルの主キーをFOREIGN KEYとして持つ形で表現されます。
1対多 (One-to-Many: 1:N)
- 一方のエンティティの1つのインスタンスが、もう一方のエンティティの複数のインスタンスと関連を持つが、もう一方のエンティティの1つのインスタンスは、最初のエンティティの1つのインスタンスとだけ関連を持つ。
- 例: 部署と従業員（1つの部署には複数の従業員が所属するが、1人の従業員は1つの部署にだけ所属する）
- データベース化する際には、「多」側のテーブルに「1」側のテーブルの主キーをFOREIGN KEYとして持たせる形で表現されます。
多対多 (Many-to-Many: N:M)
- 一方のエンティティの1つのインスタンスが、もう一方のエンティティの複数のインスタンスと関連を持ち、かつ、もう一方のエンティティの1つのインスタンスも、最初のエンティティの複数のインスタンスと関連を持つ。
- 例: 学生と科目（1人の学生は複数の科目を履修し、1つの科目には複数の学生が所属する）
- データベース化する際には、直接表現することができないため、間に**関連エンティティ（連関エンティティ）**と呼ばれる新しいエンティティ（テーブル）を導入することで解消します。関連エンティティは、両方のエンティティの主キーをFOREIGN KEYとして持ち、それらを複合主キーとすることが多いです。

参加の任意性（Optionality）

多重度と合わせて、リレーションシップの参加が必須（Mandatory）か任意（Optional）かも表現します。

必須: 必ず関連するインスタンスが存在する。E-R図では線とエンティティの接続部分で表現します（例: | - |）。
任意: 関連するインスタンスが存在しなくてもよい。E-R図では線とエンティティの接続部分で表現します（例: o - |）。

3.2 論理設計

論理設計は、概念設計で作成したE-R図などの概念データモデルを、特定のリレーショナルデータベースの枠組み（リレーショナルモデル）に変換するフェーズです。この段階では、まだ特定のDBMS製品（Oracle, PostgreSQLなど）の具体的な機能には依存しませんが、リレーショナルデータベースの基本的な制約や特性を考慮に入れます。

目的

関係スキーマへの変換: エンティティをテーブルに、属性をカラムに、リレーションシップを外部キーに変換し、関係スキーマを定義する。
データの冗長性排除: 正規化というプロセスを通じて、データの重複を排除し、データの更新・挿入・削除時に発生する不整合（異常: アノマリ）を防ぐ。
データ整合性の確保: 制約（主キー、外部キー、一意性制約など）を定義し、データの正確性と信頼性を保証する。

成果物

関係スキーマ定義: 各テーブルの構造（テーブル名、カラム名、データ型、主キー、外部キー）を定義した一覧。
正規化されたテーブル群: 各正規形（通常は第3正規形またはBCNF）を満たすテーブル構造。

論理設計は、データベースの長期的な安定性とパフォーマンスに直結する重要なフェーズです。特に「正規化」は、データベーススペシャリスト試験において頻出のテーマであり、深く理解する必要があります。

3.2.1 関係スキーマ

**関係スキーマ（Relational Schema）**は、リレーショナルデータベースのテーブルの構造を形式的に記述したものです。論理設計の主要な成果物の一つであり、エンティティがテーブル、属性がカラム、リレーションシップが外部キーとして表現されます。

記述形式

一般的に、以下のような形式で記述されます。

テーブル名 (主キー, 属性1, 属性2, ..., 外部キー1, 外部キー2, ...)

主キー: 下線（_）を引くか、PKと表記します。
外部キー: FKと表記するか、外部キーであることを注記します。

E-R図から関係スキーマへの変換例

E-R図の例で示したCUSTOMER, ORDER, PRODUCT, ORDER_DETAILエンティティを関係スキーマに変換してみましょう。

CUSTOMERエンティティ:
- CUSTOMER (customer_id, customer_name, address, phone_number)
  - customer_idが主キー
PRODUCTエンティティ:
- PRODUCT (product_id, product_name, price, stock_quantity)
  - product_idが主キー
ORDERエンティティ:
- ORDER (order_id, customer_id FK, order_date, status)
  - order_idが主キー
  - customer_idがCUSTOMERテーブルへの外部キー
ORDER_DETAILエンティティ:
- ORDER_DETAIL (order_id FK, product_id FK, quantity, unit_price)
  - (order_id, product_id)が複合主キー
  - order_idがORDERテーブルへの外部キー
  - product_idがPRODUCTテーブルへの外部キー

このように、E-R図で表現された概念が、リレーショナルモデルの具体的なテーブル構造として定義されます。

3.2.2 関数従属

**関数従属（Functional Dependency: FD）**は、リレーショナルデータベースの正規化を理解する上で最も重要な概念の一つです。

「属性集合Xが属性集合Yを関数従属する」とは、X -> Yと表記され、属性集合Xの値が一意に決まれば、属性集合Yの値も一意に決まるという関係を意味します。

例

学籍番号 -> 学生氏名
- 学籍番号が一意に決まれば、それに対応する学生氏名も一意に決まります。
製品ID -> 製品名
- 製品IDが一意に決まれば、製品名も一意に決まります。
社員番号 -> (社員氏名, 所属部署名)
- 社員番号が一意に決まれば、社員氏名と所属部署名も一意に決まります。

関数従属の性質

決定項 (Determinant): 関数従属の左側にある属性集合Xのこと。Yの値を決定する側。
被決定項 (Determinand): 関数従属の右側にある属性集合Yのこと。Xによって値が決定される側。

関数従属は、テーブル内の属性間の論理的な関係を示しており、この関係を分析することで、データの冗長性や更新時の異常（アノマリ）の原因を特定し、正規化へとつなげていきます。

3.2.3 完全/部分関数従属

関数従属には、主キーとの関係によって完全関数従属と部分関数従属があります。これらは第2正規形（2NF）を理解する上で重要な概念です。

完全関数従属 (Full Functional Dependency)

属性集合Yが属性集合Xに完全関数従属するとは、X -> Y であり、かつXのどの真部分集合（Xの一部）もYを関数従属しない場合をいいます。

例: 注文明細テーブル ORDER_DETAIL (注文ID PK, 製品ID PK, 数量, 単価) 複合主キーは(注文ID, 製品ID)。

(注文ID, 製品ID) -> 数量
- 注文IDと製品IDが決まれば、数量が一意に決まります。
- 注文IDだけでは数量は決まらないし、製品IDだけでは数量は決まりません。
- よって、数量は複合主キー(注文ID, 製品ID)に完全関数従属しています。
(注文ID, 製品ID) -> 単価
- 同様に、単価も複合主キーに完全関数従属しています。

部分関数従属 (Partial Functional Dependency)

属性集合Yが属性集合Xに部分関数従属するとは、X -> Y であり、かつXの真部分集合（Xの一部）がYを関数従属する場合をいいます。部分関数従属は、第2正規形（2NF）の違反の原因となります。

例: 注文明細テーブル（製品名を含めてしまった場合） ORDER_DETAIL (注文ID PK, 製品ID PK, 数量, 単価, 製品名) 複合主キーは(注文ID, 製品ID)。

(注文ID, 製品ID) -> 製品名 という関数従属がある。
しかし、製品ID -> 製品名 という関数従属も存在する。
この場合、製品名は複合主キー(注文ID, 製品ID)の一部である製品IDにのみ従属しており、部分関数従属であると言えます。

このような部分関数従属があると、データに以下のような問題（更新異常）が生じます。

更新異常: ある製品の製品名を変更する場合、その製品が含まれる全ての注文明細のレコードを更新しなければならない。
削除異常: ある製品が全ての注文明細から削除されると、その製品の製品名に関する情報も失われてしまう。
挿入異常: 新しい製品の情報を登録する際、まだ一度も注文されていない製品だと、注文明細に挿入できない。

3.2.4 推移的関数従属

**推移的関数従属（Transitive Functional Dependency）**は、第3正規形（3NF）を理解する上で重要な概念です。

属性集合X、Y、Zが存在し、X -> Y かつ Y -> Z であり、かつYがXの真部分集合ではなく、Yが候補キーではない場合に、ZはXに推移的に関数従属するといいます。

より平易に言えば、主キーではない属性を介して、他の非主キー属性が主キーに従属している状態です。

例: 従業員テーブル EMPLOYEE (社員ID PK, 社員氏名, 部署ID FK, 部署名, 部署所在地) 主キーは社員ID。

関数従属の関係は以下のようになります。

社員ID -> 社員氏名
社員ID -> 部署ID
社員ID -> 部署名
社員ID -> 部署所在地
部署ID -> 部署名 (部署IDが決まれば部署名が決まる)
部署ID -> 部署所在地 (部署IDが決まれば部署所在地が決まる)

この場合、社員ID -> 部署ID かつ 部署ID -> 部署名 の関係があるため、部署名は社員IDに推移的に関数従属しています。同様に、部署所在地も社員IDに推移的に関数従属しています。

このような推移的関数従属があると、データに以下のような問題（更新異常）が生じます。

更新異常: ある部署の部署名を変更する場合、その部署に所属する全ての従業員のレコードを更新しなければならない。
削除異常: ある部署に所属する最後の従業員が削除されると、その部署の部署名や部署所在地に関する情報も失われてしまう。
挿入異常: 新しい部署の情報を登録する際、まだ一人も従業員が所属していない部署だと、従業員テーブルに挿入できない。

推移的関数従属は、第3正規形（3NF）への正規化によって解消されます。

3.2.5 アームストロングの公理

**アームストロングの公理（Armstrong's Axioms）**は、リレーショナルデータベースにおける関数従属の性質を形式的に記述した一連の規則です。これらの公理を使うことで、ある関数従属の集合から、それに含まれる全ての関数従属を導き出すことができます。

アームストロングの公理は以下の3つの規則（推論規則）から構成されます。

反射律 (Reflexivity)
- もし属性集合Yが属性集合Xの部分集合であるならば、XはYを関数従属する（X -> Y）。
- 例: (社員ID, 社員氏名) -> 社員ID （社員IDと社員氏名が分かれば、社員IDは一意に決まる）
- 自明な関数従属であり、常に真です。
増加律 (Augmentation)
- もしX -> Yであるならば、任意の属性集合Zに対して、XZ -> YZである。
- 例: 社員ID -> 社員氏名 であれば、社員ID, 電話番号 -> 社員氏名, 電話番号
- 決定項に属性を追加しても、従属関係は保持されることを意味します。
推移律 (Transitivity)
- もしX -> Yであり、かつY -> Zであるならば、X -> Zである。
- 例: 社員ID -> 部署ID かつ 部署ID -> 部署名 であれば、社員ID -> 部署名
- 関数従属が連鎖することを意味し、推移的関数従属の検出に利用されます。

これらの3つの公理は「健全（Sound）」であり「完全（Complete）」であることが証明されています。つまり、これらの公理を使って導出される全ての関数従属は正しいものであり、また、正しい全ての関数従属を導出することができます。

アームストロングの公理は、正規化のプロセスで複雑な関数従属関係を分析し、テーブルの分解が必要かどうかを判断するための理論的な基盤を提供します。

3.2.6 正規化

**正規化（Normalization）**は、リレーショナルデータベース設計において、データの冗長性（重複）を排除し、データの整合性（一貫性）を保ち、データ操作時（挿入、更新、削除）に発生する不整合（異常: アノマリ）を防ぐために、テーブルの構造を整理（分解）する体系的なプロセスです。

正規化の目的

データの冗長性の排除:
- 同じデータが複数箇所に存在すると、記憶領域の無駄になるだけでなく、更新時に全ての箇所を更新しきれない「更新異常」の原因となります。
更新・挿入・削除異常の防止:
- 更新異常: 特定のデータを更新する際、複数のレコードを更新する必要があり、漏れが発生するとデータ不整合につながる。
- 挿入異常: ある情報を挿入するためには、別の情報も同時に挿入しなければならない。または、ある情報がないと挿入できない。
- 削除異常: ある情報を削除すると、意図せず別の重要な情報も失われてしまう。
データ整合性の向上:
- データが常に正確で一貫した状態を保つことができます。
データモデルの明確化と理解の容易さ:
- 各テーブルが明確な意味を持つようになり、データベース全体の構造が理解しやすくなります。

正規化のプロセス

正規化は、いくつかの段階（正規形）を経て行われます。最も基本的な第1正規形から始まり、段階的に厳しくなる条件を満たすようにテーブルを分解していきます。一般的には、第3正規形（3NF）まで達成されていれば、多くのビジネスアプリケーションで十分な整合性が確保されるとされています。

この後のセクションで、各正規形とその特徴、正規化の方法について詳しく見ていきます。

3.2.7 第1正規形 (1NF)

**第1正規形（First Normal Form: 1NF）**は、正規化の最も基本的な段階です。

定義

テーブルが第1正規形であるための条件は以下の通りです。

繰り返しグループがないこと（繰り返し属性がないこと）:
- 1つのレコード内に同じ種類の情報が複数回現れる部分がないこと。
- 例: 顧客テーブルに電話番号1, 電話番号2, 電話番号3といったカラムが存在する場合や、1つのカラムに複数の値（例: カンマ区切りで複数の電話番号）が入っている場合。
全ての属性が原子値であること（非原子属性がないこと）:
- 1つのカラムに格納される値が、それ以上分割できない最小単位であること。
- 例: 住所という1つのカラムに「東京都渋谷区1-2-3」と入っている場合、これを「都道府県」「市区町村」「番地」に分割できるため、原子値ではありません。

第1正規形ではない例

顧客ID	顧客名	電話番号1	電話番号2	電話番号3
101	山田太郎	090-XXXX-1111	03-YYYY-2222
102	佐藤花子	090-XXXX-3333

このテーブルは、電話番号が繰り返しグループとして存在するため、第1正規形ではありません。

第1正規形への変換

繰り返しグループや非原子属性を解消するために、以下のいずれかの方法でテーブルを分解します。

新しいテーブルとして分離する: 繰り返しグループを新しいテーブルとして分離し、元のテーブルの主キーを外部キーとして持たせる。
複合主キーにする: 繰り返しグループを形成する属性と、元のテーブルの主キーを組み合わせて新しい主キーとする。

上記の例を第1正規形に変換する:

新しい顧客電話番号テーブルを分離する方法。

顧客テーブル CUSTOMER (顧客ID PK, 顧客名)
顧客電話番号テーブル CUSTOMER_PHONE (顧客ID PK, 電話番号 PK)

顧客ID	顧客名
101	山田太郎
102	佐藤花子

顧客ID	電話番号
101	090-XXXX-1111
101	03-YYYY-2222
102	090-XXXX-3333

このように分解することで、データの追加、更新、削除が容易になり、冗長性が低減します。

3.2.8 第2正規形 (2NF)

**第2正規形（Second Normal Form: 2NF）**は、第1正規形よりもさらに冗長性を排除するための段階です。

定義

テーブルが第2正規形であるための条件は以下の通りです。

第1正規形であること。
全ての非キー属性が、主キーに完全に関数従属していること。
- つまり、部分関数従属が存在しないこと。非キー属性が、複合主キーの一部にのみ従属する状態がないこと。

第2正規形ではない例

注文明細と製品情報が一緒になったテーブルを考えます。 ORDER_DETAIL_PRODUCT (注文ID PK, 製品ID PK, 数量, 単価, 製品名, 製品説明)

主キーは複合主キー(注文ID, 製品ID)です。ここで、以下の関数従属を考えます。

(注文ID, 製品ID) -> 数量 (完全に従属)
(注文ID, 製品ID) -> 単価 (完全に従属)
製品ID -> 製品名 (主キーの一部にのみ従属)
製品ID -> 製品説明 (主キーの一部にのみ従属)

製品名と製品説明は、複合主キー(注文ID, 製品ID)全体ではなく、その一部である製品IDにのみ関数従属しています。これは部分関数従属であり、このテーブルは第2正規形ではありません。

第2正規形ではないことによる問題（更新異常）

更新異常: ある製品の製品名を変更する場合、その製品が含まれる全ての注文明細レコードを更新する必要がある。
挿入異常: まだ一度も注文されていない新しい製品の情報を登録する場合、製品情報はORDER_DETAIL_PRODUCTテーブルに挿入できない（注文IDがないため）。
削除異常: ある注文明細が全て削除されると、その明細に含まれる製品の製品名や製品説明に関する情報も失われてしまう。

第2正規形への変換

部分関数従属が存在する場合、その部分関数従属を形成している属性（主キーの一部と、それに従属する非キー属性）を新しいテーブルとして分離します。

上記の例を第2正規形に変換する:

注文明細テーブル ORDER_DETAIL (注文ID PK, 製品ID PK, 数量, 単価)
製品テーブル PRODUCT (製品ID PK, 製品名, 製品説明)

製品テーブルの主キー製品IDは、注文明細テーブルでは外部キーとして参照されます。このように分解することで、データの重複が排除され、更新異常などの問題が解消されます。

3.2.9 第3正規形 (3NF)

**第3正規形（Third Normal Form: 3NF）**は、第2正規形よりもさらに冗長性を排除するための段階です。多くの実用的なデータベース設計では、第3正規形が目標とされます。

定義

テーブルが第3正規形であるための条件は以下の通りです。

第2正規形であること。
非キー属性が、主キーに対して推移的に関数従属していないこと。
- つまり、非キー属性が他の非キー属性を介して主キーに従属する状態（推移的関数従属）がないこと。

第3正規形ではない例

第2正規形を満たしているが、第3正規形ではない従業員テーブルを考えます。 EMPLOYEE (社員ID PK, 社員氏名, 部署ID FK, 部署名, 部署所在地)

主キーは社員ID。ここで、以下の関数従属を考えます。

社員ID -> 社員氏名
社員ID -> 部署ID
社員ID -> 部署名
社員ID -> 部署所在地
部署ID -> 部署名 (部署IDが決まれば部署名が決まる)
部署ID -> 部署所在地 (部署IDが決まれば部署所在地が決まる)

部署名と部署所在地は、主キー社員IDに直接従属しているのではなく、非キー属性である部署IDを介して従属しています（社員ID -> 部署ID -> 部署名）。これは推移的関数従属であり、このテーブルは第3正規形ではありません。

第3正規形ではないことによる問題（更新異常）

更新異常: ある部署の部署名を変更する場合、その部署に所属する全ての従業員レコードを更新する必要がある。
挿入異常: まだ一人も従業員が所属していない新しい部署の情報を登録する場合、その部署情報はEMPLOYEEテーブルに挿入できない。
削除異常: ある部署に所属する最後の従業員が削除されると、その部署の部署名や部署所在地に関する情報も失われてしまう。

第3正規形への変換

推移的関数従属が存在する場合、その推移的関数従属を形成している属性（非キー属性と、それに従属する非キー属性）を新しいテーブルとして分離します。

上記の例を第3正規形に変換する:

従業員テーブル EMPLOYEE (社員ID PK, 社員氏名, 部署ID FK)
部署テーブル DEPARTMENT (部署ID PK, 部署名, 部署所在地)

部署テーブルの主キー部署IDは、従業員テーブルでは外部キーとして参照されます。このように分解することで、データの重複が排除され、更新異常などの問題が解消されます。

3.2.10 その他の正規化

第3正規形までがデータベース設計で一般的に目指される正規化のレベルですが、さらに高度な正規形も存在します。これらは特定の状況下でのみ考慮されることが多く、実務では3NFが達成されていれば十分とされることが多いです。

ボイス・コッド正規形 (Boyce-Codd Normal Form: BCNF)
- 定義: 第3正規形であり、かつ全ての決定項が候補キーであること。
- 3NFでは解決できない、複合キーの一部が非キー属性に決定されるような、より複雑な冗長性を排除します。
- 一般に、3NFとBCNFの定義のほとんどは同じですが、複数の候補キーがオーバーラップしているような特殊なケースでBCNFは3NFより厳しくなります。
- BCNFを達成すると、推移的関数従属と部分関数従属の問題が完全に解消されます。
第4正規形 (Fourth Normal Form: 4NF)
- 定義: BCNFであり、かつ多値従属が存在しないこと。
- 多値従属とは、ある属性の組が、主キーの値に対して複数の値を対応付けられるが、それらの値の集合が互いに独立しているような関係です。
- 多値従属は、データの冗長性と更新異常を引き起こします。
第5正規形 (Fifth Normal Form: 5NF)
- 定義: 4NFであり、かつ結合従属が存在しないこと。
- 結合従属とは、テーブルを複数のテーブルに分解し、それらを自然結合で結合し直した場合に、元のテーブルと等価になるような関係です。
- ほとんどのケースで5NFはBCNFと同じになります。

正規化のメリットとデメリット

メリット:
- データの冗長性が排除され、ディスク容量が節約される。
- 更新・挿入・削除異常が防止され、データ整合性が向上する。
- データモデルが明確になり、理解・保守が容易になる。
デメリット:
- テーブルの数が増えるため、複雑な問合せを行う際に多くのテーブル結合が必要となり、パフォーマンスが低下する可能性がある。
- JOINが増えることで、SQLが複雑になる。

このため、実務では、パフォーマンスと整合性のバランスを取り、**意図的に非正規化（Denormalization）**を行うこともあります。これは、通常、読取性能の向上を目的として、更新異常のリスクを許容しながら冗長なデータをあえて持たせる設計手法です。しかし、非正規化は慎重に、そしてリスクを理解した上で行うべきです。

第3章設計問題集 (20問)

問題 1 (概念設計の目的)

データベース設計における概念設計の主な目的として、最も適切なものはどれか。

ア. 特定のDBMSの物理的な記憶構造を定義すること。
イ. ビジネス要件から必要なデータとその関連性を抽出し、DBMSに依存しないデータモデルを作成すること。
ウ. SQL文のパフォーマンスを最大化するためのインデックスを設計すること。
エ. 既存のテーブルを統合し、データ冗長性を意図的に増やすこと。

解答と解説

解答: イ

解説:
概念設計は、データベース設計の最初のフェーズであり、ユーザーの視点から現実世界の情報を抽象化してデータモデルを作成します。特定のDBMSに依存せず、ビジネス要件を正確に反映したデータ構造を定義することが目的です。

問題 2 (E-R図の要素)

E-R図において、エンティティ（実体）を表すために一般的に使用される記号はどれか。

ア. ひし形（菱形）
イ. 楕円形
ウ. 長方形
エ. 矢印

解答と解説

解答: ウ

解説:
E-R図の一般的な表記法では、エンティティは長方形で、属性は楕円形で、リレーションシップはひし形で表されます。

問題 3 (多重度 - 1対多)

「1つの部署には複数の従業員が所属するが、1人の従業員は1つの部署にだけ所属する」という関係の多重度（カーディナリティ）は何か。

ア. 1対1 (One-to-One)
イ. 1対多 (One-to-Many)
ウ. 多対多 (Many-to-Many)
エ. 多対1 (Many-to-One)

解答と解説

解答: イ

解説:
この関係は、部署側から見れば「1つの部署に複数の従業員」なので「多」、従業員側から見れば「1人の従業員は1つの部署」なので「1」です。したがって「1対多」の関係となります。

問題 4 (リレーションシップのデータベース表現)

E-R図で表現された「1対多」のリレーションシップをリレーショナルデータベースで表現する際、一般的にどのような方法がとられるか。

ア. 独立した関連テーブルを作成する。
イ. 「多」側のテーブルに「1」側のテーブルの主キーを外部キーとして持たせる。
ウ. 「1」側のテーブルに「多」側のテーブルの主キーを外部キーとして持たせる。
エ. 両方のテーブルを統合し、単一のテーブルとする。

解答と解説

解答: イ

解説:
1対多の関係では、「多」側のエンティティ（例えば従業員）が「1」側のエンティティ（例えば部署）の主キーを外部キーとして持つことで、関連を表現します。

問題 5 (論理設計の目的)

データベース設計における論理設計の主な目的として、最も適切なものはどれか。

ア. 業務要件を抽出し、E-R図を作成すること。
イ. 特定のDBMS製品を選択し、その設定を行うこと。
ウ. 関係スキーマを定義し、データの冗長性を排除すること。
エ. ディスク容量やアクセス方法などの物理的な側面を考慮すること。

解答と解説

解答: ウ

解説:
論理設計は、概念設計で作成したE-R図をリレーショナルモデルに変換し、正規化を通じてデータの冗長性を排除し、整合性を確保することが主な目的です。

問題 6 (関数従属)

「属性集合Xの値が一意に決まれば、属性集合Yの値も一意に決まる」という関係を何と呼ぶか。

ア. 多値従属
イ. 結合従属
ウ. 関数従属
エ. 候補キー

解答と解説

解答: ウ

解説:
この定義は関数従属（Functional Dependency）そのものです。X -> Yと表記されます。

問題 7 (部分関数従属)

以下のORDER_DETAIL_PRODUCTテーブルを考える。

ORDER_DETAIL_PRODUCT (注文ID PK, 製品ID PK, 数量, 単価, 製品名, 製品説明)

このテーブルの主キーは(注文ID, 製品ID)である。このテーブルにおいて、第2正規形（2NF）に違反する原因となる「部分関数従属」の例として最も適切なものはどれか。

ア. 注文ID -> 数量
イ. (注文ID, 製品ID) -> 単価
ウ. 製品ID -> 製品名
エ. 注文ID -> 製品名

解答と解説

解答: ウ

解説:
部分関数従属とは、複合主キーの一部に非キー属性が関数従属している状態です。 製品名は主キー全体(注文ID, 製品ID)ではなく、主キーの一部である製品IDのみに決定されます（製品ID -> 製品名）。これは部分関数従属です。

問題 8 (推移的関数従属)

以下のEMPLOYEEテーブルを考える。

EMPLOYEE (社員ID PK, 社員氏名, 部署ID FK, 部署名)

このテーブルの主キーは社員IDである。このテーブルにおいて、第3正規形（3NF）に違反する原因となる「推移的関数従属」の例として最も適切なものはどれか。

ア. 社員ID -> 社員氏名
イ. 部署ID -> 部署名
ウ. 社員ID -> 部署名
エ. 社員ID -> 部署ID

解答と解説

解答: ウ

解説:
推移的関数従属とは、主キーではない属性を介して、他の非主キー属性が主キーに従属している状態です。この場合、社員ID -> 部署ID かつ 部署ID -> 部署名 の関係があるため、部署名は社員IDに推移的に関数従属しています。

問題 9 (アームストロングの公理)

アームストロングの公理のうち、「もしX -> Yであり、かつY -> Zであるならば、X -> Zである」と述べられている規則は何か。

ア. 反射律 (Reflexivity)
イ. 増加律 (Augmentation)
ウ. 推移律 (Transitivity)
エ. 分解律 (Decomposition)

解答と解説

解答: ウ

解説:
これはアームストロングの公理の推移律です。関数従属が連鎖的に発生することを示しています。

問題 10 (正規化の目的)

データベースの正規化を行う主な目的として、最も適切でないものはどれか。

ア. データの冗長性を排除するため。
イ. 更新・挿入・削除異常を防止するため。
ウ. データベースの物理的なアクセス速度を必ず向上させるため。
エ. データ整合性を確保し、データモデルを明確にするため。

解答と解説

解答: ウ

解説:
正規化の主要な目的はデータの冗長性排除と整合性確保です。正規化によってテーブルが分解され、結合操作が増えることで、むしろ物理的なアクセス速度（パフォーマンス）が低下する可能性もあります。そのため、意図的に非正規化を行うこともあります。

問題 11 (第1正規形)

テーブルが第1正規形（1NF）であるための条件は何か。簡潔に説明しなさい。

解答と解説

解答:
繰り返しグループ（繰り返し属性）がないこと、および全ての属性が原子値（それ以上分割できない最小単位）であることです。つまり、1つのセルには単一の不可分な値のみが格納されている状態を指します。

問題 12 (第2正規形への変換)

以下の学生履修テーブルは第1正規形を満たしているが、第2正規形ではない。これを第2正規形に変換する際、どのようにテーブルを分解すべきか。

STUDENT_COURSE (学生ID PK, 科目ID PK, 学生氏名, 科目名, 履修日)

解答と解説

解答:
このテーブルには以下の部分関数従属が存在する。

学生ID -> 学生氏名
科目ID -> 科目名

これらを解消するために、テーブルを以下のように分解する。

学生テーブル: STUDENT (学生ID PK, 学生氏名)
科目テーブル: COURSE (科目ID PK, 科目名)
履修テーブル: ENROLLMENT (学生ID PK, FK, 科目ID PK, FK, 履修日)

問題 13 (第3正規形への変換)

以下の社員テーブルは第2正規形を満たしているが、第3正規形ではない。これを第3正規形に変換する際、どのようにテーブルを分解すべきか。

EMPLOYEE (社員ID PK, 社員氏名, 部署ID FK, 部署名, 部署所在地)

解答と解説

解答:
このテーブルには以下の推移的関数従属が存在する。

社員ID -> 部署ID -> 部署名
社員ID -> 部署ID -> 部署所在地

これらを解消するために、テーブルを以下のように分解する。

社員テーブル: EMPLOYEE (社員ID PK, 社員氏名, 部署ID FK)
部署テーブル: DEPARTMENT (部署ID PK, 部署名, 部署所在地)

問題 14 (正規化のメリット)

正規化を進めることによって得られるメリットを2つ挙げなさい。

解答と解説

解答例:

データの冗長性排除: データが重複して格納されることを防ぎ、記憶領域を節約し、データの整合性を維持しやすくなる。
更新・挿入・削除異常の防止: データ操作時に発生する矛盾や情報消失のリスクを低減する。
データ整合性の向上: 一貫性のある正確なデータを保ちやすくなる。
データモデルの明確化: 各テーブルの役割が明確になり、データベース構造が理解しやすくなる。

問題 15 (非正規化)

データベースの**非正規化（Denormalization）**とは何か。その主な目的も合わせて簡潔に説明しなさい。

解答と解説

解答:
非正規化とは、正規化されたデータベースのテーブルを、意図的に冗長な形に戻したり、テーブルを結合したりする設計手法です。主な目的は、結合操作の回数を減らすことで、特に読み取り性能（クエリのパフォーマンス）を向上させることです。データの整合性維持が難しくなるというデメリットがあります。

問題 16 (候補キー)

テーブル内の属性（カラム）または属性の集合で、行を一意に識別できる最小のものを何と呼ぶか。

ア. 主キー (Primary Key)
イ. 外部キー (Foreign Key)
ウ. 候補キー (Candidate Key)
エ. 副キー (Alternate Key)

解答と解説

解答: ウ

解説:
候補キーは、テーブル内の行を一意に識別できる属性（または属性の集合）で、それ以上属性を減らすと一意性を失う「最小の」ものです。主キーはその候補キーの中から一つ選ばれたものです。

問題 17 (多対多のリレーションシップ)

E-R図において「多対多」のリレーションシップが存在する場合、論理設計でリレーショナルスキーマに変換する際、どのように表現されるか。

解答と解説

解答:
「多対多」のリレーションシップは、直接リレーショナルスキーマに変換できないため、間に**関連エンティティ（連関エンティティ）**を導入し、それを新しいテーブルとして表現します。この関連エンティティは、元の2つのエンティティの主キーを外部キーとして持ち、それらを複合主キーとすることが一般的です。

問題 18 (E-R図の属性)

E-R図で属性（Attribute）を表すために使用される記号は何か。また、主キーとなる属性を表す際の一般的な慣習も合わせて述べなさい。

解答と解説

解答:
属性は一般的に楕円形で表されます。簡略化されたE-R図では、エンティティの長方形の中に直接属性名を列挙することもあります。主キーとなる属性を表す際は、属性名に下線を引くのが一般的な慣習です。

問題 19 (論理設計と物理設計の違い)

論理設計と物理設計の主な違いは何か。簡潔に説明しなさい。

解答と解説

解答:
論理設計は、概念設計の成果物をリレーショナルモデルに変換し、正規化を通じてデータの冗長性を排除するフェーズで、特定のDBMSに依存しない。一方、物理設計は、論理設計の成果物を基に、選択したDBMSの特性（インデックス、パーティショニング、記憶域パラメータなど）を考慮し、物理的なデータの格納方法やアクセス方法を具体的に決定するフェーズである。

問題 20 (第3正規形の定義)

テーブルが第3正規形（3NF）であるための条件を2つ挙げなさい。

解答と解説

解答:

第2正規形であること。
非キー属性が、主キーに対して推移的に関数従属していないこと。 （つまり、非キー属性が他の非キー属性を介して主キーに従属する状態がないこと。）

第4章午後試験対策物理設計

4.1 索引

第2章で、索引（インデックス）はデータベースの検索性能を向上させるために不可欠な要素であると学びました。物理設計のフェーズでは、この索引をどのように設計し、実装すれば、アプリケーションの性能要件を満たせるかを具体的に検討します。

午後試験では、与えられた業務要件やSQLの実行計画（EXPLAINの結果など）を分析し、最適な索引を提案する問題が頻繁に出題されます。ここでは、特に試験で問われやすい索引の設計と、その利用条件について深く掘り下げていきます。

4.1.1 複合索引

複合索引とは、複数のカラム（列）を組み合わせて作成される索引のことです。単一のカラムに作成される索引よりも、特定の種類のクエリにおいて高い効果を発揮します。

列の順序が重要（前方一致の原則）

複合索引の設計で最も重要なのは、索引を構成するカラムの順序です。この順序によって、索引が利用できるクエリの範囲が大きく変わります。

複合索引は、その構成カラムの先頭から連続した部分に対して前方一致で利用されます。これを**前方一致の原則（Left-most Prefix Rule）**と呼びます。

例えば、Productsテーブルに(category_id, product_name, price)という複合索引を作成した場合を考えます。

CREATE INDEX idx_products_cat_name_price ON Products (category_id, product_name, price);

この索引は、以下の条件を持つクエリで利用可能です。

WHERE category_id = ? (先頭カラムのみ)
WHERE category_id = ? AND product_name = ? (先頭2カラム)
WHERE category_id = ? AND product_name = ? AND price = ? (全カラム)

一方、以下の条件を持つクエリでは、この複合索引は利用されないか、限定的にしか利用されません。

WHERE product_name = ? (先頭カラムcategory_idが含まれない)
WHERE price = ? (先頭カラムcategory_idが含まれない)
WHERE product_name = ? AND price = ? (先頭カラムcategory_idが含まれない)

複合索引の活用例

複数条件による絞り込み: WHERE category_id = 1 AND product_name LIKE 'A%' のように、複数の条件でデータを絞り込む場合に有効です。この場合、複合索引の先頭にcategory_id、次にproduct_nameを配置することで効率的な検索が期待できます。
ソート処理の高速化: ORDER BY category_id, product_name のように、ORDER BY句で複数のカラムが指定されている場合、その順序で複合索引を作成することで、データベースがソート処理を行う手間を省き、高速化につながります。
カバリングインデックス: 問合せのSELECT句に含まれる全てのカラムが複合索引の中に含まれている場合、テーブル本体にアクセスすることなく、索引だけで問合せが完結するため、非常に高い性能を発揮します。

午後試験対策のポイント

午後試験では、以下のような形で複合索引の知識が問われることが多いです。

遅いSQLの原因分析: EXPLAINの結果から、フルテーブルスキャンが発生している原因を特定し、それを解消するための最適な複合索引を提案する。
索引設計の最適化: 複数の業務要件やクエリパターンが提示され、それらを総合的に考慮した上で、どのカラムをどの順序で複合索引に含めるべきかを論理的に説明する。

単に「索引を作成する」だけでなく、「どのような索引を、なぜ、どの順序で作成するのか」を明確に説明できるようになることが重要です。

4.1.2 使用されない索引

索引はデータベースの検索性能を向上させる強力なツールですが、常に利用されるわけではありません。間違った設計や条件の指定方法により、せっかく作成した索引がデータベースから利用されず、フルテーブルスキャンが発生して性能問題を引き起こすことがあります。

索引が使用されない主な原因

前方一致の原則の不遵守:
- 複合索引の先頭カラムがWHERE句の条件に含まれていない場合、その索引は利用されないか、非常に限定的な利用にとどまります。
- 例: idx_products_cat_name_price (category_id, product_name, price)があるのに WHERE product_name = 'PC' で検索した場合。
インデックスのカーディナリティが低い場合:
- 索引が作成されているカラムの値の種類が非常に少ない（例: 性別、真偽値フラグなど）場合、索引を利用するよりもフルテーブルスキャンの方が高速だとオプティマイザが判断することがあります。
- これは、索引を検索してからテーブルの多くの行にアクセスする手間の方が、全行を順に読み込む手間より大きくなるためです。
テーブルのデータ量が少ない場合:
- そもそもテーブルの行数が少ない場合、索引を利用するオーバーヘッド（索引を読み込むディスクI/Oなど）よりも、フルテーブルスキャンの方が高速な場合があります。
OR条件での結合:
- 複数のWHERE条件をORで結合した場合、各条件に単独で索引が効いていても、それらの索引を組み合わせることが難しい場合があり、フルテーブルスキャンに切り替わることがあります（DBMSやSQLの書き方による）。

4.1.3 索引が使用されないその他の条件

複合索引の順序の他に、SQLの記述方法やデータ型によっても索引が利用されないことがあります。

索引カラムへの関数適用:
- WHERE句で索引が設定されているカラムに対して関数を適用すると、索引は利用されません。オプティマイザは関数の戻り値の評価結果がどうなるか事前に予測できないためです。
- 例: WHERE SUBSTR(product_name, 1, 1) = 'A' （product_nameに索引があっても使われない）
- 対策: WHERE product_name LIKE 'A%' のように、関数を使わずに索引が利用できる形に条件を書き換える。
データ型の不一致:
- WHERE句で索引カラムのデータ型と異なるデータ型の値を比較した場合、暗黙的な型変換が発生し、索引が利用されないことがあります。
- 例: WHERE product_id = '123' （product_idがINT型の場合）
- 対策: WHERE product_id = 123 のように、正しいデータ型で比較する。
NOT演算子の使用:
- NOT、!=、<>などの否定条件は、多くのレコードが条件に合致する場合、索引が利用されないことがあります。例えば、「〜ではない」という条件は、ほとんど全てのレコードが合致するため、索引を使うよりもフルテーブルスキャンの方が効率的と判断される場合があるためです。
- 例: WHERE NOT is_available = FALSE （is_available = TRUEと書き換えるべき）
ワイルドカード（%や_）を先頭に使用したLIKE検索:
- WHERE product_name LIKE '%PC' や WHERE product_name LIKE '_PC' のように、ワイルドカードが検索文字列の先頭にある場合、B-Tree索引の順序性を利用できないため、索引は利用されません。
- 対策: 検索条件を前方一致（LIKE 'PC%'）に限定するか、全文検索機能の利用を検討する。
オプティマイザの統計情報が古い:
- DBMSのオプティマイザは、テーブルや索引の統計情報（データ量、値の分布など）を基に、最適な実行計画を決定します。この統計情報が古い場合、誤った判断をして索引を利用しない実行計画を選択してしまうことがあります。
- 対策: 定期的に統計情報を最新の状態に保つ（ANALYZE TABLE, GATHER STATSなどのコマンドを使用）。

4.1.4 クラスタ率

**クラスタ率（Clustering Factor）**とは、テーブルの物理的な格納順序が、特定の索引の論理的な順序とどの程度一致しているかを示す指標です。索引の効率性、特に範囲検索の性能に大きく影響します。

クラスタ率が高い場合

テーブルの物理的なデータ並びが、索引のキー順とよく似ている状態。
メリット: 索引を使った範囲検索（Index Range Scan）の際に、ディスクI/Oが少なくなるため、非常に高速になります。目的のデータがディスク上で近くにまとまっているため、データブロックを何回も読みに行く必要が減るからです。

クラスタ率が低い場合

テーブルの物理的なデータ並びが、索引のキー順と大きく異なっている状態。
デメリット: 索引を使った範囲検索の際に、ディスク上のあちこちに散らばったデータを取得するために、多くのディスクI/Oが発生し、性能が低下します。

例

Ordersテーブルに(order_date)という索引があり、物理的なデータもorder_date順に格納されていればクラスタ率は高いです。しかし、Ordersテーブルがcustomer_id順に物理的に格納されている場合、order_date索引に対するクラスタ率は低くなります。order_dateの範囲検索をすると、customer_idの異なる多くのブロックからデータを読み込む必要があるため、I/Oが増えます。

午後試験対策のポイント

午後試験では、「特定の索引のクラスタ率が低いことが原因で性能劣化が起きている」というシナリオが提示され、それを改善するための方法を問われることがあります。

改善策: ALTER TABLE MOVEやOPTIMIZE TABLEなどのコマンドを使って、テーブルの物理的な格納順序を、使用頻度の高い索引の順序に合わせて再編成します。ただし、クラスタ化インデックス（Clustered Index）が存在する場合は、そのキー順に物理的に並べられるため、その索引のクラスタ率は常に高くなります。

4.2 表領域とページ

4.2.1 表領域 (Tablespace)

**表領域（Tablespace）**は、データベースにおける物理的な記憶領域を論理的に管理するための単位です。データベース全体をいくつかの表領域に分割し、それぞれの表領域を一つ以上のデータファイルに割り当てます。

表領域の役割

物理ストレージの抽象化: ユーザーやDBAは、データがどの物理ファイルに格納されているかを直接意識することなく、論理的な表領域単位で管理できます。
ストレージ管理:
- 特定の種類のデータ（例: 索引、ユーザーデータ、ログ、一時データ）を表領域ごとに分けることで、ディスクI/Oの競合を減らし、パフォーマンスを向上させることができます。
- 異なるI/O特性を持つディスクデバイスに、性能要件の高いデータを格納する表領域を割り当てることができます。
バックアップとリカバリ: 表領域単位でのバックアップやリカバリが可能になり、管理が容易になります。
権限管理: ユーザーやオブジェクトに対して、特定の表領域へのアクセス権限を制御できます。

4.2.2 ページ (Page / Block)

ページ（Page）、または**ブロック（Block）**は、データベースにおけるディスクI/Oの最小単位です。データベースがディスクからデータを読み込む際や、ディスクにデータを書き込む際は、必ずこのページ単位で行われます。

ページの役割と構造

データ格納: テーブルの行データ、索引のエントリなどがページ内に格納されます。
サイズ: DBMSや設定によって異なりますが、一般的に2KB、4KB、8KB、16KBなどの固定サイズです。
効率: 1回のディスクI/Oでより多くのデータをメモリに読み込むことで、ディスクアクセス回数を減らし、パフォーマンスを向上させます。
ページ内管理:
- ページヘッダ: ページに関するメタデータ（ページ番号、データ量など）。
- データ部: 実際の行データ。
- 空き領域: 新しいデータ挿入や既存データの更新（行の伸長）のための領域。
- 行ディレクトリ: ページ内の各行の位置を指すポインタ。

4.2.3 空き領域

データベースのページ内には、将来のデータ挿入や更新に備えて**空き領域（Free Space）**を確保しておくことが重要です。

空き領域の管理パラメータ (`PCTFREE`, `PCTUSED`など)

多くのDBMSでは、ページ内の空き領域を管理するためのパラメータを提供しています。

PCTFREE: ページにデータがどれだけ格納されたら、それ以降はINSERTを許可しないかの割合（例: PCTFREE 10なら、ページ容量の90%がデータで埋まったらINSERT停止）。
- 目的: 既存の行が更新されてサイズが大きくなった際に、そのページ内で収まるように空きを確保しておくことで、行の**マイグレーション（行移動）やチェイニング（行連鎖）**を防ぎます。
PCTUSED: ページの使用率がこの値を下回ったら、そのページをINSERT可能な空きページリストに戻す割合（例: PCTUSED 40なら、ページ使用率が40%未満になったらINSERT許可）。
- 目的: ページ内の空きが少ない状態で行の更新が発生し、PCTFREEの制限を超えると、行全体が別の空きページに移動（マイグレーション）したり、データが複数ページに分割（チェイニング）されたりすることがあります。これらはディスクI/Oを増やし、パフォーマンスを低下させる原因となります。

午後試験対策のポイント

午後試験では、PCTFREEやPCTUSEDの値を調整することで、更新頻度の高いテーブルや挿入頻度の高いテーブルのI/O性能をどのように改善するか、といった形で問われることがあります。

4.3 区分化

区分化（Partitioning: パーティショニング）とは、非常に大きなテーブルや索引を、論理的または物理的に小さく分割し、管理しやすくする技術です。ユーザーからは一つのテーブルに見えますが、内部的には複数のパーティションに分割されています。

4.3.1 区分化の特徴

メリット

パフォーマンス向上:
- パーティションプルーニング (Partition Pruning): クエリのWHERE句の条件に基づいて、アクセスする必要のないパーティションをスキップし、必要なパーティションにのみアクセスするため、検索範囲が狭まり高速化します。
- 並列処理: 複数のパーティションを同時に処理することで、並列処理による性能向上が期待できます。
管理性向上:
- バックアップ/リカバリ: 特定のパーティションだけをバックアップしたり、リカバリしたりできるため、管理作業の柔軟性が増します。
- アーカイブ: 古いデータを保持するパーティションを独立して管理し、容易にアーカイブ（保管）したり削除したりできます。
- メンテナンス: 特定のパーティションのみを再構築するなど、メンテナンス作業の範囲を限定できます。
可用性向上:
- 一部のパーティションが障害で利用不能になっても、他のパーティションは引き続き利用できるため、システム全体の可用性が向上します。

デメリット

設計の複雑化:
- 適切なパーティションキーの選定や分割方法の決定には高度な設計知識が必要です。
グローバル索引の管理:
- パーティション化されたテーブルに対して、パーティションキー以外のカラムに索引を作成した場合（グローバル索引）、テーブルのパーティション操作（追加、削除など）に伴って索引の再構築が必要になることがあり、管理が複雑になります。

4.3.2 区分化の種類

区分化には、データをどのように分割するかに応じていくつかの種類があります。

レンジ区分化 (Range Partitioning)
- カラムの値の範囲に基づいてデータを分割します。
- 例: 日付カラムで「2024年1月〜3月」「2024年4月〜6月」のように分割。時系列データの管理に最適です。
リスト区分化 (List Partitioning)
- カラムの特定の値のリストに基づいてデータを分割します。
- 例: 地域カラムで「北海道, 東北」「関東」「中部」のように分割。特定の分類コードを持つデータに適しています。
ハッシュ区分化 (Hash Partitioning)
- カラムの値のハッシュ関数に基づいてデータを分割します。
- データが均等に分散されるため、I/O負荷を分散させるのに適しています。特定の範囲やリストでの分割が難しい場合に有効です。
コンポジット区分化 (Composite Partitioning)
- 上記のうち2種類の区分化方法を組み合わせて使用します。例えば、レンジ区分化で大まかに分割し、さらに各レンジパーティションをハッシュ区分化で細かく分割する、といった方法です。
- 非常に大規模で複雑なデータセットの管理に用いられます。

午後試験対策のポイント

午後試験では、大量データを扱うシステムの性能問題（例: 特定期間のデータ検索が遅い）や運用管理問題（例: 古いデータの削除に時間がかかる）が提示され、それを区分化によってどのように解決するかを問われることがあります。パーティションキーの選定理由や、パーティションの種類とメリット・デメリットを具体的に説明できるように準備しておきましょう。

4.4 共通テーブル式 (Common Table Expressions - CTEs)

**共通テーブル式（CTE）**は、WITH句を使用して定義する一時的な名前付き結果セットです。SELECT, INSERT, UPDATE, DELETE文の中で使用できます。CTEはクエリの読みやすさと保守性を向上させ、複雑なクエリを段階的に構築するのに役立ちます。

構文

WITH CTE名 AS (
    SELECT ...
)
SELECT ...
FROM CTE名
WHERE ...;

メリット

可読性の向上: 複雑なクエリを複数の小さな論理的なステップに分割できます。
再利用性: 同じCTEを単一のクエリ内で複数回参照できます（ただし、通常は実際に複数回実行されるわけではありません）。
再帰クエリの実現: 階層構造のデータを扱う再帰CTEを定義できます。

例

-- 平均価格より高い製品を、共通テーブル式を使って検索
WITH AveragePrice AS (
    SELECT AVG(price) AS avg_p FROM Products
)
SELECT p.product_name, p.price
FROM Products p, AveragePrice ap
WHERE p.price > ap.avg_p;

午後試験対策のポイント

午後試験では、複雑な集計や階層構造のデータを扱うSQLの問題で、CTEを使った解答が求められたり、CTEの活用によるクエリの改善点を問われたりすることがあります。特に再帰CTEは、部品構成表などの問題で出題される可能性があります。

4.5 ウィンドウ関数

ウィンドウ関数は、SELECT文のOVER句と組み合わせて使用され、**現在の行に関連する行のグループ（ウィンドウ）**に対して集計や順位付けなどの計算を行うSQL関数です。GROUP BY句による集約と異なり、ウィンドウ関数は元の行を減らすことなく、各行に対して集計結果などを付加できるのが特徴です。

基本構文

ウィンドウ関数名 ([引数]) OVER (
    [PARTITION BY カラム名, ...] -- ウィンドウ（グループ）の定義
    [ORDER BY カラム名 [ASC|DESC], ...] -- ウィンドウ内の行の順序
    [ROWS/RANGE BETWEEN ...] -- ウィンドウの範囲（オプション）
)

4.5.1 区分ごとに平均値や合計値を計算する

PARTITION BY句を使うことで、特定のカラムの値に基づいて行を区分（パーティション）し、その区分ごとに集計関数を適用できます。

-- 各製品のカテゴリごとの平均価格を、製品ごとに表示
SELECT
    product_name,
    category_id,
    price,
    AVG(price) OVER (PARTITION BY category_id) AS avg_price_in_category
FROM
    Products;

このクエリでは、category_idが同じ製品同士で平均価格を計算し、その結果を各製品の行に付加します。

4.5.2 前後の値を使って集計する

ROWS BETWEEN句を使うことで、ウィンドウ内の現在の行の前後の特定の範囲の行に対して集計を行うことができます。移動平均（Moving Average）の計算などに使われます。

-- 発売日順で、その製品と直近2つの製品の平均価格（3製品移動平均）を計算
SELECT
    release_date,
    product_name,
    price,
    AVG(price) OVER (ORDER BY release_date ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS moving_avg_price
FROM
    Products;

ROWS BETWEEN 2 PRECEDING AND CURRENT ROWは、現在の行とその前の2行（計3行）をウィンドウの範囲とします。

4.5.3 前（または後）の行を取得する

LAG()やLEAD()関数を使うと、ウィンドウ内で指定した順序に基づき、現在の行の前の行や後の行のカラム値を取得できます。時系列データの比較などに非常に便利です。

-- 発売日順で、前の製品の価格と現在の製品の価格の差を表示
SELECT
    release_date,
    product_name,
    price,
    LAG(price, 1, 0) OVER (ORDER BY release_date) AS previous_price, -- 1行前のprice、無ければ0
    price - LAG(price, 1, 0) OVER (ORDER BY release_date) AS price_difference
FROM
    Products;

4.5.4 順位を求める

RANK(), DENSE_RANK(), ROW_NUMBER()などの関数を使って、ウィンドウ内で順位を付けることができます。

ROW_NUMBER(): 単純な行番号。重複があっても連番。
RANK(): 同じ値には同じ順位を付け、次の順位は重複した数だけスキップされる。
DENSE_RANK(): 同じ値には同じ順位を付け、次の順位はスキップされずに連続する。

-- 各カテゴリ内で価格の高い順に製品の順位を付ける
SELECT
    product_name,
    category_id,
    price,
    RANK() OVER (PARTITION BY category_id ORDER BY price DESC) AS rank_in_category
FROM
    Products;

4.5.5 所属する階級を求める

NTILE(n)関数は、ウィンドウ内の行をn個のグループに均等に分割し、各行がどのグループに属するかを示す番号を返します。

-- 全製品を価格でソートし、4つの階級に分ける
SELECT
    product_name,
    price,
    NTILE(4) OVER (ORDER BY price DESC) AS price_quartile
FROM
    Products;

午後試験対策のポイント

ウィンドウ関数は、複雑な集計や分析をSQL単体で記述できる強力な機能であり、午後試験でも非常に頻繁に出題されます。特に、「期間を指定した集計」「前後のデータとの比較」「順位付け」といった要件に対して、適切にウィンドウ関数を活用できるかが問われます。PARTITION BY、ORDER BY、ROWS BETWEENの組み合わせを理解し、使いこなすことが重要です。

4.6 トリガー

**トリガー（Trigger）**は、データベース内で特定のイベント（INSERT, UPDATE, DELETEなどのDML操作）が発生した際に、自動的に実行される特別なストアドプロシージャのようなものです。データの整合性保証や監査ログの記録など、様々な用途で利用されます。

基本的な構文

CREATE TRIGGER トリガー名
{BEFORE | AFTER} {INSERT | UPDATE | DELETE} ON テーブル名
[FOR EACH ROW] -- 各行に対して実行 (ROWトリガー) / ステートメント全体に対して実行 (STATEMENTトリガー)
[WHEN 条件式]  -- オプション: トリガーを起動する条件
BEGIN
    -- トリガーが実行されるSQL文や手続き
END;

4.6.1 別名を付ける (`OLD`, `NEW`)

行レベルトリガー（FOR EACH ROW）の場合、INSERT、UPDATE、DELETEの対象となる行の変更前と変更後の値を参照できます。参照にはDBMS固有のキーワード（例: Oracleでは:OLD, :NEW、PostgreSQLではOLD, NEW、MySQLではOLD. NEW.）を使用します。

NEW: 挿入される行、または更新後の行の値を参照。
OLD: 削除される行、または更新前の行の値を参照。

-- Productsテーブルの価格が更新された際に、変更履歴を記録するトリガー (PostgreSQL/Oracle風)
CREATE TRIGGER trg_product_price_history
AFTER UPDATE OF price ON Products
FOR EACH ROW
BEGIN
    INSERT INTO ProductPriceHistory (product_id, old_price, new_price, change_date)
    VALUES (OLD.product_id, OLD.price, NEW.price, CURRENT_DATE);
END;

4.6.2 特定の列だけを対象にする

UPDATEトリガーの場合、OF カラム名句を使用することで、特定のカラムが更新された場合にのみトリガーを起動させることができます。これにより、不要なトリガーの実行を防ぎ、パフォーマンスを向上させます。

-- Productsテーブルのpriceカラムが更新された時だけトリガーを起動
CREATE TRIGGER trg_product_price_check
BEFORE UPDATE OF price ON Products -- priceカラムが更新された時のみ
FOR EACH ROW
BEGIN
    IF NEW.price < 0 THEN
        RAISE EXCEPTION '価格は0以上である必要があります。';
    END IF;
END;

4.6.3 条件を指定する (`WHEN`句)

WHEN句を使用すると、トリガーが起動する直前に追加の条件を指定できます。WHEN句の条件が真と評価された場合にのみ、トリガー本体の処理が実行されます。

-- Productsテーブルの在庫数が減少した場合のみ、監査ログを記録
CREATE TRIGGER trg_stock_decrease_audit
AFTER UPDATE OF stock_quantity ON Products
FOR EACH ROW
WHEN (NEW.stock_quantity < OLD.stock_quantity) -- 在庫が減った場合のみ起動
BEGIN
    INSERT INTO StockAuditLog (product_id, old_quantity, new_quantity, audit_date)
    VALUES (OLD.product_id, OLD.stock_quantity, NEW.stock_quantity, CURRENT_DATE);
END;

4.6.4 トリガーの永久ループ

トリガーの設計で最も注意すべき点の一つに**永久ループ（Infinite Loop）**があります。あるトリガーが実行され、その中で別のテーブルを更新し、そのテーブルの更新がさらに別のトリガーを起動し、それが最初のトリガーを再度起動する、というように、トリガーが連鎖的に無限に実行されてしまう状態です。

永久ループの例

TableAのUPDATEでTriggerAが起動。
TriggerAがTableBをUPDATEする。
TableBのUPDATEでTriggerBが起動。
TriggerBがTableAをUPDATEする。
1に戻り、永久ループ。

対策

トリガーの設計をシンプルにする: 不要なトリガーの連鎖を避ける。
相互に更新し合わない: トリガーが起動するテーブルと、トリガー内で更新するテーブルが同じにならないように注意する。
トリガー内で条件を厳しくする: WHEN句やIF文を使って、特定の条件が満たされた場合のみ処理を実行するようにする。
DBMSが提供する対策: 一部のDBMSは、トリガーの実行回数を制限するなどの対策機能を提供しています。

午後試験対策のポイント

午後試験では、データの整合性を保証するビジネスルールをトリガーで実装する問題や、既存のシステムで発生している性能問題の原因としてトリガーの不適切な設計（永久ループや無駄な処理）を指摘し、改善策を提案する問題が出題されることがあります。特にOLD/NEWの活用方法やWHEN句による効率化は重要です。

4.7 レプリケーション

レプリケーション（Replication: 複製）とは、データベースのデータを、ネットワークで接続された複数のデータベースサーバ（マスタとスレーブ）間で複製し、常に同じ状態に保つための技術です。

マスタとスレーブ

マスタ（Master）: データの書き込み（INSERT, UPDATE, DELETE）を受け付けるデータベースサーバ。
スレーブ（Slave）: マスタからの変更を受け取り、自身のデータを更新するデータベースサーバ。通常、読み取り（SELECT）リクエストを受け付けます。

レプリケーションの目的

高可用性 (High Availability): マスタに障害が発生した場合でも、スレーブを新しいマスタに昇格させることで、サービスを継続できます。
負荷分散 (Load Balancing): データの書き込みはマスタで行い、読み取りリクエストは複数のスレーブに分散させることで、データベース全体の負荷を軽減し、パフォーマンスを向上させます。
災害復旧 (Disaster Recovery): 遠隔地にスレーブを配置することで、マスタのあるデータセンターが災害で壊滅しても、データを保護し復旧できます。
データウェアハウスへのデータ供給: マスタで発生したトランザクションデータをスレーブ経由でデータウェアハウスに転送し、分析に利用できます。

4.7.1 レプリケーションの特徴

メリット

スケーラビリティ: 読み取り性能を向上させるために、スレーブを増やすだけで容易にスケールアウトできます。
可用性: マスタ障害時のダウンタイムを最小限に抑えられます。
パフォーマンス: 読み取り負荷を分散できます。

デメリット

複雑性: 設定や運用管理が単一のデータベースよりも複雑になります。
データ同期の遅延: 特に非同期レプリケーションの場合、マスタとスレーブ間でデータに時間差が生じる可能性があります。
コンフリクト（競合）: 複数のマスタが同時にデータを更新するマルチマスタレプリケーションの場合、データの競合が発生し、その解決が難しい場合があります。

4.7.2 イベント型とバッチ型

レプリケーションにおけるデータ変更の伝播方式には、大きく分けてイベント型とバッチ型があります。

イベント型レプリケーション:
- マスタで発生したデータ変更イベント（INSERT, UPDATE, DELETEなどのSQL文や、行単位の変更）をリアルタイムに近い形でスレーブに伝播します。
- 特徴: データの同期が迅速で、マスタとスレーブ間のデータ差が小さい。ログシッピング（トランザクションログの転送）がこれに該当します。
- 用途: 高可用性、負荷分散、ニアリアルタイムのデータ分析など。
バッチ型レプリケーション:
- 一定期間に発生したデータ変更をまとめて（バッチ処理として）スレーブに伝播します。
- 特徴: データの同期には時間がかかりますが、システム負荷は比較的低い。
- 用途: データウェアハウスへの定期的なデータ転送、データ移行、あまりリアルタイム性が求められないバックアップなど。

4.7.3 同期型と非同期型

レプリケーションにおけるコミットの保証度合いによって、同期型と非同期型があります。

同期型レプリケーション (Synchronous Replication)
- マスタでトランザクションがコミットされる際、その変更がスレーブにも正常に反映されたことを確認してから、クライアントにコミット成功を返します。
- 特徴:
  - 高整合性: マスタ障害時でも、スレーブにはコミットされた全てのデータが反映されているため、データ損失がありません。
  - 低パフォーマンス: スレーブからの応答を待つため、マスタでのトランザクション処理性能が低下します。
- 用途: 厳密なデータ整合性が求められる基幹システム。
非同期型レプリケーション (Asynchronous Replication)
- マスタでトランザクションがコミットされる際、その変更がスレーブに伝播されるのを待たずに、すぐにクライアントにコミット成功を返します。スレーブへのデータ反映は遅延して行われます。
- 特徴:
  - 高パフォーマンス: スレーブの応答を待たないため、マスタでのトランザクション処理性能が高い。
  - 低整合性: マスタ障害時、スレーブに未反映のデータが存在する可能性があり、データ損失が発生する可能性があります。
- 用途: 読み取り負荷分散、災害復旧（多少のデータ損失が許容される場合）など、パフォーマンスや可用性が優先されるシステム。

午後試験対策のポイント

レプリケーションは、システムの高可用性やスケーラビリティを実現するための重要な技術であり、午後試験でもシステムの要件に応じて最適なレプリケーション構成（イベント型/バッチ型、同期型/非同期型）を選択し、その理由やメリット・デメリットを説明する問題が出題されます。特に、CAP定理との関連性や、同期型と非同期型のトレードオフ（整合性と性能）は頻出テーマです。

4.8 問題対策

第4章で学んだ内容は、データベーススペシャリスト試験の午後試験、特に午後Ⅰ問題で頻繁に問われるテーマです。物理設計は、概念設計・論理設計で定義されたデータモデルを、実際のDBMS上でどのように効率的に実装・運用するかを決定する重要なフェーズだからです。

ここでは、午後試験でこれらの知識がどのように問われ、どのように解答すべきか、その対策のポイントをまとめます。

1. 索引の設計と利用条件

問われ方:
- 「現状のSQLが遅い原因を、実行計画（EXPLAIN）の出力結果から分析しなさい。」
- 「性能改善のために、どのような索引を、どのカラムに対して、どのような順序で作成すべきか、その理由とともに述べなさい。」
- 「提案した索引がどのようなクエリで利用され、どのような効果をもたらすかを説明しなさい。」
- 「既存の索引の中で、不要なもの、または利用効率の低いものを指摘し、その理由を述べなさい。」
対策:
- **複合索引の「前方一致の原則」**を完全に理解し、説明できるようにする。
- 索引が利用されない条件（関数適用、データ型不一致、ワイルドカード先頭など）を具体例とともに説明できるようにする。
- EXPLAIN（またはそれに類する実行計画）の出力結果を読み解き、フルテーブルスキャンや索引レンジスキャン、ソートなどの操作が何を意味するのかを理解する。

2. ストレージ構造とパフォーマンス

問われ方:
- 「行の更新頻度が高いテーブルにおいて、ページ内の空き領域（PCTFREEなど）をどのように設定すべきか、その理由とともに述べなさい。」
- 「テーブルの物理的な格納順序と索引の論理順序の乖離（クラスタ率の低さ）が性能に与える影響と、その改善策を説明しなさい。」
対策:
- **ページ、表領域、空き領域（PCTFREE, PCTUSED）**の役割と相互関係を理解する。
- クラスタ率が検索性能、特に範囲検索に与える影響を説明できるようにする。
- 物理的なデータ再編成（テーブルの再構築など）がどのような場合に必要で、どのような効果があるかを理解する。

3. 区分化（パーティショニング）

問われ方:
- 「大量データを扱うテーブルの管理性や性能を向上させるために、区分化を導入すべきか。導入する場合、どの種類の区分化が適切か、その理由を述べなさい。」
- 「区分化のメリット・デメリットを具体的に説明しなさい。」
- 「特定の検索条件において、パーティションプルーニングがどのように機能するか説明しなさい。」
対策:
- レンジ、リスト、ハッシュなどの区分化の種類と、それぞれがどのようなデータ特性やアクセスパターンに適しているかを理解する。
- 区分化によるパーティションプルーニングの性能向上効果を説明できるようにする。
- 区分化がグローバル索引の管理に与える影響も考慮に入れる。

4. 高度なSQL（CTE, ウィンドウ関数）

問われ方:
- 「特定のビジネス要件（例: 各部署で給与が上位3位の従業員、移動平均、前月比）を満たすSQL文をCTEやウィンドウ関数を使って記述しなさい。」
- 「既存の複雑なサブクエリを、CTEやウィンドウ関数を使ってどのように改善できるか説明しなさい。」
- 「ウィンドウ関数におけるPARTITION BYとORDER BY句の役割を説明しなさい。」
対策:
- CTEによる可読性向上と再帰クエリの記述方法を理解する。
- **ウィンドウ関数の各種類（RANK, LAG, AVGなど）**とOVER句（PARTITION BY, ORDER BY, ROWS BETWEEN）の組み合わせを使いこなせるようにする。

5. トリガーとレプリケーション

問われ方:
- 「特定のビジネスルール（例: 在庫数が一定値を下回ったら警告ログを記録）をトリガーで実装しなさい。」
- 「トリガーの永久ループが発生するメカニズムと、その対策を説明しなさい。」
- 「システムに高可用性、高スケーラビリティ、読み取り負荷分散の要件がある場合、どのようなレプリケーション構成が考えられるか、そのメリット・デメリットを同期型/非同期型に触れながら説明しなさい。」
対策:
- トリガーの起動タイミング（BEFORE/AFTER、FOR EACH ROW/STATEMENT）、OLD/NEW参照、WHEN句の利用方法を理解する。
- トリガーによる副作用（永久ループなど）とその回避策を理解する。
- レプリケーションの目的（可用性、負荷分散など）と、同期型/非同期型のトレードオフ（整合性と性能）を明確に説明できるようにする。

午後試験は、単なる知識の有無だけでなく、その知識を現実のシステム課題に適用し、最適な解決策を提案する能力が問われます。各概念を深く理解し、具体的なシナリオに基づいて考え、記述する練習を重ねることが最も効果的な対策となります。

第4章午後試験対策物理設計問題集 (20問)

問題 1 (複合索引 - 前方一致の原則)

Ordersテーブルに(customer_id, order_date, total_amount)という複合索引が作成されている。以下のWHERE句を持つSQL文のうち、この複合索引が有効に利用されるものはどれか。複数選択可。

ア. WHERE customer_id = 101
イ. WHERE order_date = '2025-01-01'
ウ. WHERE customer_id = 101 AND order_date > '2025-01-01'
エ. WHERE order_date = '2025-01-01' AND total_amount > 1000
オ. WHERE customer_id = 101 AND order_date = '2025-01-01' AND total_amount > 1000

解答と解説

解答: ア, ウ, オ

解説:
複合索引は「前方一致の原則」に従い、先頭から連続した部分に対して利用されます。

ア: customer_idのみを指定しており、先頭カラムを利用できる。
イ: customer_idが含まれていないため、索引は利用されない。
ウ: customer_idとorder_dateを指定しており、先頭2カラムを利用できる。
エ: customer_idが含まれていないため、索引は利用されない。
オ: 全てのカラムを指定しており、索引が利用できる。

問題 2 (索引が使用されない条件)

Productsテーブルのproduct_nameカラムに索引が作成されている。以下のSQL文のうち、この索引が利用されない可能性が高いものはどれか。

ア. SELECT * FROM Products WHERE product_name LIKE 'デスク%';
イ. SELECT * FROM Products WHERE SUBSTR(product_name, 1, 1) = 'デ';
ウ. SELECT * FROM Products WHERE product_name IS NOT NULL;
エ. SELECT * FROM Products WHERE product_name = 'ノートPC';

解答と解説

解答: イ

解説:
WHERE句で索引カラムに対して関数を適用すると、オプティマイザは索引を利用せずフルテーブルスキャンを選択する可能性が高いです。

アは前方一致検索であり、索引は利用されます。
ウはIS NOT NULLであり、多くの場合索引を利用できます（ただし、NULL値が多い場合はフルテーブルスキャンの方が速いと判断されることもあります）。
エは等価検索であり、索引は利用されます。

問題 3 (クラスタ率)

データベースのクラスタ率（Clustering Factor）とは何か。また、それが低い場合にどのような問題が発生するか簡潔に説明しなさい。

解答と解説

解答:
クラスタ率とは、テーブルの物理的な格納順序が、特定の索引の論理的な順序とどの程度一致しているかを示す指標です。

問題点: クラスタ率が低い場合、索引を使った範囲検索（Index Range Scan）の際に、データがディスク上のあちこちに散らばって格納されているため、多くのディスクI/Oが発生し、クエリのパフォーマンスが大幅に低下します。

問題 4 (表領域の役割)

データベースの表領域（Tablespace）の主な役割を2つ挙げなさい。

解答と解説

解答例:

ストレージ管理: 異なる種類のデータ（ユーザーデータ、索引、ログなど）を論理的に分離し、物理的なディスクに割り当てることで、効率的なI/O管理やディスク領域の割り当て制御が可能になる。
バックアップとリカバリ: 表領域単位でのバックアップやリカバリが可能になり、データベース管理の柔軟性と効率が向上する。
パフォーマンスの最適化: 異なるI/O特性を持つディスクデバイスに、性能要件の異なるデータを格納する表領域を配置することで、全体のパフォーマンスを最適化できる。

問題 5 (PCTFREE)

PCTFREEパラメータの主な目的は何か。簡潔に説明しなさい。

解答と解説

解答:
PCTFREEは、データベースのページ（ブロック）内に、将来のデータ更新によって行のサイズが拡張された際に、その行が同じページ内に収まるように確保しておく空き領域の割合を指定するパラメータです。これにより、行のマイグレーション（行移動）やチェイニング（行連鎖）を防ぎ、I/O性能の低下を抑制することを目的とします。

問題 6 (パーティショニングのメリット)

テーブルのパーティショニング（区分化）を導入するメリットとして、最も適切なものはどれか。

ア. データの冗長性を完全に排除できる。
イ. クエリのWHERE句の条件に関わらず、必ず検索性能が向上する。
ウ. 特定のパーティションだけを対象にバックアップやアーカイブが可能になり、管理性が向上する。
エ. INSERT、UPDATE、DELETEの処理が常に高速になる。

解答と解説

解答: ウ

解説:
パーティショニングのメリットの一つに、特定期間のデータや特定カテゴリのデータなど、パーティション単位で独立した管理が可能になることが挙げられます。これにより、バックアップ、アーカイブ、メンテナンスなどの管理作業の柔軟性が増します。

問題 7 (パーティショニングの種類)

データを日付の範囲（例: 年、月）に基づいて分割するパーティショニングの種類は何か。

ア. レンジ区分化 (Range Partitioning)
イ. リスト区分化 (List Partitioning)
ウ. ハッシュ区分化 (Hash Partitioning)
エ. コンポジット区分化 (Composite Partitioning)

解答と解説

解答: ア

解説:
レンジ区分化は、特定のカラムの値の範囲に基づいてデータを分割する方法で、時系列データや連続的な数値データに適しています。

問題 8 (共通テーブル式 - CTE)

共通テーブル式（CTE）を使用する主なメリットを1つ挙げなさい。

解答と解説

解答例:

可読性の向上: 複雑なクエリを複数の論理的なステップに分割できるため、SQL文が読みやすく理解しやすくなる。
再利用性: 同じ一時的な結果セットをクエリ内で複数回参照できるため、コードの重複を減らせる。
再帰クエリの実現: 階層構造のデータ（例: 組織図、部品構成表）を処理する再帰クエリを記述できる。

問題 9 (ウィンドウ関数)

Productsテーブルにおいて、各製品のcategory_idごとに、その製品の価格がカテゴリ内の平均価格より高いかどうかを判定するSELECT文を完成させなさい。

SELECT
    product_name,
    category_id,
    price,
    CASE WHEN price > AVG(price) OVER (PARTITION BY category_id) THEN '高い' ELSE '高くない' END AS price_comparison
FROM
    Products;

このSELECT文のOVER句の中の[ ______ ]に当てはまるものは何か。

解答と解説

解答: PARTITION BY category_id

解説:
PARTITION BY句は、ウィンドウ関数を適用する行のグループ（区分）を定義します。この場合、category_idごとに平均価格を計算するため、PARTITION BY category_idと指定します。

問題 10 (LAG関数)

Productsテーブルのデータを使って、release_dateでソートした際に、各製品の「前の製品の価格」を取得するSQL文を完成させなさい。（前の製品がない場合は0とする）

SELECT
    product_name,
    release_date,
    price,
    LAG(price, 1, 0) OVER (ORDER BY release_date) AS previous_product_price
FROM
    Products;

このSELECT文のOVER句の中の[ ______ ]に当てはまるものは何か。

解答と解説

解答: ORDER BY release_date

解説:
LAG()関数は、ウィンドウ内で指定された順序に基づいて、現在の行の前の行の値を返します。LAG(price, 1, 0)は、1つ前の行のpriceを取得し、もし前の行がなければ0を返します。この「前の行」を決定するためには、ウィンドウ内の順序をORDER BY句で指定する必要があります。

問題 11 (順位関数)

各category_id内でpriceが高い順に製品の順位を付与したい。同じ価格の製品には同じ順位を付け、次の順位は重複した数だけスキップされる順位付けを行うウィンドウ関数は何か。

ア. ROW_NUMBER()
イ. RANK()
ウ. DENSE_RANK()
エ. NTILE()

解答と解説

解答: イ

解説:

ROW_NUMBER(): 重複を考慮せず一意の連番を付与。
RANK(): 同じ値には同じ順位を付け、次の順位は重複数分スキップされる。
DENSE_RANK(): 同じ値には同じ順位を付け、次の順位はスキップされずに連続する。
NTILE(): 指定した数に均等に分割したグループ番号を付与。

問題 12 (トリガーの起動タイミング)

AFTER UPDATE ON Orders FOR EACH ROWというトリガーは、どのようなタイミングで起動するか。

ア. Ordersテーブルの行が更新される直前。
イ. Ordersテーブルの行が更新された直後。
ウ. Ordersテーブルに対してUPDATE文が実行される直前。
エ. Ordersテーブルに対してUPDATE文が実行された直後。

解答と解説

解答: イ

解説:
AFTERは、イベント（UPDATE）が発生した後に起動します。FOR EACH ROWは、更新された各行に対してトリガーが起動することを意味します。したがって、Ordersテーブルの行が更新された直後に起動します。

問題 13 (トリガーのOLD/NEW)

Productsテーブルのpriceカラムが更新された際に、トリガー内で更新前の価格と更新後の価格を比較したい。それぞれOLD.priceとNEW.priceという形式でアクセスできるが、これはどの種類のトリガーで可能か。

ア. BEFORE STATEMENTトリガー
イ. AFTER STATEMENTトリガー
ウ. BEFORE ROWトリガー
エ. AFTER INSERTトリガー

解答と解説

解答: ウ

解説:
OLDおよびNEWの参照は、行レベルトリガー（FOR EACH ROW句が指定されたトリガー）でのみ可能です。BEFOREトリガーではNEWの値を変更できますが、AFTERトリガーではできません。UPDATEトリガーで両方の値を比較できるのはBEFOREまたはAFTERの行レベルトリガーです。選択肢にはBEFORE ROWトリガーがあります。

問題 14 (トリガーの永久ループ)

データベースにおけるトリガーの「永久ループ」とは何か。簡潔に説明しなさい。

解答と解説

解答:
トリガーの永久ループとは、あるトリガーが実行された結果、そのトリガー自身を再度起動したり、別のトリガーを起動し、その別のトリガーが最初のトリガーを起動する、というように、トリガーが連鎖的に無限に実行されてしまう状態のことです。システムのリソースを枯渇させ、データベースを停止させる可能性があります。

問題 15 (レプリケーションの目的)

データベースのレプリケーションを導入する主な目的を2つ挙げなさい。

解答と解説

解答例:

高可用性 (High Availability): マスタサーバに障害が発生した場合でも、スレーブサーバを新しいマスタに昇格させることで、サービスの中断時間を最小限に抑える。
負荷分散 (Load Balancing): データの書き込みはマスタで行い、読み取りリクエストはスレーブに分散させることで、データベース全体の処理能力を向上させる。
災害復旧 (Disaster Recovery): 遠隔地にスレーブを配置することで、地理的な災害が発生した場合でもデータを保護し、復旧を可能にする。
データウェアハウスへのデータ供給: マスタの運用に影響を与えず、スレーブからデータ分析用のデータを提供できる。

問題 16 (レプリケーション - 同期型と非同期型)

同期型レプリケーションと非同期型レプリケーションにおける、データの整合性とパフォーマンスに関するトレードオフについて簡潔に説明しなさい。

解答と解説

解答:

同期型レプリケーション: データの整合性が非常に高い（マスタのコミットがスレーブへの反映を待つため、データ損失がない）が、その代償としてスレーブからの応答を待つためマスタのパフォーマンスは低下する。
非同期型レプリケーション: マスタのコミットがスレーブの反映を待たないためマスタのパフォーマンスは高いが、スレーブに未反映のデータが存在する可能性があり、マスタ障害時にデータ損失のリスクがあるため整合性は低い。

問題 17 (物理設計 - ページとブロック)

データベースの「ページ」または「ブロック」とは何か。簡潔に説明しなさい。

解答と解説

解答:
ページ（またはブロック）は、データベースにおいてディスクI/Oの最小単位となる記憶領域のことです。データベースがディスクからデータを読み書きする際には、必ずこのページ単位で行われます。テーブルの行データや索引のエントリなどがページ内に格納されます。

問題 18 (索引が使用されない条件 - 型変換)

product_idがINT型で索引が作成されているProductsテーブルに対し、SELECT * FROM Products WHERE product_id = '123';というSQL文が実行された場合、索引が利用されない可能性がある。その主な理由を簡潔に説明しなさい。

解答と解説

解答:
product_idカラムがINT型であるにもかかわらず、WHERE句で文字列リテラル'123'と比較しているため、DBMSがproduct_idカラムに対して暗黙的な型変換を行ってしまう可能性があります。カラム自体に型変換の関数が適用されたのと同じ状態になり、索引の利用効率が著しく低下するか、全く利用されなくなるためです。

問題 19 (ウィンドウ関数 - NTILE)

NTILE(n)ウィンドウ関数は、どのような計算を行うために使用されるか。簡潔に説明しなさい。

解答と解説

解答:
NTILE(n)ウィンドウ関数は、ウィンドウ内の行を、指定されたn個のグループに均等に分割し、各行がどのグループ（階級）に属するかを示す番号を返します。例えばNTILE(4)は、データを4つの四分位に分割するために使用できます。

問題 20 (午後対策 - EXPLAIN)

午後試験で、遅いSQLの性能改善のためにEXPLAINコマンドの実行結果を分析する問題が出題された場合、特にどのような情報に注目すべきか、2つ挙げなさい。

解答と解説

解答例:

フルテーブルスキャン (Full Table Scan) の有無: 意図しないフルテーブルスキャンが発生している場合、索引が適切に利用されていない可能性が高い。
索引の利用状況: どの索引が利用されているか、あるいは利用されていないかを確認する。利用されている場合でも、Index Range ScanかIndex Full Scanかなど、利用効率の度合いを見る。
ソート処理の有無: ORDER BY句やGROUP BY句でソート処理が発生している場合、これを索引によって回避できないか検討する。
JOINの種類: JOINの種類（ネステッドループ、ハッシュ、マージなど）や結合順序が適切かを確認する。
I/Oコスト、CPUコスト: 各操作にかかるコストがどこに集中しているかを確認する。

第5章午後試験対策論理設計

この章では、データベーススペシャリスト試験の午後問題、特に午後Ⅱ問題で頻繁に出題される論理設計に焦点を当てます。概念設計で作成したE-R図をリレーショナルデータベースのテーブル構造に正確に落とし込み、データの冗長性を排除し、整合性を保つための知識が問われます。

5.1 概念データモデル

概念設計で作成する概念データモデルは、ビジネス要件をデータベースの構造に変換する最初のステップです。ここでは、E-R図の要素をより深く理解し、午後試験で与えられる業務記述から正確なデータモデルを導き出すためのポイントを解説します。

5.1.1 E-R図

E-R図は、概念データモデルを視覚的に表現するツールであり、午後試験では問題文の業務記述をE-R図で表現する能力や、与えられたE-R図を解釈する能力が問われます。

E-R図の要素の再確認と午後対策のポイント

エンティティ（実体）:
- 定義: 業務上、管理すべき情報のまとまり（例: 顧客, 製品, 注文）。
- 午後対策: 問題文中の主要な名詞や、情報を保持する必要がある「モノ」「コト」を正確に抽出する。
属性（アトリビュート）:
- 定義: エンティティが持つ具体的な情報（例: 顧客名, 製品価格）。
- 午後対策: 業務記述から、各エンティティが持つべき情報を漏れなく抽出する。主キー候補となる属性には下線などの印を付ける。
リレーションシップ（関連）:
- 定義: エンティティ間の関係性（例: 顧客が注文する）。
- 午後対策: エンティティ間の動詞や接続詞に注目し、関係の種類と多重度（カーディナリティ）、参加の任意性（オプショナリティ）を正確に判断する。

E-R図の例 (再掲)

erDiagram
    CUSTOMER ||--o{ ORDER : "places"
    ORDER ||--o{ ORDER_DETAIL : "includes"
    PRODUCT ||--o{ ORDER_DETAIL : "is_part_of"

    CUSTOMER {
        int customer_id PK
        string customer_name
        string address
        string phone_number
    }

    ORDER {
        int order_id PK
        int customer_id FK
        date order_date
        string status
    }

    PRODUCT {
        int product_id PK
        string product_name
        decimal price
        int stock_quantity
    }

    ORDER_DETAIL {
        int order_id PK, FK
        int product_id PK, FK
        int quantity
        decimal unit_price
    }

午後試験では、このようなE-R図を業務記述から作成したり、E-R図の不備を指摘する問題が出題されます。

5.1.2 リレーションシップ

リレーションシップはエンティティ間のつながりを示し、その「強さ」や「数」を表す**多重度（カーディナリティ）と参加の任意性（オプショナリティ）**を正確に読み取ることが重要です。

多重度（Cardinality）

1対1 (One-to-One: 1:1): 一方のエンティティの1インスタンスが、他方のエンティティの1インスタンスとだけ関連する。
- 例: 従業員と駐車券（1人の従業員は1枚の駐車券を持ち、1枚の駐車券は1人の従業員に割り当てられる）
1対多 (One-to-Many: 1:N): 一方のエンティティの1インスタンスが、他方のエンティティの複数インスタンスと関連する。逆方向では、他方のエンティティの1インスタンスは、最初のエンティティの1インスタンスと関連する。
- 例: 部署と従業員（1つの部署に複数の従業員が所属し、1人の従業員は1つの部署に所属する）
多対多 (Many-to-Many: N:M): 一方のエンティティの複数インスタンスが、他方のエンティティの複数インスタンスと関連する。
- 例: 学生と科目（1人の学生は複数の科目を履修し、1つの科目には複数の学生が所属する）
- 午後試験では、多対多のリレーションシップを**関連エンティティ（連関エンティティ）**で解消する手順が頻出です。

参加の任意性（Optionality）

リレーションシップの線とエンティティの接続部分に表示される記号で、そのエンティティがリレーションシップに必ず参加しなければならないか（必須：Mandatory）、**参加しなくてもよいか（任意：Optional）**を示します。

erDiagram
    CUSTOMER ||--o{ ORDER : "places"
    EMPLOYEE ||--|{ DEPARTMENT : "belongs_to"

CUSTOMER ||--o{ ORDER: CUSTOMER側は|（必須）、ORDER側はo（任意）。
- 「1つの顧客は0個以上の注文を行う」
- 「1つの注文は必ず1つの顧客によって行われる」
EMPLOYEE ||--|{ DEPARTMENT: 両側とも|（必須）。
- 「1つの従業員は必ず1つの部署に所属する」
- 「1つの部署には必ず1人以上の従業員が所属する」

午後試験では、業務要件を正確に読み解き、適切な多重度と任意性をE-R図に反映できるかが評価のポイントとなります。

5.1.3 リレーションシップと参照制約

概念設計におけるリレーションシップは、論理設計で外部キー（FOREIGN KEY）による参照制約として実装されます。参照制約は、関連するテーブル間のデータの整合性を保証する重要な機能です。

参照制約 (Referential Constraint)

定義: 外部キーの値が、参照先のテーブル（親テーブル）の主キーまたは一意キーの値として必ず存在することを保証する制約です。
役割: 「子のデータは親が存在しないと作れない」「親のデータを削除・更新する際は子のデータとの整合性を保つ」といったルールを強制します。

参照制約アクション (ON DELETE / ON UPDATE)

親テーブルの行が削除（ON DELETE）または更新（ON UPDATE）された際に、関連する子テーブルの行に対してどのような操作を行うかを定義します。午後試験では、業務ルールに基づいてこれらのアクションを適切に選択する能力が問われます。

NO ACTION / RESTRICT:
- 子テーブルに関連する行が存在する場合、親テーブルの行の削除/更新を拒否します。最も厳格な整合性保証。
CASCADE:
- 親テーブルの行が削除/更新された場合、関連する子テーブルの行も自動的に削除/更新します。
- 例: CUSTOMERが削除されたら、その顧客のORDERも全て削除する。
SET NULL:
- 親テーブルの行が削除/更新された場合、関連する子テーブルの外部キーの値をNULLに設定します。
- 子テーブルの外部キーがNOT NULL制約を持つ場合は使用できません。
SET DEFAULT:
- 親テーブルの行が削除/更新された場合、関連する子テーブルの外部キーの値をデフォルト値に設定します。

-- Productsテーブル (子) が Categoriesテーブル (親) を参照する例
CREATE TABLE Products (
    product_id   INT PRIMARY KEY,
    category_id  INT,
    ...
    FOREIGN KEY (category_id) REFERENCES Categories(category_id) -- 参照制約
        ON DELETE SET NULL  -- 親カテゴリが削除されたら、製品のcategory_idはNULLになる
        ON UPDATE CASCADE   -- 親カテゴリのcategory_idが更新されたら、製品のcategory_idも自動更新される
);

5.1.4 間違いやすいリレーションシップ

午後試験では、一見簡単そうに見える業務記述の中に、リレーションシップの落とし穴が隠されていることがあります。特に注意すべきパターンを理解しておきましょう。

多対多のリレーションシップの見落とし:
- 「AはBを複数持つことができる」「BはAに複数属することができる」といった記述は多対多です。
- 例: 「従業員は複数のプロジェクトに参加する」「プロジェクトには複数の従業員が参加する」
- 間違い: 従業員テーブルにプロジェクトIDを複数持たせる（1対多の誤解）。
- 正解: 従業員とプロジェクトの間に参加という関連エンティティ（テーブル）を設ける。
自己参照（再帰的）リレーションシップの見落とし:
- エンティティが自分自身とリレーションシップを持つケースです。階層構造を表す際に登場します。
- 例: 「従業員は上司を持つ」（上司も従業員である）、「部品は複数の下位部品で構成される」（下位部品も部品である）
- 間違い: 別の上司エンティティや下位部品エンティティを作成する。
- 正解: 従業員テーブル内に上司IDカラムを設け、EMPLOYEE.employee_idを参照する自己参照FOREIGN KEYとする。
排他的リレーションシップ:
- あるエンティティが、複数の異なるエンティティのいずれか一つと排他的に関連を持つ場合です。
- 例: 「注文は、宅配か店頭受け取りのいずれかである」
- 間違い: 注文テーブルに宅配IDと店頭受取IDの両方の外部キーを持ち、どちらか一方がNULLになるようにする。これはNULLが多く発生し、整合性チェックも複雑。
- 正解: スーパタイプ/サブタイプとしてモデリングするか、注文テーブルに配送方法という区分カラムと、宅配ID、店頭受取IDの2つの外部キーを持ち、適切なCHECK制約で排他を保証する。
属性とエンティティの混同:
- 特定の情報が属性として扱うべきか、独立したエンティティとして扱うべきか迷うことがあります。
- 判断基準: その情報が単一の値を持ち、それ自体で属性以上の意味を持たないか。あるいは、それ自体が属性を持ち、独立して識別される必要があるか。
- 例: 都道府県は住所の属性の一つだが、都道府県自体に県庁所在地や人口などの属性を管理する必要があれば独立したエンティティとすべき。

これらのパターンを理解し、業務記述から正確にモデル化する訓練が午後試験突破の鍵となります。

5.1.5 スーパタイプとサブタイプ

**スーパタイプ（Supertype: 上位型）とサブタイプ（Subtype: 下位型）**は、オブジェクト指向の「継承」の概念をデータモデルに適用したもので、「is-a」の関係（～である）を表現します。共通の特性を持つエンティティ群を一般化（汎化）してスーパタイプとし、固有の特性を持つサブタイプを特殊化（特化）して表現します。

スーパタイプ/サブタイプの例

スーパタイプ: 従業員
サブタイプ: 正社員, パートタイマー, 契約社員
- 全ての従業員が共通して持つ属性（例: 氏名, 生年月日）は従業員エンティティに定義します。
- 各サブタイプ固有の属性（例: 正社員の月給、パートタイマーの時給）はそれぞれのサブタイプエンティティに定義します。

erDiagram
    EMPLOYEE ||--o{ FULL_TIME_EMPLOYEE : "is a"
    EMPLOYEE ||--o{ PART_TIME_EMPLOYEE : "is a"
    EMPLOYEE ||--o{ CONTRACT_EMPLOYEE : "is a"

    EMPLOYEE {
        int employee_id PK
        string employee_name
        date birth_date
    }

    FULL_TIME_EMPLOYEE {
        int employee_id PK, FK
        decimal monthly_salary
    }

    PART_TIME_EMPLOYEE {
        int employee_id PK, FK
        decimal hourly_wage
        int work_hours
    }

    CONTRACT_EMPLOYEE {
        int employee_id PK, FK
        date contract_end_date
    }

包含制約 (Disjoint/Overlap)

排他（Disjoint）: スーパタイプのインスタンスが、いずれか一つのサブタイプにのみ属することができる。
- 例: 従業員は「正社員」か「パートタイマー」のどちらか一方にしか属せない。
重なり（Overlap）: スーパタイプのインスタンスが、複数のサブタイプに属することができる。
- 例: 人は「顧客」であると同時に「サプライヤー」でもある。

完全性制約 (Completeness)

完全（Complete / Total）: スーパタイプの全てのインスタンスが、必ずいずれかのサブタイプに属さなければならない。
- 例: 全ての従業員は「正社員」「パートタイマー」「契約社員」のいずれかである。
部分（Partial）: スーパタイプのインスタンスが、どのサブタイプにも属さないことが許される。
- 例: 全ての人が顧客やサプライヤーであるとは限らない（一般的なPersonエンティティがある場合）。

午後試験対策のポイント

午後試験では、複雑な業務ルール（例: 従業員の種類による属性の違い）をスーパタイプ/サブタイプで適切にモデリングする能力や、その実装方法（リレーショナルスキーマへの変換）が問われます。特に包含制約と完全性制約を業務記述から正確に判断することが重要です。

5.2 関係スキーマとテーブル構造

概念設計で作成したE-R図を、リレーショナルデータベースで実際に構築するためのテーブル構造（関係スキーマ）に変換する詳細なステップが論理設計の後半部分です。ここでは、各要素がどのようにテーブルとして表現されるかを具体的に見ていきます。

5.2.1 主キー

**主キー（Primary Key）**は、リレーショナルテーブルの各行を一意に識別するためのカラム（またはカラムの組み合わせ）です。

主キーの選定と午後試験対策

午後試験では、業務要件から主キーを適切に選定できるかが問われます。

一意性: どの行も重複する値を持たないこと。
非NULL性: 値がNULLであってはならないこと。
不変性: 原則として、値が変更されないこと。
簡潔性: 可能な限り短い、少ないカラム数で構成されること。

自然キー: 業務上の意味を持つ属性（例: 顧客コード、商品コード）。意味が明確で直感的だが、値が変更されたり重複が発生するリスクがある。
代理キー（サロゲートキー）: 業務上の意味を持たない、システムが自動生成する連番などのID（例: customer_id, product_id）。不変で一意性が保証されやすいが、業務上の意味がないため、ユーザーに提示する際には別の識別子が必要になることがある。

午後試験では、自然キーと代理キーのどちらを選ぶべきか、それぞれのメリット・デメリットを考慮して判断する問題が出題されます。特に、複合主キー（複数のカラムを組み合わせた主キー）の設計では、部分関数従属を発生させないよう注意が必要です。

5.2.2 外部キー

**外部キー（Foreign Key）**は、テーブル間のリレーションシップを表現するためのカラムです。子テーブルの外部キーが、親テーブルの主キーを参照することで、関連性のあるデータの一貫性（参照整合性）を保ちます。

外部キーの定義と午後試験対策

定義: FOREIGN KEY (外部キーカラム) REFERENCES 親テーブル名(親テーブルの主キーカラム)
役割: 参照整合性を保証します。外部キーの値は、親テーブルの主キーに存在するか、またはNULLである必要があります（NULLが許可されている場合）。
午後対策: E-R図のリレーションシップを正確に外部キーとして表現できるかが問われます。特に多対多のリレーションシップを解消した関連エンティティの外部キー設計や、自己参照リレーションシップの外部キーが重要です。また、ON DELETE/ON UPDATEアクションを業務ルールに合わせて適切に選択できることも求められます。

5.2.3 その他の属性

主キーや外部キー以外のカラムは、エンティティが持つ具体的な情報、つまり「非キー属性」となります。これらの属性に対しても、データ型、NOT NULL制約、UNIQUE制約、CHECK制約などを適切に設定し、データ整合性を確保する必要があります。

派生属性（Derived Attributes）

他の属性から計算で導き出せる属性を派生属性と呼びます（例: 生年月日から年齢を計算）。

派生属性を格納しない場合: 常に最新の値が取得できる。ストレージ容量を節約。計算処理が発生するため、リアルタイム性が求められる場合はオーバーヘッド。
派生属性を格納する場合: 読み取りが高速。データの更新時に再計算が必要になるため、更新時のオーバーヘッドやデータ不整合のリスクがある。

午後試験では、派生属性をデータベースに格納すべきか、クエリ実行時に計算すべきか、性能要件や更新頻度などを考慮して判断する問題が出題されることがあります。

5.2.4 スーパタイプとサブタイプ

概念設計で定義したスーパタイプとサブタイプを、リレーショナルデータベースのテーブル構造に落とし込む方法にはいくつかのパターンがあります。午後試験では、それぞれの実装方法のメリット・デメリットを理解し、業務要件に合った最適な方法を選択する能力が問われます。

単一テーブル方式 (Single Table Inheritance)
- 特徴: スーパタイプと全てのサブタイプの属性を一つの大きなテーブルにまとめる。サブタイプ固有の属性はNULLを許容する。
- メリット: 実装がシンプル。サブタイプ間の関係を追跡しやすい。
- デメリット: NULL値が多くなりストレージ効率が悪い。サブタイプが増えるとカラム数が多くなる。
- 午後対策: 識別子カラム（どのサブタイプかを示すカラム）の設計や、CHECK制約による整合性確保がポイント。
クラス階層テーブル方式 (Class Table Inheritance / 継承テーブル方式)
- 特徴: スーパタイプを一つのテーブル（共通属性を格納）とし、各サブタイプを別のテーブル（固有属性を格納）とする。サブタイプテーブルはスーパタイプテーブルの主キーを外部キーとして参照し、かつサブタイプテーブルの主キーを構成する。
- メリット: ストレージ効率が良い（NULLが少ない）。サブタイプ固有の制約を定義しやすい。
- デメリット: サブタイプごとの全データ取得にはJOINが必要になり、クエリが複雑になる。
- 午後対策: サブタイプテーブルの主キーと外部キーの設計、JOINによるデータ取得方法がポイント。
具象テーブル方式 (Concrete Table Inheritance)
- 特徴: 各サブタイプごとに独立したテーブルを作成し、スーパタイプが持つ共通属性も各サブタイプテーブルに含める。スーパタイプテーブルは存在しない。
- メリット: サブタイプごとのクエリがシンプルで高速。NULLが少ない。
- デメリット: 共通属性の重複が発生する。全てのサブタイプを横断するクエリにはUNION ALLなどが必要になり複雑。共通属性の変更時に全てのサブタイプテーブルを更新する必要がある。
- 午後対策: 共通属性の重複による保守性への影響を説明できるかがポイント。

午後試験での選択のポイント

午後試験では、これらの実装方法について、業務要件（例: 検索頻度、更新頻度、サブタイプの追加・削除頻度）や性能要件、保守性などを考慮し、最適なものを選択し、その理由を論理的に説明できる能力が問われます。

5.3 問題対策

第5章で学んだ論理設計の知識は、データベーススペシャリスト試験の午後Ⅱ問題の核となる部分です。午後Ⅱでは、多くの場合、与えられた業務記述を基にE-R図を作成・修正したり、正規化を進めて関係スキーマを定義したりする能力が問われます。

ここでは、午後試験でこれらの知識がどのように問われ、どのように解答すべきか、その対策のポイントをまとめます。

1. 業務記述からの概念データモデル作成

問われ方:
- 「与えられた業務記述を読み解き、適切なエンティティ、属性、リレーションシップ、多重度、任意性を含むE-R図を作成しなさい。」
- 「E-R図に記述されたエンティティについて、主キーとその他の属性を明確にしなさい。」
対策:
- 業務記述を徹底的に読み込む: 名詞はエンティティや属性、動詞はリレーションシップの候補となる。
- 「モノ」と「コト」の区別: 情報を蓄積する対象か、それとも単なる属性かを見極める。
- 多重度と任意性の正確な判断: 「1つ以上」「0または1つ」「複数」などの表現に注意し、図に正確に反映する。
- 関連エンティティの導入: 多対多のリレーションシップは必ず関連エンティティで解消することを忘れない。
- 再帰的リレーションシップの識別: 従業員の上司関係のように、エンティティ自身との関係を見抜く。

2. 論理設計と正規化

問われ方:
- 「与えられたE-R図をリレーショナルスキーマに変換し、主キー、外部キー、および必要な制約を記述しなさい。」
- 「与えられたテーブルが第X正規形に違反している場合、その原因となる関数従属を指摘し、第Y正規形になるようにテーブルを分解しなさい。」
- 「正規化の各段階（1NF, 2NF, 3NF）において、どのような冗長性が排除され、どのような異常が防止されるか説明しなさい。」
対策:
- E-R図から関係スキーマへの変換規則を確実にマスターする。
- 関数従属（完全、部分、推移的）を正確に識別できる訓練を積む。
- 各正規形（1NF, 2NF, 3NF）の定義と、それぞれの正規形で解消される異常（更新、挿入、削除異常）を具体例とともに説明できるようにする。
- テーブルの分解手順を実践的に理解し、与えられたテーブルを適切に正規化できる力を養う。
- アームストロングの公理は理論的な背景として理解しておくと良い。

3. スーパタイプ/サブタイプのモデリング

問われ方:
- 「特定の業務ルール（例: 従業員には正社員とパートタイマーがいて、それぞれ異なる属性を持つ）をスーパタイプ/サブタイプで表現し、E-R図および関係スキーマに落とし込みなさい。」
- 「スーパタイプ/サブタイプのリレーショナルデータベースへの実装方法（単一テーブル方式、クラス階層テーブル方式、具象テーブル方式）それぞれのメリット・デメリットを比較し、適切なものを選択しなさい。」
対策:
- **包含制約（排他/重なり）と完全性制約（完全/部分）**の意味を業務記述から正確に判断する。
- 3つの実装方法のそれぞれが、どのような業務要件や性能特性に適しているかを理解し、具体的な理由とともに説明できるようにする。

午後Ⅱ問題は、与えられた情報から論理的な思考を重ね、設計プロセスを追体験するような問題が多いです。単なる知識の暗記だけでなく、なぜそのような設計になるのか、どのようなメリット・デメリットがあるのかを自分の言葉で論理的に説明できる能力が問われます。多くの過去問を実際に解き、模範解答と自分の解答を比較分析する訓練を徹底しましょう。

第5章午後試験対策論理設計問題集 (20問)

問題 1 (概念設計の成果物)

概念データモデルの主要な成果物であり、エンティティ、属性、リレーションシップを視覚的に表現する図は何か。

ア. データフロー図 (DFD)
イ. 状態遷移図 (STD)
ウ. クラス図
エ. E-R図 (エンティティ関連図)

解答と解説

解答: エ

解説:
E-R図は、データベースの概念設計において、現実世界に存在するモノやコト、それらの属性、そしてモノやコト同士の関係を視覚的に表現するための図法です。

問題 2 (リレーションシップの多重度)

「1つの製品は複数の部品で構成され、1つの部品は複数の製品に使用される」という関係の多重度（カーディナリティ）は何か。

ア. 1対1
イ. 1対多
ウ. 多対多
エ. 多対1

解答と解説

解答: ウ

解説:
一方のエンティティの1つのインスタンスが他方の複数のインスタンスと関連し、かつ他方の1つのインスタンスも最初の複数のインスタンスと関連する場合、多対多（N:M）の関係となります。

問題 3 (参加の任意性)

E-R図で「参加が任意」であることを示す表記（例: クローズフィート記法）はどれか。

ア. 線上に1本の縦棒
イ. 線上に2本の縦棒
ウ. 線上に小さな円
エ. 線上にクロウズフィート（カラスの足）

解答と解説

解答: ウ

解説:
クローズフィート記法では、参加が必須の場合は線上に縦棒（|）を、任意の場合は小さな円（o）を記します。

問題 4 (参照制約アクション - ON DELETE)

親テーブルの行が削除された際に、関連する子テーブルの行も自動的に削除されるようにするON DELETEアクションはどれか。

ア. NO ACTION
イ. RESTRICT
ウ. SET NULL
エ. CASCADE

解答と解説

解答: エ

解説:
ON DELETE CASCADEは、親テーブルの行が削除されると、その親を参照している子テーブルの関連する行も自動的に削除する動作です。

問題 5 (多対多解消)

E-R図で多対多のリレーションシップを表現した場合、論理設計でリレーショナルスキーマに変換する際には、どのように解消するのが一般的か。簡潔に説明しなさい。

解答と解説

解答:
多対多のリレーションシップは、直接リレーショナルスキーマ（テーブル）で表現できないため、間に**関連エンティティ（連関エンティティ）**を導入して解消します。この関連エンティティは、元の2つのエンティティの主キーを外部キーとして持ち、それらを複合主キーとすることが一般的です。

問題 6 (自己参照リレーションシップ)

「従業員が上司を持つ（上司も従業員である）」という階層構造をデータベースで表現するためのリレーションシップの種類は何か。

ア. 排他的リレーションシップ
イ. 多対多リレーションシップ
ウ. 自己参照リレーションシップ
エ. 外部キーリレーションシップ

解答と解説

解答: ウ

解説:
自己参照リレーションシップは、エンティティ自身が自分自身とリレーションシップを持つ場合で、階層構造を表現する際によく用いられます。この場合、EMPLOYEEテーブル内に上司IDカラムを設け、それがEMPLOYEE.employee_idを参照する外部キーとなります。

問題 7 (スーパタイプ/サブタイプ - 完全性制約)

スーパタイプ/サブタイプのリレーションシップにおいて、スーパタイプの全てのインスタンスが必ずいずれかのサブタイプに属さなければならないという制約を何と呼ぶか。

ア. 排他制約
イ. 重なり制約
ウ. 完全性制約 (Complete)
エ. 部分性制約 (Partial)

解答と解説

解答: ウ

解説:
完全性制約（Complete Constraint）は、スーパタイプのインスタンスが、必ず一つ以上のサブタイプに属することを要求します。

問題 8 (スーパタイプ/サブタイプ - 包含制約)

スーパタイプのインスタンスが、いずれか一つのサブタイプにのみ属することができるという包含制約を何と呼ぶか。

ア. 排他 (Disjoint)
イ. 重なり (Overlap)
ウ. 完全 (Complete)
エ. 部分 (Partial)

解答と解説

解答: ア

解説:
排他（Disjoint）制約は、スーパタイプのインスタンスが、複数のサブタイプに同時に属することを禁止します。重なり（Overlap）はその逆で、複数のサブタイプに属することを許容します。

問題 9 (主キーの要件)

主キーが満たすべき要件として、適切でないものはどれか。

ア. 一意性（各行を一意に識別できること）
イ. 非NULL性（値がNULLであってはならないこと）
ウ. 不変性（原則として、値が変更されないこと）
エ. 業務上の意味を必ず持つこと（自然キーであること）

解答と解説

解答: エ

解説:
主キーは業務上の意味を持つ自然キーでも、システムが自動生成する意味を持たない代理キー（サロゲートキー）でも構いません。実際、代理キーの方が不変性や簡潔性に優れるため、広く利用されます。

問題 10 (代理キーの利点)

主キーとして代理キー（サロゲートキー）を使用する主な利点を1つ挙げなさい。

解答と解説

解答例:

不変性: 業務上の意味を持たないため、業務ルールの変更やデータの意味合いの変更があっても、主キーの値自体が変更されるリスクが低い。
簡潔性: 通常、連番などの短い形式であり、複合キーのように複数のカラムで構成されないため、主キーや外部キーとして参照する際の記述がシンプルになる。
一意性の保証: システムが自動的に生成するため、重複する値が発生しないことが保証されやすい。

問題 11 (派生属性)

顧客テーブルに生年月日カラムがあり、年齢カラムは生年月日から計算できる派生属性である。この年齢カラムをデータベースに格納しない設計を選択した場合の主なメリットは何か。

解答と解説

解答:
常に最新の年齢が取得できること（データの整合性が保たれること）と、年齢カラム分のストレージ容量を節約できることです。格納しない場合、生年月日が更新されれば年齢も自動的に最新になるため、更新時のデータ不整合リスクがありません。

問題 12 (スーパタイプ/サブタイプ - 単一テーブル方式)

スーパタイプ/サブタイプの実装方法の一つである「単一テーブル方式」の主なデメリットを1つ挙げなさい。

解答と解説

解答例:

NULL値の多発: 各サブタイプ固有の属性をすべて一つのテーブルに持つため、あるサブタイプのレコードでは他のサブタイプの属性がNULLとなり、NULL値が多く発生しストレージ効率が低下する。
テーブルの肥大化と管理の複雑化: サブタイプや属性が増えるとテーブルのカラム数が非常に多くなり、管理やクエリが複雑になる。
整合性制約の困難さ: サブタイプ固有の制約（例: 正社員の月給は0より大きい）を実装するのが難しい、またはCHECK制約が複雑になる。

問題 13 (スーパタイプ/サブタイプ - クラス階層テーブル方式)

スーパタイプ/サブタイプの実装方法の一つである「クラス階層テーブル方式」が「単一テーブル方式」と比較して優れている点（メリット）を1つ挙げなさい。

解答と解説

解答例:

NULL値の削減: 各サブタイプ固有の属性がそれぞれのテーブルに格納されるため、NULL値の発生が抑えられ、ストレージ効率が向上する。
サブタイプ固有の制約定義の容易さ: 各サブタイプテーブルで固有の制約（NOT NULLなど）を明確に定義できる。
柔軟性: 新しいサブタイプを追加する際に、既存のテーブル構造に大きな変更を加える必要がない。

問題 14 (E-R図の多対多解消後の関係スキーマ)

学生エンティティと科目エンティティの間に「多対多」の履修リレーションシップがある。これを論理設計で解消し、関係スキーマとして表現しなさい。

解答と解説

解答:
以下のように3つのテーブルに分解する。

学生 (学生ID PK, 学生名)
科目 (科目ID PK, 科目名)
履修 (学生ID PK, FK, 科目ID PK, FK, 履修日)

ここで、履修テーブルが関連エンティティとなり、学生IDと科目IDの複合主キーを持つ。

問題 15 (論理設計 - 非キー属性)

主キーでも外部キーでもない、エンティティが持つ具体的な情報を示すカラムを何と呼ぶか。

ア. 候補キー
イ. 非キー属性
ウ. 複合属性
エ. 派生属性

解答と解説

解答: イ

解説:
非キー属性（Non-Key Attribute）は、主キーでも外部キーでもない、エンティティの具体的な特徴を表す属性です。

問題 16 (排他的リレーションシップの例)

「取引先は顧客であるか、または仕入先であるかのいずれかであり、両方ではない」という業務ルールは、どのような種類のリレーションシップを示すか。

解答と解説

解答:
排他的リレーションシップです。取引先というスーパタイプに対して、顧客と仕入先というサブタイプが排他（Disjoint）の関係にあることを示します。

問題 17 (派生属性の格納判断)

商品テーブルに原価と売価があり、利益率は (売価 - 原価) / 売価 * 100 で計算できる派生属性である。この利益率をテーブルに格納する設計を選択した場合の主なデメリットは何か。

解答と解説

解答:
データの更新時にデータ不整合が発生するリスクがあることです。原価や売価が更新された際に利益率も同時に更新しないと、利益率の値が古くなり、実際の値と乖離してしまう可能性があります。また、利益率分のストレージ容量も余計に消費します。

問題 18 (参照制約アクション - SET NULLの制約)

ON DELETE SET NULLアクションを持つ参照制約を設定する際、子テーブルの外部キーカラムに対してどのような制約がないことを確認する必要があるか。

解答と解説

解答:
子テーブルの外部キーカラムが**NOT NULL制約**を持っていないことを確認する必要があります。SET NULLアクションは、親の行が削除された際に子の外部キーをNULLにするため、子の外部キーがNOT NULL制約を持っているとエラーが発生します。

問題 19 (論理設計での正規化の重要性)

データベースの論理設計において、正規化を行うことが特に重要な理由を簡潔に説明しなさい。

解答と解説

解答:
論理設計段階での正規化は、データの冗長性を排除し、更新、挿入、削除の際に発生しうるデータ異常（アノマリ）を防止することで、データベース全体のデータ整合性（一貫性）を確保するために不可欠です。これにより、データの品質と信頼性が向上し、アプリケーション開発や保守の容易性にも寄与します。

問題 20 (午後Ⅱ問題の対策 - E-R図)

午後Ⅱ問題において、与えられた業務記述からE-R図を作成する際、特にどのような点に注意して記述を読み解くべきか、2つ挙げなさい。

解答と解説

解答例:

名詞と動詞の区別: 業務記述中の名詞はエンティティや属性の候補、動詞はリレーションシップの候補となるため、これらを正確に識別する。
多重度と任意性の明示: 「必ず〜する」「〜の可能性がある」「複数の〜」といった表現に注目し、リレーションシップの多重度（1対1, 1対多, 多対多）と参加の任意性（必須/任意）を正確に判断する。
主キー候補の特定: 各エンティティを一意に識別できる属性（または属性の組み合わせ）を見つける。
関連エンティティの必要性: 多対多のリレーションシップが存在しないかを確認し、必要であれば関連エンティティを導入する。

第6章業務知識

データベーススペシャリスト試験の午後問題、特に午後Ⅱでは、単なるデータベースの技術知識だけでなく、与えられた業務を深く理解し、それをデータモデルとして表現する能力が問われます。そのためには、ITシステムが支える主要な業務プロセス（業務知識）を把握しておくことが不可欠です。

この章では、代表的な業務プロセスである「販売管理」と「生産管理」に焦点を当て、その流れ、登場する主要なデータ（エンティティ）、そしてデータ間の関係性を分かりやすく解説します。

6.1 販売管理

販売管理とは、顧客への「見積」から「受注」、「出荷」、「請求」、「入金」までの一連の業務プロセスを管理することです。企業の売上に関わる根幹の業務であり、データベースで管理される情報の典型例です。

6.1.1 見積

見積は、顧客からの引き合い（問い合わせ）に対し、商品やサービスの価格、数量、納期などを提示する業務です。

業務の流れ:
1. 顧客からの問い合わせ
2. 営業担当者が見積書を作成
3. 顧客へ提示
4. 顧客の見積承認/却下
登場する主なデータ（エンティティ）:
- 顧客 (Customer): 見積依頼主の情報（顧客ID, 顧客名, 連絡先など）。
- 製品 (Product): 見積対象の商品情報（製品ID, 製品名, 単価など）。
- 見積 (Quotation): 見積書そのものの管理情報（見積ID, 顧客ID, 見積作成日, 有効期限, 状況など）。
- 見積明細 (QuotationDetail): 見積に含まれる各製品の詳細（見積ID, 製品ID, 数量, 単価など）。

graph TD
    A["顧客からの問い合わせ"] --> B["見積作成"];
    B --> C["顧客へ提示"];
    C -- "承認" --> D["見積承認"];
    C -- "却下" --> E["見積却下"];

erDiagram
    CUSTOMER ||--o{ QUOTATION : "requests"
    QUOTATION ||--o{ QUOTATION_DETAIL : "contains"
    PRODUCT ||--o{ QUOTATION_DETAIL : "includes"

6.1.2 受注

受注は、顧客から提示された見積や、それ以外の方法で、正式な注文（オーダー）を受け付ける業務です。

業務の流れ:
1. 顧客からの注文（見積承認後、または直接）
2. 受注情報の登録
3. 在庫確認、納期回答
登場する主なデータ（エンティティ）:
- 顧客 (Customer): （見積と同様）
- 製品 (Product): （見積と同様）
- 注文 (Order): 受注情報（注文ID, 顧客ID, 注文日, 希望納期, 状況など）。見積IDと紐づく場合も多い。
- 注文明細 (OrderDetail): 注文に含まれる各製品の詳細（注文ID, 製品ID, 数量, 単価など）。

graph TD
    A["顧客からの注文"] --> B["受注登録"];
    B --> C["在庫・納期確認"];
    C --> D["顧客へ納期回答"];

erDiagram
    CUSTOMER ||--o{ ORDER : "places"
    ORDER ||--o{ ORDER_DETAIL : "contains"
    PRODUCT ||--o{ ORDER_DETAIL : "includes"
    QUOTATION ||--o| ORDER : "generated_from"

QUOTATIONとORDERは1対1または1対多の関係（1つの見積もりから複数の注文が発生することもあるため）。

6.1.3 出荷指示

出荷指示は、受注した商品を倉庫から顧客へ発送するよう、倉庫部門に指示を出す業務です。

業務の流れ:
1. 受注確定
2. 出荷指示書の作成
3. 倉庫部門へ指示
登場する主なデータ（エンティティ）:
- 注文 (Order): 出荷対象の注文情報。
- 出荷指示 (ShippingInstruction): 出荷指示書そのもの（出荷指示ID, 注文ID, 出荷予定日, 配送先情報, 状況など）。
- 出荷指示明細 (ShippingInstructionDetail): 出荷指示に含まれる各製品の詳細（出荷指示ID, 製品ID, 数量など）。

erDiagram
    ORDER ||--o{ SHIPPING_INSTRUCTION : "instruct_shipping"
    SHIPPING_INSTRUCTION ||--o{ SHIPPING_INSTRUCTION_DETAIL : "contains"
    PRODUCT ||--o{ SHIPPING_INSTRUCTION_DETAIL : "includes"

6.1.4 出庫指示と出庫実績

出庫指示は、出荷指示に基づいて倉庫内で特定の商品をピッキング（取り出し）するよう作業員に指示する業務です。出庫実績は、実際に出庫された内容を記録する業務です。

業務の流れ:
1. 出荷指示に基づく出庫指示の作成
2. 作業員による商品のピッキング
3. ピッキング結果（実績）の記録
登場する主なデータ（エンティティ）:
- 出庫指示 (PickingInstruction): 出庫作業の指示（出庫指示ID, 出荷指示ID, 作業担当者, 状況など）。
- 出庫指示明細 (PickingInstructionDetail): 出庫指示に含まれる各製品の詳細（出庫指示ID, 製品ID, 指示数量など）。
- 出庫実績 (PickingResult): 実際に出庫された製品の記録（出庫実績ID, 出庫指示ID, 製品ID, 実際数量, 出庫日時など）。指示と実績で数量が異なる場合があるため、両方を管理することが重要です。

erDiagram
    SHIPPING_INSTRUCTION ||--o{ PICKING_INSTRUCTION : "generates"
    PICKING_INSTRUCTION ||--o{ PICKING_INSTRUCTION_DETAIL : "contains"
    PRODUCT ||--o{ PICKING_INSTRUCTION_DETAIL : "instructs_to_pick"
    PICKING_INSTRUCTION ||--o{ PICKING_RESULT : "records_result_of"
    PRODUCT ||--o{ PICKING_RESULT : "picked"

6.1.5 出荷実績

出荷実績は、実際に出荷が完了した内容を記録する業務です。出庫実績と照合され、最終的な顧客への出荷情報を確定します。

業務の流れ:
1. 出庫済み商品の梱包・発送
2. 運送業者への引き渡し
3. 出荷情報の記録（追跡番号など）
登場する主なデータ（エンティティ）:
- 出荷実績 (ShippingRecord): 実際の出荷情報（出荷実績ID, 出庫実績ID, 配送業者, 追跡番号, 実際出荷日時, 状況など）。
- 出荷実績明細 (ShippingRecordDetail): 出荷された各製品の詳細（出荷実績ID, 製品ID, 数量など）。

erDiagram
    PICKING_RESULT ||--o{ SHIPPING_RECORD : "generates"
    SHIPPING_RECORD ||--o{ SHIPPING_RECORD_DETAIL : "contains"
    PRODUCT ||--o{ SHIPPING_RECORD_DETAIL : "shipped"

6.1.6 請求

請求は、出荷した商品やサービスに対して、顧客に代金の支払いを要求する業務です。

業務の流れ:
1. 出荷実績に基づき請求情報を確定
2. 請求書の発行
3. 顧客への送付
登場する主なデータ（エンティティ）:
- 顧客 (Customer): （受注と同様）
- 請求書 (Invoice): 請求書そのもの（請求書ID, 顧客ID, 注文ID, 請求日, 支払期限, 請求総額, 状況など）。
- 請求明細 (InvoiceDetail): 請求に含まれる各製品の詳細（請求書ID, 製品ID, 数量, 単価, 小計など）。

erDiagram
    CUSTOMER ||--o{ INVOICE : "receives"
    ORDER ||--o| INVOICE : "associated_with"
    INVOICE ||--o{ INVOICE_DETAIL : "contains"
    PRODUCT ||--o{ INVOICE_DETAIL : "billed"

販売管理業務フロー全体の概要

graph TD
    見積("見積") --> 受注("受注");
    受注 --> 出荷指示("出荷指示");
    出荷指示 --> 出庫指示("出庫指示");
    出庫指示 --> 出庫実績("出庫実績");
    出庫実績 --> 出荷実績("出荷実績");
    出荷実績 --> 請求("請求");
    請求 --> 入金("入金");

午後試験では、このような一連の業務フロー全体を俯瞰し、各エンティティ間の連携やデータの一貫性をどのように保つべきかが問われます。

6.2 生産管理

生産管理とは、顧客の需要や販売計画に基づいて、製品を効率的に製造し、供給するまでの一連の業務プロセスを管理することです。原材料の調達から製造計画、生産実行、品質管理、完成品の在庫管理まで多岐にわたります。

6.2.1 製造を行うきっかけ

製品の製造は、様々なきっかけで開始されます。これを生産トリガーとも呼びます。

需要予測・販売計画:
- 将来の需要を予測し、それに基づいて生産計画を立てる。
- 例: 季節商品や定番商品の定期的な生産。
顧客からの受注:
- 顧客からの具体的な注文を受けてから生産を開始する（受注生産）。
- 例: オーダーメイド製品や特殊な部品。
在庫補充:
- 製品や部品の在庫が安全在庫レベルを下回った際に、自動的に生産を開始する。
- 例: 一般的な消耗品や汎用部品。
他部門からの依頼:
- 修理用部品や社内設備用の部品など、製造部門以外の部門からの依頼。

登場する主なデータ（エンティティ）:

需要 (Demand): 生産を行うきっかけとなる情報（需要ID, 製品ID, 数量, 納期など）。

6.2.2 品目

**品目（Item）**とは、生産管理において扱う全ての「モノ」の総称です。完成品、半製品、部品、原材料など、種類に関わらず一意に識別・管理されます。

登場する主なデータ（エンティティ）:
- 品目 (Item): 全てのモノの基本情報（品目ID, 品目名, 品目区分（完成品、半製品、原材料など）, 単位, 標準原価など）。

部品構成表 (Bill Of Materials: BOM)

品目の中でも、完成品や半製品を製造するためには、どの部品がどれだけ必要かを示す**部品構成表（BOM）**が非常に重要です。部品構成表は階層構造をしており、製品とその部品、さらにその部品の部品といった関係を管理します。

graph TD
    A["製品A"] --> B["部品B"];
    A --> C["部品C"];
    B --> D["部品D"];
    C --> D;
    C --> E["部品E"];

業務では、このような階層構造を持つデータを扱うことが多いため、午後試験でも関連問題が出題されることがあります。

6.2.3 所要量展開 (Material Requirements Planning: MRP)

所要量展開（MRP）は、生産計画や顧客からの注文（独立需要）に基づいて、完成品を製造するために必要な部品や原材料の必要量と必要時期を計算することです。部品構成表（BOM）がこの計算の基礎となります。

業務の流れ:
1. 完成品の生産計画（または受注）から、完成品を構成する部品の所要量を逆算。
2. 部品の在庫を考慮し、不足分を計算。
3. 不足部品の調達（製造または発注）計画を立案。
登場する主なデータ（エンティティ）:
- 品目 (Item): （品目ID, 品目区分, ...）
- 部品構成 (BillOfMaterial): （親品目ID, 子品目ID, 構成数量など）
- 所要量計画 (MRPPlan): （品目ID, 必要数量, 必要時期など）

6.2.4 製造指図

製造指図は、所要量展開の結果に基づいて、実際に製品や部品を製造するよう製造現場に指示を出す業務です。

業務の流れ:
1. MRP結果に基づき製造指図を作成
2. 製造現場への発行
3. 製造実績の記録
登場する主なデータ（エンティティ）:
- 製造指図 (ProductionOrder): 指示書そのもの（製造指図ID, 品目ID, 指示数量, 指示開始日, 指示完了日, 状況など）。
- 製造指図明細 (ProductionOrderDetail): 製造に必要な部品や工程の詳細（製造指図ID, 部品品目ID, 必要数量など）。
- 製造実績 (ProductionResult): 実際の結果（製造実績ID, 製造指図ID, 品目ID, 実際製造数量, 製造日時など）。

6.2.5 発注と入荷

生産に必要な原材料や部品の不足分は、外部の仕入先（サプライヤー）に発注し、それが届けられた際に入荷として受け入れます。

業務の流れ:
1. 所要量展開や安全在庫に基づき、発注が必要な品目を特定
2. 仕入先へ発注（発注書の作成）
3. 仕入先からの商品受領（入荷）
4. 入荷実績の記録
登場する主なデータ（エンティティ）:
- 仕入先 (Supplier): 部品や原材料の供給元（仕入先ID, 仕入先名, 連絡先など）。
- 品目 (Item): （発注対象の部品・原材料）
- 発注 (PurchaseOrder): 発注書そのもの（発注ID, 仕入先ID, 発注日, 納期, 状況など）。
- 発注明細 (PurchaseOrderDetail): 発注に含まれる各品目の詳細（発注ID, 品目ID, 数量, 単価など）。
- 入荷 (GoodsReceipt): 実際に入荷した製品の記録（入荷ID, 発注ID, 品目ID, 実際入荷数量, 入荷日時など）。

graph TD
    A["所要量展開"] --> B["発注"];
    B --> C["入荷"];

erDiagram
    SUPPLIER ||--o{ PURCHASE_ORDER : "supplies for"
    PURCHASE_ORDER ||--o{ PURCHASE_ORDER_DETAIL : "contains"
    ITEM ||--o{ PURCHASE_ORDER_DETAIL : "orders"
    PURCHASE_ORDER ||--o{ GOODS_RECEIPT : "receives"
    ITEM ||--o{ GOODS_RECEIPT : "received"

生産管理業務フロー全体の概要

graph TD
    A["需要/計画"] --> B["所要量展開_MRP"];
    B --> C{"部品不足?"};
    C -- "Yes" --> D["発注"];
    D --> E["入荷"];
    C -- "No" --> F["製造指図"];
    E --> F;
    F --> G["製造実行"];
    G --> H["製造実績"];
    H --> I["完成品在庫"];

午後試験では、これらの業務フローを正確に理解し、データ間の依存関係や整合性を考慮したデータモデルを構築できるかが問われます。特に、在庫管理や原価計算といった側面とデータベース設計を結びつける問題が出題されることがあります。

第6章業務知識問題集 (20問)

問題 1 (販売管理のプロセス順序)

一般的な販売管理の一連の業務プロセスにおいて、「受注」の次に発生する業務として最も適切なものはどれか。

ア. 見積
イ. 請求
ウ. 出荷指示
エ. 入金

解答と解説

解答: ウ

解説:
販売管理の一般的なプロセスは「見積 → 受注 → 出荷指示 → 出庫指示・実績 → 出荷実績 → 請求 → 入金」の順に進みます。受注が確定した後、倉庫に出荷を依頼するための「出荷指示」が出されます。

問題 2 (見積管理のエンティティ)

「見積（Quotation）」業務において、主要な情報を管理するために最低限必要なエンティティの組み合わせとして適切なものはどれか。

ア. 顧客、製品、注文
イ. 顧客、製品、見積、見積明細
ウ. 製品、出荷指示、請求
エ. 従業員、製品、見積

解答と解説

解答: イ

解説:
見積は顧客と製品を対象に行われるため、顧客情報、製品情報、そして見積書そのものの情報（見積）とその詳細（見積明細）が必要となります。注文は受注業務以降に発生するエンティティです。

問題 3 (受注と見積のリレーションシップ)

「顧客からの注文は、必ず以前に提示された見積に基づいて行われる」という業務ルールがある場合、注文 (Order)エンティティと見積 (Quotation)エンティティ間のリレーションシップの多重度と任意性として最も適切なものはどれか。

ア. 注文(多) - 見積(1) (必須)
イ. 注文(1) - 見積(1) (必須)
ウ. 注文(多) - 見積(1) (注文は見積に対して必須、見積は注文に対して任意)
エ. 注文(1) - 見積(多) (必須)

解答と解説

解答: ア

解説:
「顧客からの注文は、必ず以前に提示された見積に基づいて行われる」ということは、「1つの注文は必ず1つの見積から来る（注文→見積が必須で1）」ことを意味します。「1つの見積からは、複数の注文が発生する可能性がある」と考えるのが自然なので、「見積→注文が任意で多」となります。したがって、「注文(多) - 見積(1)」で、注文側から見積側への関連は必須です。

問題 4 (出庫指示と出庫実績)

「出庫指示」と「出庫実績」の業務において、指示数量と実際数量の両方を記録することが重要な理由を簡潔に説明しなさい。

解答と解説

解答:
指示数量と実際数量の両方を記録することで、ピッキング作業における過不足や間違いを把握し、在庫差異の原因特定や作業品質の評価に役立てることができます。また、顧客への出荷情報との突合や、在庫管理の正確性を保つためにも重要です。

問題 5 (請求業務のトリガー)

販売管理において、請求業務が開始される典型的なきっかけ（トリガー）となる業務は何か。

ア. 見積が承認された時
イ. 注文が確定された時
ウ. 製品の出荷が完了した時
エ. 入金が確認された時

解答と解説

解答: ウ

解説:
一般的に、請求書は商品やサービスが顧客に提供され、出荷が完了したことを確認した後で発行されます。

問題 6 (生産管理のトリガー)

生産管理において、製品の製造を行うきっかけとなる「需要予測」以外に、考えられるトリガーを1つ挙げなさい。

解答と解説

解答例:

顧客からの受注: 顧客からの具体的な注文に基づいて製造を開始する（受注生産）。
在庫補充: 製品や部品の在庫が安全在庫レベルを下回った際に、在庫を補充するために製造を開始する。
他部門からの依頼: 修理用部品や社内設備用の部品など、製造部門以外の部門からの依頼。

問題 7 (品目)

生産管理で扱う「品目（Item）」には、通常どのような種類の「モノ」が含まれるか。適切なものをすべて選択しなさい。

ア. 完成品
イ. 半製品
ウ. 部品
エ. 原材料
オ. サービス

解答と解説

解答: ア, イ, ウ, エ

解説:
生産管理における品目は、製造に関わる全ての物理的な「モノ」を指します。完成品、半製品、部品、原材料などが該当します。サービスは物理的なモノではないため、通常は品目としては扱われませんが、品目として管理される完成品に付随するサービスとして管理されることはあります。

問題 8 (部品構成表)

「部品構成表（BOM）」が生産管理において果たす最も重要な役割は何か。

ア. 製品の価格を決定するため。
イ. 完成品を製造するために必要な部品の種類と数量を示すため。
ウ. 従業員の勤務時間を管理するため。
エ. 顧客からのクレーム情報を記録するため。

解答と解説

解答: イ

解説:
部品構成表（BOM）は、ある製品がどのような部品や原材料から構成されているか、そしてそれぞれがどれだけ必要かを示すリストであり、所要量展開（MRP）の基礎となります。

問題 9 (所要量展開 - MRP)

「所要量展開（MRP）」の主な目的は何か。簡潔に説明しなさい。

解答と解説

解答:
所要量展開（MRP）の主な目的は、完成品の生産計画や受注量に基づいて、それを製造するために必要な部品や原材料の「必要量」と「いつまでに必要か（必要時期）」を正確に計算することです。これにより、過剰な在庫や部品不足を防ぎ、生産計画を最適化します。

問題 10 (製造指図)

「製造指図（Production Order）」は、生産管理のどの段階で発行されるか。

ア. 顧客からの受注時
イ. 部品構成表の作成時
ウ. 所要量展開（MRP）の結果に基づいて
エ. 完成品の出荷時

解答と解説

解答: ウ

解説:
所要量展開（MRP）によって、どのような製品や部品をどれだけ製造する必要があるかが明確になった後、具体的な製造作業を指示するために製造指図が発行されます。

問題 11 (発注と入荷)

生産管理における「発注」業務で作成される主なエンティティは何か。また、そのエンティティが参照する主なエンティティも挙げなさい。

解答と解説

解答:

主なエンティティ: 発注 (PurchaseOrder)、発注明細 (PurchaseOrderDetail)
参照する主なエンティティ: 仕入先 (Supplier)、品目 (Item) （PurchaseOrderはSupplierを参照し、PurchaseOrderDetailはPurchaseOrderとItemを参照します。）

問題 12 (販売管理 - 注文と注文明細)

注文 (Order)エンティティと注文明細 (OrderDetail)エンティティのリレーションシップは、一般的にどのような多重度になるか。

ア. 注文(1) - 注文明細(1)
イ. 注文(1) - 注文明細(多)
ウ. 注文(多) - 注文明細(1)
エ. 注文(多) - 注文明細(多)

解答と解説

解答: イ

解説:
1つの注文は複数の製品を含む注文明細を持つことができ、1つの注文明細は必ず1つの注文に属します。したがって、1対多（Order:1 - OrderDetail:N）の関係となります。

問題 13 (生産管理 - 部品構成の階層表現)

製品Aが部品Bと部品Cから構成され、部品Bは部品Dから構成される階層構造を持つ場合、この部品構成表をデータベースで表現するために必要な主要なエンティティとその関係について簡潔に説明しなさい。

解答と解説

解答:
主要なエンティティは品目 (Item)と部品構成 (BillOfMaterial)です。 Itemテーブルが全ての部品や製品の基本情報を持ち、BillOfMaterialテーブルが親品目IDと子品目ID、使用数量などの情報を持つことで、Item間の自己参照リレーションシップを通じて階層構造を表現します。

問題 14 (販売管理 - 出荷実績の記録内容)

出荷実績（ShippingRecord）エンティティに記録される情報として、主要なものを2つ挙げなさい。

解答と解説

解答例:

実際出荷日時: 実際に製品が出荷された日時。
配送業者: 製品を配送した運送業者の情報。
追跡番号: 荷物の追跡に使用する番号。
出荷実績ID: 出荷実績を一意に識別するID。

問題 15 (生産管理 - 入荷と発注のリレーションシップ)

「1つの発注に対して複数の入荷実績がある場合があり、1つの入荷実績は必ず1つの発注に対するものである」という業務ルールがある場合、入荷 (GoodsReceipt)エンティティと発注 (PurchaseOrder)エンティティ間のリレーションシップの多重度と任意性として最も適切なものはどれか。

ア. 入荷(多) - 発注(1) (必須)
イ. 入荷(1) - 発注(多) (必須)
ウ. 入荷(多) - 発注(1) (入荷は発注に対して必須、発注は入荷に対して任意)
エ. 入荷(1) - 発注(多) (入荷は発注に対して任意、発注は入荷に対して必須)

解答と解説

解答: ア

解説:
「1つの入荷実績は必ず1つの発注に対するもの」なので、入荷側から発注側への関連は必須で1。「1つの発注に対して複数の入荷実績がある場合がある」ので、発注側から入荷側への関連は多（かつ発注にまだ入荷がない可能性があるので任意）。結果として「入荷(多) - 発注(1)」で、入荷から発注への関連が必須となります。

問題 16 (販売管理 - 顧客エンティティの属性)

顧客 (Customer)エンティティが持つべき主要な属性を3つ挙げなさい。

解答と解説

解答例:

顧客ID: 顧客を一意に識別するための主キー。
顧客名: 顧客の氏名または会社名。
住所: 顧客の連絡先住所。
電話番号: 顧客の連絡先電話番号。
メールアドレス: 顧客の連絡先メールアドレス。

問題 17 (生産管理 - 製造指図の目的)

製造指図（ProductionOrder）の主な目的は何か。簡潔に説明しなさい。

解答と解説

解答:
製造指図は、所要量展開（MRP）の結果に基づいて、特定の製品や部品を、いつまでに、どれだけ製造すべきかを製造現場に具体的に指示するための業務指示書です。製造の実行管理、進捗管理、および実績記録の基礎となります。

問題 18 (午後問題対策 - 業務知識)

データベーススペシャリスト試験の午後Ⅱ問題では、業務知識をどのように活用する能力が問われるか、簡潔に説明しなさい。

解答と解説

解答:
午後Ⅱ問題では、与えられた複雑な業務記述を正確に読み解き、その業務の流れやルールを理解した上で、適切なエンティティ、属性、リレーションシップを抽出し、データモデル（E-R図や関係スキーマ）として表現する能力が問われます。単なるデータベースの技術知識だけでなく、ビジネスプロセスをデータとしてどのように捉えるかが重要となります。

問題 19 (販売管理 - 在庫との関連)

販売管理において、受注が発生した際と出荷が発生した際で、製品の在庫数に与える影響はそれぞれどのように処理されるべきか。

解答と解説

解答:

受注発生時: 通常、製品の在庫数を直接減らすのではなく、引当在庫（注文済みで、まだ出荷されていない在庫）として管理し、実在庫からは減らさないことが多いです。
出荷発生時: 実際に製品が倉庫から出庫され、出荷が完了した時点で、製品の実在庫数を減少させます。

問題 20 (生産管理 - 発注の自動化)

生産管理において、発注業務を自動化するための情報として、品目 (Item)エンティティが持つべき属性と、所要量計画 (MRPPlan)エンティティが持つべき属性をそれぞれ1つずつ挙げなさい。

解答と解説

解答:

品目 (Item)エンティティ: 安全在庫数、標準リードタイム、仕入先IDなど（安全在庫を下回ったら自動発注など）。
所要量計画 (MRPPlan)エンティティ: 必要数量、必要時期など（MRPの計算結果に基づいて発注量を決定するため）。

データベーススペシャリスト試験対策テキスト＆問題集

本書の特徴と使い方

本書が目指すもの

本書の使い方

目次

本書の特徴と使い方

第0章 受験のススメ

第1章 SQL

第2章 DBMS

第3章 設計

第4章 午後試験対策 物理設計

第5章 午後試験対策 論理設計

第6章 業務知識

索引

第0章 受験のススメ

0.1 試験の概要

0.1.1 データベーススペシャリスト試験とは

試験の目的と対象者

試験のレベルと位置づけ

0.1.2 試験の詳細

各試験区分の概要

合格基準（ノックダウン方式）

午前Ⅰ試験の免除制度

0.2 学習の計画

0.2.1 午前Ⅰ試験の学習計画

0.2.2 午前Ⅱ試験の学習計画

0.2.3 午後試験の学習計画

0.3 解答のテクニック

0.3.1 午前試験の解答テクニック

0.3.2 午後試験の解答テクニック

0.4 日々の勉強のアドバイス

第1章 SQL

1.1 テーブル作成

1.1.1 データ型

1. 文字列型 (Character String Types)

2. 数値型 (Numeric Types)

3. 日付/時間型 (Date/Time Types)

4. 真偽値型 (Boolean Types)

テーブル作成例

1.1.2 NULL

NULLの特性

NULL値の検索方法 (IS NULL, IS NOT NULL)

NOT NULL制約

デフォルト値とNULL

1.2 問合せ

1.2.1 SELECT

全てのカラムと行を取得する (SELECT *)

特定のカラムだけを取得する

重複行を除外する (DISTINCT)

カラムに別名をつける (AS句)

演算結果をカラムとして表示する（計算フィールド）

1.2.2 WHERE

比較演算子

論理演算子

その他の便利な演算子

1.2.3 ORDER BY

1.3 副問合せ

1.3.1 一般的な副問合せ

1.3.2 相関副問合せ

1.4 グループ化

1.4.1 集約関数

1.4.2 グループ化した後に絞り込みを行う (GROUP BY, HAVING)

1.5 関係代数

1.5.1 和 (UNION)

1.5.2 差 (EXCEPT / MINUS)

1.5.3 積 (INTERSECT)

1.5.4 直積 (CROSS JOIN)

1.5.5 商

1.6 結合

1.6.1, 1.6.2 内部結合 (INNER JOIN)

1.6.3 外部結合 (LEFT/RIGHT OUTER JOIN)

1.6.4 全外部結合 (FULL OUTER JOIN)

1.7 追加、更新、削除

1.7.1 INSERT

1.7.2 UPDATE

1.7.3 DELETE

1.8 整合性制約

1.9 ビュー

1.9.1 更新可能ビュー

1.10 ユーザと権限

第0章受験のススメ

第3章設計

第4章午後試験対策物理設計

第5章午後試験対策論理設計

第6章業務知識

第0章受験のススメ

NULL値の検索方法 (`IS NULL`, `IS NOT NULL`)

全てのカラムと行を取得する (`SELECT *`)

重複行を除外する (`DISTINCT`)

カラムに別名をつける (`AS`句)

1.4.2 グループ化した後に絞り込みを行う (`GROUP BY`, `HAVING`)