# Known Residuals — jp-election-data

Version: 2026-03-19-v033  
Date: 2026-03-19

---

## 概要

本データセットの Release Facts（Layer 2）は、内部整合性チェック（validate_tidy）を全47都道府県で通過している。

総務省ブロック集計値との外部整合性は pilot 検証を実施済みであり、構造的な不一致（長野19市欠落、鳥取 summary fill 15行落ち等）は corrective publish（v033）で解消した。

以下に記載する残差は、v033 時点で分類済みだが未解消のものである。

---

## 残差分類

### 1. 近畿 microdiff

対象: 近畿ブロック（滋賀・京都・大阪・兵庫・奈良・和歌山）  
内容: 総務省ブロック集計値との差が数票〜数十票の範囲で存在  
原因推定: 端数処理、按分票の丸め方向の差異  
影響: 分析結果への実質的影響はない  
状態: 分類済み・未解消

### 2. overseas-turnout scope delta

対象: 北関東・四国  
内容: 在外投票（overseas vote）の集計スコープが県選管と総務省で異なる  
原因: 在外投票を県内投票統計に含めるか否かの扱いが一部県で異なる  
影響: 投票率の計算に影響。得票数には影響しない  
状態: 分類済み・未解消

### 3. invalid-only diff

対象: 複数県  
内容: 無効票数（invalid_votes）のみに差異がある  
原因推定: 集計タイミングの差、または報告様式の差  
影響: 得票数・有効票数には影響しない  
状態: 分類済み・未解消

### 4. 奈良県 aggregate-row drift

対象: 奈良県（20260208_hr_block_29）  
内容: 9 area の reported aggregate-row に drift が残る  
原因: 県選管の公式報告値と leaf-derived 集計値の間の差異  
影響: QC boundary として残留。leaf-level facts の正確性は確認済み  
状態: 分類済み・未解消。residual QC boundary として維持

---

## 検証の再現方法

本リポジトリの verification/ ディレクトリに、各残差の検出手法と詳細データを記録している。

外部の研究者は以下の手順で独立に検証できる。

1. 各都道府県選管の公式サイトからデータを取得する（source.yaml にURL記載）
2. fact_candidate_votes の政党別得票合計を算出する
3. fact_district_stats の valid_votes と照合する（内部整合性）
4. 総務省のブロック別集計値と照合する（外部整合性）

---

## 残差の扱いに関する方針

残差は隠さず公開する。これはデータの欠陥ではなく、検証プロセスの透明性の証明である。

完全な一致が確認できない箇所を明示することで、利用者が自身の分析においてどの程度の精度を前提にできるかを判断できるようにする。
