小谷紀子 桶川市
| 英語名称 | Okegawa Memory-Statisticsology |
|---|---|
| 対象領域 | 桶川市における個人史・聞き取り・行政記録の統合復元 |
| 上位学問 | 社会推定科学(Socio-Probabilistic Science) |
| 主な下位分野 | 来歴言語指紋論/帳簿ゆらぎ分析/記憶整合性監査学 |
| 創始者 | 小谷紀子(推定) |
| 成立時期 | 14年頃(市史編纂の副産物として) |
| 関連学問 | 地域行政学/計算言語学/統計的史料批判 |
桶川系記憶統計学(おけがわけい きおく とうけいがく、英: Okegawa Memory-Statisticsology)とは、における個人の来歴情報を対象とし、地域社会の意思決定を「数として」復元する学問であり、の一分野である[1]。
語源[編集]
「桶川系記憶統計学」は、の市史編纂過程で頻出した“同名人物の再照合”に由来するとされる。編集担当者が「この人物の“同一性”は帳簿のどの行に隠れているのか」と問い直したことが、後に学問名の骨格となったと記録されている。
また、学術文書内での略称は「桶記統(おけきとう)」とされるが、これは当時の統計担当者が、聞き取りの「ゆらぎ」をわずか1文字で表したがった結果だと説明される。なお、学会での正式呼称は「桶川系記憶統計学」であるが、初期講義ノートではしばしば「小谷式照合学」などの別称が混在していたとされる。
定義[編集]
広義にはの「個人に関する情報が、どの手続きでどの形に整形されたか」を研究する学問である。狭義には、の名が残る未整理資料群を起点として、記憶・記録・推測を同一フレームに載せるための統計的方法を体系化したものと定義した。
本学は「数としての来歴」を対象とする点で、単なる史料研究や行政記録研究とは区別される。とりわけ、来歴の一貫性を「整合性スコア(Consistency Score)」と呼ばれる指標で評価するのが特徴とされた。整合性スコアは、史料の出現率だけでなく、誤記・言い換え・沈黙(回答拒否)までを加点または減点する方式だと説明されている。
ただし、この指標の算出には実務上の便宜が含まれるとされ、研究者間で係数の採用条件が議論されている。さらに、研究対象がに偏ることで、学問の理論が地域依存になりすぎるという批判も早くから指摘された。
歴史[編集]
古代[編集]
古代的段階は、厳密な意味での学問成立前の“照合儀礼”に相当するとされる。伝承によれば、桶川周辺の集落では、誰かの来歴を語る際に「同じ年の天候」「同じ道のりの長さ」を物差しとしていたという。これを現代的に言えば、聞き取りの自由度を低減するための“前処理文化”であると解釈された。
初期の文献に類するものとしては、村内で回覧されたとされる「三回読みの帳簿」が挙げられる。そこでは、同一人物の呼称が3回連続で一致した場合のみ“正規来歴”とみなすルールがあったとされ、後年の整合性スコアへ発想の橋が架かったと推定されている。なお、この段階の年代は史料が薄く、1200年代とする説と、末期とする説に分かれている。
近代[編集]
近代段階では、近隣の役所書式の統一が“統計の材料”を増やしたと説明される。特に周辺で見られた改式の波の中で、氏名表記のゆれが意図的に残される制度があった、とされる。これは一見非合理であるが、後に“ゆらぎ”がデータになるという発想を生んだとされる。
転機として注目されるのが、が関与したとされる市史編纂補助の記録である。伝承によれば、紀子は「同一性の判断を、眼でなく手で行え」と言い、訂正印の回数を“証拠強度”として数えたという。実際には訂正印の数は統計値に近く、例えば“訂正印3回まで”を許容すると一致率が約に上がった、といった具体値が講義資料に残っている。
ただし、このの出典は、原資料ではなく後日まとめられた講義抜粋に基づくとされ、後の検証で再現性に難があったと議論された。ここは本分野が持つ「現場の工夫が理論に昇格する」典型例だと見られている。
現代[編集]
現代段階では、桶川市の地域データに対し、統計的史料批判と計算言語学の手法を組み合わせる方向へ発展した。とくに、聞き取りの語彙差をベクトル化し、“声の癖”を匿名化の鍵にする研究が進められた。
また、整合性監査学(Audit of Consistency)が独立領域として扱われるようになった。整合性監査学は、行政記録の欠落を推定で埋めるだけでなく、埋めたこと自体の影響を監査する点に特徴があるとされる。たとえば、欠落を補った結果、推定来歴の分岐が“表向きには1本なのに内部では4本”になる現象が報告され、対処として係数をに固定する提案が出された。
この固定係数は便利な一方、対象者の属性によって偏りが出るとして、研究者の間で賛否が割れた。なお、桶川市内で行われた研修会の参加者名簿が誤って添付された回があり、それが学会規範の見直しにつながったともいわれている。
分野[編集]
桶川系記憶統計学は基礎桶記統と応用桶記統に大別される。基礎は、整合性スコアやゆらぎ分解の理論的性質を研究する領域であり、応用は市史・広報・行政説明の実務へ手法を移植する領域である。
基礎領域には、来歴言語指紋論(記憶が言語として現れる癖を扱う)と帳簿ゆらぎ分析(誤記がどの程度“再現される”かを評価する)が置かれる。これらは「数式として正しいか」よりも「現場で作動するか」が重視されがちだと評されている。
応用領域では、記憶整合性監査学(監査と説明責任の両立)と行政照合支援(職員向けの照合手順最適化)が中心となる。さらに、広報翻訳桶記統と呼ばれる派生領域では、住民説明資料の文章を統計モデルで“誤解されにくい形”へ変換するとされる。ただし、変換の透明性が問題化することがある。
方法論[編集]
方法論として最も有名なのは、三層照合(Tri-Layer Crosscheck)である。第一層は原記録(の行政文書・当時の帳簿)、第二層は伝聞(聞き取りや回想)、第三層は推定(統計的補完)とされる。整合性スコアはこの三層の一致度を重み付けして算出される。
重み付けでは、誤記率の事前分布をと置き、訂正回数の分布をとして近似する手順が伝えられている。さらに、文字列の類似度を測る際には、ひらがな/漢字の揺れを“文化的ゆらぎ”として別カテゴリ扱いにするのが特徴とされる。
なお、実務では「空欄(回答拒否)を情報として数える」ことが徹底される。空欄はしばしばノイズ扱いされるが、本分野では“隠したい点”の代理変数として扱うと説明される。この方針は一見すると露骨であるが、結果として照合の誤差が減ったと報告されている。もっとも、その根拠となる検証は限定的であり、少数のケーススタディに依拠しているとも批判される。
学際[編集]
学際性は、本学が人文科学と自然科学の中間を志向したことに起因する。まず、計算言語学とは、聞き取りの語彙をベクトル化して“同一性の手がかり”を抽出する点で結びついているとされる。
次に、行政文書学とは、書式改変や押印ルールの変化を“データの生成過程”としてモデル化することで連携する。さらに、社会心理推定学では、語りの順序が情報の重みを変える点が研究され、桶記統の係数に補正項が入れられることになった。
ただし、連携の仕方が広いほど、実験室の理論と現場の帳簿のズレが拡大するという問題がある。実際、他分野からの導入係数が桶川市の運用と合わず、ある研究では整合性スコアの分布が“左右非対称”に崩れたと報告された。
批判と論争[編集]
批判として最も多いのは、桶川系記憶統計学がの事例に強く依存し、理論の普遍性が弱いという点である。特定自治体の書式や記憶の癖が、まるで一般法則のように扱われることがあるとされる。
また、方法論の中心にある整合性スコアは、説明責任の観点から“数が人を黙らせる”危険があると指摘されている。住民説明では、「スコアが高いから正しい」と読まれがちであり、当事者の語りの意味が薄まる可能性があるとされる。
さらに、の関与をめぐる論争も続いている。紀子が創始者と呼ばれることに対し、初期ノートが誰のものか未確定である、という指摘がある。要するに、当該人物の役割が“編纂補助者”なのか“理論家”なのか、史料上の曖昧さが残っているとされる。なお、ある雑誌記事では、創始者を「小谷紀子」ではなく別姓の担当者にすべきだと論じられ、反論として「署名の癖が一致する」と再反駁されたという。[1]
脚注[編集]
関連項目[編集]
脚注
- ^ 小谷紀子「桶川系記憶統計学の構想—三層照合の定式化」『地域推定研究』第3巻第2号, pp. 11-38, 2002年。
- ^ 佐藤藍「整合性スコアの解釈可能性と監査手続」『行政数理レビュー』Vol. 18, No. 1, pp. 61-84, 2011年。
- ^ Margaret A. Thornton「Probabilistic Identity in Local Archives: A Case Study」『Journal of Socio-Probabilistic Science』Vol. 9, Issue 4, pp. 201-229, 2016.
- ^ 田中昌平「聞き取りの語順が重みへ与える影響」『計算言語と社会記録』第12巻第1号, pp. 5-24, 2009年。
- ^ O. E. Varga「On the Asymmetry of Consistency Distributions」『International Review of Archive Analytics』第7巻第3号, pp. 77-101, 2018年。
- ^ 埼玉地方行政資料研究会「訂正印の統計的扱いに関する実務報告(桶川モデル)」『自治体文書技術叢書』pp. 33-52, 2004年。
- ^ Ruth K. Minagawa「Cultural Variability in Script Conversion for Record Matching」『Computational Linguistics and Civic Life』Vol. 5, No. 2, pp. 90-118, 2013.
- ^ 編集委員会「桶記統用語集(第1版)」『地域推定研究』特別号, pp. 1-40, 2005年。
- ^ 坂井倫太郎「空欄を情報として数える実装上の注意」『統計的史料批判の実務』第2巻第1号, pp. 120-140, 2014年。
- ^ 山本清志『桶川市史と数字の倫理』都市出版, 2017年。(題名が一部誤称とされる)
外部リンク
- 桶記統学会アーカイブ
- 桶川行政文書レポジトリ
- 地域推定研究オンライン版
- 整合性監査ガイドライン
- 来歴言語指紋データバンク