千筆文庫社
| 社名 | 千筆文庫社株式会社 |
|---|---|
| 英文社名 | Senpitsu Bunko-sha Co., Ltd. |
| 種類 | 株式会社 |
| 市場情報 | 非上場(特別照会株主制度を採用) |
| 本社所在地 | 千葉県千葉市中央区花見川3-17-2 |
| 設立 | (定款上の創業日:2月29日) |
| 業種 | 出版・情報サービス |
| 事業内容 | 逐語記録ライブラリ、電子学習台帳、自治体史料のデータ化 |
| 代表者 | 代表取締役会長 早瀬(はやせ)啓之 |
| 資本金 | 約4億2,300万円 |
千筆文庫社(せんぴつぶんこしゃ)は、日本のグローバル企業の一社として、出版とデータ化を組み合わせた「逐語記録」事業を展開する企業である。千葉県を拠点に、法務・教育・自治体の三分野で拡大してきたとされる[1]。
概要[編集]
千筆文庫社株式会社は、定款において「書字文化の保存と、学習可能な形への変換」を目的として掲げる企業である[1]。同社は、紙の写しを機械が読める「逐語記録」として再編集する技術体系を整備し、出版業を情報産業へ引き延ばしたとされる。
同社の中核は「文庫化エンジン」と呼ばれる一連の工程であり、閲覧者が必要とする一文だけを抽出できることが特徴とされる[2]。もっとも、設計思想は「本のページを解体するのではなく、読み手の癖を保存する」点に置かれたと、同社元役員は語っている[2]。
なお、社名の由来は創業当時の“千回筆を入れた校正”にあると説明されがちだが、実際には「千の筆致(ひっち)を同一品質に揃える」工学的理念から来たとする資料も存在する[3]。この点は、後年の株主総会議事録で「由来を一つに決めると品質が落ちる」との発言が残っていることでも知られる[4]。
沿革[編集]
創業と初期拡大(“2月29日”の定款)[編集]
千筆文庫社は2月29日付の定款で設立されたとされる[5]。創業者側は、日付を“存在しない日”にした理由を「存在しない日にすることで、製品仕様が現実に縛られないようにした」と述べたとされる[5]。
当時の主要顧客は、内の小規模出版社よりも、むしろ市史編纂の臨時班であった。1989年の夏にで行われた実証では、史料の傍注を平均“1ページあたり3.17箇所”に統一することが目標とされ、達成率は翌年に92.4%へ引き上げられたと報告されている[6]。
一方で、社内には「数字で約束すると文章が死ぬ」という反発も存在した。これを収めたのが、社内規程「文庫倫理10条」であり、10条のうち第7条が『約束するのは数値ではなく読みの手触りである』と定めていた点は、のちに社史編集委員会の“最重要条文”として扱われた[6]。
海外展開(“逐語の輸出”)[編集]
1998年、同社はの学習プラットフォーム事業者と提携し、電子学習台帳の英語版を試験導入した。契約上は「単語翻訳ではなく、語順の迷いまで復元する」とされ、結果として“学習者が誤読する場所”を統計的に保持する仕組みが追加されたとされる[7]。
2003年には北米の大学図書館向けに、書誌データへ“筆跡メタデータ”を結びつける方針を打ち出した。ここで用いられた指標は「筆致一致率(FCR)」であり、初期テストでは67.1%から最終的に83.9%へ改善したとされる[8]。ただし、この改善が「改善」ではなく「揃え込み」であったのではないか、という指摘も当時からあった[8]。
さらに2009年、同社は相当の「公共史料同期機構」と呼ばれる枠組みに参加したとされる。同期機構では、自治体ごとの表記ゆれを“記憶の違い”として扱う運用が採られ、結果として同社のデータ製品は“表記の博物館”として紹介されるに至った[9]。
事業内容[編集]
千筆文庫社の事業は、大きく日本国内向けと海外向けに分かれていると説明される。国内では、自治体史料のデータ化と、教育現場向けの電子学習台帳(書き込み履歴を含む)を中心に展開してきたとされる[2]。
同社が提供する逐語記録ライブラリは、単なる全文検索ではなく、文の“前後関係の癖”を学習者がたどれるように設計されたものとされる。たとえば、国語教材では「接続詞の出現タイミング」を“授業の空白”として扱い、授業進度に応じて文の順序を再構成する機能が売り文句となった[10]。
また、法務分野では契約書の改訂履歴を“比喩的整合性”の観点で再編集するサービスが導入されたとされる。ここでの比喩的整合性は、条項が採用する婉曲表現の割合(年間平均0.42%〜0.79%の範囲)を管理する概念として定義されたとされる[11]。もっとも、運用の実態は「婉曲を増やす」ことではなく、「婉曲が増えた理由を追跡する」ことに重点があった、と社内研修資料には記されている[11]。
なお、同社は販売形態として“まとめて買わせない”方針を掲げ、導入契約は「60日間の手触り評価」→「正式採用」→「更新は読みの満足度スコア連動」で進むとされる[3]。この制度により、導入初年度の解約率は28.6%から14.2%へ改善したと報告される一方、スコアの算定方法がブラックボックスではないかという疑念も出た[12]。
主要製品・サービス[編集]
同社の代表的な製品群として、逐語記録ライブラリ(VGL)、電子学習台帳(ETB)、史料同期キット(SSK)が挙げられることが多い。VGLは閲覧者の「探し方」を学習し、次に提示すべき一文の“候補集合”を狭める仕組みを採用しているとされる[2]。
ETBは、ノートの書き込みを「意味」と「癖」の二層に分解する仕様が特徴とされる。特に中等教育では、誤答の理由を“訂正に使う筆致”として保存する設計があり、これが学習者の自己修正を促すとして紹介された[10]。
SSKは自治体向けのデータ整備ツールであり、史料の劣化に応じて文字の再現度を段階化する。再現度はA〜Eの5段階で運用され、初回スキャンでは概ねB判定が中心になるよう調整されるとされる[9]。ただし、運用現場では「B判定が多い=丁寧だ」という誤解が生まれ、後年同社が注意文を追記したことが、社内通達番号「SSK-17-注意」で残っている[9]。
また、企業向けには校正代行サービス「千筆レビュー」がある。同サービスは、単語の誤りだけでなく“段落の呼吸”を整えるとして売り出され、最短納期は3営業日、長期案件では平均で121.5営業日を要すると発表されている[13]。この“呼吸”をどう測ったのかは資料によって揺れがあるものの、社内では呼吸を「句点までの平均文字数の分散」と置き換える運用がなされていたとされる[13]。
関連企業・子会社[編集]
千筆文庫社は、いくつかの関連会社を通じて技術と流通を補完しているとされる。代表的には、データ品質管理を担当する、教育コンテンツ編成を行う、そして海外翻訳運用を担うが挙げられることがある[2]。
千筆品質検査は、逐語記録の誤差を“統計上の遠近”として扱う方針を採ったとされ、出荷前には必ず「3回の同一作業」を実施し、差分を記録する。差分の許容範囲は、社内規程では「文字単位ではなく、連想単位」で定義されており、連想単位の平均は1.9語であると説明される[12]。
一方で花見川教材編成室は、学校現場の要望を“脚注の欲しさ”という物差しで整理することで知られるとされる[10]。この物差しは、脚注の数そのものではなく、脚注が読まれるまでの時間(平均分)で見積もるとされ、試算では平均7.6分であったと報告された[10]。
なお、Babel逐語工房は、海外提携先の文化圏に合わせて、逐語の密度を調整することで差別化しているとされる。もっとも、同工房の提案書にあった“密度は上げれば良い”という文言が、のちに「読み手の疲労を無視していないか」と批判されたとされる[14]。
脚注[編集]
参考文献[編集]
脚注ではないが、本記事の記述に用いられたとされる資料群である。
1. 早瀬啓之『逐語記録産業論—本は分解せずに編み直す』千葉学術出版, 2007年.
2. 井上明里『文庫化エンジンの設計要点(Vol.2)』データ校正研究会, 2011年.
3. K. Nakamura, “The Myth of Page Integrity: Senpitsu’s FCR Framework”, *Journal of Reading Engineering*, Vol.34 No.1, pp.11-29, 2014.
4. 佐久間柾『公共史料同期機構の運用実態』公共情報調査機構, 2018年.
5. 千筆文庫社『定款逐条解説(改訂第3版)』千筆文庫社出版部, 1995年.
6. “FCRと筆致一致率の関係:初期実証報告(千葉市史料編)”, *図書館情報学報*, 第12巻第4号, pp.201-219, 1992年.
7. M. Thornton, “Exporting Marginalia: Localized Phrasing in ETB”, *International Education Systems Review*, Vol.9 No.3, pp.77-104, 2006.
8. 宮城典雄『逐語は揃え込めるか?—差分の許容範囲—』新書館, 2012年.
9. Babel逐語工房『史料同期キット運用マニュアル(SSK-17)』Babel逐語工房, 2010年.
10. “句点までの分散による呼吸指標の推定”, *文章計測研究*, 第5巻第2号, pp.55-68, 2005年.
11. 田中圭太『契約条項の婉曲ログ:比喩的整合性の測定』法律情報技術協会, 2016年.
12. L. Dubois, *Footnotes and Fatigue: A Reading-Delay Study*, Academic Press, 2020.
13.(タイトルがやや不自然)千筆文庫社『千筆レビューはなぜ3営業日で直るのか(第0章)』千筆文庫社出版部, 2001年.
関連項目[編集]
外部リンク[編集]
脚注
- ^ 早瀬啓之『逐語記録産業論—本は分解せずに編み直す』千葉学術出版, 2007年.
- ^ 井上明里『文庫化エンジンの設計要点(Vol.2)』データ校正研究会, 2011年.
- ^ K. Nakamura, “The Myth of Page Integrity: Senpitsu’s FCR Framework”, *Journal of Reading Engineering*, Vol.34 No.1, pp.11-29, 2014.
- ^ 佐久間柾『公共史料同期機構の運用実態』公共情報調査機構, 2018年.
- ^ 千筆文庫社『定款逐条解説(改訂第3版)』千筆文庫社出版部, 1995年.
- ^ “FCRと筆致一致率の関係:初期実証報告(千葉市史料編)”, *図書館情報学報*, 第12巻第4号, pp.201-219, 1992年.
- ^ M. Thornton, “Exporting Marginalia: Localized Phrasing in ETB”, *International Education Systems Review*, Vol.9 No.3, pp.77-104, 2006.
- ^ 宮城典雄『逐語は揃え込めるか?—差分の許容範囲—』新書館, 2012年.
- ^ Babel逐語工房『史料同期キット運用マニュアル(SSK-17)』Babel逐語工房, 2010年.
- ^ “句点までの分散による呼吸指標の推定”, *文章計測研究*, 第5巻第2号, pp.55-68, 2005年.
- ^ 田中圭太『契約条項の婉曲ログ:比喩的整合性の測定』法律情報技術協会, 2016年.
- ^ (タイトルが微妙におかしい)千筆文庫社『千筆レビューはなぜ3営業日で直るのか(第0章)』千筆文庫社出版部, 2001年.
外部リンク
- 千筆文庫社 公式アーカイブ
- 文庫化エンジン技術公開ページ
- 逐語記録ライブラリ デモサイト
- 自治体史料同期 実装事例集
- 千筆レビュー 仕様照会窓口