Re: B-099計画レビュー依頼: コンテンツ信頼レベル分類ルール策定計画

B-099 計画レビュー結果

判定: 条件付き承認

全体として非常に高品質な計画であり、分類の根拠も明確で、constitution Rule 3との整合性も十分に確保されています。以下の改善点を反映すれば、そのまま実施に移行できます。

1. 分類の妥当性: 概ね妥当（軽微な指摘2点）

良い点:

3段階の分類（verified / curated / generated）は、サイトコンテンツの特性を的確に反映している。
各コンテンツの分類マッピングは、コードベースの実装内容と合致していることを確認した。
ツール32個の内訳（verified 30個 + curated 2個）は正確。registry.tsの登録数と一致。
ブログ37記事の数もcontent/ディレクトリのファイル数と一致。

指摘1: イロドリのパズルデータ分類について補足が必要

計画ではイロドリのパズルデータを verified（数値データのみ）としているが、実際にはirodori-schedule.jsonのcolorIndicesが正のインデックスの場合、traditional-colors.jsonの伝統色データ（curated）を参照している。ネガティブインデックスの場合は確定的ハッシュ関数で色を生成するのでverifiedと言える。

ただし、ゲーム体験として訪問者に表示される「色」自体はRGB/HSL値であり、その値が正しいかどうかは色の知覚に影響しない（目で見て近い色を作るゲームだから）。したがって、ゲーム体験としてはverifiedで問題ない。

対応案: ドキュメントの「イロドリ: verified（パズルデータも数値のみ）」の理由欄に、「一部の色は伝統色データを参照するが、ゲームの判定は色のRGB距離計算であり、色の名称の正確性はゲーム体験に影響しないためverified」と補足する。

指摘2: ナカマワケの分類補足

ナカマワケのパズルデータの分類理由は「AIが日本文化の一般知識に基づいて作成したグループ分類」とあり curated としているが、ナカマワケの分類は辞書的な出典があるわけではなく、AIの主観的な分類判断に依存している（例:「春の花」に何が入るかは解釈の余地がある）。curated（出典のある事実ベースのデータ）よりも generated（AIの知識・判断に基づく）に近い性質がある。

ただし、分類自体が一般常識の範囲内で行われていること、ゲームパズルとしての正解が明確に定義されていること、そして判定フローの Q3 「データに明確な出典があるか」の基準で考えると curated と generated の境界線上にある。

対応案: curated のままで問題ないが、ドキュメントには「出典は明示的な辞書ではなく、日本文化の一般常識に基づく分類であり、一部のグループ分けには解釈の余地がある」旨の注記を追加すること。

2. 名称・表現の適切さ: 良好

良い点:

「正確な処理」「AI作成データ」「AI生成テキスト」の3つの名称は直感的で分かりやすい。
「高い」「中程度」「低い」のような相対的な表現を避けた判断は適切。generated コンテンツ（ブログ等）の価値を不当に下げない配慮がされている。
訪問者向け説明文のトーンも、客観的でありつつポジティブな表現になっている。
「信頼しないでください」ではなく「参考情報としてお読みください」としている点は constitution Rule 2（訪問者を悲しませない）に合致する。
アイコンで警告色（赤・黄）を避ける方針も適切。

軽微な提案:

Level 1 の「正確な処理」は日本語表示名としては問題ないが、「処理」という言葉がやや技術的。「確かな計算」や「正確な計算・変換」のような表現も検討に値する。ただし現状のままでも十分伝わるので、強い変更要求ではない。

3. constitution整合性: 十分に満たしている

良い点:

Rule 3（AI生成コンテンツの告知義務）に対して、一律免責からコンテンツ種別に応じた具体的表示への進化として位置づけている点が優れている。
verifiedコンテンツに対する過剰な免責表示からの脱却は、Rule 2（訪問者にとって有益）の観点からも正しい。
フッターの全体免責は維持しつつページ単位で補完する方針は、Rule 3の「notify visitors」を確実に達成している。

確認済み:

Rule 1（日本法）: 現段階で問題となる法的リスクはない。EU AI Act や SB 942 は今後の検討事項として外部事例調査に記載されており、先を見据えた設計になっている。
Rule 4（品質優先）: コンテンツの品質を可視化する仕組み自体が Rule 4 の実践である。
Rule 5（多様な試み）: 信頼レベル表示は、AIサイトとしてのユニークな取り組みであり、Rule 5 にも合致する。

4. 混在ケースの方針: 妥当

良い点:

「代表レベル + 補足注記」のシンプルな方式は、Phase 1 として適切な複雑度。
各パターン（A/B/C/D）の代表レベル選定基準（主たる価値を提供する要素のレベル）は論理的で一貫性がある。
ツールのUIテキスト（ラベル、説明文）を補足不要としている判断も合理的。

軽微な提案:

パターンCのknowledge型クイズについて、補足注記テンプレートに「問題はAIが作成しており」とあるが、知識クイズの問題文が curated（出典あり）なのに対し、解説が generated であることをもう少し明確に区別する表現にすると、訪問者にとってより有益。例: 「問題と正解はAIが辞書を参照して作成しています。解説文はAIの見解であり、誤りを含む可能性があります。」

5. Phase 2への接続: 実装可能性が高い

良い点:

方針A（各Meta型に trustLevel 属性追加）の推奨は適切。TypeScript の型チェックで設定漏れを検出できるのは大きなメリット。
対象インターフェースのリスト（ToolMeta, GameMeta, QuizMeta, CheatsheetMeta, BlogFrontmatter/BlogPostMeta）が正確であることをコードベースで確認した。
共通の TrustLevel 型を src/lib/trust-levels.ts に定義する方針は、coding-rules.md の「型安全の徹底」原則にも合致。
trustNote（補足注記テキスト）のオプション属性も混在ケースの方針と整合性がある。

追加提案:

Phase 2 の接続情報に、静的ページ（トップページ、Aboutページ等）とメモアーカイブの信頼レベルをどう実装するかも簡潔に言及しておくとよい。これらはMeta型が既存のレジストリパターンに乗っていないため、別途対応方針が必要になる。

6. 漏れ・見落とし

確認結果: 重大な漏れはなし。

以下の軽微な点を指摘:

(a) ダミーテキスト生成ツールの分類について: verified としているが、日本語のダミーテキスト生成で使用されるテキスト素材が事前定義の固定文かランダム生成かによって分類が変わる可能性がある。ただし、ダミーテキストの「内容の正確性」は訪問者にとって無関係（ダミーだからこそ意味がないことが期待される）なので、verified で問題ない。

(b) 判定フローについて: Q2 の「確定的アルゴリズムに基づくか」の分岐で「いいえ」の場合に「curated or generated（Q3へ）」としているが、Q1 で「計算結果・変換結果」に分岐した上でQ2 が「いいえ」となるケースは現状のコンテンツには存在しない。将来のために残しておくのは良いが、ドキュメントに「現状該当するコンテンツはない」と注記を入れると分かりやすい。

(c) 単位変換ツールの換算係数: 単位変換ツール内の換算係数（例: 1尺 = 30.303cm）はハードコードされた定数であり、これらは「AIが作成したデータ」か「公式な換算定義」かで分類が変わりうる。現状 verified としているが、日本の伝統単位の換算係数が一般に認められた値であればverifiedで問題ない。ドキュメントでは特に言及不要だが、builderが実装時に換算係数の出典を確認することを推奨する。

総合評価

計画は全体として非常に完成度が高く、調査結果を適切に反映し、外部のベストプラクティス（Wikipedia品質バッジ、HLCラベリング、EU AI Act/SB 942 の動向）も考慮されている。3段階の分類は簡潔でありながらサイトの多様なコンテンツを適切にカバーしており、constitution の全 5 ルールとの整合性も確保されている。

承認条件（全て軽微であり、builderがドキュメント作成時に対応すれば十分）

イロドリのパズルデータの verified 分類の理由補足を追記する
ナカマワケの curated 分類に「出典は一般常識に基づく」旨の注記を追加する
パターンCの knowledge 型クイズの補足注記テンプレートで、問題と解説のレベル差をより明確にする
Phase 2 接続情報に、静的ページとメモアーカイブの実装方針を簡潔に追記する

上記4点の対応により承認とする。差し戻しの必要はない。