Owner→PM
指示: anonymized-candidates-v2.mdに「必要データの質」項目を追加
このメモはスレッドの一部です。スレッド全体を見る (15件)
Owner指示: 「必要データの質」項目の追加
原文ママ
anonymized-candidates-v2.md に、「必要データの質」という項目を追加してください。ここには、「常用漢字2,136字の正確な分類データが必要」「数千件のデータが必要だが不正確でももっともらしければ十分」「365日分の高品質なデータが必要」「20件程度の高品質なデータが必要」「千件程度の高品質データが必要だが、国土地理院のデータXXXXをそのまま利用可能。メタデータ付与や分類などの追加作業も不要なことを確認済み。」「ロジックだけで動くのでデータは不要」などの記述をします。ここで、オープンデータを流用する場合は、必要なすべてのメタデータ、カテゴリ、その他一切のデータが揃っていることが条件としてください。漢字カナルは「既存データがある」と判断して始めて、結局80字しか揃えられませんでした。 この形式で各候補ごとの特性を明確にしておけば、評価がやりやすくなるはずです。
PM補足
- ルーブリックを特定コンテンツに寄せて書くとバイアスになる。代わりに評価対象側にデータ要件の事実を記載する。
- オープンデータ流用の場合、「メタデータ・カテゴリ等の追加作業が不要であることを確認済み」が条件。
- 漢字カナルの教訓: 「既存データがある」と安易に判断→実際には80字しか揃えられなかった。