>
情報検索の基礎知識
>
参考事例
参考事例. 新日本古典籍総合データベースによる古典籍検索
*2023年2月28日停止、国書データベースへ移行
1. パンフレットと基本マニュアルの確認
パンフレットと基本マニュアルを読み、検索の注意点を確認する。
新日本古典籍総合データベース のリンクは下記から。
パンフレットのリンクは下記から。
基本マニュアルのリンクは下記から。
2. 新日本古典籍総合データベース の特徴
(1) 収録対象
- 古典籍(江戸時代以前の日本の書物)の書誌と、デジタル画像。
(2) AND 検索
(3) OR 検索
- 項目内=可能。「+」か「|」で区切る。
- 項目間=不可。
(4) NOT 検索
(5) 部分一致
- 基本が中間一致か?。フレーズ入力は半角「"」で囲む。
- 前方一致=可能。
- 後方一致=可能。
- 両端一致=説明なし。
(6) 完全一致
(7) 正規化
- 全角と半角=説明はないが、区別しない。
- 大文字・小文字=説明はないが、区別しない。
- ひらがな・カタカナ=説明はないが、区別しない。
- ひらがな・カタカナの大小(アァ、ツッ、ヨョ、など)=説明はないが、区別する。
- 漢字の異体字=語句対応テーブルに基づいた異体字同定検索。
- 記号の扱いは、不明。繰り返し記号(々、ゝなど)は普通の文字として扱うらしい。
(8) その他
- 「書誌から探す」、「画像タグから探す」、「全文から探す」の3種類の検索が可能。
- 書誌詳細画面では、「人文学オープンデータセット」や「CiNii Books」へのリンクもある。
3. 新日本古典籍総合データベース の検索例
(1) 簡易検索:「西洋事情」
- 最も単純な検索。
- ヒット結果の表示例。「リスト表示」
(2) 詳細検索:「書名」=「西洋事情」、「画像」=「あり」の場合
- 詳細検索では複数の項目を使用できる。
- 項目間は「AND」のみ。
- ヒット結果の「サムネイル表示」例。
- 表示形式には「リスト表示」と「サムネイル表示」の2種類があり、切替可能。
(3) 画像がある場合の書誌詳細画面例
4. フルテキストの入手
(1) 画像ビューア画面
(2) 表示画像のダウンロード
- 画像ビューアのダウンロード機能を使い、JPEG形式の画像データを入手することが可能。
- 「画像ダウンロード」アイコンをクリックすると別画面で表示されるので、任意の場所に保存することができる。
5. 引用データの入手
- 検索結果一覧画面の「ダウンロード」を使い、CSV形式のデータを入手することが可能。
- 文字コードは「UTF-8」。
- 使用するソフトウェアによっては文字コードの調整が必要となる場合があるので注意。
- クリックすると、以下のような画面が表示される。
- (表示内容はブラウザによって異なる。)
- 以下は、いったんデスクトップに保存し、メモ帳で開いた場合の例。
- 項目ごとにコンマで区切られており、表計算ソフトで扱うと便利。