学位論文検索インタフェース...

37
利用マニュアル 2012/12/18 学位論文検索インタフェース 利用マニュアル 1 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo. 取扱 文書名 学位論文検索インタフェース 利用マニュアル 作成基準日 2012 12 18 文書番号 DOC-2012-SYSTEMDOCNAME Rev. 1.2 <承認> <作成> 株式会社ネクスト リッテル研究所

Upload: others

Post on 13-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

1 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

文書名

学位論文検索インタフェース 利用マニュアル

作成基準日

2012年 12月 18日

文書番号

DOC-2012-SYSTEMDOCNAME Rev. 1.2

<承認>

<作成> 株式会社ネクスト リッテル研究所

Page 2: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

2 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

目 次

1. 本ドキュメントについて ..................................................... 3 2. CentOS 5環境へのセットアップ .............................................. 4 2.1. セットアップの前提条件 ................................................. 4 2.2. パッケージのインストール ............................................... 5 2.2.1. root権限によるログイン ............................................ 5 2.2.2. ターミナルの起動 .................................................. 6 2.2.3. パッケージを rootのホームディレクトリへ展開 ........................... 7 2.2.4. セットアップ用スクリプトの実行 ...................................... 8 2.2.5. パッケージ配布の検証 ............................................. 11

3. Windowsへのセットアップ ................................................. 14 3.1. セットアップの前提条件 ................................................ 14 3.2. パッケージのインストール .............................................. 15 3.2.1. Windows環境へのログイン ......................................... 15 3.2.2. パッケージの ZIPファイルの展開 ..................................... 15 3.2.3. インストーラーの実行 ............................................. 16

4. パッケージ説明 .......................................................... 36 4.1. インデックスバッチ ................................................... 36 4.2. ログ ............................................................... 36 4.3. 設定ファイル ........................................................ 36 4.3.1. インデックスバッチおよび検索インタフェースの設定ファイル ............... 36 4.3.2. ログ設定ファイル ................................................. 37 4.3.3. Luceneインデックスファイル ....................................... 37

Page 3: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

3 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

1. 本ドキュメントについて 本ドキュメントは、学位論文検索インタフェースを利用する為のインストールマニュアルです。

Page 4: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

4 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

2. CentOS 5 環境へのセットアップ

2.1. セットアップの前提条件

インストール済みの CentOSが以下の条件を満たしていることを、あらかじめ確認してください。

・以下の RPMパッケージがインストールされている

httpd

・稼働用のユーザアカウントが作成されている

(本ドキュメントでは、 user01 というアカウントの存在を前提とします)

・SELinux設定がオフになっている

・TCP 80番ポートが開いている

本パッケージは、以下の場所にインストールを行います。

/opt/dsearch パッケージ本体

/usr/local/apache-tomcat-7.0.xx Apache Tomcat

/etc/init.d/tomcat Tomcat起動用スクリプト

/etc/httpd/conf.d/dsearch.conf Apache HTTPDサーバ設定ファイル

Page 5: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

5 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

2.2. パッケージのインストール

2.2.1. root 権限によるログイン

Page 6: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

6 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

2.2.2. ターミナルの起動

Page 7: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

7 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

2.2.3. パッケージを root のホームディレクトリへ展開

・/root/dsearchにパッケージが展開されます。

Page 8: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

8 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

2.2.4. セットアップ用スクリプトの実行 スクリプト実行 Apache Tomcat があらかじめシステムにインストールされているかどうかで実行するコマンドが異なり

ます。

Apache Tomcatがインストールされていない場合

install_with_tomcat.sh を実行します。同梱の Apache Tomcat 7.0 が同時に自動的にイン

ストールされ、自動起動設定も行われます。

tar zxf dsearch_linux_yyyymmdd.tar.gz

cd dsearch

./install_with_tomcat.sh [システムを稼働させるアカウント名]

以下の例では、アカウント名として user01 を指定しています。

Apache Tomcatがすでにインストールされている場合

install_without_tomcat.sh を実行します。すでにインストール済みの Apache Tomcatにア

プリケーションが自動的にデプロイされます。同梱の Apache Tomcat 7.0は利用されません。

tar zxf dsearch_linux_yyyymmdd.tar.gz

cd dsearch

./install_without_tomcat.sh [Tomcatが稼働しているアカウント名] [Tomcatがイン

ストールされているディレクトリ]

以下の例では、アカウント名として user01、ディレクトリとして /usr/local/tomcat を指定

しています。

Page 9: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

9 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

スクリプトの実行途中に、サンプルインデックスを作成するかどうかの確認プロンプトが表示されます。

・「y」を指定すると、サンプルインデックスの作成が行われます。

(東京大学学術情報リポジトリに接続するため、インターネットに接続されている必要があります)

Page 10: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

10 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

セットアップ確認コマンド

Page 11: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

11 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

2.2.5. パッケージ配布の検証 ブラウザ起動

Page 12: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

12 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Apache の起動確認

Tomcat 起動の確認

Page 13: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

13 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

学位論文検索インタフェースの確認 http://localhost/dsearch/ にアクセスすると、検索画面が表示されます。

サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

ように検索結果が表示されます。

Page 14: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

14 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

3. Windows へのセットアップ

3.1. セットアップの前提条件

Windows環境が以下の条件を満たしていることを、あらかじめ確認してください。

・ Windows XP以上(Windows Vista、Windows 7、Windows Server 2008R2で動作確認済み)

32bit、64bitのいずれの環境でも動作します

・ Java 6 SDKがインストールされている

32bit環境では 32bit版の Java、64bit環境では 64bit版の Javaをインストールしておい

てください

・ 管理者権限をもつアカウントでログインできる

本パッケージは、デフォルト設定では以下の場所にインストールを行います。

(インストーラーにて変更可能です)

・ C:¥opt¥dsearch パッケージ本体

・ C:¥Program Files¥Apache Software Foundation¥Tomcat 7.0 Apache Tomcat

・ C:¥Program Files¥Apache Software Foundation¥Apache2.2 Apache HTTPD

※64ビット環境では C:¥Program Files (x86)になります

・ C:¥strawberry Strawberry Perl

Page 15: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

15 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

3.2. パッケージのインストール

3.2.1. Windows 環境へのログイン

管理者権限をもつアカウントでログインしてください。

3.2.2. パッケージの ZIP ファイルの展開

インストーラーの ZIPファイルを任意の場所に展開してください。

以下の例では、デスクトップ上に展開しています。

Page 16: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

16 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

3.2.3. インストーラーの実行

展開されたディレクトリ内にある install.bat を右クリックし、「管理者として実行」を選択します。

Apache Tomcatのインストールが自動的に開始されます。

Page 17: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

17 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 18: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

18 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 19: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

19 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 20: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

20 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 21: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

21 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

つづいて、Apache HTTP Serverのインストールが自動的に開始されます。

Page 22: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

22 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 23: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

23 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 24: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

24 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 25: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

25 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 26: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

26 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

つづいて、Strawberry Perlのインストールが自動的に開始されます。

Page 27: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

27 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 28: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

28 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 29: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

29 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Apache Tomcat、Apache HTTPD、Strawberry Perlのインストール完了後、システムのインストー

ル先ディレクトリ、および URLパスを指定できます。

(通常は既定値のままで差支えありません)

Page 30: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

30 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

インストールの確認画面が表示されます。間違いがなければ OK をクリックしてください。

インストール結果を反映させるため、Apache HTTPDと Apache Tomcatの再起動が行われます。

Page 31: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

31 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 32: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

32 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

インストールの完了ダイアログボックスが表示されます。

Page 33: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

33 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

サンプルインデックスを作成したい場合は、「はい」をクリックします。

(東京大学学術情報リポジトリに接続するため、インターネットへの接続が必要です)

これで、インストール作業は完了です。

Page 34: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

34 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

ブラウザで http://localhost/dsearch/ にアクセスし、動作を確認します。

Page 35: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

35 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

Page 36: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

36 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

4. パッケージ説明 ・パッケージのインストール先は/opt/dsearchである。

4.1. インデックスバッチ

・ 格納ディレクトリは/opt/dsearchである。

・ インデックス更新が必要な時は以下のコマンドでバッチを実行する。

cd /opt/dsearch

java –jar /opt/dsearch/HarvestMain.jar

・ インデックス生成ディレクトリは/opt/dsearch/lucene/indexである。

4.2. ログ

・ 格納ディレクトリは/opt/dsearch/log/dsearch.logである。

・ インデックスバッチログと検索インタフェースログが格納される。

4.3. 設定ファイル

4.3.1. インデックスバッチおよび検索インタフェースの設定ファイル

・ /opt/dsearch/conf/dsearch_config.xml

・ 詳細は以下の表を参照してください。

要素 説明

appConfig XMLのルート

lucene_index Luceneインデックスの設定

directory Luceneインデックスの生成場所

harvesting OAI-PMHによるハーベスティングのパラメータ

base_url ハーベスティング対象の URL

target_collection 収集対象となるコレクションリストの指定 (複数

指定の場合はスペースで区切る)

description_mapping 定型情報のマッピング

pattern dc.description フィールドから定型情報を取り

出すための正規表現

fields マッチした定型情報のマッピング

( マ ッ ピ ン グ 先 と し て 、 desc_houkoku,

desc_date, desc_degree, desc_subject,

desc_gakuiki, desc_majorのいずれかを指定)

lucene_fields マッピングされた情報の Luceneフィールドへの変

換方法指定

Page 37: 学位論文検索インタフェース 利用マニュアル...サンプルインデックスを作成している場合、キーワードとして「中華人民共和国」と入力すると、以下の

利用マニュアル 2012/12/18

学位論文検索インタフェース 利用マニュアル

37 DOC-201201- SYSTEMDOCNAME Rev. 1.2 All Rights Reserved, Copyright© 2012 University of Tokyo.

取扱

property : title, alternative, creator,

description, subject, language, URI,

dspace_collection, dspace_text,

dsec_houkoku, desc_gakuiki,

desc_degree, desc_subject, desc_date,

desc_major, desc_grantor,

desc_discipline

value : analyzed:yes, analyzed:no,

not_analyzed:yes, not_analyzed:no

web_ui_{ja, en, bilingual} Web検索画面のカスタマイズ

(日本語版、英語版、バイリンガル版)

[ site_name サイト名

page_num 1ページあたりの表示件数

header ヘッダ表示文字列

footer フッタ表示文字列

column 検索画面に表示するカラム名のリスト(「|」で区切

る)desc_houkoku, desc_date, title,

creator, desc_gakuiki

column_header 検索画面に表示するカラム名のヘッダ文字列のリ

スト(「|」で区切る)

paging_url 検索画面の URLベース文字列

label_hits ヒット件数のラベル文字列

label_back 「戻る」リンクのラベル文字列

servlet 検索サーブレット共通の設定項目

file_name_prefix ファイルダウンロード(CSVもしくは RefWorks形

式)の場合のファイル名接頭辞

4.3.2. ログ設定ファイル

・ /opt/dsearch/conf/log4j.properties

・ Log4j設定を参照してください。

4.3.3. Lucene インデックスファイル

・ /opt/dsearch/lucene/index

・ HarvestMain.jarの処理が完了すると、indexディレクトリが更新されます。