既存図書館システムの 「外付け」 でユーザサービス向上を図る

Post on 21-Mar-2016

39 Views

Category:

Documents

6 Downloads

Preview:

Click to see full reader

DESCRIPTION

既存図書館システムの 「外付け」 でユーザサービス向上を図る. 〜 「図書系職員のためのアプリケーション開発講習会」成果を例にして~. 東京大学社会科学研究所図書チーム 前田朗. 平成 21 年 1 月 30 日 ( 金 )  於・東京大学情報基盤センター 東京大学情報基盤センター第 2 回 ITC セミナー講演. 上記のノウハウを生かして、図書系職員が実際に 成果をあげつつ学習できる環境=講習会を企画しました!. 自己紹介 (前田朗とは). 東京大学の図書系事務職員 (現、社会科学研究所図書チーム) 東京大学附属図書館の業務でいくつかの情報システムの立ち上げに関与 - PowerPoint PPT Presentation

TRANSCRIPT

既存図書館システムの「外付け」でユーザサービス向上を図る〜「図書系職員のためのアプリケーション開発講習会」成果を例にして〜

平成 21年 1月 30 日 (金 ) 於・東京大学情報基盤センター東京大学情報基盤センター第 2回 ITCセミナー講演

東京大学社会科学研究所図書チーム 前田朗

自己紹介(前田朗とは)• 東京大学の図書系事務職員(現、社会科学研究所図書チーム)• 東京大学附属図書館の業務でいくつかの情報システムの立ち上げに関与• ボランティアとして情報基盤センター図書館電子化研究室でシステム

を開発・公開 ( http://gensen.dl.itc.u-tokyo.ac.jp )– 専門用語自動抽出サービス「言選 Web 」 (Web アプリ公開、 Perl モジュー

ル・ Windows アプリ配布)– termmi (文書間の類似度等を算出)– 「ことわけ Web 」 ( 専門用語のクラスタリング )– Lingua::LanguageGuesser ( 言語判定器 TextCat を Perl モジュール化したもの)

• ボランティアで、まれに東京大学内図書館室の助っ人をすることもあります。

本日は「図書系職員のためのアプリケーション開発講習会」講師代表として講演を行ないます。

上記のノウハウを生かして、図書系職員が実際に成果をあげつつ学習できる環境=講習会を企画しました!

講演の概要一.「図書系職員のためのアプリケーション開発講習会」概要二.既存の図書館情報システムと、そのカスタマイズについての問題三.「外付け」によるカスタマイズの技術と実例

「図書系職員のためのアプリケーション開発講習会」概要

「図書系職員のためのアプリケーション開発講習会」とは• 東京大学図書系職員のための講習会• 企画・立案は各受講生が自分で• 開発も各受講生が自力で• 成果を試行公開(利用者用は学外一般公開!)

https://mbc.dl.itc.u-tokyo.ac.jp/products.html「図書系職員のためのアプリケーション開発講習会」 成果一覧URL

講習会における「正」のスパイラル業務効率化ツールの作成

サービス向上ツールの作成 業務の余力

図書系職員のスキル向上残業の削減

ユーザのメリット

図書系職員のスキル向上とツールの作成が正のスパイラルを生む?

既存の図書館情報システムと、そのカスタマイズについての問題

既存の図書館システムの整理(東京大学附属図書館の例)• 図書館情報システム

– 図書館業務システムと、オンライン所蔵目録( OPAC) 等を込みにしたパッケージシステム

– 業者から数年にわたるシステムのレンタル契約を結び使用• 電子ジャーナル管理システム

– 業者提供のシステムと大学の自作システムとが並存• 機関リポジトリ

– 自機関所属者の論文等を掲載– 業者がカスタマイズしたオープンソースソフト (DSpace) を使用

• 特殊資料目録・画像DB– 資料や図書館(室)に応じた個別のシステムが多い

使い勝手の向上(カスタマイズ)の障害• 業者とレンタル契約を結んでいるシステム

– OPAC 、電子ジャーナル管理システム– 契約期間中の大幅なカスタマイズは不可。

• 業者から買取ったシステム– 購入後のカスタマイズ、もしくは別製品への乗り換えは経費が発生

• 独自開発システム– 複雑な手当てをすると、維持管理が難しくなる

万人向けインターフェイスにならざるを得ない?不特定多数がターゲット

既存図書館システムの「外付」

OPAC

図書館提供のDB

既存システム学術情報や書籍サイト

Web スクレイピングやWeb API 呼び出し

講習会サーバへのWebアクセス

ケースA

Web API 呼び出し

カスタマイズしたWebブラウザ(FireFoxアドオン、ブックマークレット)

講習会サーバ

ケースB

カスタマイズされた情報のやりとり

カスタマイズされた情報のやりとり

「外付け」によるカスタマイズの技術と実例

いま「外付け」が面白い!• 実現が容易

– コスト– 技術

• 未来志向ではなく、現在志向– 図書館 1.0 →  図書館 1.1 ?

個々の図書系職員のアイデア次第で、新たな提案をしていくこともできます

「外付け」に使える技術の例• FireFox アドオン• ウイジェット(ガジェット)

• ブックマークレット• 外部 URL リンク (OpenURL もしくは独自仕様パラ

メータ )• Web スクレイピング• Web API• Adobe AIR「講習会」成果を例にしつつ、これらの技術を説明していきます!

「外付け」ではない話• 講習会で若干ためしたもの

– Project Next-L プロトタイプ• 日本発オープンソースの図書館情報システム

– VuFind• 次世代 OPAC システム

• その他のオープンソース図書館システム– Koha– Evergreen– 次世代 OPAC 開発プロジェクト“ XC” ( eXtensible Catalog)– など

講演内容外になりますが、オープンソースの次世代図書館システムもいくつかあります

FireFox アドオン~東大版 LibX を例にして~

• FireFox– NetScape(Mozzila) の流

れをくむ Web ブラウザ– アドオン(プラグイ

ン)により機能強化が容易

FireFox ブラウザで「東京大学 OPAC 」検索画面を開く

東大版 LibX• LibX– Web ブラウザに図

書館機能を付与するプラグインソフト

– 東大版 LibX は文字どおりその東大版

– 日本では農林水産省 農林水産研究情報総合センターでも配布

FireFox に LibX のツールバーが追加されます!

LibX ツールバー (1)

LibX ツールバー (2)

東京大学 OPAC →  オンライン所蔵目録UT repositry     → 東京大学学術成果(論文)のデータベースE-Journal → E-Journal Portal ( 電子ジャーナル検索)UT Article Link →  東京大学における論文の最適な入手先を提示UT Article Search →  東京大学契約DB・電子ジャーナルサイトの横断検索

検索対象DBを選択

LibX ツールバー (3)

大学図書館

Web 画面中のテキストをドラッグしての検索も可

LibX ツールバー (4)

図書館関係リンクを設定しておくことが可能(ユーザによる設定は不可)

LibX 右ボタンメニュー ( テキスト選択中 )

選択したテキストでOPAC を検索

LibX 右ボタンメニュー ( テキスト非選択中 )

現在の Webページを東京大学附属図書館の電子ジャーナル用プロキシ * で読み直す* 東京大学契約電子ジャーナルの中にはプロキシ経由でしか閲覧できないタイトルもあります

東大版 LibX が自動生成するリンクの一例(デモ)

Web サーバから受け取った HTML に対し、東大 OPACへのアンカータグ( <A href=

…) をつけます。

デフォルトの FireFox ブラウザLibXを組み込んだ FireFox ブラウザ

東大版 LibX が自動生成するリンクまとめ

COinS (OpenURL リンク用の HTML 書式)UT ボタンが表示され、 UT Article Search に OpenURL リンクします

ISBN正しい ISBX を見つけると、東京大学 OPAC リンクを生成しますOCLC の xISBN サービスを使い、マウスをリンクの上に乗せると(タイトルに

よっては)書誌情報を簡略表示します。 ISSN

ハイフンありの正しい ISSN をみつけると、東京大学 OPAC リンクを生成しますOCLC の xISBN サービスを使い、マウスをリンクの上に乗せると(タイトルに

よっては)書誌情報を簡略表示します DOI

UT Article Searchへのリンクを生成します PMID

UT Article Searchへのリンクを生成します 日本版 Amazon

書籍の詳細ページ上に、 UT ボタンが表示され、東京大学 OPAC にリンクします

LibX まとめ

• FireFox アドオンを使った高度な機能– 専用ツールバーを追加– 右ボタンメニューカスタマイズ– Webページ (HTML) の書き換えを行なう!

図書館関係 FireFox アドオン(「図書系職員のためのアプリケーション開発講習会」関

係外)• Amazon から OPACへのリレー検索

– Amazon の書籍画面から OPACへリンク– OPAC に所蔵がない場合は、リンクを表示しない

• 「図書 KEN 」– ISBN ではなくタイトル文字列で OPAC 検索をするら

しい– 複数 OPAC をフレームで画面分割表示するのは斬新!

• Zotero– 参考情報を FireFox ブラウザ上で管理できる– PDF のインデックス機能や、 COinS 、 Amazon から

書誌を取り込む機能もあるらしい

Greasemonkey を使用した FireFox アドオン

~ My UT Article Search を例にして~

UT Article Search 画面My UT Article Search組み込み後

Geasemonkey を使えば、 FireFox ブラウザが表示する Web 画面を容易にカスタマイズできます。

ウイジェット(ガジェット)〜東京大学 OPAC ウイジェットを例として〜

Macintosh のダッシュボードに東京大学 OPAC の簡易検索窓を追加

ウイジェット(ガジェト)• デスクトップもしくは Web サイト上で動かす

ことのできる小アプリケーション• Web サイト

– Facebook (SNS)– iGoogle– など

• パソコンのデスクトップ– Windows VISTA– Google ガジェット– Macintosh ダッシュボード

OPAC ウイジェットのある世界

iGoogleを使用中

Webブラウザを起動していない

Webブラウザで OPAC 画面を呼び出さずに、即所蔵検索が可能!

ウイジェットのまとめ• データベースアクセスの入り口を増やすことができます• 作成は容易です。• 大学図書館(特に海外が多い)に実例があります

iGoogle ガジェット(企画中)

• iGoogle 上で動くガジェット2種を企画・開発中1. 東京大学 OPAC+ 附属図書館リンク集2. 東京大学生命科学構造化センター CSLS Searc

h ガジェット CSLS は PubMed に専門用語の日本語表示機能など

を搭載した検索システム

図書館関係ウイジェットの例 (「図書系職員のためのアプリケーション開発講習会」関係外)• iGoogle の例

– 早稲田大学学術情報検索システム– Library Mapplet   (ISBN をキーに所蔵館を Google Map表示)– Google Scholar– PubMed– Amazon

• Macintosh ダッシュボードの例– PubMed ウイジェット

• FaceBook の例– WorldCat– PubMed

ブックマークレット〜東大 OPAC から東大生協在庫検索へのリレー検索ブックマークレットを例として〜

ブックマークレットとは現在、開いている Webページの情報を利用し、他のサイトへリンクすることが可能最近の Webブラウザ (IE7,

Firefox3 、 Opera9 、 Google Chrome 、 Safari) が対応 実体は JavaScript によるブックマーク

Webページ中の任意の情報を容易に取り出せないと使えませんが、応用範囲は広そうです。

東大 OPAC から東大生協在庫検索へのリレー検索ブックマークレットOPAC の詳細画面でブックマークをクリック!

ISBN をキーに学内生協の在庫を検索

ブックマークレット内部処理</SPAN></TD></TR><TR><TD NOWRAP VALIGN=MIDDLE><SPAN CLASS="CLS" ID="LABEL">分 類 </SPAN></TD><TD VALIGN=MIDDLE><SPAN CLASS="CLS" ID="VALUE">NDC8:<A HREF="/opac/disp-query?mode=2&key=B123232695418286&con1=8&kywd1=%30%30%37%2E%36%34&con2=3&con3=4&disp=1&TGSRC=0&IRKBN=0&IRTYPE=0">007.64</A></SPAN></TD></TR><TR><TD NOWRAP VALIGN=MIDDLE><SPAN CLASS="CLS" ID="LABEL"></SPAN></TD><TD VALIGN=MIDDLE><SPAN CLASS="CLS" ID="VALUE">NDC9:<A HREF="/opac/disp-query?mode=2&key=B123232695418286&con1=8&kywd1=%30%30%37%2E%36%34&con2=3&con3=4&disp=1&TGSRC=0&IRKBN=0&IRTYPE=0">007.64</A></SPAN></TD></TR><TR><TD NOWRAP VALIGN=MIDDLE><SPAN CLASS="TXTL" ID="LABEL"> 本文言語 </SPAN></TD><TD VALIGN=MIDDLE><SPAN CLASS="TXTL" ID="VALUE"> 日本語 (Japanese)</SPAN></TD></TR><TR><TD NOWRAP VALIGN=MIDDLE><SPAN CLASS="CODES" ID="LABEL">コード類 </SPAN></TD><TD VALIGN=MIDDLE><SPAN CLASS="CODES" ID="VALUE"> 書誌 ID=21319658 NCID=BA5157663X</SPAN></TD></TR><TR><TD NOWRAP VALIGN=MIDDLE><SPAN CLASS="ISBN" ID="LABEL">ISBN</SPAN></TD><TD VALIGN=MIDDLE><SPAN CLASS="ISBN" ID="VALUE">4873110378</SPAN></TD></TR>

先のOPAC画面の HTML から一部抜粋

HTML のタグを手がかりに ISBN をとりだします

ISBN を検索キーとした生協在庫検索ページの URL を生成し開きます

ブックマークレットの活用案 (1)

東京大学駒場図書館の配架場所 MAP( 開発中)と連携させるとか

ブックマークレットの活用案 (2)

自作のソーシャルブックマーク書誌データ

OPACの処理データと自作のソーシャルブックマークを連携。各書誌に自分でコメントを入力できるようにするとかも考えられます。

CiteULike(SNS) ではAmazon 等の処理取り込みを

ブックマークレットで行なっています

他のブックマークレット活用例 (「図書系職員のためのアプリケーション開発講習会」関係外)• Amazon から OPAC へのリレー検索

–筑波大学–千葉大学– など

外部 URL リンク 〜東京大学 OPAC Plus “言選Web” を例にして〜• 現在は、 OpenURL などの規約があるので、そ

れを使っての外部リンクも可能• 各データベースのパラメータを解析して使用す

れば外部リンクが可能なサイトも多い• 密接な連携はできないが、実現は「容易」

複数 Web システム間連携の方法としてはかなり簡単な方法です。

東京大学 OPAC Plus “言選Web” とは

• 関連用語を提示するシステム– 自然言語処理の「共起」の理論に沿っているが、算出法はオリジナル– 各用語から、それに関連した東京大学内蔵書と国立国会図書館 PORTA( 雑誌記事索引等 )にリンク–国内学術サイトの学術情報信頼性を活用

関連用語検索画面 画面例関連用語検索結果と

OPAC及び PORTA リンク

OPAC検索結果OPAC リンクボタン

外部 URL リンクにより東京大学 OPAC と国会図書館 PORTA へリンク

たねあかしYahoo! ウェブ検索 (Web サービス)でランク上位から50件までのサイトを検索

Yahoo!検索結果の XML から Summary を取り出す(オンラインで Yahoo!検索したときの各サイトの要約と同じデータ)専門用語自動抽出 Perl モジュールTermExtract ( 言選 Web )にかける

用語リストに東京大学 OPAC とPORTA へのリンクを付与して結果表示

Web スクレイピング〜東京大学 OPAC バスケットを例として〜

Web スクレイピングとは• Webページの HTML を解析し、必要なデータを取り出す技術です• 必要なデータを取り出すことができるかどうかは、その Webページの HTML 記述によります

• XML が使用できれば、 HTML と違い問題なく必要なデータを取り出すことができます。

• ただし、 XML によるデータのやりとり (WebAPI) を備えていないサービスも多いので、その場合には Web スクレイピングで対応します。

東京大学 OPAC バスケットとは• 東京大学 OPAC にバスケット(買い物カゴ)機能を追加• バスケットにいれた資料の地区(キャンパス)間収集経路を提示

– 東京大学のような多くの部局図書館室がある大学向き• 巻号・年次による学内所蔵館の絞込み機能もあり

FireFox ブラウザにインストール可能。ただし、学内図書館(室)の細かい貸し出し規則や研究室図書室には未対応。

巡回セールスマン問題• 「巡回セールスマン問題」

– セールスマンが顧客をめぐるにあたり最短時間(コスト)となる経路を導く問題• 「巡回東大生問題」

– 東大生が、キャンパス拠点図書館(3館)と部局図書館室(34館室)をめぐり、最短時間(コスト)で資料を集める経路を導く問題– 前田が(勝手に)命名

東 大 生

東京大学 OPAC バスケットは、この「巡回東大生問題」の一助として作成したものです。

巡回セールスマン問題30 分

20 分50 分

10 分

10 分15 分15 分

40 分

• 右図のすべての家をめぐるルートを得る• 数学的にはグラフ理論により定義される• 家(ノード)が少なければ最適解を得るのも容易だが• 複雑な場合は遺伝的アルゴリズムが有効らしい

東京大学OPACバスケットでは、ここまでの解を出せませんが、それでも若干は役に立ちそうです

「東京大学 OPAC バスケット」インストール後の OPAC 画面例図書型の書誌 雑誌型の書誌

書誌データの上下にボタンや入力欄を追加!

使い方図書型の書誌

クリック

雑誌型の書誌巻年次を入力後、クリック

バスケットに必要な資料を入れたら、このボタンをクリック

必要なだけ繰り返し(最大3 0件 )

パラメータ設定画面

①文献集めを開始する地区(キャンパス)を指定

②貸出可な図書館(室)や資料に限定③パラメータを確定

結果表示

以下、「本郷キャンパス(浅野地区)」→「本郷キャンパス(弥生地区)」…と続く

フォントが大きい図書館(室)が標記の地区にあり

指定した巻年次に合う所蔵のみ表示

東京大学 OPAC の資料詳細画面 HTML を加工 =Web スクレイピングして集計表示

複数 Webページをひとつに集計

東京大学 OPAC の検索結果東京大学 OPAC バスケットによる集計結果

HTML解析

別形式に変換

実装• OPAC 画面上のボタンや入力欄、バスケットに入れた

データの保持– Greasemonkey (Firefox アドオン ) を使う– JavaScript と DOM でどうにか– 現状の OPAC 画面の HTMLだと、あまり凝ったことは無理

• パラメータ設定画面– HTML と JavaScript を使う– Get パラメータ付きで HTML を呼び出し、 JavaScript でそのパ

ラメータを使うのがミソ• 地区(キャンパス)提示画面

– Perl による CGI により実装– Perl モジュール MARC::diffSerials を活用– どの図書館(室)がどこの地区(キャンパス)かは、手入力

(研究室所蔵までは労力的に厳しいのでフォローせず)– 利用案内 URL や、貸出可否については、図書館業務システムの

データから取り出し設定

2館間の雑誌所蔵を比較するMARC::DiffSerials

講習会成果として業務向け公開しているが利用サービスへの応用も可能

少し脱線ですが講習会で作成した便利ツールの紹介です

Web API と Adobe AIR〜東京大学 OPAC の Web サービス化とAdobe AIR クライアント〜

• WebAPI– XML 等のフォーマットによりクライアント・

サーバ間のデータをやりとりをする仕組みです• Adobe AIR

– Adobe 社のデスクトップアプリケーション環境– Web の情報資源 (WebAPI を含む)に容易にア

クセスできます– Web ブラウザよりもリッチなクライアントを構築できます。

Web API と Adobe AIR の利用について• 既存の東京大学 OPAC には、 WebAPI の

機能がないため、まずはそれを「外付け」で付与します。

• Adobe AIR は簡単に試していますが、 WebAPI と Adobe AIR の組み合わせは今後の課題です。

OPAC の Web API 付与 (Web サービス化)OPAC

HTML

Web アプリケーションへのアクセス

Web API 呼び出し情報のカスタマイズ

XML等のデータ処理用フォーマット

Webスクレイピング

Adobe AIRによるクライアントサーバ

Web API 呼び出し

東京大学 OPAC の Web サービス化テスト

ためしに作成したテストページ

OPAC の検索結果を RSS形式で返す

図書館関係WebAPI の例

• Google Book Search APIs• Amazon Web サービス• hon.jp Web サービス• xISBN (OCLC)

• 国会図書館 PORTA

Adobe AIR の活用例〜 Adobe AIR で作成した My UT Article Search 〜

この例では、 WebAPI との連携ではなくWeb ブラウザとして使っています。

WebAPI とAdoe   AIR

の組み合わせは今後の課題です。

JavaScript を使った並列検索• JavaScript を使うことで、他のサイトのデータベースを呼び出す仕組みを簡単に作成することができます。• この講習会にて作成した「並列検索」について簡単に紹介をしましょう

東京大学所蔵雑誌タイトル並列検索• 以下のデータベースを横断検索ならぬ「並列検索」します

– 東京大学附属図書館 OPAC– 東京大学で使える電子ジャーナルリンク集– E-Journal Portal

URL のパラメータ指定で検索できるデータベースであれば、仕組みの応用が可能です。

並列検索の実行例検索キーワードを入れて、「並列検索」!

指定したデータベースごとにタブが開き、個別にデータベースの検索が表示されます

まとめ

既存図書館システムの「外付」

OPAC

図書館提供のDB

既存システム学術情報や書籍サイト

Web スクレイピングやWeb API 呼び出し

講習会サーバへのWebアクセス

ケースA

Web API 呼び出し

カスタマイズしたWebブラウザ(FireFoxアドオン、ブックマークレット)

講習会サーバ

ケースB

カスタマイズされた情報のやりとり

カスタマイズされた情報のやりとり

謝辞• 講習会に取り組み成果を示してきた「図書系職員のためのアプリケーション開発講習会」受講生各位に• 講習会の運営を行なっている事務局の東京大学情報基盤センター図書館情報係のみなさまに• 最後までご清聴いただいたみなさまに• 深く感謝を申し上げます

top related