アカデミックとリアルの谷を埋める道‐知識情報社会でライブラリアンはどうあるべきか‐
(以下敬称略)
日時:2011年11月11日(金)15:30-17:00
場所:第13回図書館総合展第6会場
講師:清田陽司(株式会社ネクスト リッテル研究所所長)、岡本真(アカデミック・リソース・ガイド株式会社)、三津石智巳(筑波大学大学院)、関戸麻衣(国立情報学研究所)、日高崇(有限会社スタジオ・ポットSD)
中継情報
配布資料
- マイニング探検会:マイニング探検会(マイタン)とは?
(以下抜粋)
マイタンは、図書館や出版の関係者など、知識情報産業に携わる参加者からなる情報マイニング技術を利用した、新たな図書館の未来を探る勉強会です。清田陽司(株式会社ネクスト技術基盤本部リッテル研究所)と岡本真(アカデミック・リソース・ガイド株式会社)の両名を発起人として開催しています。図書館業界、出版業界といった枠を一歩飛び出して、新たなアイディアを熱く語り合い、お互いに刺激を与え合うための場です。参加者ひとりひとりが新たな情報サービスのプロデューサーとして活躍されることを目指し、情報マイニング技術の広大はフィールドを探検しています、
司会挨拶
- 本日はご来場ありがとうございます
- 本フォーラムは企画協力となっておりますマイニング探検会の紹介となります
-
本フォーラムの構成
- 清田の基調講演
-
三津石、関戸らが作成したシステムの紹介
マイニングナイトのご案内
- 本フォーラムのキーワーどは”マイニング”
- マイニング技術に関する討論を他社の方をお招きして開催する
-
20時半から懇親会を開催する。そちらも併せてご参加いただきたい
ネクスト、リッテル研究所のこれまでとこれから
自己紹介
-
研究分野
- 自然言語処理技術の情報検索への応用
-
経歴
- 長尾館長の研究室に所属
-
東京大学情報基盤センターの助手を経て、株式会社ネクストに参画
ネクスト・リッテル研究所のミッション
-
株式会社ネクスト
- 国内最大級の不動産検索サービス「HOME’S」などを運営
- 生活全般に渡る情報提供サービスの展開
- 一見図書館とは関係なさそうに見えるが、情報と関わる所に関係性がある
-
「HOME’S」の実演デモ
-
駅の近くの不動産を探す
- 「みなとみらい駅」から20分以内に帰れる物件
- 賃料、間取りなどで絞り込む
-
駅の近くの不動産を探す
-
絞り込みは図書館OPACでのファセット検索と同様
- 技術的に共通する所がある
株式会社リッテル:研究開発のミッション
- 株式会社リッテルとは
- 情報リテラシーの向上を軸とした事業展開
-
リッテルナビゲーター
- Wikimediaと図書館情報の統合による情報ナビゲーションサービス
-
国立国会図書館「リサーチ・ナビ」
- リッテルの考案したエンジンを使用
-
研究所のビジョン
- 付加価値の高い情報サービスが人々に大きな影響を与えている(背景)
- 個人の生活にどう役立てられているかは、個人の能力に大きく依存
-
リッテルの目指すところ
-
ユーザーとシステムのインタラクション
-
ユーザーとシステムのインタラクション
なぜ大学教員からビジネスの世界へ?
-
情報検索の本質に迫るには実運用が不可欠
- しかし、実運用は論文の「生産性」にはあまり良くない
- そもそも、「みんなにとって役に立つシステムをつくりたい」とという動機と合致する
- スピード勝負なところもあるので、外部の力を借りたいと考えた
-
きっかけ
- 学部時代のバイト先の社長と再開し、話し合った
-
出資の機会をいただく
マイニング探検会
- 知識情報に携わる方々と対象とした勉強会
- 図書館の方が中心だが、所属の枠にとらわれない活動を目指している
- 自分は要所要所でレクチャーし、メンバーが開発などを行う
-
扱った主なトピックス
- 情報検索とは?
- 自然言語処理とは?
- プライバシー保護とデータマイニングの両立
-
マイニング探検会のメンバーの活動
- さまざまなAPIを活用したサービス開発
- 既存ツールを組み合わせたサービス開発
- OPACログデータの活用
-
言選ウェブの紹介
- 文章中から専門用語を自動的に切り出すツール
- 東大柏図書館の前田さんが開発
- 普通の図書館員の方でもそのような開発を行なっていただける
-
意識していること
- メンバーの一人ひとりが「情報サービスのプロデューサー」として活躍されることを目指す
-
メンバー個人の所属、立場を意識した運営
- 発言の責任は所属組織ではなく個人に帰属する
-
マイニング探検会開発合宿
- マイタンメンバー及びネクストのエンジニアが参加
-
ここで開発したシステムを紹介する
アカデミックとリアルの谷を埋める道
-
情報検索システム
- 検索質問を入力すると、テキストがヒットする
- ヒットしたテキストがどれだけ正確かで整合率を測る
- しかし、必ずしも適切なものが出てくるとは限らない
-
現実のくウェブエンジンの使われ方
- 実際のモデルは、人によるフィードバックがかかっている
- ギャップがある
- アカデミックの枠を外すというのは、こういうこと
-
「組織」と「個人」の違い
- 組織としては、役目を果たす事でクレジットを蓄積していく
- 個人はコンセンサスを取る必要が無いので、自分が決めれば動くことができる。スピードが速いのがメリット
- 組織にどっぷり使ってしまうと、個人としての側面を見失ってしまう
- 両方大事
-
組織に関わっていらっしゃる方は、自分自身の目的がある
- それらは異なって当たり前
- 異なっていても協力できることがたくさんあるから、組織というものが作る
- 組織の強みと個人の強みを両立させる
- 「ルール」と「ガイドライン」の違い
-
ルール
- 「〜すべきである」
- ルールを設けると、往々にして守ることばかりに目がいってしまう
-
ガイドライン
- 〜のが望ましい
- おおまかな指針になる
-
Wikipediaモデルから学ぶこと
-
ガイドラインの精神を非常に尊重している
- 「百科事典を作る」という目的を最重要視
-
システムを現実世界で機能させる仕組み
- 情報検索は現実の人間の営みの一つ
- 営みである以上、ある種の ad hoc性が重要
- 一方で秩序維持の努力も要求される
- 試行錯誤をし続けることが重要
- 努力を続けるビジネスモデルが成立するかどうか
-
ガイドラインの精神を非常に尊重している
-
リスクに対する考え方
- マーク・ザッカーバーグ「最大のリスクは一切リスクを取らないこと。」
- ただ、やみくもにリスクを取ればいいというわけではない
-
リスクを自分自身が主体的にコントロールすることが重要
まとめ
-
図書館の未来は私たち一人ひとりの、今この瞬間の行動にかかっている
- 「あとで」と思いがちだが、そういうものは大抵やらない
- 「今この瞬間」が大事。それが未来を作っている
-
ひとりでも多くの方が枠を超えて活動されることを期待している
マイニング探検会成果報告
Ref.Master(三津石智巳)
-
Ref.Masterとは何か
- レファレンス支援ツール
- レファレンス協同データベースを利用し、「楽しみながら」レファレンスに必要なスキルを身につけることができる
- 「遊びながら」「モチベーションの維持」を重視
-
開発の動機
- 個人のレファレンススキルをどうすれば向上させられるか?
- レファレンス質問を実際に処理すると、回答に時間がかかる
- 「レファレンス協同データベース」の提供しているデータを利用し、簡単に実践を学ぶことを目標とする
-
機能
- OpenIDを利用し、参加が容易
-
ユーザ用ポイントデータを管理
- ゲーム感覚で利用できる
-
開発メンバー
- 図書館職員1人、学生2人
- 技術支援を受けた
-
デモ(URL: http://refmaster.litteldev.net/)
- プロフィール公開
- ユーザーの称号:見習い司書からレジェンドまで
-
将来の展望
- システムの利用実験
-
ユーザーのログから統計情報を出せたら面白い
- どの都道府県がどの分類が強い、など
-
レファレンス協同データベースのデータ自体へのフィードバック
- 優秀な人でも誤答が多い問題は、登録されている回答に問題があるかもしれない
- レファレンス協同データベースの品質向上につながる
-
ぜひご利用下さい!
ブクリス:ニュース×カーリル×OPAC+CiNii Books、『気になる本』と出会える図書館サイト(関戸麻衣)
- スライド資料
-
開発の動機
- キーワードを入力するのは、実は手間
- 出会いを求めるにはOPACはハードルが高い
- 旬な話題から自動的に資料情報を提供してくれるウェブサイト
-
デモ(URL: http://maitan-a.litteldev.net/)
- ブクリス:デモサイト(中津川市立図書館バージョン)
- トップページで「こんな本はいかがですか」など、資料やキーワードの提示
- リンク先はOPACなので、すぐに資料を利用できる
-
目指したもの
-
設定や日々の運用が難しくないこと
- 少しの設定変更で対応可能
-
設定や日々の運用が難しくないこと
-
どのような仕組みか
-
情報源から情報を得る
- 定期的な更新
- 情報源からある操作を行い、情報を抽出
-
各館のOPACにそれぞれ対応する仕組みをつくるのは大変。。
- カーリルローカルのAPIを利用する
- OPACでヒットしないキーワード、ヒットしすぎるキーワードは削除する仕組みを設定
-
情報源から情報を得る
-
合宿時の問題点
-
ソースから抽出するキーワードが多すぎると負荷がかかりすぎてしまう
- →キーワードを抽出するフィルターを作成する
- 専門用語を切り出すキーフレーズ抽出:長めのキーワード
- 単語を切り出す形態素解析:短めのキーワード
-
ソースから抽出するキーワードが多すぎると負荷がかかりすぎてしまう
-
対象とする情報源
- ニュースサイトの他に、地域のポータルサイト、Wikipedia,はてなのキーワードの新着など
-
まとめ
-
抽管理画面では抽出したキーワードからCiNii Booksでヒットする数などをポップ
アップ表示 -
今後は各図書館への実用を目指す
-
抽管理画面では抽出したキーワードからCiNii Booksでヒットする数などをポップ
「俺CiNII」チーム発表(日高崇)
- スライド資料
-
概要
-
最初は作る内容を迷っていた
- 「自分が興味ある論文(だけ)を漏らさずチェクしたい」
- 国文系の論文だけを見れるウェブサイトを作れないのか?
-
最初は作る内容を迷っていた
-
合宿中
- SVMを利用するという案
- 実証実験を中心に
- 清田先生に入り口の部分をPerlで作ってもらう
-
合宿の成果
-
実験の結果、まずますの精度
- 上位100位の集合に国文論文の80%が集中している
- 欲しいものが散らばっている集合から、欲しい物が詰まっている集合の抽出に成功
-
実験の結果、まずますの精度
-
デモ(URL: http://sd.pot.co.jp/orecinii/users/login)
- 自分で判定し、スコアをつけることができる
- つけたスコアから、ユーザーの好みを記憶する
-
まとめ
- SVMは気軽に使える
-
少し時間がかかるが、ぜひ試してみていただきたい
パネル討論
岡本/
清田さんに。シビアに見て、3作品ともいいできだと思うが、課題として何が考えられるか。
清田/
Ref.Masterは選択肢が課題。ブクリスは、いろんな図書館さんに使っていただくことを意識しているが、実際のユーザーを開拓するところを頑張ってもらいたい。俺CiNiiは現実的な割り切りが良かった。精度にこだわると終わりがないが、実際にもう少しお手伝いできると良かった。
三津石/
今回はゲームを作ったよ、という発表だったが、ゆくゆくはフィードバックが目標である。今回は研究より実運用が主眼だったので、同時アクセスが何人まで大丈夫とか、OpenIDの利用だとか、実運用を行なっていく上で方向性が見えてくるのではないかと思う。
関戸/
合宿の時は非常に心配だったが、チームの関わりの中で方向性が見えた。公共図書館でなくても良いが、ぜひ実現に向けて取り組んでいきたい。
日高/
今回は進め方、取り組み方が勉強になったが、ずっと俺のターンになってしまって申し訳なかった。持論として、手持ちのカードでなんとかなるという思いがあるが、次回は違うアプローチを考えてみたい。
清田/
共生プログラミングが我々エンジニアにも勉強になった。科学的なところから、どうリアルな側面に着地するのか、そこで成果が出てきたのかなと思う。
岡本/
共生プログラミングとは「強制」ではなく「共生」。京都大学の西田先生が提唱しているもので、作り手であるエンジニアと使いてであるユーザーが一緒に考え、一緒に作っていく開発の手法である。日本での実践は今年1月が始めなど、非常に新しい話題。
図書館系の勉強会というのは非常に数が多い。中には閉鎖的な、図書館員のみのものも多いが、一方で多様性に富んでいるものもある。その中で、図書館のシステムを考える中で、マイニング探検会みたいな勉強会は有意義である。このような勉強会に出資する側として、どのようにお考えか?
清田/
枠に閉じ込まれず、枠を超えて、視野を広げるような環境を作ることが非常に重要だと思う。エンジニアの使う言葉や、プレゼンテーションを意識するということが非常に良かったのではないか。
岡本/
参加されている方の立場がそれぞれ違う。関戸さんはCiNIIの中の人だが、作っているわけではない。そのような立場ではどうだったか?
関戸/
NIIの人とは距離感がある。書類でやり取りなど、なかなか身近に感じない。今回合宿で膝を付き合わせて話をすることで、すごく密に時間を共にすることができた。そのようにすることで、良いものがつくれるんだなと実感した。
質疑
佐藤(会場)/
ブクリスが非常に面白かったが、あれをCiNiiBooksに組み込むことはできないのか。
関戸/
それは非常に面白いと思う。今からでもぜひやってみたい。
司会者のまとめ
- マイニング探検会を始めてまる2年になる。今回成果を出せて良かった
-
形式として、「清田ゼミ」という形で、定期的に顔を合わせて勉強していた
- 合宿では実際に手をつくりシステムをつくっていただいた
-
この集まりには、システムを作ったことがない人に、技術を使えるようになってもらいたいという思いがあった
-
図書館の現場のシステムの質はあまり良くない
- いろいろな事情がある
- 課題として考えるのは、図書館の中の人と技術者の方とのコミュニケーションがとりにくいということがある
-
技術者は自分たちの専門用語を意識していない
- 「コンパイル」という言葉を使われても、自分たちでは上手く使えない
-
図書館の現場のシステムの質はあまり良くない
-
自分たちが作りたい技術を相手に伝える勉強になる
- 何度もやっていれば、伝える方法、表現する方法がうまくなる
- それは技術者も同じ。技術者もどういうふうに言えばいいのか分かるようになってくる
-
「カーリル」も技術自体はそれほど珍しくない
- 当たり前のことをしっかりやっているから素晴らしい
- 今回のフォーラムではアカデミックとリアルの間、隙間をテーマにした
-
マイニング探検会は普段はクローズドで行われている勉強会である
- 12月はオープン形式で実施するので、誰でも参加できる
- 参加してみたいという方がいらっしゃれば、来ていただいて構わない
- 告知はフェイスブック上にて行う
-
あくまでもゼミ形式なので、必ず参加できるわけではない
- 除名することも
- フリーライダーで他人のアイディアをのぞき見することは良くない
-
長い時間お付き合いいただき、ありがとうございました
感想
実際に作られたシステムのデモを見ることができ、思わず使ってみたいと思いました。アカデミックとリアルの谷を埋める、ということは、システムに馴染みのない人でも技術に慣れ親しむということです。実際に作れなくても同じ言葉をしゃべることができれば、仕事上のコミュニケーションも上手くいくのではないでしょうか。苦手だから、とか詳しくないから、と敬遠せず、まずは実際にシステムを利用してみることから始めて、だんだん身近なものにしていきたいと思います。
(執筆:平山陽菜)