大森 匡(教授) 研究課題説明 (2016年5月記載+2024年Apr.+Nov.15追記)
Introduction of Prof. Tadashi OHMORI and his studies,
UEC-IS
Data Engineering Laboratory (2016.May+2024.April)
このページでは電気通信大学大学院/情報システム学研究科・情報システム基
盤学専攻における大森担当の研究課題を説明します.(当研究科は大学改組で募集を
2016.3.で終了し,2016以後は我々データベース講座メンバは,大学院
情報理工学研究科・I専攻コンピュータサイエンスコースに所属).
a new English version is: researchmap
2023年度から,研究内容・成果一覧など最新の情報は,大学の方針に従い,科学技術研究振興機構が管理するresearchmapシステムに掲載しています.研究の経歴や成果が簡潔にまとまっているので,時間のない人はresearchmapの記載をご覧ください.
-- 2024年度の研究室公開向けコメント(2024.Apr.1.+Nov.15)-----
学部3年生配属向け概要(学内アクセス限定)
大森の研究は,「データベース研究」(Database Researches, DB研究)と呼ばれる領域です.要するにデータベースシステムやトランザクション処理システムなどのデータの記憶・処理・利用などを支える基幹ソフトウェアに始まり,今なら今風の巨大データ応用を支えるデータエンジン技術,例えば検索エンジン系やデータクラウド系までのデータベース的な仕掛けや理論を扱う領域です.
現在のデータベース研究は,様々な実世界の新データ利用のために劇的に変化しており,古典的な関係データベースシステムとは見た目は違いますが,データベースシステムという点では中心になる技術は活きています.新しいデータに応じた利用能力を考えて,それにあわせてどう要素技術- indexing, 問い合わせ処理の能力, 並行処理や一貫性,巨大データ処理系,などを進化させるか,が,研究として面白いところです.
今年の大学公開(5月, 7月,11月)でもデータ処理基盤やデータ利用の研究紹介をやります(西10号館5F).
以下は2016年までの大学院情報システム学研究科のときの研究紹介として書いたものです.当時の大学院は学部なしで全員修士から入る独立研究科組織でしたので,自分の研究や学生指導のやり方を,広く学外からの大学院受験希望者向けに分かりやすく言おうという姿勢があります.この考え方は今でも同じです.学生指導の際の研究テーマや考え方も良く書けているので,研究内容を知りたいという方はぜひご覧ください.
-----
データ工学という研究領域の紹介
現実世界のサイバー化が進むにつれて,新しく多様なデータが大量に生成
されています.これら大量データを有用な情報として扱うためには,新しい情
報抽出や検索・利用能力を提供するシステムソフトウェアやそれを支えるデータベース処理アルゴリズム,システム制御技術,が必要です.この分野は長年,「データ工学(data
engineering/database research)」」と呼ばれるコンピュータ科学の領域で研
究されてきました.
大森は,このデータ工学の分野において,大量データから有用な情報を表
すデータ集合を生成・変換する効率的な技法や演算系,システム原理,の
研究をしています.
例えば:
新しい多様な大量データを使った新しい情報問い合わせ・情報抽出能力の
創案と効率的な処理機構の実現,
上記に必要なデータ演算体系の考案と効率的処理アルゴリズムの研究,
新しいデータ処理基盤の研究,高機能化・巨大データ処理対応力,トランザクション処理など並行処理機構,
などが主要な課題.
2010年以後,巨大データ処理基盤と高価値利用の研究は,検索エンジン,巨大データ共有システム,
新しいデータ応用と接続した巨大データ処理技術,など,ITの中心です.我々は,この要請に
対応したデータ処理基盤のアルゴリズムやソフトウェアの研究をしています.
詳細は,SIGMOD,VLDB, ICDE などの代表的国際会議や,DEIMという国内
会議での我々の最近の発表論文などをご覧ください.
-------------------------------------------
研究方針の概要 (IS教員紹介ページへ.(ISの2024.9.30終了に伴いwebサイトも閉じてリンク切れ)
目次
研究課題の事例
指導学生中心の例
自分の研究
最近の論文発表(2016年3月まで)
我々データ工学研究グループ(新谷准教授,藤田准教授)の解説(旧データベース学講座)
------------------------------------------
TOPへ
研究課題の事例
1. 学生指導研究について
2013年度からは,巨大データ時代に応じた新しいアルゴリズムやシステム基盤
技術の研究課題に取り組み,データ工学分野で活動しています.現在
の研究内容の詳細は次を参照してください:
2012以後の外部発表論文へ
2016前後で言うと,大まかに分けて,巨大データから複雑な情報構造を計算するためのアルゴリズ
ムと計算機構の問題,グラフデータで表された情報源の情報検索問題,空間デー
タの情報抽出・検索機構の問題,制約つき情報源からのデータ収集アルゴリズ
ムの設計,など.2023時点だと多様性・公平性を考慮したデータマイニング機構,
巨大データ集合上の類似結合演算による情報要約・利用,他,巨大データ処理系に必要なデータ一貫性の原理,など.
追記: 「どんな学生が向いているか?」--- 最近は特に,「大量にデータ
はあるがそれだけでは意味が分からない」,「大量データからどこまで情報と
して取り出せるのか,効率や重要性」,などの限界をコンピュータ科学の立場
から考えて制御することが重要です.情報工学でもデータ工学のアルゴリズム・
並列応用系の人や,数理系の意識が高いと,この分野は面白いでしょう.電気
電子物性系の学生も理論教育が厳しいためか,かなり活躍できます.
主な研究成果は下記:
新しいデータ空間の演算機構の研究成果の欄へ
位置情報データ,ストリームデータの研究
異種情報統合の研究
構造化データ・半構造データ・グラフデータのキーワー
ド検索の研究
多次元データのインデックス(R-tree)と応用の研究へ
-------------------------------------------------
2. 自分の研究について
(自分の博士論文(2.1. データベースマシンの高機能化技法)と、 ト
ランザクション理論の研究(2.2.).時期は旧いが原理にこだわる研究.).
2.1 並列データベース処理機構の高機能化
大規模データ処理基盤システムは、本質的に並列データベース処理機構であり、1980年代から研究されてきました.大森は,疎結合型
(Shared-Nothing)の並列データベースマシンが持つ巨大データ空間をConsistencyを保ちつつ並行更新する技術として、大量データ処理(bulk-read/-update) を単
位実行操作(=トランザクション)とした並行制御機構を提案しています. (自分の博士論文
の研究). 現在の視点から言うと, 巨大データ処理システム上の並行データ処理と高機能化を考える研究です.
並列データベース関連の業績
2.2 トランザクション処理と高機能化
トランザクション処理の立場では、データの共有化と並行同時更新に伴う制
御技術があげられます.原理を抽出して現在に応用していく理論的な領域の研究
です. 「トランザクション処理」というA.ロイター, J.グレイ博士の教科書の翻訳
なども行いました.
応用成果としては, データ一貫性管理機能のついた高機能なストレージシステ
ムの研究を修士学生と行いました.
トランザクション処理の研究成果の欄へ
その他: 1990年代に日本のIT企業で開発された本邦初の自律分散コン
ピュータ専用のデータベース機構について, 2011年9月に博士論文を指導・修了
しています. (論文.)
-----------------------------------------------------------
まとめ: 大量データ処理基盤の研究=新しい情報環境を創り出す研究
現在, データ工学の研究領域においては,新しいデータベース処理アルゴ
リズムやインデックスの開発,分散データ共有や新しいデータ管理環境のため
の制御アルゴリズム,システムソフトウェアとしての実現,斬新な情報抽出技
術,などの研究が積極的に行われています.
特に2010年代に入って,巨大データ処理基盤がオープンソース化した時代にな
り,新しいデータ群をどうやって集めて何の情報を取り出すか,という要請自
体が多様化したため,これに応えるアルゴリズム,システム,ソフトウェア,
の新設計による新応用新技術の提案が主題になっています.巨大データ時代を
支える研究分野として,データ工学分野はその中心に位置していると言えるで
しょう.
-----------------------------------------------------------
その他,
国内学会:電子情報通信学会デー
タ工学研究会DEWS論文集サイト、日本デー
タベース学会サイト, など.
海外学会:
ACM SIGMOD、 VLDB、IEEE Data Engineering Conference
の論文集. (
DBLP参照)
国内では、DEIM(データ工学と情報マネジメントに関するフォーラム)
という毎年3月のワークショップ論文集にデータベース分野の修士研究、卒業研
究が毎年集中して発表されます..
------------------------------------------
TOPへ
最近の論文発表(2016年4月まで). それ以後はresearchmapに掲載.
英語論文: Search
DBLP, by
the author name.
国内論文:
DEIM (Data Engineering and Information Management Forum).
Googleから検索できます.全論文PDF公開.
ACM, IEEE,電子情報通信学会,のデジタルライブラリへは,uec.ac.jp
の大学ドメインからはフリーアクセス.
------------------------------------------------
2012-2016の発表論文一覧
- 「m-最近接空間キーワード検索における探索優先順制御とタイトな下界を
用いた高速化手法の提案」,電子情報通信学会和論文誌D分冊,Vol.99 掲載予
定.2016年4月採録決定.(電子情報通信学会サイトにて早期公開中)
- 大森,今野,新谷,「MapReduce上の編集距離結合における2段階ハッシュ
分割技法の効果」,FIT情報技術フォーラム D-045, 2015年9月.
- 「データ取得制限のあるDeep Webからの適切なサンプルデータ取得方式」,
FIT情報技術フォーラム D-028, 2015年9月.
- "A New Search Strategy of mCK queries over Spatial Web with Grid
Partitioning," IEEE SNPD 2015, June 2015.
- 今野,大森,新谷,「Map/Reduceにおける編集距離結合の負荷分散・効率
化方式」,DEIM2015, E7-6, 2015年3月.(学生プレゼンテーション賞(E7セッショ
ン,「プラットフォーム技術」)
(DEIM2015論文集).
- 原嶋,大森,
「知的分散システムIDPSにおけるデータベース処理機構
IDPS-DBの設計と評価」,
電子情報通信学会論文誌D分冊 システム開発特
集号, Vol. J96-D, No.10, pp.2274-2285, 2013年10月.
-
廣瀬,大森,新谷,
「Map/Reduceにおけるバケット再グループ化を用いた
ハイブリッドハッシュ結合アルゴリズム」,
日本データベース学会論文誌,
Vol.16 (No.1), pp.61-66, 2013年6月.
-
廣瀬,大森,新谷,
「Map/Reduceにおけるバケット再グループ化を
用いたハイブリッドハッシュ結合アルゴリズム」,
DEIM2013, F2-4, 2013年3月.
学生プレゼンテーション賞,
(DEIM2013論文集).
-
Qiu, 大森,新谷,
「空間データにおける2^n分割木を用いたm-最近傍キーワード検索」,
DEIM 2013, A9-5, 2013年3月.
(DEIM2013論文集).
- Kim, 大森,
「グラフデータベースにおけるキーワード検索算法の結果分類・推薦方式」,
WebDBフォーラム 2012, A1-3, 2012年11月発表.
(予稿集).
- 原嶋,大森,
「知的分散システムIDPSにおけるデータベース処理機構IDPS-DBに関する研究」
,
DEIM 2012, C4-3. 2012年3月.
並列データベース,トランザクション処理
-
廣瀬,大森,新谷,
「Map/Reduceにおけるバケット再グループ化を用いた
ハイブリッドハッシュ結合アルゴリズム」,
日本データベース学会論文誌,
Vol.16 (No.1), pp.61-66 , 2013年6月.
- 出口 彰、大森 匡、星 守.
「ストレージシステムにおけるデータ一貫性を保証したアーカイブ取得方式」,
電子情報通信学会論文誌D-I,
Vol.J-88-D-I, No.3, pp.698-714, '05年3月.
(概要)
- 出口 彰、大森 匡、星 守.
「ストレージシステムにおけるデータ一貫性を保証したアーカイブ取得方式」
,
DEWS2004 4-a-5, 電子情報通信学会・DBSJ、2004年3月.
DEWS04論文集
- 大森 匡 「トランザクション処理モニタの概要とその構造」,
SIGMOD-Jトランザクション処理部会チュートリアル、2003年12月.
概要
(ACM SIGMOD日本支部主催による、ジム・グレイ博士と
アンドレアス・ロ
イター博士著作本(下記)のチュートリアル).
- (共訳) J.グレイ, A.ロイタ著、喜連川監訳、大森他7名訳,
「トラン
ザクション処理 -- 概念と技法 --」(上)(下),
日経BP社、'01年10月.
5,6章(TPモニタ)担当.
(amazonで書評を見てください. トランザク
ション処理システムの代表的大著).
- Tadashi Ohmori, Mamoru Hoshi
``Gaming-Simulation of
Multi-Agent Database Information Systems: its Concept and Database
Algorithms,''
DASFAA'95 (IPSJ/ACM). 1995.
- Tadashi Ohmori, Masaru Kitsuregawa, Hidehiko Tanaka,
``Scheduling Batch Transactions on Shared-Nothing parallel
database machines,''
IEEE Int. Conf. Data Engineering 1991.,
pp.210-219, IEEE, 1991.
- Tadashi Ohmori, Masaru Kitsuregawa, Hidehiko Tanaka,
``Concurrency Control of Bulk-Access Transactions on
Shared-Nothing Parallel Database Machines,''
IEEE Int. Conf. Data Engineering 1990., pp.476-485, IEEE, 1990.
- 大森匡, 喜連川優, 田中英彦,
「並列ディスクデータベースマシン
における大量データアクセストランザクションの並行制御方式」,
電子情報通信学会論文誌 D-I, Vol.J73-D1(No.1), pp.37-46, 1990年1月.
(
概要)
-------- 番外 (社会人博士による企業開発製品の博士論文)--------------
-
原嶋秀次、大森 匡.
「知的分散システムIDPSにおけるデータベース処理機
構 IDPS-DBに関する研究」,
DEIM2012, C4-2, 2012年3月.
(
論文集).
------------------------------------------------
ファイル編成法, インデックスと応用.
- 高橋 秀和、大森 匡、星 守,
「アーカイブシステムにおけるバッ
クアップ系列データの管理方式に関する検討」
DEWS'06, 4C-i6,
2006年3月. (pdf)
- 大森 匡、佐藤龍雄、星 守.
「問い合わせ分布に適応したR
木の領域分割方式」
(英題:A New Region-Splitting Strategy
for R-trees Adaptive to Query Distributions),
電子情報通信
学会論文誌D-I Vol.J-86-D-I, No.10, pp.746-761, '03年10 月. (
概要)
- 高橋 秀和、大森 匡、星 守、高塚.
「問い合わせ分布に適応し
た多次元ファイル編成法GR木のアーカイブ環境への適用」
FIT情報
技術レターズ LD-5, 情報処理学会 情報技術フォーラム(FIT), 2002年
9月. (FIT論文賞受賞) click
------------------------------------------------
情報構造計算と新しいデータベース演算機構の研究.
- 齊藤、大森、星,
「多次元的なWeb空間マイニングを行うデータベースシステムの実現: 制
約条件の一般化」,
DEIM 2010, F5-3, 2010年3月.
(WEB空
間処理用の多次元データベースシステムとして完成度の高い論文です.
山下の論文 DEWS2006(以下にあります)から出たほぼ完成形を書いてい
ます.)
- 張洪鋒, 大森匡, 星守,
「Web構造分析を目的とした多次元データマイニング機構の効率化:
To型制約問い合わせの処理方法」,
DEIM2009, E7-3,
IEICE, 2009年3月.
- 栗原大輔,大森匡, 星守,
「Web構造分析を目的とした多次元データマイニング機構の効率化」
,
日本データベース学会論文誌
Vol.7 (No.1),
pp.xx-xx, 日本データベース学会, 2008年6月.
- 栗原大輔,大森匡, 星守,
「Web構造分析を目的とした多次元データマイニング機構の効率化」
,
DEWS2008, D1-6, IEICE, 2008.
- Tadashi Ohmori, Masahide Naruse, Mamoru Hoshi,
``A New
Data Cube for Integrating Data Mining and OLAP'',
ICDE
Workshop on Data Mining and Business Intelligence,
paper ID 3,
(8 pages), IEEE, April 2007. (see PDF in IEEE digital library).
- 林 和宏、大森 匡、星 守,
「多次元データマイニングによるWeb空間の構造分析の評価」,
DBSJ letters, Vol.6, No.1,
pp.141-144,
日本データベース学会, 2007年6月号.
(日本データベース学会からDBSJ
lettersはダウンロードできます).
(pdf)
- 涌波 信弥, 大森 匡, 星 守,
「多構造データベースを用いたログデー
タ分析の試み」,
DBSJ letters, Vol.6, No.1,
pp.137-140, 日本データベース学会, 2007年6月号.
(pdf)
- 林 和宏、大森 匡、星 守,
「多次元データマイニングによるWebアー
カイブの構造分析の評価」,
DEWS2007, B8-6, 電子情報通信学会,
2007年3 月. (DEWS2007サイトからダウンロード可).
(pdf)
- 涌波 信弥, 大森 匡, 星 守,
「多構造データベースを用いたログデー
タ分析の試み」、
DEWS2007, E7-6, 電子情報通信学会, 2007年3
月. (DEWS2007サイトからダウンロード可).
- Yoshinobu Yamashita, Tadashi Ohmori, Mamoru Hoshi,
``Mining Web Structures Using Multi-dimensional Data Mining
Model,''
SWOD2006, ICDE'06 workshops, IEEE, Atlanta/US,
April 2006. (avaiable from IEEE Digital Library. or, Look,
DBLP site).
- 山下 由展、大森 匡、星 守,
「多次元データマイニングを用
いたWeb空間の構造解析」,
DEWS2006, 3B-o3 (通常論文), 2006年
3月. (pdf)
- 成瀬 正英、大森 匡、星 守.
「多次元的なログデータマイニングを
実現するデータキューブ機構の提案」、
DBSJ letters, Vol.4
(No.1), pp.85-88, 日本データベース学会(というものがある.
DBSJ lettersでフリーアクセスできる)、2005年7月.
(pdf)
- 成瀬 正英、大森 匡、星 守.
「多次元的なログデータマイニングを
実現するデータキューブ機構の提案と評価」、
DEWS'05,
3C-i10. click
(pdf)
- 助川、大森、蔦谷、星.
「Webログ分析における高頻度パターン検出
を支援するデータキューブモデル」、
DEWS2003
1-A-1. click
- Tadashi Ohmori, Yusuke Tsutatani, Mamoru Hoshi.
``A Novel
Datacube Model Supporting Interactive Web-log Mining'',
IEEE CyberWorlds '02.
- 古立,大森, 星,
「高次元データベースにおける距離結合演算を用い
たクラスタ検出方式」、
DEWS'01, 2001.
------------------------------------------------
空間データ・ストリームデータからの情報抽出問題
- Qiu, Ohmori, Shintani, Fujita,
"A New Search Strategy of mCK
queries over Spatial Web with Grid Partitioning,"
IEEE
Int. Conf. SNPD 2015,
to appear, June 2015. (D3の研究)
-
Qiu, 大森,新谷,
「空間データにおける2^n分割木を用いたm-最近傍キーワード検索」,
DEIM 2013, A9-5, 2013年3月. (2013.3.修士論文)
- 徳村力太,大森 匡,
「センサーデータマップにおけるSSD利用
COLR-Treeシステムの検討」,
DEIM2011
B9-6, 電子情報通信学会データ工学研究專門委員会他, 2011年3
月.
- 大森 匡、李 光浩、七海 嘉仁、星 守,
「N-OPS: 系列データベース
における連続系列パターンの探索算法」,
電子情報通信学会和
論文誌, Vol.J89-D, No.7,pp.1465-1480, 2006年7月号.
(
概要)
- 李 光浩、大森 匡、星 守.
「データストリームにおける連続系列パ
ターン照合算法N-OPSの性能評価」,
DEWS'05, 4C-o4. (DEWSライ
ブラリからアクセス可).
(pdf)
- Guanghao Li, Tadashi Ohmori, Mamoru Hoshi,
``A New
Sequence Pattern Search Algorithm N-OPS,''
Int. Special
Workshop on Databases '05, joint with IEEE
ICDE'05. Apr. 05.
(see IEEE digital library).
- Lilian Harada, Yuji Hotta, Tadashi Ohmori,
``Detection of
Sequential Patterns of Events for Supporting Business
Intelligence Solutions,''
IEEE Int. Database and
Application Engineering Symp. (IDEAS) 2004, pp.475-479, June
2004
- Lilian Harada, Yuji Hotta, Nooki Akaboshi, K.Kubota, Tadashi
Ohmori, R.Take,
``Event Analyzer: A Tool for Sequential
Data Processing,'',
ACM CIKM 2003. (他1)
------------------------------------------------
モバイルユーザによるWeb情報統合・利用機構
------------------------------------------------
構造化データやグラフデータにおけるキーワード検索方式の研究
- Liru Zhang, 大森匡, 星守,
「XMLデータ表現を考慮した関係データベースのキーワード検索方式」
,
DEWS2008, C6-2, IEICE, 2008年3月.
- Liru Zhang, Tadashi Ohmori, Mamoru
Hoshi.
"Keyword Search Over Hybrid XML-Relational Databases,"
IEEE SICE 2008, Aug., 2008
- 岡谷,大森,星, 「グラフデータベースのキーワード検索方式の改良」,
情報処理学会 FITフォーラム2009, A-020, 2009年9月.
- Liru Zhang, Tadashi Ohmori, Mamoru Hoshi,
"Keyword Search on
Hybrid XML-Relational Databases Using XRjoin,"
ACM DASFAA 2010,
Apr. 2010.
- Liru Zhang, Tadashi Ohmori, Mamoru Hoshi,
"A System for
Keyword Search on Hybrid XML-Relational Databases,"
ACM
DASFAA 2010, demo paper, Apr. 2010.
- Liru Zhang, Tadashi Ohmori, Mamoru Hoshi,
"Keyword Search on
both XML and Relational Data,"
Journal of Communication and
Computer, (accepted on 2011 February), ISSN 1548-7709, USA.
- 蒋,大森,星,
「グラフデータベースにおける正確なTop-Kキーワード検索方式」
,
DEIM2010, F6-2, IEICE, 2010年3
月.
- 王,張,大森,"A Report on Exact Top-K Keyword Search with
Redundancy Elimination on Graph Databases,"
情報処理学会データベースシステム研究会 2010-DBS-151-28,
2010年11月.(
学生奨励賞受賞)
(情報処理学会デジタルライブラリ参照).
- 王,張,大森,
"Top-K Keyword Search with Redundancy Elimination on Large Graph
Databases,"
DEIM2011, B10-1, 2011 March
- M.Wang, L.Jiang, L.Zhang, T.Ohmori, "Exact Top-k Keyword Search on
Graph Databases,"
ACM SAC 2011 data mining track,
(poster paper), 2011 March.
----------------------------------
受賞歴、科研費、受託研究
受賞歴:
FIT2002論文賞(共著). 情報処理学会及び電子情報通信学会, 2002年.
電子情報通信学会 ISS活動功労賞(論文誌編集委員及び査読活動による),
2004年9月.
2010年11月・情報処理学会データベースシステム研究会・学生奨励賞(指導
学生 Wang Meirong)
2013年3月・DEIM2013学生プレゼンテーション賞(指導学生 廣瀬繁雄)
2014年3月・情報処理学会全国大会学生奨励賞(指導学生 Y.Qiu)
2015年3月・DEIM2015学生プレゼンテーション賞(指導学生 今野篤人)
科学研究費(研究代表者のみ)
-
奨励(A) '94 「大規模データベースを用いた計画問題とその並列処理方式に関する研究」
概要
-
奨励(A) '95 「大規模データベースを用いた多エージェント型情報システムの行動シミュレーション」
概要
-
奨励(A) '96 「普遍的情報資源ネットワークにおける移動計算機向け仲介者エージェント機構の研究」
概要
-
奨励(A) '99-'00年度「移動ユーザによるWWW埋め込み型異種情報資源のビュー統合に関する研究」
概要
-
基盤(C) '05-'06年度 「データ管理システムにおけるログデータ分析方式に関する研究」
概要
-
基盤(C) '09-'11年度 「多角的なWeb空間マイニングを行うデータベース処理機
構の研究」概要
-
基盤(C) '12-'15年度 「大規模データ処理基盤における情報空間の生成演算と更新方式に関する研究」
奨学寄付金/受託研究
2001年度. トッパンフォームズ(株) 「Webマイニングの研究」(代表:星教授).
2001年-2003度. 富士通研究所(株)「イベントデータの利用方法」
TOPへ