大森 匡(教授) 研究課題説明 (2016年5月6日掲載)

Introduction of Prof. Tadashi OHMORI and his studies,
UEC-IS Data Engineering Laboratory (2016.May 6)

このページでは電気通信大学大学院/情報システム学研究科・情報システム基 盤学専攻における大森担当の研究課題を説明します.

This page introduces studies of Prof. Tadashi OHMORI (U.Electro-Comm., Graduate School of Information Systems, Data Engineering Lab.) as of 2016 April in Japanese. For the information in English, refer to the official page: Profile of Prof. Tadashi OHMORI

注:2016年4月1日づけの大学改組に伴い,当大学院は学生募集を終了しました. 4月以後は,当講座メンバは,大学院情報理工学研究科情報ネットワーク工学専 攻コンピュータサイエンスコースに所属します.

Note: Our Graduate School of Information Systems stopped new admission of students due to the reorganization of the university. Members in the laboratory will move to new organizations. Official information will be found in www.uec.ac.jp.

------------------------------------------

データ工学という研究分野の紹介

現実世界のサイバー化が進むにつれて,新しく多様なデータが大量に生成 されています.これら大量データを有用な情報として扱うためには,新しい情 報抽出や検索・利用能力を提供するシステムソフトウェアやそれを支える高効 率アルゴリズムが必要です.この分野は長年,「データ工学(data engineering/database research)」」と呼ばれるコンピュータ科学の領域で研 究されてきました.

大森は,このデータ工学の分野において,大量データから有用な情報を表 すデータ集合を生成・変換する効率的な技法や演算系,システム原理,の 研究をしています. 例えば:

  • 新しい多様な大量データを使った新しい情報問い合わせ・情報抽出能力の 創出と効率的な処理アルゴリズムの実現,
  • 上記に必要なデータ演算体系の考案と効率的処理アルゴリズムの研究,
  • 新しいデータ処理基盤の研究,高機能化・高性能化,並行処理と正当性原理,
  • などが課題です.

    データ工学は, 国際的にはACM SIGMOD, VLDB, IEEE ICDE などの国際会議, 国内では電子情報通信学会データ工学研究専門委員会などを主要学会として多 くの大学・企業で研究されています.

    2010年以後,データ工学が主題としている大規模データ処理と高価値利用 の分野は,コンピュータ科学の主力応用になっています.我々は,この要請に 対応したアルゴリズムやソフトウェア研究をデータ工学の立場から推進してい ます. 詳細は,SIGMOD,VLDB, ICDE などの代表的国際会議や,DEIMという国内 会議での我々の最近の発表論文などをご覧ください.

  • データ工学分野の国際会議論文集: ACM SIGMOD、 VLDB、ICDEの論文集は DBLPを参照. VLDBなどは全論文とtutorialを公開しているので,眺めるには良い.
  • 日本語ならDEIMという会議の論文のうち,新しいアルゴリズム系やシステム基 盤系のものを見ると雰囲気が分かります."DEIM"で検索エンジンを引いて,論 文一覧を覗きましょう.我々の論文も載っています.
  • 当講座のスタッフはデータ工学の最新動向を上手にカバーした優れた編成に なっています.新谷准教授,藤田助教の解説も読み,新しく大学院で何をする のか,をお考えください.

    -------------------------------------------

    データ工学・データベース研究(Database Research)は,多様な巨大データ の格納・検索・変形・分析・一貫性・更新共有などを目的として,効果的な処 理モデルやアルゴリズム・システム・並列分散の機構・概念を研究している分 野です. 小職の指導下では,学部で情報工学を学んだ人に限らず,数理や電気電子・シ ステム・機械などの情報周辺学科などで多様な数学の基礎(今なら,確率論) と情報系を学んだ学生の参加も多く,活躍してきました.もちろん, 境界領域から入ってくるときは,コンピュータ科学という分野の原理を修士前 半で学び,そこから研究へ展開する力が重要です.

    -------------------------------------------

    研究方針の概要 (IS教員紹介ページへjump. -- だが,もうすぐcloseされるだ ろう)

    目次
    研究課題の事例
    最近の論文発表(2016年3月まで)

    ------------------------------------------ TOPへ

     研究課題の事例 

    1. 学生指導研究について

    2013年度からは,巨大データ時代に応じた新しいアルゴリズムやシステム基盤 技術の研究課題に取り組み,積極的にデータ工学分野で活動しています.現在 の研究内容の詳細は次を参照してください:
    2012以後の外部発表論文へ

    大まかに分けて,巨大データから複雑な情報構造を計算するためのアルゴリズ ムと計算機構の問題,グラフデータで表された情報源の情報検索問題,空間デー タの情報抽出・検索機構の問題,制約つき情報源からのデータ収集アルゴリズ ムの設計,など.

    追記: 「どんな学生が向いているか?」--- 最近は特に,「大量にデータ はあるがそれだけでは意味が分からない」,「大量データからどこまで情報と して取り出せるのか,効率や重要性」,などの限界をコンピュータ科学の立場 から考えて制御することが重要です.情報工学でもデータ工学のアルゴリズム・ 並列応用系の人や,数理系の意識が高いと,この分野は面白いでしょう.電気 電子物性系の学生も理論教育が厳しいためか,かなり活躍できます.(すぐに 役立つビジネスソリューション指向の人は不向き.)

    2011以前の研究例は下記:

    新しいデータ空間の演算機構の研究成果の欄へ
    位置情報データ,ストリームデータの研究
    異種情報統合の研究
    構造化データ・半構造データ・グラフデータのキーワー ド検索の研究
    多次元データのインデックス(R-tree)と応用の研究へ
    -------------------------------------------------

    2. 自分の研究について

    (以下は,自分の博士論文(2.1. データベースマシンの高機能化技法)と、 ト ランザクション理論の研究(2.2.).時期は旧いが原理的な研究です.).

    2.1 並列データベースの高機能化の研究

    大規模データ処理用のシステムは、本質的に並列データベース処理システ ムであり、1980年代から研究されてきました.大森は、並列データベースマシ ンが持つ巨大データ空間の一貫した並行更新に必要な技術として、大量データ 処理(bulk-read/-update) を単位実行操作とした高速並行データ処理技術を提 案しています. (自分の博士論文の研究). 現在の視点から言うと, 巨大データ 処理基盤における並行処理・高機能化の研究と言えます.
    並列データベース関連の業績

    2.2 トランザクション処理と高機能化

    トランザクション処理の立場では、データの共有化と並行同時更新に伴う制 御技術があげられます.原理を抽出して現在に応用していく理論的な領域の研究 です. 「トランザクション処理」というA.ロイター, J.グレイ博士の教科書の翻訳 なども行いました.
    応用成果としては, データ一貫性管理機能のついた高機能なストレージシステ ムの研究を修士学生と行いました.
    トランザクション処理の研究成果の欄へ

    その他: 1990年代に日本のIT企業で開発された本邦初の自律分散コン ピュータ専用のデータベース機構について, 2011年9月に博士論文を指導・修了 しています. (論文.)

    -----------------------------------------------------------

    まとめ: 大量データ処理基盤の研究=新しい情報環境を創り出す研究

    現在, データ工学の研究領域においては,新しいデータベース処理アルゴ リズムやインデックスの開発,分散データ共有や新しいデータ管理環境のため の制御アルゴリズム,システムソフトウェアとしての実現,斬新な情報抽出技 術,などの研究が積極的に行われています.

    特に2010年代に入って,巨大データ処理基盤がオープンソース化した時代にな り,新しいデータ群をどうやって集めて何の情報を取り出すか,という要請自 体が多様化したため,これに応えるアルゴリズム,システム,ソフトウェア, の新設計による新技術提案が主題になっています.巨大データ時代を支える研 究分野として,データ工学分野はその中心に位置していると言えるでしょう.

    -----------------------------------------------------------

    その他, 注意事項

    国内学会:電子情報通信学会デー タ工学研究会DEWS論文集サイト日本デー タベース学会サイト, など.

    海外学会:
    ACM SIGMOD、 VLDB、IEEE Data Engineering Conference の論文集. ( DBLP参照)

    国内では、DEIM(データ工学と情報マネジメントに関するフォーラム) という毎年3月のワークショップ論文集にデータベース分野の修士研究、卒業研 究が毎年集中して発表されます.受験希望者はまず、目を通してください.

    研究課題を考えるときは,分野が扱う問題や話題に興味があるのが一番で す.SIGMODやDEIMなどの研究や最近の我々の研究論文を眺めて自分の関心や適 性を考えると良いでしょう.

    注意1: 以前は良く誤解されたが, 当講座はSQL製品やWebアプリケーション のプログラム開発とは無関係です. 特に私は, C/unixによる学術伝統的な巨大 データ処理アルゴリズムと理論体系, 高性能システム化の基礎研究を中心に研 究しています.テキスト系やソーシャル系を主としたビジネス意思決定支援な どは対象外.(統計科学ならAIへ.)

    注意3:ここまで読んだ人は分かると思いますが,ビッ○○ータ,ソーシャ ○,ウェッ○X.0などの流行のビジネス用語とは我々は関係ないです.データ工 学の研究は今や,新技術・新機能を実現する新しいアイデアと数理モデル化, アルゴリズム化・システム技術が中心で,大学らしい挑戦的な基礎研究を目指 して活動しています.

    ------------------------------------------ TOPへ

    ------------------------------------------ TOPへ

    最近の論文発表(2016年4月まで).

    英語論文: Search DBLP, by the author name.

    国内論文: DEIM (Data Engineering and Information Management Forum). Googleから検索できます.全論文PDF公開.

    ACM, IEEE,電子情報通信学会,のデジタルライブラリへは,uec.ac.jp の大学ドメインからはフリーアクセス.

    ------------------------------------------------

    2012以後の発表論文一覧

    並列データベース,トランザクション処理

    -------- 番外 (社会人博士による企業開発製品の博士論文)--------------

    ------------------------------------------------

    ファイル編成法, インデックスと応用.

    ------------------------------------------------

    情報構造計算と新しいデータベース演算機構の研究.

    ------------------------------------------------

    空間データ・ストリームデータからの情報抽出問題

    ------------------------------------------------

    モバイルユーザによるWeb情報統合・利用機構

    ------------------------------------------------

    構造化データやグラフデータにおけるキーワード検索方式の研究

    ----------------------------------

    受賞歴、科研費、受託研究

    受賞歴:

    FIT2002論文賞(共著). 情報処理学会及び電子情報通信学会, 2002年.

    電子情報通信学会 ISS活動功労賞(論文誌編集委員及び査読活動による), 2004年9月.

    2010年11月・情報処理学会データベースシステム研究会・学生奨励賞(指導 学生 Wang Meirong)

    2013年3月・DEIM2013学生プレゼンテーション賞(指導学生 廣瀬繁雄)

    2014年3月・情報処理学会全国大会学生奨励賞(指導学生 Y.Qiu)

    2015年3月・DEIM2015学生プレゼンテーション賞(指導学生 今野篤人)

    科学研究費(研究代表者のみ)

    奨学寄付金/受託研究

    2001年度. トッパンフォームズ(株) 「Webマイニングの研究」(代表:星教授).

    2001年-2003度. 富士通研究所(株)「イベントデータの利用方法」

    TOPへ