大森 匡(教授) 研究課題説明 (2016年5月記載+2023年5月追記)

Introduction of Prof. Tadashi OHMORI and his studies,
UEC-IS Data Engineering Laboratory (2016.May+2023.May.)

このページでは電気通信大学大学院/情報システム学研究科・情報システム基 盤学専攻における大森担当の研究課題を説明します.(当研究科は大学改組で募集を 2016.3.で終了. 2016以後は我々データベース講座メンバは,大学院 情報理工学研究科・I専攻コンピュータサイエンスコースに所属).

This page introduces studies of Prof. Tadashi OHMORI (U.Electro-Comm., Graduate School of Information Systems, Data Engineering Lab.) as of 2016 April in Japanese. For the latest information in English, refer to the official page: Profile of Prof. Tadashi OHMORI . Or a new English version will be found in the "researchmap" web-site of JST. See researchmap

----- 2023年度の大学公開向け記載(2023.5.11)------

2023年以後の研究分野や研究論文一覧など最新の情報は,大学の意欲的方針に従って, 科学技術研究振興機構が管理するresearchmap システムにて執筆します.研究の経歴など良くまとまっています.時間のない人はresearchmapをご覧ください.

---- 以下,現在の研究概要など ----

大森の研究分野は,一言でいうと「データベース研究」(Database Researches, DB研究). ACMでいうと SIGMOD (Special Interest Group on Management of Data). 他,有名国際会議が Int. Conf. Very Large Data Bases (VLDB).

この分野は,今の巨大IT基盤システムを出している領域であり,巨大データ, 新データ,古典的な関係データベース,などを全て扱って斬新な情報抽出や情 報検索能力を提供したり,超高速トランザクション処理,分散データ共有記憶,検索エンジン的なもの,な どのデータベース的なシステムの原理を作ってきた分野です.

今日の巨大データ向けのデータ処理基盤システムの研究は新データ応用 のために劇的に変化していて,古典的な関係データベースシステムとは見た目が違いますが, データベースシステムという点では原理は活きています.

我々データ工学研究グループ(旧データベース学講座) も,新データ処理 基盤のための演算やシステム・アルゴリズム技術(大森),データマイニング (新谷),空間地図情報(藤田)と幅広いレパートリーで現代の巨大データ工 学を研究しています.大学院生の指導研究では,各教員が自分の領域から学生 の適性を見つつテーマを相談して起動していきます.

--- 大学院受験希望について ---
今の大学院の所属I専攻は卒論から持ち上がりの研究室が大半です.一方, 我々が元々いた大学院情報システム学研究科は大学院だけの組織だったので, 学外や学内の情報系周辺の電気電子・数理・機械などの学科からの 修士受け入れを前提に20年ほどやってきました.ゆえに,情報系の基礎学力があることは必須としても 学内外からの大学院受験は今でもwelcome. 

もちろん研究の方向に何か共通する関心があって,学力的にOKなら修士から受ければ良いという事なので,見学や 相談は必須.(願書に雑に書けば良いものではない.)今の学科の卒論で来た学部生にも,「卒論は希望順が低くても行先で努力すれば良いが大学院は研究室で決まるから,各分野の様子がわかってきてから真剣に行先を考えるように」と言っています.そのためか改組後の組織では修士が少ない.良いと思っているわけではないが,いる人を使って研究活動をするのが大学の学生指導というもの.

以下は2016年までの大学院情報システム学研究科のときの研究紹介として書いたものですが, 研究の本質や姿勢は変わっていません.researchmap記載よりも研究室としての 本質をつかみやすい面もあります.分野の紹介も兼ねてお読みいただければ幸いです.
------------------------------------------

データ工学という研究分野の紹介

現実世界のサイバー化が進むにつれて,新しく多様なデータが大量に生成 されています.これら大量データを有用な情報として扱うためには,新しい情 報抽出や検索・利用能力を提供するシステムソフトウェアやそれを支える高効 率アルゴリズムが必要です.この分野は長年,「データ工学(data engineering/database research)」」と呼ばれるコンピュータ科学の領域で研 究されてきました.

大森は,このデータ工学の分野において,大量データから有用な情報を表 すデータ集合を生成・変換する効率的な技法や演算系,システム原理,の 研究をしています. 例えば:

  • 新しい多様な大量データを使った新しい情報問い合わせ・情報抽出能力の 創出と効率的な処理アルゴリズムの実現,
  • 上記に必要なデータ演算体系の考案と効率的処理アルゴリズムの研究,
  • 新しいデータ処理基盤の研究,高機能化・高性能化,並行処理と正当性原理,
  • などが課題です.

    データ工学は, 国際的にはACM SIGMOD, VLDB, IEEE ICDE などの国際会議, 国内では電子情報通信学会データ工学研究専門委員会などを主要学会として多 くの大学・企業で研究されています.

    2010年以後,データ工学が主題としている大規模データ処理と高価値利用 の分野は,コンピュータ科学の主力応用になっています.我々は,この要請に 対応したアルゴリズムやソフトウェア研究をデータ工学の立場から推進してい ます. 詳細は,SIGMOD,VLDB, ICDE などの代表的国際会議や,DEIMという国内 会議での我々の最近の発表論文などをご覧ください.

  • データ工学分野の国際会議論文集: ACM SIGMOD、 VLDB、ICDEの論文集は DBLPを参照. VLDBなどは全論文とtutorialを公開しているので,眺めるには良い.
  • 日本語ならDEIMという会議の論文のうち,新しいアルゴリズム系やシステム基 盤系のものを見ると雰囲気が分かります."DEIM"で検索エンジンを引いて,論 文一覧を覗きましょう.我々の論文も載っています.
  • 当講座のスタッフはデータ工学の最新動向を上手にカバーした優れた編成に なっています.新谷准教授,藤田准教授の解説も読んでいただいて,新しく大 学院で何をするのか,をお考えください.

    -------------------------------------------

    -------------------------------------------

    研究方針の概要 (IS教員紹介ページへjump. -- だが,もうすぐcloseされるだ ろう)

    目次
    研究課題の事例
    最近の論文発表(2016年3月まで)

    ------------------------------------------ TOPへ

     研究課題の事例 

    1. 学生指導研究について

    2013年度からは,巨大データ時代に応じた新しいアルゴリズムやシステム基盤 技術の研究課題に取り組み,積極的にデータ工学分野で活動しています.現在 の研究内容の詳細は次を参照してください:
    2012以後の外部発表論文へ

    大まかに分けて,巨大データから複雑な情報構造を計算するためのアルゴリズ ムと計算機構の問題,グラフデータで表された情報源の情報検索問題,空間デー タの情報抽出・検索機構の問題,制約つき情報源からのデータ収集アルゴリズ ムの設計,など.

    追記: 「どんな学生が向いているか?」--- 最近は特に,「大量にデータ はあるがそれだけでは意味が分からない」,「大量データからどこまで情報と して取り出せるのか,効率や重要性」,などの限界をコンピュータ科学の立場 から考えて制御することが重要です.情報工学でもデータ工学のアルゴリズム・ 並列応用系の人や,数理系の意識が高いと,この分野は面白いでしょう.電気 電子物性系の学生も理論教育が厳しいためか,かなり活躍できます.(すぐに 役立つビジネスソリューション指向の人は不向き.)

    2011以前の研究例は下記:

    新しいデータ空間の演算機構の研究成果の欄へ
    位置情報データ,ストリームデータの研究
    異種情報統合の研究
    構造化データ・半構造データ・グラフデータのキーワー ド検索の研究
    多次元データのインデックス(R-tree)と応用の研究へ
    -------------------------------------------------

    2. 自分の研究について

    (以下は,自分の博士論文(2.1. データベースマシンの高機能化技法)と、 ト ランザクション理論の研究(2.2.).時期は旧いが原理的な研究です.).

    2.1 並列データベースの高機能化の研究

    大規模データ処理用のシステムは、本質的に並列データベース処理システ ムであり、1980年代から研究されてきました.大森は,疎結合型 (Shared-Nothing)の並列データベースマシンが持つ巨大データ空間を,一貫性 を保って並行更新する技術として、大量データ処理(bulk-read/-update) を単 位実行操作とした高速並行データ処理技術を提案しています. (自分の博士論文 の研究). 現在の視点から言うと, 巨大データ処理システムにおける並行処理・ 高機能化の研究と言えます.
    並列データベース関連の業績

    2.2 トランザクション処理と高機能化

    トランザクション処理の立場では、データの共有化と並行同時更新に伴う制 御技術があげられます.原理を抽出して現在に応用していく理論的な領域の研究 です. 「トランザクション処理」というA.ロイター, J.グレイ博士の教科書の翻訳 なども行いました.
    応用成果としては, データ一貫性管理機能のついた高機能なストレージシステ ムの研究を修士学生と行いました.
    トランザクション処理の研究成果の欄へ

    その他: 1990年代に日本のIT企業で開発された本邦初の自律分散コン ピュータ専用のデータベース機構について, 2011年9月に博士論文を指導・修了 しています. (論文.)

    -----------------------------------------------------------

    まとめ: 大量データ処理基盤の研究=新しい情報環境を創り出す研究

    現在, データ工学の研究領域においては,新しいデータベース処理アルゴ リズムやインデックスの開発,分散データ共有や新しいデータ管理環境のため の制御アルゴリズム,システムソフトウェアとしての実現,斬新な情報抽出技 術,などの研究が積極的に行われています.

    特に2010年代に入って,巨大データ処理基盤がオープンソース化した時代にな り,新しいデータ群をどうやって集めて何の情報を取り出すか,という要請自 体が多様化したため,これに応えるアルゴリズム,システム,ソフトウェア, の新設計による新応用新技術の提案が主題になっています.巨大データ時代を 支える研究分野として,データ工学分野はその中心に位置していると言えるで しょう.

    -----------------------------------------------------------

    その他, 注意事項

    国内学会:電子情報通信学会デー タ工学研究会DEWS論文集サイト日本デー タベース学会サイト, など.

    海外学会:
    ACM SIGMOD、 VLDB、IEEE Data Engineering Conference の論文集. ( DBLP参照)

    国内では、DEIM(データ工学と情報マネジメントに関するフォーラム) という毎年3月のワークショップ論文集にデータベース分野の修士研究、卒業研 究が毎年集中して発表されます.受験希望者はまず、目を通してください.

    研究課題を考えるときは,分野が扱う問題や話題に興味があるのが一番で す.SIGMODやDEIMなどの研究や最近の我々の研究論文を眺めて自分の関心や適 性を考えると良いでしょう.

    注意1: 以前は良く誤解されたが, 当講座はSQL製品やWebアプリケーション のプログラム開発とは無関係です. 特に私は, C/unixによる学術伝統的な巨大 データ処理アルゴリズムと理論体系, 高性能システム化の基礎研究を中心に研 究しています.テキスト系やソーシャル系を主としたビジネス意思決定支援な どは対象外.(統計科学ならAIへ.)

    注意3:ここまで読んだ人は分かると思いますが,ビッ○○ータ,ソーシャ ○,ウェッ○X.0などの流行のビジネス用語とは我々は関係ないです.データ工 学の研究は今や,新技術・新機能を実現する新しいアイデアと数理モデル化, アルゴリズム化・システム技術が中心で,大学らしい挑戦的な基礎研究を目指 して活動しています.

    ------------------------------------------ TOPへ

    ------------------------------------------ TOPへ

    最近の論文発表(2016年4月まで).

    英語論文: Search DBLP, by the author name.

    国内論文: DEIM (Data Engineering and Information Management Forum). Googleから検索できます.全論文PDF公開.

    ACM, IEEE,電子情報通信学会,のデジタルライブラリへは,uec.ac.jp の大学ドメインからはフリーアクセス.

    ------------------------------------------------

    2012以後の発表論文一覧

    並列データベース,トランザクション処理

    -------- 番外 (社会人博士による企業開発製品の博士論文)--------------

    ------------------------------------------------

    ファイル編成法, インデックスと応用.

    ------------------------------------------------

    情報構造計算と新しいデータベース演算機構の研究.

    ------------------------------------------------

    空間データ・ストリームデータからの情報抽出問題

    ------------------------------------------------

    モバイルユーザによるWeb情報統合・利用機構

    ------------------------------------------------

    構造化データやグラフデータにおけるキーワード検索方式の研究

    ----------------------------------

    受賞歴、科研費、受託研究

    受賞歴:

    FIT2002論文賞(共著). 情報処理学会及び電子情報通信学会, 2002年.

    電子情報通信学会 ISS活動功労賞(論文誌編集委員及び査読活動による), 2004年9月.

    2010年11月・情報処理学会データベースシステム研究会・学生奨励賞(指導 学生 Wang Meirong)

    2013年3月・DEIM2013学生プレゼンテーション賞(指導学生 廣瀬繁雄)

    2014年3月・情報処理学会全国大会学生奨励賞(指導学生 Y.Qiu)

    2015年3月・DEIM2015学生プレゼンテーション賞(指導学生 今野篤人)

    科学研究費(研究代表者のみ)

    奨学寄付金/受託研究

    2001年度. トッパンフォームズ(株) 「Webマイニングの研究」(代表:星教授).

    2001年-2003度. 富士通研究所(株)「イベントデータの利用方法」

    TOPへ