2010年3月8日(月)〜3月11日(木)
3月8日(月) | チュートリアル | (10:00〜17:30) |
9日(火) | 本会議 第1日 | (9:00〜18:00) |
Plenary session | (15:30〜18:00) | |
10日(水) | 本会議 第2日 | (9:30〜18:00) |
招待講演 | (13:00〜14:00) | |
総会 | (14:30〜15:20) | |
懇親会 | (18:30〜21:00) | |
11日(木) | 本会議 第3日 | (9:00〜18:00) |
所在地: | 東京都文京区本郷7-3-1 (〒113-8654) [キャンパス内の会場地図 (情報処理学会全国大会の分も含む) (pdf)] |
---|
受付・大会本部: | 工学部新2号館2F フォーラム |
---|---|
チュートリアル: | 理学部2号館講堂,赤門総合研究棟2F 6番教室 |
NLP A会場: | 理学部2号館講堂 |
NLP B会場: | 赤門総合研究棟2F 6番教室 |
NLP C会場: | 赤門総合研究棟1F 7番教室 |
NLP D会場: | 経済学研究科棟B1F 1番教室 |
NLP E会場: | 経済学研究科棟3F 2番教室 |
ポスターセッション会場: | 福武ホール(スタジオ,ロビー) |
Plenary session: | 安田講堂 |
招待講演: | 安田講堂 |
企業展示室: | 経済学研究科棟1F コミュニティーラウンジ |
総会: | 赤門総合研究棟2F 6番教室 |
休憩室: | 赤門総合研究棟B1F 8番教室,9番教室 |
懇親会: | 医学部研究棟13F Capo PELLICANO |
言語処理学会第16回年次大会は,東京大学本郷キャンパスで開催します.
○情報処理学会創立50周年記念全国大会との共催について
本年次大会は,情報処理学会との共催となり,言語処理学会のアクティビティを専門外の方々に知らしめるチャンスであります. ただ,結果として例年より非会員による発表申し込みが増加することがあり得ます. 例年よりは多めの発表が可能になるよう,会場等を手配しておりますが,極端な場合にはすべての発表申し込みに発表時間を割り当てることができなくなる可能性があります. そうした場合,申し込みが遅い発表は,ご希望の発表形式以外で発表していただく,あるいは,発表ができなくなることもあり得ますが,ご了承ください.
○大会発表募集
例年通り,自然言語に関する理論から応用まで幅広い研究発表を募集します. とくに,言語学,教育学,心理学など,日頃「言語処理」とは縁が薄いと感じておられる人文系の研究者の方々からの積極的な発表を期待しています. また,情報処理学会全国大会との共催となることから,言語処理の研究コミュニティー以外にアピールすることを狙った言語関連の研究発表,さらには,Web等のビジネス的側面を重視した発表も期待しております.
従来通り,研究発表の形態は口頭発表(質疑応答も含めて20分間程度を予定)とポスター発表のいずれかです. 特に,人文系と理工系とのより密接な交流を図るには,多くの場合,ポスター発表が適しています. さまざまな分野の研究者との深い議論を期待される方は,是非ポスター発表への申込をお願いします. 口頭発表とポスター発表は時間帯を分け,両者が重ならないよう考慮する予定です. ポスター発表ではパソコン持ち込みなどによるデモ等も歓迎します. 両種の発表とも,予稿集には最大4ページの論文を掲載する予定です.
また,今大会でも言語処理関連分野内にある人文系,理工系,アカデミア,ビジネスなどのコミュニティーを超えた議論を奨励するために,以下の分野横断的テーマセッションを口頭発表の中に設けます. テーマセッションでは,セッションの最後に総合討論の時間を取り,参加者の間でより活発な討論ができるような場を持ちたいと考えています. これらのテーマに関連する研究は,人文系・理工系の別を問わず,ぜひテーマセッション希望と指定してお申し込みください.(趣旨は下記参照)テーマセッションでは,セッションの最後に総合討論の時間を取り,参加者の間でより活発な討論ができるような場を持ちたいと考えています. 上記のテーマに関連する研究は,人文系・理工系の別を問わず,ぜひテーマセッション希望と指定してお申し込みください.
さらに,今大会では「情報爆発特別セッション」を設けます.
本特別セッションでは文部科学省特定領域研究「情報爆発IT基盤」における成果に関する発表はもちろんのこと,特定領域研究に参加していない一般の研究者からも,情報爆発からの新たな価値の創出や,情報爆発の負の側面への対処などを狙った研究に関する発表を基礎的/基盤的研究から応用まで広く募集します. (なお,このセッションでは,他のテーマセッションとは異なり,総合討論の時間は設けない可能性があります.)
情報爆発セッションで発表を希望される方はテーマセッションと同様,発表申込時に情報爆発特別セッション希望と指定してお申し込みください.
なお,以上のテーマセッション,特別セッションは発表希望をされた方が少なすぎる場合,もしくは,極端に多い場合,必ずしもご希望に沿うことができかねる場合もありますがご了承ください.
開催日時: | 2010年3月8日(月) 10:00〜17:30 |
---|
トラック1「自然言語処理と関連領域」 理学部2号館3F講堂
(T1-a) 10:00〜12:00
「推薦システム −機械学習の視点から−」
講義資料追加分と正誤表 [PDF]
神嶌 敏弘 氏(産業技術総合研究所)
推薦システムとは,利用者が探している情報やものを予測し,その結果を利用者に提示するシステムである. このシステムについて,概要を述べたのち,予測に使われる機械学習の手法,特にGroupLens,pLSA,行列分解の三つの方法を中心に紹介する. その後,プライバシやサクラ攻撃といった現状のシステムに対する課題を紹介し,これらへの対応策について述べる. 最後に,推薦システム研究の今後の展望についてもふれる.
(T1-b) 13:00〜15:00
「並列テキスト処理のための環境・ツール(EC2上での並列処理体験付き)」
田浦 健次朗 氏(東京大学)
自然言語処理, ゲノム解析をはじめとしたデータ集約的計算を行うための, 環境構築の方法から, 並列実行するためのツールやプログラミングフレームワーク, 性能を理解する上で重要な要素となる要素(特にファイルシステムなど)について概観する. クラスタ型計算機の一般的な構成や利用環境について簡単に述べた後, データ処理の並列化を行う方法として, 講演者が開発しているGXP make (並列make), 近年ポピュラーになっているMapReduceなどについて紹介する. そして, ワークフローを実行する際に性能に大きな影響を与えるファイルシステムの構成, 特に, NFS, Lustre, Gfarm, Hadoop FSなどの違いについて述べる. 講演中にAmazon EC2上に構築されたクラスタ環境上でデモを行い, 聴衆にも開放し, 並列処理をその場で体験することが出来るようにします.
(T1-c) 15:30〜17:30
「はてなで利用している言語処理技術」
伊藤 直也 氏(株式会社はてな)
株式会社はてながブログやソーシャルブックマークなどのウェブサービスの開発にあたって取り組んでいる言語処理的な取り組みについて紹介する. 検索,テキスト分類,記事推薦などの各種機能がどのような手法を用いて実装されているか,またその実装のために解決すべきだった課題は何かといった点に焦点を当てて解説,理論的な成果を製品に仕上げるまでの過程や課題などを紹介する.
トラック2「自然言語処理学基礎論」 赤門総合研究棟2F6番教室
(T2-a) 10:00〜12:00
「超高速テキスト処理のためのアルゴリズムとデータ構造」
岡野原 大輔 氏(東京大学)
近年,膨大な量のテキストを解析する要望が高まり,より洗練されたアルゴリズムやデータ構造が必要とされている. 本チュートリアルでは最新のデータ構造とアルゴリズムを紹介し,これらを利用することで従来手法と比較し文字通り桁違いに高速かつ省スペースでテキスト処理ができることを示す. 具体的には教師有/無のオンライン学習,疎ベクトルの効率的かつ高速な操作方法,文字列上の統計量の高速な計算手法などについて取り上げる.
(T2-b) 13:00〜15:00
「NICT発の言語資源−ALAGINフォーラムの活動を中心に−」
風間 淳一 氏,橋本 力 氏,山田 一郎 氏(情報通信研究機構)
Web上のいわゆる情報爆発によって,言語処理技術の重要性はますます増している. 高度に知的な言語処理技術の実現にとって,高品質な言語資源の継続的な開発,流通は不可欠である. 情報通信研究機構(NICT)では,辞書やコーパス,知識獲得システムなどの言語資源を構築し,高度言語情報融合フォーラムALAGINを経由して公開している. 本チュートリアルでは,ALAGINフォーラムの活動と,NICT発の言語資源について紹介し,言語資源の活用方法やALAGINフォーラムに参加する企業における応用事例について解説する.
(T2-c) 15:30〜17:30
「『現代思想』と言葉――脳・認知から遠く離れて」
影浦 峡 氏 (東京大学)
言語処理の領域から見える限りで言うならば,言語をめぐる研究は,一方で潜在的に無限の適格な発話を許容する規則を求めて認知・脳へと遡り,他方で与えられた及びそれに類した与えられうる言語表現の編成を記述したり処理する方向に向かいます. 本チュートリアルでは,両者の間に「存在」する生々しい言語の具体性をその直接性を失わずに触知しようとする試みがどのようなものかを,主にその周辺を埋めていくことにより感じてもらうことを目指します.
イベント名: | 言語と知識 −最新言語処理研究の射程− |
---|---|
開催日時: | 2010年3月9日(火) 15:30〜18:00 |
イベント詳細: | 情報処理学会のサイトへ |
概要: | 知識の表現と伝達のための最も一般的な手段である言語が果たすべき役割は知識社会においてますます重要性を増している.そして,近年の言語処理技術は,そのような言語の機能を増幅することによって社会における知識循環を高度化することを射程に入れつつある.本セッションでは,そのような言語処理に関する研究プロジェクトに関するプロジェクトリーダーらによる講演を通じて,変貌著しい言語処理研究の最前線とそれによって予見される社会的インパクトについて紹介し,言語への工学的アプローチに関する理解を深めてもらうことを狙う. |
今日インターネット上には会話文,論説文,小説文など種々のスタイルの文章がぼう大に存在している.またテキストと他言語への翻訳文の対などもある.これらのテキストを何十億文と収集しデータベース化すれば,これは言語のあらゆる可能な表現の集りとみなすことができよう.言語の総体がこのように客観的な形で把握できれば,言語研究は自然科学的手法で行うことが出来ることになる.そういった立場からスーパーコンピュータの力を借りて言語処理が行われ,多くの優れた成果が出て来ている.これらは機械翻訳,情報検索,情報信頼性,電子図書館などの研究開発に大きく貢献するようになっている.またこれら大量のテキストデータから知識を抽出し,これを組織化し言語処理過程に組み込むことによって,言語処理の精度が向上し,また種々の言語処理の応用分野のシステムの性能の向上につながるという好循環が実現している.これまでの半世紀の言語処理研究の努力がようやく実を結び,社会に具体的な形で貢献する時代に入って来た.
ますます困難になりつつある社会的課題を解決するためには,従来を上回る規模での科学的知識の体系化とその社会的共有が必須と思われる.それには,研究領域のタコツボ化を防ぎ領域間の融合を進めつつ,科学研究と実社会とを融合する必要があるだろう.その意味での「科学的根拠に基づく社会 evidence-based society」の構築に資するため,情報処理学会の「次世代情報処理ハンドブック」および日本認知科学会の「認知科学オントロジー」を中核として,多数の学会の共同作業により,学術的な概念をオントロジーに基づいて構造化・体系化して「総合学術オントロジー」を編纂し,これによって研究分野の間および研究コミュニティと一般社会との間の相互作用を活性化する計画を進めている.
大量のコーパスと統計モデル,機械学習による音声言語処理手法の到来は,研究開発フェーズから実際の場面での性能向上を産業界,社会とリンクした形で持続的に直接行える,新しい研究開発プロセスの到来と考えることが出来る.さらに,Webの仕組み,Web上の情報を利用することで,世の中にある固有名詞の取り込み,多言語辞書の構築やコーパス収集,単語の関係抽出などの解析を行うことも可能になる.当機構では,Web,ネットワークを利用し,持続的に研究開発を進めるMASTARプロジェクトを2008年4月から開始した.具体的には,ネットワーク型の音声翻訳,機械翻訳,音声対話システム,言語資源の研究開発を進めている.また,2009年3月には,当プロジェクトの成果だけでなく,産学官が成果を持ち寄り,成果を融合し,新たな展開を促進する高度言語情報融合(ALAGIN)フォーラムが設立された.これらの活動の現状と狙いについて紹介する.
開催日時: | 2010年3月10日(水) 13:00〜14:00 |
---|---|
イベント詳細: | 情報処理学会のサイトへ |
演題「The Challenge of the Multicores」
講演者 Fran Allen 女史 (IBM名誉フェロー) *チューリング賞受賞者
Computers have traditionally used complex “cores” to manage and execute computations and, over the years, these computers have achieved ever increasing levels of performance. However fundamental limitations of size, heat and energy have emerged. To overcome these limitations complex cores are being displaced by multicores that are not only simpler and more numerous but can be used more flexibly. So what is the challenge?
Multicore computers are ushering in a new era of parallelism everywhere. As more cores are available, the potential performance of the system can increase at the traditional rate by the use of the inherent parallelism. Or can it? How will users and applications take advantage of all the parallelism? This talk will review some of the history of languages and compilers for high performance systems and consider opportunities for performance on multicore systems. The talk is intended to encourage the exploration of new approaches including how users will continue to code sequential for parallel systems.
言語学でも自然言語処理でも,多くの場合,例えば日本語というまとまりの存在を自明のものとみなしていますが,よく考えてみるとこれはとても不思議なことです. 例えば「日本語の母語話者」と言われるグループの中でも,誰一人同じ言葉を話している人はいませんし,それに対応して,おそらく「日本語」として実際に想定する範囲,「日本語」として潜在的に操作可能な範囲も,誰一人同じではないでしょう. 実際,観察可能なかたちで存在するのは,そうした個々人の言語表現の集積に過ぎないにもかかわらず,どうしてそれを集めた「コーパス」が抽象的な「日本語」なるものの一つのサンプルと言えるのか,そのような「コーパス」から学習させた言語のモデルは,例えば「平均人」なるものの不在とアナロジカルに考えるならば,一体,「何の」モデルなのか,立ち戻って個別の言語表現――それらは個々人のものであり「日本語」なる抽象体に還元できないかも知れないにもかかわらず――を「日本語」のモデルに基づいて処理することは何を意味し,どこまで可能なのか. 言語処理応用が根づき,実社会での言語表現を前にした課題への取り組みが展開している現在,こうした視点から言語処理を考える必要が大きくなっています. 本テーマセッションでは,個別的な「言語表現」と抽象的な「言語」の差異を意識した研究,既往の手法をこの点から再検討した研究を募集します.
具体的には,例えば,
言語表現の個別性と言語の一般性,言語表現の歴史的一回性と言語処理が必然的に要請する一般化との関係などをめぐり,具体的な研究をもとに議論することに主眼を置いたセッションです.
インターネットの世界的な展開により,様々な場で協調的処理やコミュニケーションが発生しています. 本テーマセッションでは,人間と機械の協調による知的言語処理の高度化,crowdsourcingに基づく言語処理,人間間の協調を促す言語処理,言語処理の協働的高度化を促す人間の位置付けなど,広い意味での「協調」をテーマにした研究発表を募集します.
例えば,
近年,NLP技術はWebやIRなど様々な場で応用されていますが,強いて挑発的に言うならば,それらの多くが,言語処理の先端が――「知的」な言語処理を含め――前面に出たものではなく,むしろ基盤的な処理として使われているものです. 本テーマセッションでは,NLPのNLPならではの,夢のある先端的な応用に関する/を目指す研究を募集します.
例えば,
近年のいわゆる「情報爆発」は,特にWeb上において顕著であり,産業的,経済的に大きな変化をもたらしているのみならず,一般の人々の生活,ライフスタイルまで大きく変えています. また,爆発している情報のうち,現在一般の人々の目に直接触れているものの多くがテキスト情報であることから,情報爆発からのいわゆる新たな価値の創出において,自然言語処理技術が大きな役割をはたすべきであろうことは論を待ちません. さらに,スパム,違法有害サイトなど,情報爆発の負の側面から人々の生活を守るためにも,自然言語処理技術が有用であることもほぼ自明と思われます.
こうした状況を踏まえて文部科学省特定領域研究「情報爆発IT基盤」が開始されてから,4年が経過しようとしており,そこでは様々な具体的成果が得られています. 本特別セッションでは文部科学省特定領域研究「情報爆発IT基盤」における成果に関する発表はもちろんのこと,特定領域研究に参加していない一般の研究者からも,情報爆発からの新たな価値の創出や,情報爆発の負の側面への対処などを狙った研究に関する発表を基礎的/基盤的研究から応用まで広く募集します. (なお,このセッションでは,他のテーマセッションとは異なり,総合討論の時間は設けない可能性があります.)
発表申込締切: | |
---|---|
発表採否通知: | |
発表最終論文提出期限: |
《口頭発表・テーマセッション》
口頭発表(テーマセッションを除く)の発表時間は1件20分で,講演時間が15分,質疑応答・討論の時間が5分です. テーマセッションにおいても基本的にはこの発表時間に準じますが,各セッションの最後に,それぞれのテーマに関する総括的な議論のための時間をとります. このため,各発表も通常の口頭発表とは異なる進行になる可能性があります(たとえば発表時間が少しずつ短いなど). 部分聴講の際にはご留意ください.
口頭発表・テーマセッションの会場では,プロジェクタが設置されています. ノート型PCの貸し出しは行いませんので,各人でお持ちください. なお,有線・無線LANの設備は提供できませんので,必要な方は各人でご準備ください.
セッション開始前に,会場設備のテスト(ノート型PCとプロジェクタの接続確認など)を必ず行ってください.
《ポスターセッション》
ポスターセッションは150分間です. セッション開始と同時に始められるようにご準備をお願いいたします. 10日午後のポスターセッション(PA2,PB2)は15:30の開始ですが,昼休みにご準備いただいても結構です.
各発表に対して,ポスターボード(幅90cm×高さ210cm)を1つずつ用意いたします. ポスターは,ピンまたはテープで固定してください(ピンもしくはテープは発表者がご用意ください). なお,セッション終了後はただちに片付けていただくようお願いいたします.
発表申込時に電源を希望された方にはコンセントを用意いたします. 配置等の関係で,ポスターからの距離が遠くなることもありますので,長めの電源コードをお持ちいただくようお願いいたします. 発表申込時にテーブルを希望された方には,ポスターボードの前に置いてご利用いただく机(縦45cm×横72cm×高さ71cm)を用意します.
発表申込時に無線LANを希望された方には,ポスター会場にて無線LAN環境を用意いたします. ただし,接続数に限りがありますので,必要な場合のみご使用いただくようお願いいたします.
ノート型PCの貸し出しは一切行いませんので,各人でお持ち下さい. また,スペースの関係で,プロジェクターの利用は困難です. 画面の大きなノート型PCを用いるなどにより対応してください.
《お問い合わせ先》
必要機材等のお問い合わせは以下のメールアドレスまでお願いいたします.
nlp2010-oc(at)is.s.u-tokyo.ac.jp
宮尾 祐介(東京大学)
事前予約を情報処理学会全国大会の事前予約受付ページで行っております.
2010年2月26日(金) 19:00まで受け付けています.(終了しました)
大会共通聴講参加のみ2010年3月2日(火) 19:00まで受け付けています.
開催時期が例年よりも早いため,例年より発表申込締切,最終論文提出期限も早まっております.ご注意下さい.
本大会は情報処理学会創立50周年記念全国大会と共催となり,共通のイベントも予定されております. 発表申し込みの受付,プログラム作成はそれぞれの学会で独立に行いますが,聴講参加のための事前予約,印刷物,DVD-ROMの購入の申込先が例年と異なっております. 下記に説明をあげますのでご注意ください. ご不明な点がありましたら,本ページ末尾のプログラム委員会までご連絡ください.
日時: | 2010年3月10日(水) 18:30〜21:00 |
---|---|
会場: | 東京大学 本郷キャンパス 医学部研究棟13F Capo PELLICANO 本郷店 |
費用: | 一般5000円,学生4000円 |
懇親会に参加される方は,できるだけ事前予約で申込をお願いします.
大会当日の参加申込も可能ですが,準備の都合上,先着順で少人数とさせていただきます.
委員長 | 村上 仁一 | (鳥取大) |
---|---|---|
委員 | 黒橋 禎夫 | (京大) |
鳥澤 健太郎 | (NICT) | |
宮尾 祐介 | (東大) | |
柏野 和佳子 | (国語研) |
委員長 | 鳥澤 健太郎 | (NICT) |
---|---|---|
委員 | 荒牧 英治 | (東大) |
影浦 峡 | (東大) | |
風間 淳一 | (NICT) | |
木村 俊也 | (ミクシィ) | |
颯々野 学 | (ヤフー) | |
新里 圭司 | (京大) | |
竹内 孔一 | (岡大) | |
田中 久美子 | (東大) | |
鶴岡 慶雅 | (JAIST) | |
中川 哲治 | (NICT) | |
二宮 崇 | (東大) | |
橋本 力 | (NICT) | |
藤田 篤 | (公立はこだて未来大) | |
森 辰則 | (横浜国大) | |
渡邊 日出雄 | (日本IBM) |
委員長 | 宮尾 祐介 | (東大) |
---|---|---|
委員 | 荒牧 英治 | (東大) |
岡崎 直観 | (東大) | |
清水 伸幸 | (東大) | |
松崎 拓也 | (東大) | |
吉田 稔 | (東大) |