研究
岡崎研究室は,自然言語処理,すなわち言葉を操るコンピュータの研究を中心に,人工知能の実現を目指しています. 例えば,外国語の文章を翻訳する,相手と対話する,質問に答える,状況を説明する,といった知的なコミュニケーションをコンピュータ上で実現するための原理や方法を探求しています. 言語学,統計学,機械学習などの基礎を踏まえながら,深層学習などの最先端のアプローチも積極的に取り入れています. さらに,ビッグデータ解析による社会観測など,研究成果の実社会での応用も展開しています.
ここでは,当研究室で取り組んでいる研究テーマをいくつか紹介します(このページに掲載されていない研究テーマもありますし,新しい研究テーマに挑戦することもできます).
研究テーマ例
逆方向言語モデル
一般的な大規模言語モデルは,左から右に(順方向に)単語を予測します.本研究では,右から左に(逆方向に)単語を予測する言語モデルの応用可能性を調査します.調査の結果,逆方向言語モデルは結論から理由を生成する常識推論タスクを有利に解けることが示されました.これは日本語では理由が先,結論が後に記述されやすいことが原因だと推測されます. (谷口 大輔 et al., 2023)

言語モデルにおける性別バイアス
言語モデルには言語の概念だけでなく,性別を含む社会的なバイアスが学習されています.本研究では,下流タスクでの事前学習モデルの性別バイアスの評価手法を提案します.提案手法を用いて評価を行った結果,既存の事前学習済み言語モデル(日本語)には,性別バイアスがあることが判明されました. (Anantaprayoon et al., 2023)

生成型要約のためのデータ拡張
近年では,大規模な訓練データを用いた深層学習により,自動要約の高い性能が達成されています. しかしながら,大規模な訓練データの構築はコストの観点から容易ではありません. 本研究では,自動要約の疑似訓練データを低コストで効果的に構築する手法として,文圧縮と言い換えを組み合わせた手法を提案します.提案手法は,自動要約タスクの性能を向上させ,既存の訓練データ拡張手法よりも効果的であることを示しました. (Loem et al., 2023)

クエリ推薦付き要約
ある特定のクエリ(質問)に対して要約を生成するタスクとして,クエリ指向要約がありますが,実際には,ユーザが未知の文書に対してクエリを考えることは難しい場合もあります. 本研究では,クエリ指向要約の発展形として,クエリも含めて自動生成する「クエリ推薦付き要約」を提案し,タスク・評価方法・生成手法の設計を行いました. 実験では,文書の特定部分に着目する機構が多様なクエリ生成に有効であることなどを確認しました. (服部 翔 et al., 2023)

検索モデルに対する教師なしドメイン適応
事前学習済み言語モデルを用いた検索モデルは,従来の検索モデルを大きく上回る精度を達成しています. しかし,検索モデルを学習するには大量の教師データが必要となり,応用先が限定されています. 本研究では,検索対象とするデータにおいて教師データを用いずに検索精度を向上させる方法を研究しています. (Iida et al., 2022)

表現学習
単語や文の意味をコンピュータ上でどのように表現すればよいか? これは,自然言語処理における課題のひとつです.近年では,深層学習の技術を取り入れて,大規模言語データから単語の意味を表現するベクトルを学習したり,文脈の違いを考慮したベクトルを計算することが可能になりました.一方で人間は,辞書をつくることで単語の情報を整理しています.では,深層学習の技術と辞書の知識をともに活用できないでしょうか? 本研究では,単語の意味を体系的に整理した辞書データに対してベクトルを適応させることで,単語間の関係や,おなじ単語の異なる意味の使い分けを捉えやすくなることを明らかにしました. (水木 栄 et al., 2021) (Mizuki et al., 2023)

情報抽出 / 知識獲得
「たばこ」が「肺がん」を引き起こすなど,人間は常識的知識を活用しながら言葉の意味を理解し,コミュニケーションをしています.このような常識的な知識をコンピュータに身につけさせるため,ウェブ,Wikipedia,SNS投稿などのデータから知識を自動的に獲得する方法を探求しています.また,文書などの長いテキストから知識を獲得するたび,知識の出所(エビデンス)を明示的に示せるようにしています.

研究助成
当研究室の活動において,以下のご支援を賜りました(奨学寄附金は掲載しておりません).
国や研究機関の競争的資金制度
- 文科省科研費 若手研究(代表: 高瀬 翔): 2021年4月~
- 文科省科研費 特別研究員奨励費(代表: 丹羽 彩奈): 2021年4月~2023年3月
- 科学技術研究機構 ACT-X(代表: 高瀬 翔): 2020年10月~2023年3月
- NEDO委託研究(分担: 岡崎 直観): 2019年6月~2024年3月
- 文科省科研費 基盤研究A(代表: 岡崎 直観): 2019年4月~2024年3月
- NICT委託研究(代表: 岡崎 直観): 2018年6月~2021年3月
- 文科省科研費 若手研究A(代表: 高瀬 翔): 2018年10月~2021年3月
- 産総研・東工大 実社会ビッグデータ活用 オープンイノベーションラボラトリ(分担: 岡崎 直観): 2018年4月~2022年3月
- 文科省科研費 基盤研究A(分担: 岡崎 直観): 2017年8月~2019年3月
- 文科省科研費 若手研究A(代表: 岡崎 直観): 2017年8月~2018年3月
企業との共同研究
- NEC Laboratories Europe GmbH
- 株式会社デンソー
- 株式会社サイバーエージェント
- ソフトバンクグループ株式会社
- 住友電工情報システム株式会社
企業との学術指導
- 株式会社日立製作所
- 株式会社リコー
産学連携の制度について
産学連携の制度をご紹介いたします.ご検討される場合は,制度の内容や手続きについてご案内いたしますので,教員までお気軽にご相談ください.
共同研究
共同研究は,特定の研究課題について,研究室の教員と企業の研究者とで研究を行い,併せて研究成果を得る制度です.研究に必要な経費は,企業にご負担いただきます.企業の研究者を研究室に派遣し,研究を進めることもできます(民間等共同研究員).研究内容や体制によって必要な経費が変わりますが,研究経費の目安(1年あたり・直接経費)は以下の通りです.
- 企業側が主として研究を進める想定: 100万円~
- 研究室側が主として研究を進める想定: 200万円~
学術指導
学術指導は,企業が抱える特定の課題について,本研究室の教員が,自身が有する知見や技術を用いて,指導やアドバイスを行う制度です.(企業の課題を,本学の教員の研究課題とするのではありません).1回あたり2時間の打ち合わせを12回実施する場合,学術指導料の目安は120万円(直接経費)となります.
兼業
東工大の教員に技術顧問や取締役への就任,会社やセミナー等での講演や講義を依頼することもできます.学術指導と重なる部分がありますが,大学を介さずに会社と教員との直接の契約・雇用関係を結ぶことになりますので,会社側の裁量が大きくなる点が特徴です.
奨学寄附金
奨学寄附金は,企業や団体,個人などから,本研究室の担当者(教員や研究員等)を指定して寄附していただく制度です.ご寄附いただいた奨学寄附金は,研究室の教育・研究の奨励等を目的に使用され,その成果を通じ広く社会に還元されます.