発表

受賞

2025年言語資源賞 (2025-03-07)

藤井一喜, 中村泰士, Mengsay Loem, 飯田大貴, 大井聖也, 服部翔, 平井翔太, 水木栄, 横田理央, 岡崎直観

Swallow LLM

URL
言語処理学会第31回年次大会スポンサー賞（日立製作所） (2025-03-13)

趙信, 吉永直樹, 大葉大輔

多角的な評価から大規模言語モデルにおける事実知識の想起の要因分析

URL
言語処理学会第31回年次大会委員特別賞 (2025-03-13)

大南英理, 宮西大樹, 前田航希, 栗田修平

多言語での判例事実概要からの法的関係性のグラフ可視化

URL
言語処理学会第31回年次大会委員特別賞 (2025-03-13)

大井聖也, 金子正弘, 岡崎直観, 井上中順

複数タスク・複数項目に跨ったマルチモーダル自動評価手法

URL
言語処理学会第31回年次大会委員特別賞 (2025-03-13)

笹川慶人, 前田航希, 杉浦一瑳, 栗田修平, 岡崎直観, 河原大輔

LLM-jp-3 VILA: 日本語マルチモーダルデータセット及び強力な日本語マルチモーダルモデルの構築

URL
言語処理学会第31回年次大会委員特別賞 (2025-03-13)

Panatchakorn Anantaprayoon, 金子正弘, 岡崎直観

Mitigating Social Bias in Large Language Models by Self-Correction

URL
第31回言語処理学会若手奨励賞 (2025-03-13)

前田航希

llm-jp-eval-mm: 日本語視覚言語モデルの自動評価基盤

URL
言語処理学会論文賞優秀論文賞 (2025-03-10)

Youmi Ma, An Wang, 岡崎直観

文書レベル関係抽出における根拠認識の統合

URL
NLP若手の会第19回シンポジウムスポンサー賞（サイバーエージェント賞） (2024-09-06)

齋藤幸史郎, 小池隆斗, 金子正弘, 岡崎直観

強化学習を用いた、言語理解能力を維持したLLM検出器の性能向上

URL
NLP若手の会第19回シンポジウム奨励賞 (2024-09-06)

齋藤幸史郎, 小池隆斗, 金子正弘, 岡崎直観

強化学習を用いた、言語理解能力を維持したLLM検出器の性能向上

URL
第261回自然言語処理研究会優秀研究賞 (2024-09-03)

齋藤幸史郎, 水木栄, 大井聖也, 中村泰士, 塩谷泰平, 前田航希, Ma Youmi, 服部翔, 藤井一喜, 岡本拓己, 石田茂樹, 高村大也, 横田理央, 岡崎直観

LLMに日本語テキストを学習させる意義

URL
第30回言語処理学会若手奨励賞 (2024-03-14)

大井聖也

大規模言語モデルにおける評価バイアスの尤度に基づく緩和

URL
第30回言語処理学会若手奨励賞 (2024-03-14)

綿祐貴

大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃

URL
第30回言語処理学会若手奨励賞 (2024-03-14)

Mengsay Loem

敵対的発言を取り入れた議論による言語モデルの学習強化と推論力の向上

URL
第30回言語処理学会若手奨励賞 (2024-03-14)

丹羽彩奈

AmbiNLG：自然言語生成のための指示テキストの曖昧性解消

URL
第30回言語処理学会若手奨励賞 (2024-03-14)

古山翔太

文法誤り訂正の自動評価のための原文・参照文・訂正文間のN-gram F-score

URL
言語処理学会第30回年次大会優秀賞 (2024-03-14)

岡崎直観, 服部翔, 平井翔太, 飯田大貴, 大井聖也, 藤井一喜, 中村泰士, Mengsay Loem, 横田理央, 水木栄

Swallowコーパス：日本語大規模ウェブコーパス

URL
言語処理学会第30回年次大会優秀賞 (2024-03-14)

藤井一喜, 中村泰士, Mengsay Loem, 飯田大貴, 大井聖也, 服部翔, 平井翔太, 水木栄, 横田理央, 岡崎直観

継続事前学習による日本語に強い大規模言語モデルの構築

URL
NLP若手の会第18回シンポジウム奨励賞 (2023-08-31)

Youmi Ma, An Wang, 岡崎直観

日本語文書レベル関係抽出コーパスの構築

URL
NLP若手の会第18回シンポジウムスポンサー賞（PKSHA Technology賞） (2023-08-31)

小池隆斗, 金子正弘, 岡崎直観

敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出

URL
NLP若手の会第18回シンポジウムスポンサー賞（博報堂テクノロジーズ賞） (2023-08-31)

小池隆斗, 金子正弘, 岡崎直観

敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出

URL
言語処理学会第29回年次大会最優秀賞 (2023-03-16)

Youmi Ma, An Wang, 岡崎直観

文書レベル関係抽出における根拠認識の統合

URL
言語処理学会第29回年次大会優秀賞 (2023-03-16)

水木栄, 岡崎直観

埋め込み表現の意味適応による知識ベース語義曖昧性解消

URL
言語処理学会第29回年次大会スポンサー賞（日立製作所） (2023-03-16)

服部翔, Youmi Ma, 岡崎直観

クエリ指向要約におけるクエリと要約の統合的な生成

URL
言語処理学会第29回年次大会委員特別賞 (2023-03-16)

金子正弘, Graham Neubig, 岡崎直観

人間とシステムの議論に基づくNLPタスクの問題に対する予測

URL
言語処理学会第29回年次大会委員特別賞 (2023-03-16)

西田京介, 長谷川拓, 前田航希, 齋藤邦子

DueT: 視覚・言語のDual-adapter Tuningによる基盤モデル

URL
言語処理学会論文賞最優秀論文賞 (2022-03-17)

平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観

テキストベクトルの重みづけを用いたタスクに対する単語分割の最適化

URL
言語処理学会第28回年次大会優秀賞 (2022-03-17)

高瀬翔, 清野舜, 小林颯介, 鈴木潤

Transformerを多層にする際の勾配消失問題と解決法について

URL
言語処理学会第28回年次大会優秀賞 (2022-03-17)

前田航希, 金子正弘, 岡崎直観

IMPARA: パラレルデータにおける修正の影響度に基づいた文法誤り訂正の自動評価法

URL
言語処理学会第28回年次大会委員特別賞 (2022-03-17)

丹羽彩奈, 高瀬翔, 岡崎直観

近傍の事例を用いた非自己回帰生成

URL
言語処理学会第28回年次大会委員特別賞 (2022-03-17)

吉川和, 岡崎直観

確信度を考慮した言語モデルの関係知識評価

URL
言語処理学会第28回年次大会委員特別賞 (2022-03-17)

嘉田紗世, 山野陽祐, 新美茜, 田森秀明, 小海則人, 岡崎直観, 乾健太郎

動画タイトルを用いたサムネイル画像の自動選択手法の提案

URL
AKBC2021 Outstanding Paper Award (2021-10-05)

Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, Naoaki Okazaki

Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction

URL
言語処理学会第27回年次大会優秀賞 (2021-03-18)

水木栄, 岡崎直観

階層コード表現を用いた上位下位関係の識別

URL
第27回言語処理学会若手奨励賞 (2021-03-18)

平岡達也

後段モデルの損失値を用いた単語分割のタスクへの最適化

URL
第27回言語処理学会若手奨励賞 (2021-03-18)

Youmi Ma

BERTを用いたTable-Fillingによる固有表現抽出と関係抽出

URL
第27回言語処理学会委員特別賞 (2021-03-18)

山田康輔, 人見雄太, 田森秀明, 岡崎直観, 乾健太郎

指定語句を確実に含む見出し生成

URL
第27回言語処理学会スポンサー賞 (2021-03-18)

山田康輔, 人見雄太, 田森秀明, 岡崎直観, 乾健太郎

指定語句を確実に含む見出し生成

URL
令和元年度東工大教育賞 (2021-03-02)

三宅美博, 岡崎直観, 金森敬文, 村田剛志, 西崎真也, 首藤一幸, 吉瀬謙二, 下坂正倫, 関嶋政和, 柳澤渓甫, 久世正弘, 三平満司, 山中一郎, 伊藤武彦, 竹内徹, 山口猛央, 阪口啓

大学院を対象とするデータサイエンス・AI全学教育プログラム

URL
第15回NTCIR プレゼンテーション賞 (2020-12-17)

笹沢裕一, 岡崎直観

WER99 at the NTCIR-15 QA Lab-PoliInfo-2 Classification Task

URL
Video-guided Machine Translation (VMT) Challenge 2020 優勝 (2020-07-13)

Tosho Hirasawa, Zhishen Yang, Mamoru Komachi, and Naoaki Okazaki

Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020

URL
第26回言語処理学会言語資源賞 (2020-03-20)

人見雄太, 田口雄哉, 田森秀明, 岡崎直観, 乾健太郎

小規模リソースにおける生成型要約のためのスタイル転移

URL
第26回言語処理学会若手奨励賞 (2020-03-20)

松丸和樹

見出し生成の忠実性の改善

URL
第242回自然言語処理研究会若手奨励賞 (2019-10-25)

平岡達也

RNNによる遷移確率計算を用いた隠れマルコフモデル

URL
第240回自然言語処理研究会優秀研究賞 (2019-06-14)

松丸和樹, 高瀬翔, 岡崎直観

含意関係に基づく見出し生成タスクの見直し

URL
人工知能学会論文賞 (2018-06-27)

高瀬翔, 岡崎直観, 乾健太郎

関係パタンの分散表現の計算

URL
言語処理学会第24回年次大会優秀賞 (2018-03-15)

清野舜, 高瀬翔, 鈴木潤, 岡崎直観, 乾健太郎, 永田昌明

ニューラルヘッドライン生成における誤生成問題の改善

URL

発表文献

ジャーナル論文

Marco Cognetta, Naoaki Okazaki. Tokenization as Finite-State Transduction. Computational Linguistics, pp. to appear, 2025年.
An Wang, Huidong Jiang, Youmi Ma, Junfeng Jiang, Ao Liu, Naoaki Okazaki. Improving Implicit Sentiments Analysis via Explanations of Multiple Perspectives. IEEE Access, 13, pp. 61136–61148, 2025年4月. (doi: https://doi.org/10.1109/ACCESS.2025.3556762)

DOI
大井聖也, 金子正弘, 小池隆斗, Mengsay Loem, 岡崎直観. 大規模言語モデルにおける評価バイアスの尤度に基づく緩和. 自然言語処理, 32(2):480–496, 2025年7月. (doi: https://doi.org/10.5715/jnlp.32.480)

DOI
吉川和, 岡崎直観. 訓練データを用いた言語モデル生成の確信度推定. 自然言語処理, 32(1):91–113, 2025年3月. (doi: 10.5715/jnlp.32.91)

DOI
An Wang, Junfeng Jiang, Youmi Ma, Ao Liu, Naoaki Okazaki. Generative Data Augmentation for Aspect Sentiment Quad Prediction. Journal of Natural Language Processing, 31(4):1523–1544, 2024年12月. (doi: 10.5715/jnlp.31.1523)

DOI
Vijay Daultani, Hector Vazquez Martinez, Naoaki Okazaki. Acceptability Evaluation of Naturally Written Sentences. Journal of Information Processing, 32:652–666, 2024年8月. (doi: 10.2197/ipsjjip.32.652)

DOI
Zhishen Yang, Raj Dabre, Hideki Tanaka, Naoaki Okazaki. SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning. Journal of Natural Language Processing, 31(3):1140–1165, 2024年9月. (doi: 10.5715/jnlp.31.1140)

DOI
Youmi Ma, An Wang, 岡崎直観. 文書レベル関係抽出における根拠認識の統合. 自然言語処理, 31(1):105–133, 2024年3月. (doi: 10.5715/jnlp.31.105)

DOI
松原真弓, 麻場直喜, 内藤昭一, 川村晋太郎, 井口慎也, 能勢将樹, 岡崎直観. タスク指向対話システムにおけるユーザの特徴を考慮した話題導入. 情報処理学会論文誌デジタルプラクティス（DP）, 4(3):98–106, 2023年7月.

URL
Mengsay Loem, Sho Takase, Masahiro Kaneko, Naoaki Okazaki. ExtraPhrase: 生成型要約のための効率的データ拡張. 自然言語処理, 30(2):489–506, 2023年6月. (doi: 10.5715/jnlp.30.489)

DOI
Ao Liu, Congjian Luo, Naoaki Okazaki. Improving Logical-Level Natural Language Generation with Topic-Conditioned Data Augmentation and Logical Form Generation. Journal of Information Processing, 31:332–343, 2023年4月. (doi: 10.2197/ipsjjip.31.332)

DOI
Ayana Niwa, Sho Takase, Naoaki Okazaki. Nearest Neighbor Non-autoregressive Text Generation. Journal of Information Processing, 31:334–352, 2023年4月. (doi: 10.2197/ipsjjip.31.344)

DOI
Chunpeng Ma, Aili Shen, Hiyori Yoshikawa, Tomoya Iwakura, Daniel Beck, Timothy Baldwin. On the Effectiveness of Images in Multi-Modal Text Classification: An Annotation Study. ACM Trans. Asian Low-Resour. Lang. Inf. Process., 22(3):1–19, 2023年3月. (doi: 10.1145/3565572)

URL DOI
村岡雅康, 岡崎直観, 小比田涼介, 石井悦子. マルチモーダル文書におけるテキストと画像の整合タスクの提案. 自然言語処理, 29(4):1198–1232, 2022年12月. (doi: 10.5715/jnlp.29.1198)

DOI
Tosho Hirasawa, Masahiro Kaneko, Aizhan Imankulova, Mamoru Komachi. Pre-Trained Word Embedding and Language Model Improve Multimodal Machine Translation: A Case Study in Multi30K. IEEE Access, 10:67653–67668, 2022年. (doi: 10.1109/ACCESS.2022.3185243)

DOI
飯田大貴, 岡崎直観. Zero-shotニューラル検索のための語彙一致と文脈の類似度による関連度スコアリング. 情報処理学会論文誌データベース(TOD), 15(3):20–35, 2022年10月.

URL
古山翔太, 高村大也, 岡崎直観. 多様な規則を活用した文法誤り訂正のデータ拡張に関する分析. 自然言語処理, 29(2):542–586, 2022年6月. (doi: 10.5715/jnlp.29.542)

DOI
Zhishen Yang, Tosho Hirasawa, Mamoru Komachi, Naoaki Okazaki. Why videos do not guide translations in video-guided machine translation? An empirical evaluation of video-guided machine translation dataset. Journal of Information Processing, 30:388–396, 2022年5月. (doi: 10.2197/ipsjjip.30.388)

DOI
Youmi Ma, Tatsuya Hiraoka, Naoaki Okazaki. Named Entity Recognition and Relation Extraction Using Enhanced Table Filling by Contextualized Representations. Journal of Natural Language Processing, 29(1):187–223, 2022年3月. (doi: 10.5715/jnlp.29.187)

DOI
平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観. 単語分割と後段モデルの損失値を用いた同時最適化. 自然言語処理, 29(1):112–143, 2022年3月. (doi: 10.5715/jnlp.29.112)

DOI
甫立健悟, 金子正弘, 勝又智, 小町守. 文法誤り訂正における訂正度を考慮した多様な訂正文の生成. 自然言語処理, 28(2):428–449, 2021年6月. (doi: 10.5715/jnlp.28.428)

DOI
吉村綾馬, 金子正弘, 梶原智之, 小町守. 文法誤り訂正の参照文を用いない自動評価の人手評価への最適化. 自然言語処理, 28(2):404–427, 2021年6月. (doi: 10.5715/jnlp.28.404)

DOI
Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, Naoaki Okazaki. Recurrent Neural Hidden Markov Model for High-Order Transition. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 21(2):1–15, 2022年3月. (doi: 10.1145/3476511)

URL DOI
水木栄, 岡崎直観. 階層コード表現学習による上位下位関係の識別. 情報処理学会論文誌データベース(TOD), 14(4):8–23, 2021年10月.

URL
Emanuele Bugliarello, Ryan Cotterell, Naoaki Okazaki, Desmond Elliott. Multimodal Pretraining Unmasked: A Meta-Analysis and a Unified Framework of Vision-and-Language BERTs. Transactions of the Association for Computational Linguistics, 9:978–994, 2021年9月. (doi: 10.1162/tacl_a_00408)

URL DOI
Ayana Niwa, Naoaki Okazaki, Kohei Wakimoto, Keisuke Nishiguchi, Masataka Mouri. Construction of a Corpus of Rhetorical Devices in Slogans and Structural Analysis of Antitheses. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 20(6), 2021年11月. (doi: 10.1145/3465218)

DOI
Sangwhan Moon, Naoaki Okazaki. The Effects and Mitigation of Out-of-Vocabulary in Universal Language Models. Journal of Information Processing, 29:490–503, 2021年7月. (doi: 10.2197/ipsjjip.29.490)

DOI
平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観. テキストベクトルの重みづけを用いたタスクに対する単語分割の最適化. 自然言語処理, 28(2):479–507, 2021年6月. (doi: 10.5715/jnlp.28.479)

DOI
Kaori Abe, Yuichiroh Matsubayashi, Naoaki Okazaki, Kentaro Inui. Multi-dialect Neural Machine Translation for 48 Low-resource Japanese Dialects. Journal of Natural Language Processing, 27(4):781–800, 2020年12月. (doi: 10.5715/jnlp.27.781)

DOI
Hayate Iso, Yui Uehara, Tatsuya Ishigaki, Hiroshi Noji, Eiji Aramaki, Ichiro Kobayashi, Yusuke Miyao, Naoaki Okazaki, Hiroya Takamura. Learning to Select, Track, and Generate for Data-to-Text. Journal of Natural Language Processing, 27(3):599–626, 2020年9月. (doi: 10.5715/jnlp.27.599)

DOI
Diana Galvan-Sosa, Koji Matsuda, Naoaki Okazaki, Kentaro Inui. Empirical Exploration of the Challenges in Temporal Relation Extraction from Clinical Text. Journal of Natural Language Processing, 27(2):383–409, 2020年6月. (doi: 10.5715/jnlp.27.383)

DOI
Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, Kentaro Inui. Stance Detection Attending External Knowledge from Wikipedia. Journal of Information Processing, 27:499–506, 2019年8月. (doi: 10.2197/ipsjjip.27.499)

DOI
Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki, Kentaro Inui. A Joint Neural Model for Fine-Grained Named Entity Classification of Wikipedia Articles. IEICE Transactions on Information and Systems, Special Section on Semantic Web and Linked Data, E101.D(1):73–81, 2018年1月. (doi: 10.1587/transinf.2017SWP0005)

DOI
Ran Tian, Naoaki Okazaki, Kentaro Inui. The mechanism of additive composition. Machine Learning, 106(7):1083–1130, 2017年7月. (doi: 10.1007/s10994-017-5634-8)

DOI
高瀬翔, 岡崎直観, 乾健太郎. 関係パタンの分散表現の計算. 人工知能学会論文誌, 32(4):D-G96_1-11, 2017年7月. (doi: 10.1527/tjsai.D-G96)

DOI
Shuangshuang Zhou, Naoaki Okazaki, Koji Matsuda, Ran Tian, Kentaro Inui. Supervised Approaches for Japanese Wikification. Journal of Information Processing, 25:341–350, 2017年4月. (doi: 10.2197/ipsjjip.25.341)

DOI

国際会議論文

Koshiro Saito, Sakae Mizuki, Masanari Ohi, Taishi Nakamura, Taihei Shiotani, Koki Maeda, Youmi Ma, Kakeru Hattori, Kazuki Fujii, Takumi Okamoto, Shigeki Ishida, Hiroya Takamura, Rio Yokota, and Naoaki Okazaki. Why We Build Local Large Language Models: An Observational Analysis from 35 Japanese and Multilingual LLMs. In The 1st Workshop on Multilingual and Equitable Language Technologies (MELT), Montreal, Canada, October 2025.

URL
Youmi Ma, Sakae Mizuki, Kazuki Fujii, Taishi Nakamura, Masanari Ohi, Hinari Shimada, Taihei Shiotani, Koshiro Saito, Koki Maeda, Kakeru Hattori, Takumi Okamoto, Shigeki Ishida, Rio Yokota, Hiroya Takamura, and Naoaki Okazaki. Building Instruction-Tuning Datasets from Human-Written Instructions with Open-Weight Large Language Models. In Proceedings of the Second Conference on Language Modeling (COLM), pages (to appear), Montreal, Canada, October 2025.
Marco Cognetta, David Pohl, Junyoung Lee, and Naoaki Okazaki. Pitfalls, Subtleties, and Techniques in Automata-Based Subword-Level Constrained Generation. In Tokenization Workshop (TokShop), pages (16 pages), Vancouver, Canada, July 2025.

URL
Masahiro Kaneko, Youmi Ma, Yuki Wata, and Naoaki Okazaki. Sampling-based Pseudo-Likelihood for Membership Inference Attacks. In Findings of the Association for Computational Linguistics: ACL 2025, pages 8894–8907, Vienna, Austria, July 2025.

URL
Eri Onami, Taiki Miyanishi, Koki Maeda, and Shuhei Kurita. LegalViz: Legal Text Visualization by Text To Diagram Generation. In Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers) (NAACL-HLT), pages 6657–6676, Albuquerque, New Mexico, April 2025. (doi: 10.18653/v1/2025.naacl-long.339)

URL DOI
Keito Sasagawa, Koki Maeda, Issa Sugiura, Shuhei Kurita, Naoaki Okazaki, and Daisuke Kawahara. Constructing Multimodal Datasets from Scratch for Rapid Development of a Japanese Visual Language Model. In Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (System Demonstrations) (NAACL-HLT), pages 470–484, Albuquerque, New Mexico, April 2025. (doi: 10.18653/v1/2025.naacl-demo.38)

URL DOI
Junyoung Lee, Marco Cognetta, Sangwhan Moon, and Naoaki Okazaki. Jamo-Level Subword Tokenization in Low-Resource Korean Machine Translation. In Proceedings of the Eighth Workshop on Technologies for Machine Translation of Low-Resource Languages (LoResMT 2025), pages 66–80, Albuquerque, New Mexico, U.S.A., May 2025. (doi: 10.18653/v1/2025.loresmt-1.8)

URL DOI
Ryuto Koike, Masahiro Kaneko, and Naoaki Okazaki. How You Prompt Matters! Even Task-Oriented Constraints in Instructions Affect LLM-Generated Text Detection. In Findings of the Association for Computational Linguistics: EMNLP 2024 (EMNLP), pages 14384–14395, Miami, Florida, USA, November 2024. (doi: 10.18653/v1/2024.findings-emnlp.841)

URL DOI
Marco Cognetta, Vilém Zouhar, and Naoaki Okazaki. Distributional Properties of Subword Regularization. In Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 10753–10763, Miami, Florida, USA, November 2024. (doi: 10.18653/v1/2024.emnlp-main.600)

URL DOI
Shota Koyama, Ryo Nagata, Hiroya Takamura, and Naoaki Okazaki. n-gram F-score for Evaluating Grammatical Error Correction. In Proceedings of the 17th International Natural Language Generation Conference (INLG), pages 303–313, Tokyo, Japan, September 2024.

URL
Naoaki Okazaki, Kakeru Hattori, Hirai Shota, Hiroki Iida, Masanari Ohi, Kazuki Fujii, Taishi Nakamura, Mengsay Loem, Rio Yokota, and Sakae Mizuki. Building a Large Japanese Web Corpus for Large Language Models. In Proceedings of the First Conference on Language Modeling (COLM), pages (18 pages), University of Pennsylvania, USA, October 2024.

URL
Kazuki Fujii, Taishi Nakamura, Mengsay Loem, Hiroki Iida, Masanari Ohi, Kakeru Hattori, Hirai Shota, Sakae Mizuki, Rio Yokota, and Naoaki Okazaki. Continual Pre-Training for Cross-Lingual LLM Adaptation: Enhancing Japanese Language Capabilities. In Proceedings of the First Conference on Language Modeling (COLM), pages (25 pages), University of Pennsylvania, USA, October 2024.

URL
Mengsay Loem, Masahiro Kaneko, and Naoaki Okazaki. SAIE Framework: Support Alone Isn’t Enough - Advancing LLM Training with Adversarial Remarks. In Proceedings of the 27th European Conference on Artificial Intelligence (ECAI), pages 3717–3724, Santiago de Compostela, Spain, October 2024. (doi: 10.3233/FAIA240931)

URL DOI
Koki Maeda, Tosho Hirasawa, Atsushi Hashimoto, Jun Harashima, Leszek Rybicki, Yusuke Fukasawa, and Yoshitaka Ushiku. COM Kitchens: An Unedited Overhead-View Video Dataset as a Vision-Language Benchmark. In Computer Vision – ECCV 2024: 18th European Conference, Milan, Italy, September 29–October 4, 2024, Proceedings, Part LXV, pages 123–140, Milan, Italy, 2024. (doi: 10.1007/978-3-031-73650-6_8)

URL DOI
Masanari Ohi, Masahiro Kaneko, Ryuto Koike, Mengsay Loem, and Naoaki Okazaki. Likelihood-based Mitigation of Evaluation Bias in Large Language Models. In Lun-Wei Ku, Andre Martins, and Vivek Srikumar, editors, Findings of the Association for Computational Linguistics ACL 2024 (ACL 2024), pages 3237–3245, Bangkok, Thailand and virtual meeting, August 2024. (doi: 10.18653/v1/2024.findings-acl.193)

URL DOI
Marco Cognetta, Tatsuya Hiraoka, Rico Sennrich, Yuval Pinter, and Naoaki Okazaki. An Analysis of BPE Vocabulary Trimming in Neural Machine Translation. In Shabnam Tafreshi, Arjun Akula, João Sedoc, Aleksandr Drozd, Anna Rogers, and Anna Rumshisky, editors, Proceedings of the Fifth Workshop on Insights from Negative Results in NLP, pages 48–50, Mexico City, Mexico, June 2024. (doi: 10.18653/v1/2024.insights-1.7)

URL DOI
Marco Cognetta, Vilém Zouhar, Sangwhan Moon, and Naoaki Okazaki. Two Counterexamples to Tokenization and the Noiseless Channel. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 16897–16906, Torino, Italia, May 2024.

URL
Panatchakorn Anantaprayoon, Masahiro Kaneko, and Naoaki Okazaki. Evaluating Gender Bias of Pre-trained Language Models in Natural Language Inference by Considering All Labels. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 6395–6408, Torino, Italia, May 2024.

URL
Youmi Ma, An Wang, and Naoaki Okazaki. Building a Japanese Document-Level Relation Extraction Dataset Assisted by Cross-Lingual Transfer. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 2567–2579, Torino, Italia, May 2024.

URL
Masahiro Kaneko and Naoaki Okazaki. Controlled Generation with Prompt Insertion for Natural Language Explanations in Grammatical Error Correction. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 3955–3961, Torino, Italia, May 2024.

URL
Masahiro Kaneko, Graham Neubig, and Naoaki Okazaki. Solving NLP Problems through Human-System Collaboration: A Discussion-based Approach. In Findings of the Association for Computational Linguistics: EACL 2024 (EACL), pages 1644–1658, St. Julian’s, Malta, March 2024.

URL
Ryuto Koike, Masahiro Kaneko, and Naoaki Okazaki. OUTFOX: LLM-generated Essay Detection through In-context Learning with Adversarially Generated Examples. In The 38th Annual AAAI Conference on Artificial Intelligence (AAAI), pages 21258–21266, February 2024.
Koki Maeda, Shuhei Kurita, Taiki Miyanishi, and Naoaki Okazaki. Query-based Image Captioning from Multi-context 360° Images. In Findings of the Association for Computational Linguistics: EMNLP 2023 (EMNLP), pages 6940–6954, Singapore, December 2023. (doi: 10.18653/v1/2023.findings-emnlp.463)

URL DOI
Taku Hasegawa, Kyosuke Nishida, Koki Maeda, and Kuniko Saito. DueT: Image-Text Contrastive Transfer Learning with Dual-adapter Tuning. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 13607–13624, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.839)

URL DOI
Trang Nguyen and Naoaki Okazaki. Causal Reasoning through Two Layers of Cognition for Improving Generalization in Visual Question Answering. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 9221–9236, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.573)

URL DOI
Masahiro Kaneko and Naoaki Okazaki. Reducing Sequence Length by Predicting Edit Operations with Large Language Models. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 10017–10029, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.619)

URL DOI
Youmi Ma, Bhushan Kotnis, Carolin Lawrance, Goran Glavaš, and Naoaki Okazaki. Improving Cross-Lingual Transfer for Open Information Extraction with Linguistic Feature Projection. In Proceedings of the 3rd Workshop on Multi-lingual Representation Learning (MRL), pages 125–138, Singapore, December 2023. (doi: 10.18653/v1/2023.mrl-1.11)

URL DOI
Trang Nguyen, Amin Mansouri, Kanika Madan, Khuong Duy Nguyen, Kartik Ahuja, Dianbo Liu, and Yoshua Bengio. Reusable Slotwise Mechanisms. In A. Oh, T. Naumann, A. Globerson, K. Saenko, M. Hardt, and S. Levine, editors, Advances in Neural Information Processing Systems (NeurIPS), volume 36, pages 23533–23556, 2023.

URL
Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. The Impact of Debiasing on the Performance of Language Models in Downstream Tasks is Underestimated. In Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (Volume 2: Short Papers) (AACL), pages 29–36, Nusa Dua, Bali, November 2023. (doi: 10.18653/v1/2023.ijcnlp-short.4)

URL DOI
Masayasu Muraoka, Bishwaranjan Bhattacharjee, Michele Merler, Graeme Blackwood, Yulong Li, and Yang Zhao. Cross-Lingual Transfer of Large Language Model by Visually-Derived Supervision Toward Low-Resource Languages. In Proceedings of the 31th ACM International Conference on Multimedia (MM ’23), pages 3637–3646, October 2023. (doi: 10.1145/3581783.3611992)

DOI
Yang Zhao, Tetsuya Nasukawa, Masayasu Muraoka, and Bishwaranjan Bhattacharjee. A Simple Yet Strong Domain-Agnostic De-bias Method for Zero-Shot Sentiment Classification. In Findings of the Association for Computational Linguistics: ACL 2023, pages 3923–3931, Toronto, Canada, July 2023.

URL
Mengsay Loem, Masahiro Kaneko, Sho Takase, and Naoaki Okazaki. Exploring Effectiveness of GPT-3 in Grammatical Error Correction: A Study on Performance and Controllability in Prompt-Based Methods. In Proceedings of the 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023) (BEA), pages 205–219, Toronto, Canada, July 2023.

URL
An Wang, Junfeng Jiang, Youmi Ma, Ao Liu, and Naoaki Okazaki. Generative Data Augmentation for Aspect Sentiment Quad Prediction. In Proceedings of the 12th Joint Conference on Lexical and Computational Semantics (*SEM), pages 128–140, Toronto, Canada, July 2023. (doi: 10.18653/v1/2023.starsem-1.12)

URL DOI
Marco Cognetta, Sangwhan Moon, Lawrence Wolf-Sonkin, and Naoaki Okazaki. Parameter-Efficient Korean Character-Level Language Modeling. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 2350–2356, Dubrovnik, Croatia, May 2023.

URL
Hiyori Yoshikawa and Naoaki Okazaki. Selective-LAMA: Selective Prediction for Confidence-Aware Evaluation of Language Models. In Findings of the Association for Computational Linguistics: EACL 2023 (Findings of EACL), pages 2017–2028, Dubrovnik, Croatia, May 2023.

URL
Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Comparing Intrinsic Gender Bias Evaluation Measures without using Human Annotated Examples. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 2857–2863, Dubrovnik, Croatia, May 2023.

URL
Sakae Mizuki and Naoaki Okazaki. Semantic Specialization for Knowledge-based Word Sense Disambiguation. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 3457–3470, Dubrovnik, Croatia, May 2023.

URL
Youmi Ma, An Wang, and Naoaki Okazaki. DREEAM: Guiding Attention with Evidence for Improving Document-Level Relation Extraction. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 1971–1983, Dubrovnik, Croatia, May 2023.

URL
Zhishen Yang, Raj Dabre, Hideki Tanaka, and Naoaki Okazaki. SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning. In Proceedings of the Workshop on Scientific Document Understanding, co-located with 37th AAAI Conference on Artificial Intelligence (CEUR Workshop Proceedings), page (Paper13), Washington DC, USA, February 2023.

URL
Ao Liu, Haoyu Dong, Naoaki Okazaki, Shi Han, and Dongmei Zhang. PLOG: Table-to-Logic Pretraining for Logical Table-to-Text Generation. In Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 5531–5546, Abu Dhabi, United Arab Emirates, December 2022.

URL
Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Gender Bias in Meta-Embeddings. In Findings of the Association for Computational Linguistics: EMNLP 2022 (EMNLP), pages 3118–3133, Abu Dhabi, United Arab Emirates, December 2022.

URL
Hiroki Iida and Naoaki Okazaki. Unsupervised Domain Adaptation for Sparse Retrieval by Filling Vocabulary and Word Frequency Gaps. In Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing (Volume 1: Long Papers) (AACL), pages 752–765, Online, November 2022.

URL
Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Debiasing Isn’t Enough! – on the Effectiveness of Debiasing MLMs and Their Social Biases in Downstream Tasks. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 1299–1310, Gyeongju, Republic of Korea, October 2022.

URL
Koki Maeda, Masahiro Kaneko, and Naoaki Okazaki. IMPARA: Impact based Metric for GEC using Parallel Data. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 3578–3588, Gyeongju, Republic of Korea, October 2022.

URL
Yidong Wang, Hao Wu, Ao Liu, Wenxin Hou, Zhen Wu, Jindong Wang, Takahiro Shinozaki, Manabu Okumura, and Yue Zhang. Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 7075–7085, Gyeongju, Republic of Korea, October 2022.

URL
Hsuan-Yu Kuo, Youmi Ma, and Naoaki Okazaki. Annotating Entity and Causal Relationships on Japanese Vehicle Recall Information. In Proceedings of the 36th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 783–791, Manila, Philippines, October 2022.

URL
Vijay Daultani and Naoaki Okazaki. Improving Automatic Evaluation of Acceptability Based on Language Models with a Coarse Sentence Representation. In Proceedings of the 36th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 109–118, Manila, Philippines, October 2022.

URL
Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Overview of ChEMU 2022 Evaluation Campaign: Information Extraction in Chemical Patents. In International Conference of the Cross-Language Evaluation Forum for European Languages (CLEF), pages 521–540, September 2022.
Mengsay Loem, Sho Takase, Masahiro Kaneko, and Naoaki Okazaki. ExtraPhrase: Efficient Data Augmentation for Abstractive Summarization. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop (NAACL SRW), pages 16–24, Hybrid: Seattle, Washington + Online, July 2022. (doi: 10.18653/v1/2022.naacl-srw.3)

URL DOI
Haoyu Dong, Zhoujun Cheng, Xinyi He, Mengyu Zhou, Anda Zhou, Fan Zhou, Ao Liu, Shi Han, and Dongmei Zhang. Table Pre-training: A Survey on Model Architectures, Pre-training Objectives, and Downstream Tasks. In Proceedings of the Thirty-First International Joint Conference on Artificial Intelligence (IJCAI), pages 5426–5435, July 2022. (doi: 10.24963/ijcai.2022/761)

URL DOI
Masahiro Kaneko, Aizhan Imankulova, Danushka Bollegala, and Naoaki Okazaki. Gender Bias in Masked Language Models for Multiple Languages. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), pages 2740–2750, Seattle, United States, July 2022. (doi: 10.18653/v1/2022.naacl-main.197)

URL Code DOI
Yu Pan, Zeyong Su, Ao Liu, Wang Jingquan, Nannan Li, and Zenglin Xu. A Unified Weight Initialization Paradigm for Tensorial Convolutional Neural Networks. In International Conference on Machine Learning (ICML), pages 17238–17257, Baltimore, Maryland, United States, July 2022.

URL
Won Ik Cho, Sangwhan Moon, Jongin Kim, Seokmin Kim, and Nam Soo Kim. StyleKQC: A Style-Variant Paraphrase Corpus for Korean Questions and Commands. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 7122–7128, Marseille, France, June 2022.

URL
Hwichan Kim, Sangwhan Moon, Naoaki Okazaki, and Mamoru Komachi. Learning How to Translate North Korean through South Korean. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 6711–6718, Marseille, France, June 2022.

URL
Sangwhan Moon, Won Ik Cho, Hye Joo Han, Naoaki Okazaki, and Nam Soo Kim. OpenKorPOS: Democratizing Korean Tokenization with Voting-Based Open Corpus Annotation. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 4975–4983, Marseille, France, June 2022.

URL
Sho Takase and Naoaki Okazaki. Multi-Task Learning for Cross-Lingual Abstractive Summarization. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 3008–3016, Marseille, France, June 2022.

URL
Yujin Takahashi, Masahiro Kaneko, Masato Mita, and Mamoru Komachi. ProQE: Proficiency-wise Quality Estimation dataset for Grammatical Error Correction. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 5994–6000, Marseille, France, June 2022.

URL
Masahiro Kaneko, Sho Takase, Ayana Niwa, and Naoaki Okazaki. Interpretability for Language Learners Using Example-Based Grammatical Error Correction. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 7176–7187, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.496)

URL Code DOI
Ao Liu, An Wang, and Naoaki Okazaki. Semi-Supervised Formality Style Transfer with Consistency Training. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 4689–4701, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.321)

URL Code DOI
Yi Zhou, Masahiro Kaneko, and Danushka Bollegala. Sense Embeddings are also Biased – Evaluating Social Biases in Static and Contextualised Sense Embeddings. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 1924–1935, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.135)

URL DOI
Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Word-level Perturbation Considering Word Length and Compositional Subwords. In Findings of the Association for Computational Linguistics: ACL 2022 (Findings of ACL), pages 3268–3275, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.findings-acl.258)

URL Code DOI
Sho Takase, Tatsuya Hiraoka, and Naoaki Okazaki. Single Model Ensemble for Subword Regularized Models in Low-Resource Machine Translation. In Findings of the Association for Computational Linguistics: ACL 2022 (Findings of ACL), pages 2536–2541, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.findings-acl.199)

URL DOI
Youmi Ma, Tatsuya Hiraoka, and Naoaki Okazaki. Joint Entity and Relation Extraction Based on Table Labeling Using Convolutional Neural Networks. In Proceedings of the Sixth Workshop on Structured Prediction for NLP (SPNLP), pages 11–21, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.spnlp-1.2)

URL Code DOI
Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zenan Zhai, Zubair Afzal, Trevor Cohn, Timothy Baldwin, and Karin Verspoor. The ChEMU 2022 Evaluation Campaign: Information Extraction in Chemical Patents. In European Conference on Information Retrieval (ECIR), pages 400–407, April 2022.
Masahiro Kaneko and Danushka Bollegala. Unmasking the Mask – Evaluating Social Biases in Masked Language Models. In Proceedings of the Thirty-Sixth AAAI Conference on Artificial Intelligence (AAAI), pages 11954–11962, Vancouver, BC, Canada, February 2022. (doi: 10.1609/aaai.v36i11.21453)

URL DOI
Qian Sun, Aili Shen, Hiyori Yoshikawa, Chunpeng Ma, Daniel Beck, Tomoya Iwakura, and Timothy Baldwin. Evaluating Hierarchical Document Categorisation. In Proceedings of the The 19th Annual Workshop of the Australasian Language Technology Association (ALTA), pages 179–184, December 2021.
Hiroki Iida and Naoaki Okazaki. Incorporating Semantic Textual Similarity and Lexical Matching for Information Retrieval. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 582–591, Shanghai, China, November 2021.

URL
Shota Koyama, Hiroya Takamura, and Naoaki Okazaki. Various Errors Improve Neural Grammatical Error Correction. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 251–261, Shanghai, China, November 2021.

URL
Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Overview of ChEMU 2021: Reaction Reference Resolution and Anaphora Resolution in Chemical Patents. In Experimental IR Meets Multilinguality, Multimodality, and Interaction: 12th International Conference of the CLEF Association (CLEF), September 2021. (doi: 10.1007/978-3-030-85251-1_20)

URL DOI
Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Extended Overview of ChEMU 2021: Reaction Reference Resolution and Anaphora Resolution in Chemical Patents. In Proceedings of the Working Notes of CLEF 2021, volume 2936, pages 693–709, September 2021.

URL
Kosuke Yamada, Yuta Hitomi, Hideaki Tamori, Ryohei Sasano, Naoaki Okazaki, Kentaro Inui, and Koichi Takeda. Transformer-based Lexically Constrained Headline Generation. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 4085–4090, Online and Punta Cana, Dominican Republic, November 2021. (doi: 10.18653/v1/2021.emnlp-main.335)

URL Code DOI
Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, and Naoaki Okazaki. Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction. In Proceedings of the 3rd Conference on Automated Knowledge Base Construction (AKBC), pages (19 pages), October 2021.

URL Slides
Hiyori Yoshikawa, Tomoya Iwakura, Kimi Kaneko, Hiroaki Yoshida, Yasutaka Kumano, Kazutaka Shimada, Rafal Rzepka, and Patrycja Swieczkowska. Tell Me What You Read: Automatic Expertise-Based Annotator Assignment for Text Annotation in Expert Domains. In Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2021), pages 1575–1585, Held Online, September 2021.

URL
Ayana Niwa, Keisuke Nishiguchi, and Naoaki Okazaki. Predicting Antonyms in Context using BERT. In Proceedings of the 14th International Conference on Natural Language Generation (INLG), pages 48–54, Aberdeen, Scotland, UK, August 2021.

URL
Keiji Yasuda, Ichiro Yamada, Naoaki Okazaki, Hideki Tanaka, Hidehiro Asaka, Takeshi Anzai, and Fumiaki Sugaya. Field Experiments of Real Time Foreign News Distribution Powered by MT. In Proceedings of Machine Translation Summit XVIII: Users and Providers Track (MT Summit), pages 227–232, Virtual, August 2021.

URL
Raj Dabre, Aizhan Imankulova, and Masahiro Kaneko. Studying The Impact Of Document-level Context On Simultaneous Neural Machine Translation. In Proceedings of the 18th Biennial Machine Translation Summit (Volume 1: Research Track) (MT Summit), pages 202–214, Virtual, August 2021.

URL
Hiyori Yoshikawa, Saber A. Akhondi, Camilo Thorne, Christian Druckenbrodt, Ralph Hoessel, Zenan Zhai, Jiayuan He, Timothy Baldwin, and Karin Verspoor. Chemical Reaction Reference Resolution in Patents. In Proceedings of the 2nd Workshop on on Patent Text Mining and Semantic Technologies, pages 10–17, July 2021.

URL
Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Joint Optimization of Tokenization and Downstream Model. In Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021 (Findings of ACL), pages 244–255, Online, August 2021. (doi: 10.18653/v1/2021.findings-acl.21)

URL Code DOI
Aomi Koyama, Kengo Hotate, Masahiro Kaneko, and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW), pages 126–135, Online, June 2021. (doi: 10.18653/v1/2021.naacl-srw.16)

URL Video DOI
Seiichiro Kondo, Kengo Hotate, Tosho Hirasawa, Masahiro Kaneko, and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW), pages 143–149, Online, June 2021. (doi: 10.18653/v1/2021.naacl-srw.18)

URL DOI
Sho Takase and Shun Kiyono. Rethinking Perturbations in Encoder-Decoders for Fast Training. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), pages 5767–5780, Online, June 2021. (doi: 10.18653/v1/2021.naacl-main.460)

URL DOI
Chunpeng Ma, Aili Shen, Hiyori Yoshikawa, Tomoya Iwakura, Daniel Beck, and Timothy Baldwin. On the (In)Effectiveness of Images for Text Classification. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 42–48, Online, April 2021. (doi: 10.18653/v1/2021.eacl-main.4)

URL DOI
Masahiro Kaneko and Danushka Bollegala. Debiasing Pre-trained Contextualised Embeddings. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 1256–1266, Online, April 2021.

URL Code
Masahiro Kaneko and Danushka Bollegala. Dictionary-based Debiasing of Pre-trained Word Embeddings. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 212–223, Online, April 2021. (doi: 10.18653/v1/2021.eacl-main.16)

URL Code DOI
Zhishen Yang and Naoaki Okazaki. Image Caption Generation for News Articles. In Proceedings of the 28th International Conference on Computational Linguistics (COLING), pages 1941–1951, Barcelona, Spain (Online), December 2020. (doi: 10.18653/v1/2020.coling-main.176)

URL Code DOI
Sho Takase and Sosuke Kobayashi. All Word Embeddings from One Embedding. In Proceedings of the 34th Conference on Neural Information Processing System (NeurIPS), pages 3775–3785, December 2020.

URL arXiv Code
Won Ik Cho, Sangwhan Moon, and Youngsook Song. Open Korean Corpora: A Practical Report. In Proceedings of Second Workshop for NLP Open Source Software (NLP-OSS), pages 85–93, Online, November 2020. (doi: 10.18653/v1/2020.nlposs-1.12)

URL DOI
Shin Kanouchi, Masato Neishi, Yuta Hayashibe, Hiroki Ouchi, and Naoaki Okazaki. You May Like This Hotel Because ...: Identifying Evidence for Explainable Recommendations. In Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing (AACL-IJCNLP), pages 890–899, Suzhou, China, December 2020.

URL
Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Optimizing Word Segmentation for Downstream Task. In Findings of the Association for Computational Linguistics: EMNLP 2020 (Findings of EMNLP), pages 1341–1351, Online, November 2020. (doi: 10.18653/v1/2020.findings-emnlp.120)

URL DOI
Won Ik Cho, Youngki Moon, Sangwhan Moon, Seok Min Kim, and Nam Soo Kim. Machines Getting with the Program: Understanding Intent Arguments of Non-Canonical Directives. In Findings of the Association for Computational Linguistics: EMNLP 2020 (Findings of EMNLP), pages 329–339, Online, November 2020. (doi: 10.18653/v1/2020.findings-emnlp.31)

URL DOI
Sangwhan Moon and Naoaki Okazaki. PatchBERT: Just-in-Time, Out-of-Vocabulary Patching. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 7846–7852, Online, November 2020. (doi: 10.18653/v1/2020.emnlp-main.631)

URL DOI
Wiem Ben Rim and Naoaki Okazaki. SWAGex at SemEval-2020 Task 4: Commonsense Explanation as Next Event Prediction. In Proceedings of the Fourteenth Workshop on Semantic Evaluation (SemEval), pages 422–429, Barcelona (online), December 2020.

URL
Zhishen Yang, Lars Wolfsteller, and Naoaki Okazaki. TextLearner at SemEval-2020 Task 10: A Contextualized Ranking System in Solving Emphasis Selection in Text. In Proceedings of the Fourteenth Workshop on Semantic Evaluation (SemEval), pages 1691–1697, Barcelona (online), December 2020.

URL
Emanuele Bugliarello, Sabrina J. Mielke, Antonios Anastasopoulos, Ryan Cotterell, and Naoaki Okazaki. It’s Easier to Translate out of English than into it: Measuring Neural Translation Difficulty by Cross-Mutual Information. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1640–1649, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.149)

URL DOI
Emanuele Bugliarello and Naoaki Okazaki. Enhancing Machine Translation with Dependency-Aware Self-Attention. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1618–1627, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.147)

URL DOI
Zixia Jia, Youmi Ma, Jiong Cai, and Kewei Tu. Semi-Supervised Semantic Dependency Parsing Using CRF Autoencoders. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 6795–6805, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.607)

URL DOI
Kazuki Matsumaru, Sho Takase, and Naoaki Okazaki. Improving Truthfulness of Headline Generation. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1335–1346, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.123)

URL DOI
Matsuno Shogo, Mizuki Sakae, and Sakaki Takeshi. Improved Advertisement Targeting via Fine-grained Location Prediction using Twitter. In Companion of The 2020 Web Conference 2020 (WWW), pages 527–532, Taipei, Taiwan, 2020. (doi: 10.1145/3366424.3382118)

URL DOI
Sangwhan Moon and Naoaki Okazaki. Jamo Pair Encoding: Subcharacter Representation-based Extreme Korean Vocabulary Compression for Efficient Subword Tokenization. In Proceedings of the 12th Language Resources and Evaluation Conference (LREC), pages 3490–3497, Marseille, France, May 2020.

URL
Sho Shimazu, Sho Takase, Toshiaki Nakazawa, and Naoaki Okazaki. Evaluation Dataset for Zero Pronoun in Japanese to English Translation. In Proceedings of the 12th Language Resources and Evaluation Conference (LREC), pages 3630–3634, Marseille, France, May 2020.

URL
Sakae Mizuki and Naoaki Okazaki. Analyzing the Variation Property of Contextualized Word Representations. In AI 2019: Advances in Artificial Intelligence, pages 393–405, December 2019. (doi: 10.1007/978-3-030-35288-2_32)

URL DOI
Yuichi Sasazawa, Sho Takase, and Naoaki Okazaki. Neural Question Generation using Interrogative Phrases. In Proceedings of the 12th International Conference on Natural Language Generation (INLG), pages 106–111, Tokyo, Japan, October 2019. (doi: 10.18653/v1/W19-8613)

URL DOI
Emanuele Bugliarello, Swayambhoo Jain, and Vineeth Rakesh. Matrix Completion in the Unit Hypercube via Structured Matrix Factorization. In Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI), pages 2038–2044, August 2019. (doi: 10.24963/ijcai.2019/282)

URL DOI
Tatsuya Hiraoka, Hiroyuki Shindo, and Yuji Matsumoto. Stochastic Tokenization with a Language Model for Neural Text Classification. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1620–1629, Florence, Italy, July 2019. (doi: 10.18653/v1/P19-1158)

URL DOI
Hayate Iso, Yui Uehara, Tatsuya Ishigaki, Hiroshi Noji, Eiji Aramaki, Ichiro Kobayashi, Yusuke Miyao, Naoaki Okazaki, and Hiroya Takamura. Learning to Select, Track, and Generate for Data-to-Text. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL), pages 2102–2113, Florence, Italy, July 2019. (doi: 10.18653/v1/P19-1202)

URL DOI
Sho Takase and Naoaki Okazaki. Positional Encoding to Control Output Sequence Length. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers) (NAACL), pages 3999–4004, Minneapolis, Minnesota, June 2019. (doi: 10.18653/v1/N19-1401)

URL DOI
Zhishen Yang, Sam Vijlbrief, and Naoaki Okazaki. TokyoTech_NLP at SemEval-2019 Task 3: Emotion-related Symbols in Emotion Detection. In Proceedings of the 13th International Workshop on Semantic Evaluation (SemEval), pages 350–354, Minneapolis, Minnesota, USA, June 2019. (doi: 10.18653/v1/S19-2061)

URL DOI
Sho Takase, Jun Suzuki, and Masaaki Nagata. Character n-gram Embeddings to Improve RNN Language Models. In Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence (AAAI), pages 5074–5082, January 2019.

arXiv
Shun Kiyono, Sho Takase, Jun Suzuki, Naoaki Okazaki, Kentaro Inui, and Masaaki Nagata. Reducing Odd Generation from Neural Headline Generation. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation (PACLIC), Hong Kong, December 2018.

URL
Kaori Abe, Yuichiroh Matsubayashi, Naoaki Okazaki, and Kentaro Inui. Multi-dialect Neural Machine Translation and Dialectometry. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation (PACLIC), Hong Kong, December 2018.

URL
Sho Takase, Jun Suzuki, and Masaaki Nagata. Direct Output Connection for a High-Rank Language Model. In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 4599–4609, Brussels, Belgium, October 2018. (doi: 10.18653/v1/D18-1489)

URL DOI
Shun Kiyono, Sho Takase, Jun Suzuki, Naoaki Okazaki, Kentaro Inui, and Masaaki Nagata. Unsupervised Token-wise Alignment to Improve Interpretation of Encoder-Decoder Models. In Proceedings of the 2018 EMNLP Workshop BlackboxNLP: Analyzing and Interpreting Neural Networks for NLP, pages 74–81, Brussels, Belgium, November 2018. (doi: 10.18653/v1/W18-5410)

URL DOI
Diana Galvan, Naoaki Okazaki, Koji Matsuda, and Kentaro Inui. Investigating the Challenges of Temporal Relation Extraction from Clinical Text. In Proceedings of the Ninth International Workshop on Health Text Mining and Information Analysis (Louhi), pages 55–64, Brussels, Belgium, October 2018. (doi: 10.18653/v1/W18-5607)

URL DOI
Akira Sasaki, Kazuaki Hanawa, Naoaki Okazaki, and Kentaro Inui. Predicting Stances from Social Media Posts using Factorization Machines. In Proceedings of the 27th International Conference on Computational Linguistics (COLING), pages 3381–3390, August 2018.

URL
Yuta Hitomi, Hideaki Tamori, Naoaki Okazaki, and Kentaro Inui. Proofread Sentence Generation as Multi-Task Learning with Editing Operation Prediction. In Proceedings of the Eighth International Joint Conference on Natural Language Processing (IJCNLP), pages 436–441, November 2017.

URL
Sosuke Kobayashi, Naoaki Okazaki, and Kentaro Inui. A Neural Language Model for Dynamically Representing the Meanings of Unknown Words and Entities in a Discourse. In Proceedings of the Eighth International Joint Conference on Natural Language Processing (IJCNLP), pages 473–483, November 2017.

URL
Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, and Kentaro Inui. A Crowdsourcing Approach for Annotating Causal Relation Instances in Wikipedia. In Proceedings of the 31st Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 336–345, November 2017.

URL
Shota Sasaki, Sho Takase, Naoya Inoue, Naoaki Okazaki, and Kentaro Inui. Handling Multiword Expressions in Causality Estimation. In IWCS 2017 — 12th International Conference on Computational Semantics — Short papers, pages (6 pages), 2017.

URL
Hideaki Tamori, Yuta Hitomi, Naoaki Okazaki, and Kentaro Inui. Analyzing the Revision Logs of a Japanese Newspaper for Article Quality Assessment. In Proceedings of the 2017 EMNLP Workshop: Natural Language Processing meets Journalism, pages 46–50, Copenhagen, Denmark, September 2017. (doi: 10.18653/v1/W17-4208)

URL DOI
Sho Yokoi, Daichi Mochihashi, Ryo Takahashi, Naoaki Okazaki, and Kentaro Inui. Learning Co-Substructures by Kernel Dependence Maximization. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI), pages 3329–3335, August 2017.

URL
Akira Sasaki, Kazuaki Hanawa, Naoaki Okazaki, and Kentaro Inui. Other Topics You May Also Agree or Disagree: Modeling Inter-Topic Preferences using Tweets and Matrix Factorization. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 398–408, Vancouver, Canada, July 2017. (doi: 10.18653/v1/P17-1037)

URL DOI

書籍

北川源四郎 (編), 竹村彰通 (編), 赤穂昭太郎, 今泉允聡, 内田誠一, 岡﨑直観, 清智也, 高野渉, 辻真吾, 原尚幸, 久野遼平, 松原仁, 宮地充子, 森畑明昌, 宿久洋. 応用基礎としてのデータサイエンス改訂第2版. 講談社, 2025年2月.

URL
岡崎直観, 荒瀬由紀, 鈴木潤, 鶴岡慶雅, 宮尾祐介. IT Text 自然言語処理の基礎. オーム社, 2022年8月.

URL
Henry Brighton, 岡崎直観（監訳）, 浅野ユカリ（翻訳）. 人工知能グラフィックガイド. ニュートンプレス, 2019年10月.

URL

解説記事

岡崎直観. 大規模言語モデル. 数理科学, 736:(to appear), 2024年10月.
水木栄. 「埋め込み表現の意味適応による知識ベース語義曖昧性解消」ができるまで. 自然言語処理, 30(3):1105–1109, 2023年9月. (doi: 10.5715/jnlp.30.1105)

URL DOI
馬尤咪. 「文書レベル関係抽出における根拠認識の統合」の完成まで. 自然言語処理, 30(3):1088–1093, 2023年9月. (doi: 10.5715/jnlp.30.1088)

URL DOI
岡崎直観. 大規模言語モデルの驚異と脅威 — ChatGPTの衝撃と大規模言語モデルの課題 —（特集　新時代の道具，ChatGPT：14の視点からその可能性を探る）. 情報処理, 64(9):e1–e3, 2023年9月.

URL
平岡達也. 単語分割の最適化に関する研究は雑談と偶然の出会いに育まれた. 自然言語処理, 29(2):688–693, 2022年6月. (doi: 10.5715/jnlp.29.688)

URL DOI
岡崎直観. 深層学習がもたらした自然言語処理研究の発展と変革. 電子情報通信学会誌, 105(5):397–400, 2022年5月.

URL
岡崎直観, 矢田勝俊. 研究会報告：国際シンポジウムJSAI International Symposia on AI 2020（JSAI-isAI 2020）開催報告. 人工知能, 36(3):374–376, 2021年5月. (doi: 10.11517/jjsai.36.3_374)

DOI
岡崎直観, 清野舜, 高橋諒, 横井祥. 言語処理100本ノック. 自然言語処理, 27(3):703–710, 2020年9月. (doi: 10.5715/jnlp.27.703)

DOI
坂本真樹, 岡崎直観. 国際シンポジウムJSAI International Symposia on AI 2019（JSAI-isAI 2019）開催報告. 人工知能, 35(2):282–285, 2020年3月. (doi: 10.11517/jjsai.35.2_282)

DOI
岡崎直観. ロボットジャーナリズムの現状と課題. 映像情報メディア学会誌, 72(2):70–75, 2018年3月. (doi: 10.3169/itej.72.212)

DOI
高瀬翔, 岡崎直観. 自然言語文からの関係知識ベースの構築. 知能と情報（日本知能情報ファジィ学会誌）, 29(2):55–64, 2017年4月. (doi: 10.3156/jsoft.29.2_55)

DOI
海野裕也, 岡崎直観, 西川仁, 中澤敏明. NLP 若手の会. 人工知能, 32(2):266–267, 2017年3月. (doi: 10.11517/jjsai.32.2_266)

DOI

招待講演 / 依頼講演

岡崎直観. 自ら進化する大規模言語モデル: LLMによるLLMのためのLLM開発. 画像の認識・理解シンポジウムMIRU2025 特別講演, 2025年7月.

URL
岡崎直観. 大規模言語モデルの開発. 情報処理学会連続セミナー2025「AIが拓く次世代イノベーション」, 2025年7月.

URL
岡崎直観. 大規模言語モデルはどこまで賢くなるのか？. 第15回東京科学大学ITクラブ・蔵前ITコミュニティ合同セミナー「AIの現状と未来」, 2025年7月.

URL
岡崎直観. 東京科学大学と産業技術総合研究所「Swallow」プロジェクト Gemma 2が拓く日本語LLMの未来. The Beyond Series: Research@Tokyo - Co-imagine the Future of Society with AI -, 2025年6月.

URL Video
岡崎直観, 金子正弘. 安全な大規模言語モデルの構築と利用を目指して. 2025年度人工知能学会全国大会（第39回）オーガナイズドセッション OS-42「大規模言語モデルの安全対策 ― 大いなる力には、大いなる責任が伴う」, 2025年5月.

URL
岡崎直観. 大規模言語モデルの発展. 2025年度人工知能学会全国大会（第39回）企画セッション KS-2「人工知能学会・日本神経回路学会合同企画「AI for Science」」, 2025年5月.

URL
岡崎直観. 日本語に特化した大規模言語モデルの現状と展望. 計測自動制御学会定時社員総会, 2025年3月.
岡崎直観. 大規模言語モデルはどのように「ことばの壁」を超えるのか. 第8回自動翻訳シンポジウム, 2025年2月.

URL
Naoaki Okazaki. Adapting Overseas Large Language Models to Japanese. 4th International Forum on Energy & Informatics, 2024年12月.

URL
岡崎直観. 大規模言語モデルの最前線と医療・ヘルスケアへの応用. CHUGAI INNOVATION DAY 2024, Session 1「生成AIが変えるヘルスケアの未来想像図」, 2024年11月.

URL
岡崎直観. 日本語に強い大規模言語モデルのレシピ. NVIDIA AI Summit Japan, 2024年11月.

URL Video
岡崎直観. 日本語に強い大規模言語モデルSwallowの構築. 第49回蔵前科学技術セミナー「AIの光と影」, 2024年11月.

URL
岡崎直観. マルチモーダル基盤モデルと教育への応用. 第82回大学等におけるオンライン教育とデジタル変革に関するサイバーシンポジウム, 2024年11月.

URL Video
岡崎直観. 基盤モデルの最先端と科学研究での活用. CBI学会2024年大会招待講演「LLMの最先端トピックス」, 2024年10月.

URL
丹波廣寅, 林達, 岡崎直観, 横田理央, 渡辺琢也. 日本における生成AI普及への挑戦〜国産LLMはどう貢献できるか (パネル討論). Generative AI Summit (GenAI/Sum): 生成AIが起こす “シン”産業革命, 2024年10月.

URL
Jetha Chan, Ju-yeong Ji, Naoaki Okazaki, Junbum Lee. Japanese and Korean developers share their experiences with Gemma (Fireside Chat). Gemma Developer Day in Tokyo, 2024年10月.

URL
Preslav Nakov, Noah Smith, Naoaki Okazaki, Sebastian Arnold. The Global View on (local) LLMs in US, Europe and Asia (Panel Discussion). Shonan Meeting 209: Empowering Local Open Source LLMs, 2024年10月.

URL
岡崎直観. マルチモーダルWG. LLMシンポジウム2024「大規模言語モデルのあるべき姿とは？」, 2024年9月.

URL
岡崎直観. 大規模言語モデルSwallowの現状と展望. 学術変革B「身体記号学」領域会議招待講演, 2024年9月.
岡崎直観. 大規模言語モデルSwallowの現状と展望. 第23回弁護士業務改革シンポジウム第１分科会「リーガルテクノロジーは弁護士業務をどう変えるか」, 2024年9月.

URL
岡崎直観. 大規模言語モデルの仕組みと生命医学分野での展望. 第34回日本心臓核医学会総会・学術大会シンポジウム2「人工知能による診断支援の可能性：機械学習・深層学習・大規模言語モデル」, 2024年6月.

URL
岡崎直観. 大規模言語モデルの開発. 2024年度人工知能学会全国大会（第38回）チュートリアル講演1, 2024年5月.

URL
岡崎直観. 大規模言語モデルの現状と展望. スマートニュースメディア研究所「AIと人間」研究会, 2024年5月.
Naoaki Okazaki. Foundation to Build LLMs. AI Open Innovation Day Japan 2024, 2024年5月.

URL
岡崎直観, 曽根岡侑也, 近江崇宏. 大規模言語モデル開発の最前線. 生成AIカンファレンスパネルディスカッション Vol. 1, 2024年5月.

URL
岡崎直観. 大規模言語モデルの仕組みと翻訳新時代. ATIS特許翻訳分科会, 2024年4月.
岡崎直観, 武藤まい, 早川健. 生成AIの現状とこれから日本、ＥＵ、その先へ. 第一東京弁護士会セミナー, 2024年3月.
岡崎直観. 自然言語処理の基礎. 言語処理学会第30回年次大会 (NLP2024) チュートリアルT1, 2024年3月.

URL
岡崎直観. 生成AIは創造の扉を開くのか～大規模言語モデルが産み出す新しい未来～. けいはんな「エジソンの会」第44回会合, 2024年1月.

URL
岡崎直観. 大規模言語モデルの進化の方向性・社会変革の可能性. 科学技術と経済の会 (JATES) 第27期・第3回代表者懇談会, 2023年12月.

URL
岡崎直観. 大規模言語モデルと科学研究. 第46回日本分子生物学会年会研究倫理委員会企画・研究倫理フォーラム, 2023年12月.

URL
岡崎直観. 生成AIの最前線と研究・開発の未来地図. GPU UNITE 2023 Day3: 生成AI Day, 2023年11月.

URL
岡崎直観. AIと共創する未来: 大規模言語モデルの開発、応用、そして私たちの役割. 2023年東工大メンバーシップ年次総会, 2023年10月.
岡崎直観. 改めて知りたい自然言語処理技術～ AI チャットボットは翻訳のプロから仕事を奪うのか. 第32回JTF翻訳祭, 2023年10月.

URL
岡崎直観, 辻井潤一, 松原仁, 樋口知之. 次世代AIの舵取り：進化するAI技術と未来への展望. データサイエンス協会10thシンポジウム〜データサイエンスの最前線〜, 2023年10月.

URL
岡崎直観. 大規模言語モデルの脅威. JEITAデバイス・ハードウェアセキュリティ技術分科会, 2023年9月.
岡崎直観. 大規模言語モデル — 言語モデルと自然言語処理のフロンティア. 2023年度統計関連学会連合大会, 2023年9月.

URL Slides
岡崎直観. 生成AIの仕組み・可能性・脅威. 2023年度蔵前工業会千葉県支部講演会, 2023年9月.

URL
金子正弘. 言語モデルの公平性. NLP若手の会 (YANS) 第18回シンポジウム, 2023年8月.

URL
岡崎直観. 自然言語生成の仕組みと最先端. 第6回機械学習工学研究会, MLSE夏合宿2023, 2023年6月.

URL
岡崎直観. ChatGPTをはじめとした生成AIとその社会実装について. 第７回政治家と科学者の対話の会（日本工学アカデミー政策共創推進委員会）, 2023年6月.

URL
Jun Suzuki, Kyosuke Nishida, Naoaki Okazaki. A Gentle Introduction to Technologies Behind Language Models and Recent Achievement in ChatGPT. Tutorial 2, the 27nd Pacific-Asia Conference on Knowledge Discovery and Data Mining, PAKDD, 2023年5月.

URL Slides
岡崎直観. 大規模言語モデルの驚異と脅威. 2022年度AIPシンポジウム成果報告会, 2023年3月.

URL Slides Video
岡崎直観. 大規模言語モデルの進展. JDLA緊急企画「生成AIの衝撃」〜ChatGPTで世界はどう変わるのか？〜, 2023年3月.

URL
岡崎直観. 自然言語処理技術の最先端. 第一東京弁護士会 100周年記念講演会, 2023年2月.
岡崎直観. 自然言語生成における内容の制御. 第14回産業日本語研究会・シンポジウム（パネリスト講演）, 2023年2月.

URL
岡崎直観. 近傍の事例を活用したニューラル言語生成. NAIST DSC NLP Seminar 2022 Summer, 2022年9月.

URL
Naoaki Okazaki. Towards controllable, faithful, and explainable text generation. Advances in Data Science and AI Conference 2022 (ADSAI 2022), 2022年6月.

URL
丹羽彩奈. 自然言語生成におけるテンプレートの導出と活用. 人工知能学会合同研究会2021 第118回人工知能基本問題研究会, 2021年11月.

URL
岡崎直観. 自然言語生成の現状と展望. 第41回医療情報学連合大会（第22回日本医療情報学会学術大会）共同企画セッション「医学医療におけるAI応用」, 2021年11月.

URL
岡崎直観. AIによる言語処理の革命. 第4回自動翻訳シンポジウム〜自動翻訳と翻訳バンク〜, 2021年3月.

URL
岡崎直観. 深層ニューラルネットワークによる自然言語生成の制御. 日本大学人工知能ソサイエティ（NUAIS）設立シンポジウム, 2021年3月.

URL
Naoaki Okazaki. Neural Machine Translation and Summarization for News. International Workshop on Speech to Speech Machine Translation (IWSSMT), 2020年11月.

URL
丹羽彩奈. NeurIPS 2019における自然言語処理. 第78回人工知能セミナー AIトレンド・トップカンファレンス報告（NeurIPS 2019報告会）, 2020年4月.

Slides Video
岡崎直観. 自然言語処理によるニュース記事執筆の現状と課題. 第11回産業日本語研究会・シンポジウム（COVID-19のため中止）, 2020年3月.

URL
岡崎直観. 深層学習はなぜ重宝されるのか ― 自然言語処理の場合. 応用物理学会有機分子・バイオエレクトロニクス分科会講習会「情報技術と有機分子・バイオエレクトロニクス～機器制御からAI活用まで～」, 2019年11月.

URL
高瀬翔. ニューラル言語モデルの研究動向. 第240回自然言語処理研究会, 2019年6月.

URL
岡崎直観. 深層学習による自然言語処理の現状と展望. 第40回蔵前科学技術セミナー「最新の情報理工学とは」〜 AI、ビッグデータ、サイバーセキュリティは未来をどう変えるのか？〜, 2019年2月.

URL
岡崎直観. 自然言語処理の現状と展望. 応用脳科学アカデミー応用脳科学アドバンスコース「脳と人工知能・ロボット」第3回, 2019年1月.

URL
Naoaki Okazaki. Towards Natural Language Processing that Understands Context. AI Shooting Stars Session, Artificial Intelligence — International Research and Applications: 1st Japanese-German-French DWIH Symposium, 2018年11月.

URL
Naoaki Okazaki. How Deep Learning Changes Natural Language Processing. Fourth Asia Pacific Corpus Linguistics Conference (APCLC 2018), 2018年9月.

URL
岡崎直観. ウェブからの知識獲得と意見分析. 第131回情報基礎とアクセス技術研究発表会, 2018年7月.

URL
Naoaki Okazaki. Bridging Knowledge and Text with Deep Neural Networks. Second International Workshop on Symbolic-Neural Learning (SNL-2018), 2018年7月.

URL
岡崎直観. 自然言語による状況理解. 第24回画像センシングシンポジウム, OS2: マルチモーダル深層学習：画像認識を越えて広がる世界～画像・自然言語・音声の共創～, 2018年6月.

URL
岡崎直観. 自然言語処理による議論マイニング. 2018年度人工知能学会全国大会 (第32回), OS-28 複雑化社会における意思決定・合意形成のためのAI技術, 2018年6月.

URL
Naoaki Okazaki. Generating Text with Deep Neural Networks. Deep Learning: Theory, Algorithms, and Applications, 2018年3月.

URL
岡崎直観. エンコーダ・デコーダモデルによるテキスト生成. 第211回情報処理学会コンピュータビジョンとイメージメディア（ＣＶＩＭ）研究会, 2018年3月.

URL
岡崎直観. 自然言語処理における深層学習の進展. 豊橋技術科学大学先端データサイエンス講演会, 2018年1月.

URL
岡崎直観. 深層学習の自然言語処理への応用. 情報処理学会連続セミナー2017 第4回：ディープラーニングの活用と基盤, 2017年10月.

URL
岡崎直観. 自然言語処理を支える大規模計算資源. 第２回データサイエンス支援サービスシンポジウム, 2017年6月.

URL
岡崎直観. 自然言語処理におけるDeep Learning. 電子情報通信学会総合大会 2017 企画セッション「もっと知りたい！ Deep Learning ～基礎から活用まで～」, 2017年3月.

URL

口頭発表

服部翔, 水木栄, 藤井一喜, 中村泰士, 塩谷泰平, 植田快, 新妻巧朗, 川畑輝, 田森秀明, Youmi Ma, 前田航希, 大井聖也, 齋藤幸史郎, 岡本拓己, 石田茂樹, 横田理央, 高村大也, 岡崎直観. 新聞記事からつくる時事と社会に強い日本語LLM. 言語処理学会第31回年次大会 (NLP2025), C10-1, pp. 3948–3953, 2025年3月.

URL
Youmi Ma, 水木栄, 藤井一喜, 中村泰士, 大井聖也, 島田比奈理, 塩谷泰平, 齋藤幸史郎, 前田航希, 服部翔, 岡本拓己, 石田茂樹, 横田理央, 高村大也, 岡崎直観. 模倣学習による大規模言語モデルの指示チューニング. 言語処理学会第31回年次大会 (NLP2025), Q8-21, pp. 3446–3451, 2025年3月.

URL
島田比奈理, 金子正弘, 岡崎直観. Jailbreakにより生成したフェイクニュースの危険度評価. 言語処理学会第31回年次大会 (NLP2025), P7-18, pp. 2867–2872, 2025年3月.

URL
大葉大輔, 金子正弘, Danushka Bollegala, 岡崎直観. 大規模言語モデルの多言語社会的バイアス抑制における単言語ラベル付きデータの役割. 言語処理学会第31回年次大会 (NLP2025), P7-11, pp. 2826–2831, 2025年3月.

URL
齋藤幸史郎, 小池隆斗, 金子正弘, 岡崎直観. PUPPET：タスク性能を維持しながらLLMとして検出されやすくする学習フレームワーク. 言語処理学会第31回年次大会 (NLP2025), P7-5, pp. 2791–2796, 2025年3月.

URL
杉野かおり, 山野陽祐, 河崎真琴, 田森秀明, 岡崎直観, 乾健太郎. SOMO: 音声認識出力の可読性向上を目的とした整文手法の提案. 言語処理学会第31回年次大会 (NLP2025), C7-1, pp. 2686–2691, 2025年3月.

URL
大南英理, 宮西大樹, 前田航希, 栗田修平. 多言語での判例事実概要からの法的関係性のグラフ可視化. 言語処理学会第31回年次大会 (NLP2025), B7-4, pp. 2669–2674, 2025年3月.

URL
植木快, 川畑輝, 田口雄哉, 新妻巧朗, 浦川通, 田森秀明, 岡崎直観, 乾健太郎. 時事情報に関する日本語QAベンチマーク『ニュースQ』. 言語処理学会第31回年次大会 (NLP2025), Q6-24, pp. 2606–2611, 2025年3月.

URL
趙信, 吉永直樹, 大葉大輔. Tracing the Roots of Facts in Multilingual Language Models: Independent, Shared, and Transferred Knowledge. 言語処理学会第31回年次大会 (NLP2025), A5-3, pp. 1763–1768, 2025年3月.

URL
杉浦一瑳, 栗田修平, 小田悠介, 河原大輔, 岡崎直観. オープンLLMによる翻訳を活用した日本語CLIPの開発. 言語処理学会第31回年次大会 (NLP2025), C4-6, pp. 1421–1426, 2025年3月.

URL
前田航希, 杉浦一瑳, 小田悠介, 栗田修平, 岡崎直観. llm-jp-eval-mm: 日本語視覚言語モデルの自動評価基盤. 言語処理学会第31回年次大会 (NLP2025), Q3-23, pp. 1303–1308, 2025年3月.

URL
遠藤洸亮, 脇本宏平, 宮西洋輔, 岡崎直観. バナー広告における画像と広告コピーの評価ベンチマーク構築. 言語処理学会第31回年次大会 (NLP2025), Q3-9, pp. 1225–1230, 2025年3月.

URL
村岡雅康, 岡崎直観. 視覚言語モデルの識別性能に関する評価用ベンチマークの構築. 言語処理学会第31回年次大会 (NLP2025), Q3-4, pp. 1196–1201, 2025年3月.

URL
笹川慶人, 前田航希, 杉浦一瑳, 栗田修平, 岡崎直観, 河原大輔. LLM-jp-3 VILA: 日本語マルチモーダルデータセット及び強力な日本語マルチモーダルモデルの構築. 言語処理学会第31回年次大会 (NLP2025), Q3-2, pp. 1185–1190, 2025年3月.

URL
大井聖也, 金子正弘, 岡崎直観, 井上中順. 複数タスク・複数項目に跨ったマルチモーダル自動評価手法. 言語処理学会第31回年次大会 (NLP2025), C3-4, pp. 970–975, 2025年3月.

URL
高橋侑成, Youmi Ma, 金子正弘, 岡崎直観. 大規模言語モデルはデータ漏洩を隠蔽できるのか. 言語処理学会第31回年次大会 (NLP2025), A3-1, pp. 887–892, 2025年3月.

URL
Panatchakorn Anantaprayoon, 金子正弘, 岡崎直観. Mitigating Social Bias in Large Language Models by Self-Correction. 言語処理学会第31回年次大会 (NLP2025), Q2-22, pp. 863–868, 2025年3月.

URL
服部翔, 岡崎直観, 水木栄, 藤井一喜, 中村泰士, 大井聖也, 塩谷泰平, 齋藤幸史郎, Youmi Ma, 前田航希, 岡本拓己, 石田茂樹, 横田理央, 高村大也. Swallowコーパスv2: 教育的な日本語ウェブコーパスの構築. 言語処理学会第31回年次大会 (NLP2025), C1-5, pp. 94–99, 2025年3月.

URL
前田航希, 長谷川騎平, 栗田修平, 小田悠介, 徳久良子, 岡崎直観. 日本の文化常識・日常生活知識理解のための視覚言語ベンチマーク MECHA-Ja の構築. 情報処理学会第263回自然言語処理研究会研究報告 (2024-NL-263), 28, pp. 1–7, 2025年3月.

URL
高橋侑成, 馬尤咪, 金子正弘, 岡崎直観. 大規模言語モデルに対する漏洩検出への敵対的なデータ隠蔽. 第19回YANSシンポジウム (YANS2024), S4-P22, 2024年9月.

URL
服部翔, 水木栄, 藤井一喜, 中村泰士, 大井聖也, 馬尤咪, 前田航希, 塩谷泰平, 齋藤幸史郎, 岡本拓己, 石田茂樹, 横田理央, 高村大也, 岡崎直観. 小規模で高性能なLLMのための高品質事前学習Webコーパスの構築. 第19回YANSシンポジウム (YANS2024), S3-P33, 2024年9月.

URL
赤部晃一, 前田航希, 栗田修平, 小田悠介. ESG情報抽出データセットの検討. 第19回YANSシンポジウム (YANS2024), S3-P22, 2024年9月.

URL
大井聖也, 金子正弘, 岡崎直観, 井上中順. マルチモーダルモデル自動評価のための複数タスク・複数基準評価データセット. 第19回YANSシンポジウム (YANS2024), S1-P28, 2024年9月.

URL
塩谷泰平, 金子正弘, 岡崎直観. 大規模言語モデルによる日本文化に沿った指示データ生成. 第19回YANSシンポジウム (YANS2024), S1-P25, 2024年9月.

URL
齋藤幸史郎, 小池隆斗, 金子正弘, 岡崎直観. 強化学習を用いた、言語理解能力を維持したLLM検出器の性能向上. 第19回YANSシンポジウム (YANS2024), S1-P23, 2024年9月.

URL
齋藤幸史郎, 水木栄, 大井聖也, 中村泰士, 塩谷泰平, 前田航希, 馬尤咪, 服部翔, 藤井一喜, 岡本拓己, 石田茂樹, 高村大也, 横田理央, 岡崎直観. LLMに日本語テキストを学習させる意義. 情報処理学会第261回自然言語処理研究会研究報告 (2024-NL-261), 12, pp. 1–15, 2024年9月.

URL
加藤靖久, 金子正弘, 岡崎直観. 多言語プロンプト: 低資源言語での多言語例を用いたfew-shot推論. 2024年度人工知能学会全国大会 (JSAI2024), pp. 4Xin2110-4Xin2110, 2024年5月. (doi: 10.11517/pjsai.JSAI2024.0_4Xin2110)

DOI
栗原健太郎, 三田雅人, 張培楠, 佐々木翔大, 石上亮介, 岡崎直観. LCTG Bench: 日本語LLMの制御性ベンチマークの構築. 言語処理学会第30回年次大会 (NLP2024), D11-2, pp. 3113–3118, 2024年3月.

URL
大井聖也, 金子正弘, 小池隆斗, Mengsay Loem, 岡崎直観. 大規模言語モデルにおける評価バイアスの尤度に基づく緩和. 言語処理学会第30回年次大会 (NLP2024), A11-4, pp. 3021–3026, 2024年3月.

URL
綿祐貴, 金子正弘, Youmi Ma, 岡崎直観. 大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃. 言語処理学会第30回年次大会 (NLP2024), A11-3, pp. 3015–3020, 2024年3月.

URL
平岡達也, 岡崎直観. 事前学習済みの分散表現は表層的な知識を獲得しているか. 言語処理学会第30回年次大会 (NLP2024), P10-6, pp. 2880–2885, 2024年3月.

URL
Mengsay Loem, 金子正弘, 岡崎直観. 敵対的発言を取り入れた議論による言語モデルの学習強化と推論力の向上. 言語処理学会第30回年次大会 (NLP2024), B10-6, pp. 2750–2755, 2024年3月.

URL
藤井一喜, 中村泰士, Mengsay Loem, 飯田大貴, 大井聖也, 服部翔, 平井翔太, 水木栄, 横田理央, 岡崎直観. 継続事前学習による日本語に強い大規模言語モデルの構築. 言語処理学会第30回年次大会 (NLP2024), A8-5, pp. 2102–2107, 2024年3月.

URL
Zhishen Yang, Tosho Hirasawa, Edison Marrese-Tyalor, Naoaki Okazaki. Large Language Models as Manga Translators: A Case Study. 言語処理学会第30回年次大会 (NLP2024), P7-13, pp. 2012–2017, 2024年3月.

URL
前田航希, 栗田修平, 宮西大樹, 岡崎直観. 視覚的文脈を利用した視覚言語モデルによる画像キャプション生成自動評価手法. 言語処理学会第30回年次大会 (NLP2024), P7-10, pp. 1996–2001, 2024年3月.

URL
丹羽彩奈, 磯颯. AmbiNLG: 自然言語生成のための指示テキストの曖昧性解消. 言語処理学会第30回年次大会 (NLP2024), A7-6, pp. 1809–1814, 2024年3月.

URL
水木栄, 飯田大貴, 藤井一喜, 中村泰士, Mengsay Loem, 大井聖也, 服部翔, 平井翔太, 横田理央, 岡崎直観. 大規模言語モデルの日本語能力の効率的な強化: 継続事前学習における語彙拡張と対訳コーパスの活用. 言語処理学会第30回年次大会 (NLP2024), A6-4, pp. 1514–1519, 2024年3月.

URL
岡崎直観, 服部翔, 平井翔太, 飯田大貴, 大井聖也, 藤井一喜, 中村泰士, Mengsay Loem, 横田理央, 水木栄. Swallowコーパス: 日本語大規模ウェブコーパス. 言語処理学会第30回年次大会 (NLP2024), A6-1, pp. 1498–1503, 2024年3月.

URL
古山翔太, 永田亮, 高村大也, 岡崎直観. 文法誤り訂正の自動評価のための原文・参照文・訂正文間のN-gram F-score. 言語処理学会第30回年次大会 (NLP2024), P4-25, pp. 1198–1203, 2024年3月.

URL
小池隆斗, 金子正弘, 岡崎直観. 制約が異なる指示で生成された文章に対するLLM生成検出の頑健性. 言語処理学会第30回年次大会 (NLP2024), A4-4, pp. 943–948, 2024年3月.

URL
Youmi Ma, An Wang, 岡崎直観. 言語横断ラベル射影を用いた日本語文書レベル関係抽出データセットの構築. 言語処理学会第30回年次大会 (NLP2024), P3-4, pp. 783–788, 2024年3月.

URL
小池隆斗, 金子正弘, 岡崎直観. 敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出. 第18回NLP若手の会シンポジウム, S3-P13, 2023年8月.
Youmi Ma, An Wang, 岡崎直観. 日本語文書レベル関係抽出コーパスの構築. 第18回NLP若手の会シンポジウム, S5-P19, 2023年8月.
平井翔太, 村岡雅康, 岡崎直観. 割り当て画像の多様性を考慮したVokenizationによるマスク言語モデルの改善. 2023年度人工知能学会全国大会 (JSAI2023), 4Xin1-38, pp. (4 pages), 2023年6月. (doi: 10.11517/pjsai.JSAI2023.0_4Xin138)

DOI
丹羽彩奈, 岡崎直観. 事前学習済みモデルT5における近傍分布の有効性の調査. 言語処理学会第29回年次大会 (NLP2023), P12-6, pp. 3048–3053, 2023年3月.

URL
前田航希, 栗田修平, 宮西大樹. QuIC-360◦: 360◦ 画像に対するクエリ指向画像説明文生成のためのデータセット構築. 言語処理学会第29回年次大会 (NLP2023), H12-5, pp. 3013–3018, 2023年3月.

URL
浦川通, 新妻巧朗, 田口雄哉, 田森秀明, 岡崎直観, 乾健太郎. 短歌における言語モデルの実応用–歌人の視点を通した生成と作歌支援の実践から–. 言語処理学会第29回年次大会 (NLP2023), P11-6, pp. 2779–2784, 2023年3月.

URL
谷口大輔, 脇本宏平, 丹羽彩奈, 岡崎直観. 大規模言語モデルにおける文生成方向に関する依存性の検証. 言語処理学会第29回年次大会 (NLP2023), H9-1, pp. 2200–2205, 2023年3月.

URL
中本裕大, 瀬在恭介, 元川凱喜, 麻生英樹, 岡崎直観. 日本語大規模言語モデルにおける知識グラフを活用した意味理解性能の向上. 言語処理学会第29回年次大会 (NLP2023), B9-4, pp. 2140–2145, 2023年3月.

URL
Mengsay Loem, 高瀬翔, 金子正弘, 岡崎直観. マルチヘッドニューラルN-gramによる自己注意機構の代替. 言語処理学会第29回年次大会 (NLP2023), A9-1, pp. 2094–2099, 2023年3月.

URL
西田京介, 長谷川拓, 前田航希, 齋藤邦子. DueT: 視覚・言語のDual-adapter Tuningによる基盤モデル. 言語処理学会第29回年次大会 (NLP2023), B7-3, pp. 1586–1591, 2023年3月.

URL
Trang Nguyen, Naoaki Okazaki. DAS-VQA: Dual Awareness Systems for Improving Generalization in Visual Question Answering. 言語処理学会第29回年次大会 (NLP2023), B7-1, pp. 1574–1579, 2023年3月.

URL
Panatchakorn Anantaprayoon, 金子正弘, 岡崎直観. 下流タスクでの日本語事前学習モデルの性別バイアスの評価. 言語処理学会第29回年次大会 (NLP2023), A7-3, pp. 1563–1568, 2023年3月.

URL
服部翔, Youmi Ma, 岡崎直観. クエリ指向要約におけるクエリと要約の統合的な生成. 言語処理学会第29回年次大会 (NLP2023), H5-2, pp. 1244–1249, 2023年3月.

URL
金子正弘, Graham Neubig, 岡崎直観. 人間とシステムの議論に基づくNLPタスクの問題に対する予測. 言語処理学会第29回年次大会 (NLP2023), H4-5, pp. 979–983, 2023年3月.

URL
水木栄, 岡崎直観. 埋め込み表現の意味適応による知識ベース語義曖昧性解消. 言語処理学会第29回年次大会 (NLP2023), C3-1, pp. 622–627, 2023年3月.

URL
Youmi Ma, An Wang, 岡崎直観. 文書レベル関係抽出における根拠認識の統合. 言語処理学会第29回年次大会 (NLP2023), B3-3, pp. 605–610, 2023年3月.

URL
Zhishen Yang, Raj Dabre, Hideki Tanaka, Naoaki Okazaki. Knowledge-Augmented Figure Caption Generation. 言語処理学会第29回年次大会 (NLP2023), P2-9, pp. 460–465, 2023年3月.

URL
遠藤洸亮, Zhishen Yang, 岡崎直観. 画像キャプション生成におけるJPEG圧縮への頑健性の改善. 言語処理学会第29回年次大会 (NLP2023), P2-2, pp. 419–424, 2023年3月.

URL
飯田大貴, 岡崎直観. 事前学習済みモデルに基づく検索モデルにおけるドメイン適応手法の比較と相乗効果の検証. 言語処理学会第29回年次大会 (NLP2023), P1-9, pp. 176–181, 2023年3月.

URL
飯田大貴, 岡崎直観. 疎ベクトル検索における語彙と単語頻度のギャップ解消を通じた教師なしドメイン適合. 第17回NLP若手の会シンポジウム, P4-08, 2022年8月.
馬尤咪, 王安, 岡崎直観. 文書レベル関係抽出における人間と注意機構の根拠文の対応付け. 第17回NLP若手の会シンポジウム, P2-03, 2022年8月.
古山翔太, 永田亮, 高村大也, 岡崎直観. 日本語誤り訂正のための誤り区間と誤り種類の自動アノテーションに向けて. 第17回NLP若手の会シンポジウム, P4-09, 2022年8月.
Mengsay Loem, 高瀬翔, 岡崎直観. Are Neighbors Enough? Multi-Head Neural n-gram can be Alternative to Self-attention. 第17回NLP若手の会シンポジウム, P5-07, 2022年8月.
谷口大輔, 脇本宏平, 黒田和矢, 川本峻頌, 西口佳佑, 丹羽彩奈, 岡崎直観. 商品レビューと商品特徴を用いた広告文制作支援. 2022年度人工知能学会全国大会 (JSAI2022), 3Yin2-07, pp. (4 pages), 2022年6月. (doi: 10.11517/pjsai.JSAI2022.0_3Yin207)

DOI
植木滉一郎, 平岡達也, 岡崎直観. 記事に忠実ではない訓練事例も活用した見出し生成モデルの忠実性の改善法. 言語処理学会第28回年次大会 (NLP2022), pp. 2002–2007, 2022年3月.

URL
平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観. 単語の長さと構成要素を考慮した単語レベルの摂動. 言語処理学会第28回年次大会 (NLP2022), pp. 1455–1460, 2022年3月.

URL
前田航希, 金子正弘, 岡崎直観. IMPARA: パラレルデータにおける修正の影響度に基づいた文法誤り訂正の自動評価法. 言語処理学会第28回年次大会 (NLP2022), pp. 328–333, 2022年3月.

URL
吉川和, 岡崎直観. 確信度を考慮した言語モデルの関係知識評価. 言語処理学会第28回年次大会 (NLP2022), pp. 532–537, 2022年3月.

URL
Loem Mengsay, 高瀬翔, 金子正弘, 岡崎直観. 抽出型要約と言い換えによる生成型要約の訓練データ拡張. 言語処理学会第28回年次大会 (NLP2022), pp. 1996–2001, 2022年3月.

URL
Youmi Ma, 平岡達也, 岡崎直観. 畳み込みニューラルネットワークを用いた表ラベリングによる固有表現認識と関係抽出 . 言語処理学会第28回年次大会 (NLP2022), pp. 1197–1202, 2022年3月.

URL
石川遼伍, 丹羽彩奈, 水木栄, 岡崎直観. 疑似訓練データによる格助詞の省略に頑健な係り受け解析. 言語処理学会第28回年次大会 (NLP2022), pp. 1808–1813, 2022年3月.

URL
丹羽彩奈, 高瀬翔, 岡崎直観. 近傍の事例を用いた非自己回帰生成. 言語処理学会第28回年次大会 (NLP2022), pp. 1306–1311, 2022年3月.

URL
嘉田紗世, 山野陽祐, 新美茜, 田森秀明, 小海則人, 岡崎直観, 乾健太郎. 動画タイトルを用いたサムネイル画像の自動選択手法の提案. 言語処理学会第28回年次大会 (NLP2022), pp. 1366–1370, 2022年3月.

URL
浦川通, 新妻巧朗, 田口雄哉, 田森秀明, 岡崎直観, 乾健太郎. モーラを考慮したFine-tuningによる口語短歌生成. 言語処理学会第28回年次大会 (NLP2022), pp. 1328–1332, 2022年3月.

URL
高瀬翔, 清野舜, 小林颯介, 鈴木潤. Transformerを多層にする際の勾配消失問題と解決法について. 言語処理学会第28回年次大会 (NLP2022), pp. 173–178, 2022年3月.

URL
小山碧海, 金子正弘, 小町守. 学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析. 第16回NLP若手の会シンポジウム, P1-04, 2021年8月.
蘆田真奈, 金子正弘, 平澤寅庄, 小町守. QAタスクにおけるGPTの性差別的バイアスの評価及びプロンプトを用いたバイアス除去手法の検討. 第16回NLP若手の会シンポジウム, P2-02, 2021年8月.
丹羽彩奈, 松田寛. 個人間の感情理解の揺れを考慮した感情分析に向けた試み. 2021年度人工知能学会全国大会 (JSAI2021), pp. (4 pages), 2021年6月. (doi: pjsai.JSAI2021.0_2Yin506)

DOI
水木栄, 岡崎直観. 階層コード表現を用いた上位下位関係の識別. 言語処理学会第27回年次大会 (NLP2021), pp. 1236–1241, 2021年3月.

URL
平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観. 後段モデルの損失値を用いた単語分割のタスクへの最適化. 言語処理学会第27回年次大会 (NLP2021), pp. 486–491, 2021年3月.

URL
丹羽彩奈, 西口佳佑, 岡崎直観. 文脈を考慮した対義語穴埋め. 言語処理学会第27回年次大会 (NLP2021), pp. 1702–1707, 2021年3月.

URL
笹沢裕一, 岡崎直観. 属性情報を追加した事前学習済みモデルのファインチューニング. 言語処理学会第27回年次大会 (NLP2021), pp. 765–770, 2021年3月.

URL
昇夏海, 平岡達也, 丹羽彩奈, 西口佳佑, 岡崎直観. 企業情報を考慮したキャッチコピーの自動生成. 言語処理学会第27回年次大会 (NLP2021), pp. 450–454, 2021年3月.

URL
Youmi Ma, 平岡達也, 岡崎直観. BERTを用いたTable-Fillingによる固有表現抽出と関係抽出. 言語処理学会第27回年次大会 (NLP2021), pp. 1274–1279, 2021年3月.

URL
古山翔太, 高村大也, 岡崎直観. ニューラル文法誤り訂正のための多様な規則を用いる人工誤り生成. 言語処理学会第27回年次大会 (NLP2021), pp. 1017–1022, 2021年3月.

URL
高瀬翔, 清野舜. エンコーダ・デコーダの学習に効果的な摂動の調査. 言語処理学会第27回年次大会 (NLP2021), pp. 1391–1396, 2021年3月.

URL
那須川哲哉, 鈴木祥子, 村岡雅康, 平野真理. コロナ禍の状況を自由記述文で記録し分析する試み. 言語処理学会第27回年次大会 (NLP2021), pp. 585–589, 2021年3月.

URL
金山博, 岩本蘭, 村岡雅康, 大湖卓也, 宮本晃太郎. 名詞句の処理に頑健な構文解析器. 言語処理学会第27回年次大会 (NLP2021), pp. 492–496, 2021年3月.

URL
山田康輔, 人見雄太, 田森秀明, 岡崎直観, 乾健太郎. 指定語句を確実に含む見出し生成. 言語処理学会第27回年次大会 (NLP2021), pp. 1070–1074, 2021年3月.

URL
叶内晨, 根石将人, 林部祐太, 大内啓樹, 岡崎直観. 宿の推薦根拠説明システムにおける魅力度の考慮と実用を見据えた評価. 言語処理学会第27回年次大会 (NLP2021), pp. 461–465, 2021年3月.

URL
Yuichi Sasazawa, Naoaki Okazaki. WER99 at the NTCIR-15 QA Lab-PoliInfo-2 Classification Task. NTCIR-15, pp. 124–129, 2020年12月.

URL
丹羽彩奈, 西口佳佑, 岡﨑直観. マスク言語モデルを用いた対句キャッチコピー生成. 第15回NLP若手の会シンポジウム, 2020年8月.
昇夏海, 平岡達也, 丹羽彩奈, 岡﨑直観, 脇本宏平, 黒田和矢, 西口佳佑. 企業情報を考慮した広告文の自動生成. 第15回NLP若手の会シンポジウム, 2020年8月.
Zhishen Yang, Naoaki Okazaki. News Image Caption Generation. 第34回人工知能学会全国大会 (JSAI2020), pp. (4 pages), 2020年6月. (doi: 10.11517/pjsai.JSAI2020.0_2D1GS905)

DOI
丹羽彩奈, 脇本宏平, 西口佳佑, 毛利真崇, 岡崎直観. 単語の対応関係を利用したスパン候補の絞り込みによるキャッチコピーの対句構造解析. 第34回人工知能学会全国大会 (JSAI2020), pp. (4 pages), 2020年6月. (doi: 10.11517/pjsai.JSAI2020.0_1E5GS901)

DOI
人見雄太, 田口雄哉, 田森秀明, 岡崎直観, 乾健太郎. 小規模リソースにおける生成型要約のためのスタイル転移. 言語処理学会第26回年次大会 (NLP2020), pp. 929–932, 2020年3月.

URL
叶内晨, 根石将人, 林部祐太, 岡崎直観. 旅行情報サイトのレビューを用いた抽象的な要求に対する根拠付き推薦文の生成. 言語処理学会第26回年次大会 (NLP2020), pp. 29–32, 2020年3月.

URL
陳宏, 西田典起, 朱中元, 岡崎直観, 中山英樹. RST Discourse Structure Improves Story Ending Generation. 言語処理学会第26回年次大会 (NLP2020), pp. 21–24, 2020年3月.

URL
高瀬翔, 岡崎直観. 翻訳と見出し文生成の同時学習による言語横断見出し文生成モデル. 言語処理学会第26回年次大会 (NLP2020), pp. 1471–1474, 2020年3月.

URL
平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観. RNNにより高次の依存を考慮したニューラル隠れマルコフモデル. 言語処理学会第26回年次大会 (NLP2020), pp. 1332–1335, 2020年3月.

URL
松丸和樹, 高瀬翔, 岡崎直観. 見出し生成の忠実性の改善. 言語処理学会第26回年次大会 (NLP2020), pp. 933–936, 2020年3月.

URL
丹羽彩奈, 脇本宏平, 西口佳佑, 毛利真崇, 岡崎直観. キャッチコピーにおける対句構造の解析. 言語処理学会第26回年次大会 (NLP2020), pp. 601–604, 2020年3月.

URL
平岡達也, 高瀬翔, 内海慶, 欅惇志, 岡崎直観. RNNによる遷移確率計算を用いた隠れマルコフモデル. 第242回自然言語処理研究会, 2019-NL-242(2), pp. 1–6, 2019年10月.

URL
丹羽彩奈, 岡崎直観, 西口佳佑, 亀山千尋, 毛利真崇. 修辞技法を考慮したキャッチコピー自動生成に向けた研究. 第14回NLP若手の会シンポジウム, 63, 2019年8月.

Poster
平岡達也, 高瀬翔, 岡崎直観. RNNによる遷移確率計算を用いた隠れマルコフモデル. 第14回NLP若手の会シンポジウム, 79, 2019年8月.
高瀬翔, 岡崎直観. 機械翻訳と要約生成の統一モデルによる言語横断見出し文生成. 第14回NLP若手の会シンポジウム, 85, 2019年8月.
松丸和樹, 高瀬翔, 岡崎直観. 含意関係に基づく見出し生成タスクの見直し. 第240回自然言語処理研究会, 2019-NL-240(1), pp. 1–8, 2019年6月.

URL
島津翔, 高瀬翔, 中澤敏明, 岡崎直観. 文脈を考慮した日英機械翻訳に向けた評価データの構築. 言語処理学会第25回年次大会 (NLP2019), pp. 5–8, 2019年3月.

URL
笹沢裕一, 高瀬翔, 岡崎直観. 対話型質問応答の省略補完. 言語処理学会第25回年次大会 (NLP2019), pp. 163–166, 2019年3月.

URL
晩鴻翔, 岡崎直観. 語りに基づく認知症傾向判別. 言語処理学会第25回年次大会 (NLP2019), pp. 501–504, 2019年3月.

URL
丹羽彩奈, 岡崎直観, 西口佳佑, 亀山千尋, 毛利真崇. キャッチコピーの自動生成に向けた分析. 言語処理学会第25回年次大会 (NLP2019), pp. 558–561, 2019年3月.

URL
高瀬翔, 岡崎直観. 位置エンコーディングを用いた出力長制御. 言語処理学会第25回年次大会 (NLP2019), pp. 687–690, 2019年3月.

URL
磯颯, 上原由衣, 石垣達也, 能地宏, 荒牧英治, 小林一郎, 宮尾祐介, 岡崎直観, 高村大也. Data-to-Textにおける主題遷移のモデル化. 言語処理学会第25回年次大会 (NLP2019), pp. 727–730, 2019年3月.

URL
Erick Mendieta, Naoaki Okazaki, Hiroya Takamura. Generating Natural-Language Navigation Instructions from Panoramic Images. 言語処理学会第25回年次大会 (NLP2019), pp. 739–742, 2019年3月.

URL
人見雄太, 田口雄哉, 田森秀明, 菊田洸, 西鳥羽二郎, 岡崎直観, 乾健太郎, 奥村学. 出力長制御を考慮した見出し生成モデルのための大規模コーパス. 言語処理学会第25回年次大会 (NLP2019), pp. 1225–1228, 2019年3月.

URL
塙一晃, 佐々木彬, 岡崎直観, 乾健太郎. Wikipediaから獲得した外部知識を用いた賛否分類. 第237回自然言語処理研究会, 2018-NL-237(6), pp. 1–8, 2018年9月.

URL
鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎. 読解による解答可能性を付与した質問応答データセットの構築. 言語処理学会第24回年次大会 (NLP2018), pp. 702–705, 2018年3月.

URL
伊藤拓海, 山口健史, 田然, 松田耕史, 岡崎直観, 乾健太郎. 自治体FAQの比較マイニング. 言語処理学会第24回年次大会 (NLP2018), pp. 536–539, 2018年3月.

URL
阿部香央莉, 松林優一郎, 岡崎直観, 乾健太郎. ニューラルネットを用いた多方言の翻訳と類型分析. 言語処理学会第24回年次大会 (NLP2018), pp. 304–307, 2018年3月.

URL
清野舜, 高瀬翔, 鈴木潤, 岡崎直観, 乾健太郎, 永田昌明. ニューラルヘッドライン生成における誤生成問題の改善. 言語処理学会第24回年次大会 (NLP2018), pp. 1–4, 2018年3月.

URL
松田耕史, 岡崎直観, 乾健太郎. クラウドソーシングを系に組み込んだテキストからの関係知識抽出. 第12回NLP若手の会シンポジウム, P17, 2017年9月.
伊藤拓海, 鈴木正敏, 田然, 山口健史, 岡崎直観, 乾健太郎. 自治体QAサービスのためのFAQの自治体間の横断的解析. 第12回NLP若手の会シンポジウム, P19, 2017年9月.
塙一晃, 佐々木彬, 岡崎直観, 乾健太郎. トピックに関する因果関係知識を利用した賛否分類. 第12回NLP若手の会シンポジウム, P28, 2017年9月.
鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎. Wikipediaを知識源に用いた文書検索と読解によるクイズ解答システム. 第12回NLP若手の会シンポジウム, P46, 2017年9月.

査読なし論文

Keito Sasagawa, Koki Maeda, Issa Sugiura, Shuhei Kurita, Naoaki Okazaki, and Daisuke Kawahara. Constructing Multimodal Datasets from Scratch for Rapid Development of a Japanese Visual Language Model, 2024.

URL arXiv
Masahiro Kaneko, Youmi Ma, Yuki Wata, and Naoaki Okazaki. Sampling-based Pseudo-Likelihood for Membership Inference Attacks, 2024.

arXiv
Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, and Naoaki Okazaki. Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction. In Proceedings of the Fifth Widening Natural Language Processing Workshop (WiNLP2021), November 2021.
Zhishen Yang, Tosho Hirasawa, Mamoru Komachi, and Naoaki Okazaki. Do Videos Guide Translations? Evaluation on Video-guided Machine Translation dataset. In Visually Grounded Interaction and Language (ViGIL), 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL 2021) workshop, June 2021.

URL
Tosho Hirasawa, Zhishen Yang, Mamoru Komachi, and Naoaki Okazaki. Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020. In First Workshop on Advances in Language and Vision Research (ALVR 2020), ACL 2020, July 2020.

arXiv
Youmi Ma, Tatsuya Hiraoka, and Naoaki Okazaki. Named Entity Recognition and Relation Extraction using Enhanced Table Filling by Contextualized Representations, 2020.

arXiv