発表
受賞
-
NLP若手の会 第19回シンポジウム スポンサー賞(サイバーエージェント賞) (2024-09-06)
齋藤 幸史郎, 小池 隆斗, 金子 正弘, 岡崎 直観
強化学習を用いた、言語理解能力を維持したLLM検出器の性能向上
-
第261回自然言語処理研究会 優秀研究賞 (2024-09-03)
齋藤 幸史郎, 水木 栄, 大井 聖也, 中村 泰士, 塩谷 泰平, 前田 航希, Ma Youmi, 服部 翔, 藤井 一喜, 岡本 拓己, 石田 茂樹, 高村 大也, 横田 理央, 岡崎 直観
LLMに日本語テキストを学習させる意義
-
言語処理学会 第30回年次大会 優秀賞 (2024-03-14)
岡崎 直観, 服部 翔, 平井 翔太, 飯田 大貴, 大井 聖也, 藤井 一喜, 中村 泰士, Mengsay Loem, 横田 理央, 水木 栄
Swallowコーパス:日本語大規模ウェブコーパス
-
言語処理学会 第30回年次大会 優秀賞 (2024-03-14)
藤井 一喜, 中村 泰士, Mengsay Loem, 飯田 大貴, 大井 聖也, 服部 翔, 平井 翔太, 水木 栄, 横田 理央, 岡崎 直観
継続事前学習による日本語に強い大規模言語モデルの構築
-
NLP若手の会 第18回シンポジウム スポンサー賞(PKSHA Technology賞) (2023-08-31)
小池 隆斗, 金子 正弘, 岡崎 直観
敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出
-
NLP若手の会 第18回シンポジウム スポンサー賞(博報堂テクノロジーズ賞) (2023-08-31)
小池 隆斗, 金子 正弘, 岡崎 直観
敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出
-
言語処理学会 第29回年次大会 委員特別賞 (2023-03-16)
西田 京介, 長谷川 拓, 前田 航希, 齋藤 邦子
DueT: 視覚・言語のDual-adapter Tuningによる基盤モデル
-
言語処理学会 第28回年次大会 委員特別賞 (2022-03-17)
嘉田 紗世, 山野 陽祐, 新美 茜, 田森 秀明, 小海 則人, 岡崎 直観, 乾 健太郎
動画タイトルを用いたサムネイル画像の自動選択手法の提案
-
AKBC2021 Outstanding Paper Award (2021-10-05)
Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, Naoaki Okazaki
Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction
-
令和元年度東工大教育賞 (2021-03-02)
三宅 美博, 岡崎 直観, 金森 敬文, 村田 剛志, 西崎 真也, 首藤 一幸, 吉瀬 謙二, 下坂 正倫, 関嶋 政和, 柳澤 渓甫, 久世 正弘, 三平 満司, 山中 一郎, 伊藤 武彦, 竹内 徹, 山口 猛央, 阪口 啓
大学院を対象とするデータサイエンス・AI全学教育プログラム
-
第15回NTCIR プレゼンテーション賞 (2020-12-17)
笹沢 裕一, 岡崎 直観
WER99 at the NTCIR-15 QA Lab-PoliInfo-2 Classification Task
-
Video-guided Machine Translation (VMT) Challenge 2020 優勝 (2020-07-13)
Tosho Hirasawa, Zhishen Yang, Mamoru Komachi, and Naoaki Okazaki
Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020
-
言語処理学会 第24回年次大会 優秀賞 (2018-03-15)
清野 舜, 高瀬 翔, 鈴木 潤, 岡崎 直観, 乾 健太郎, 永田 昌明
ニューラルヘッドライン生成における誤生成問題の改善
発表文献
ジャーナル論文
- 吉川 和, 岡崎 直観. 訓練データを用いた言語モデル生成の確信度推定. 自然言語処理, 32(1):to appear, 2025年3月.
- An Wang, Junfeng Jiang, Youmi Ma, Ao Liu, Naoaki Okazaki. Generative Data Augmentation for Aspect Sentiment Quad Prediction. 自然言語処理, 31(4):to appear, 2024年12月.
- Vijay Daultani, Hector Vazquez Martinez, Naoaki Okazaki. Acceptability Evaluation of Naturally Written Sentences. Journal of Information Processing, 17(3):to appear, 2024年.
- Zhishen Yang, Raj Dabre, Hideki Tanaka, Naoaki Okazaki. SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning. 自然言語処理, 31(3):(to appear), 2024年9月.
- Youmi Ma, An Wang, 岡崎 直観. 文書レベル関係抽出における根拠認識の統合. 自然言語処理, 31(1):105–133, 2024年3月.
- 松原 真弓, 麻場 直喜, 内藤 昭一, 川村 晋太郎, 井口 慎也, 能勢 将樹, 岡崎 直観. タスク指向対話システムにおけるユーザの特徴を考慮した話題導入. 情報処理学会論文誌デジタルプラクティス(DP), 4(3):98–106, 2023年7月.
- Mengsay Loem, Sho Takase, Masahiro Kaneko, Naoaki Okazaki. ExtraPhrase: 生成型要約のための効率的データ拡張. 自然言語処理, 30(2):489–506, 2023年6月. (doi: 10.5715/jnlp.30.489)
- Ao Liu, Congjian Luo, Naoaki Okazaki. Improving Logical-Level Natural Language Generation with Topic-Conditioned Data Augmentation and Logical Form Generation. Journal of Information Processing, 31:332–343, 2023年4月. (doi: 10.2197/ipsjjip.31.332)
- Ayana Niwa, Sho Takase, Naoaki Okazaki. Nearest Neighbor Non-autoregressive Text Generation. Journal of Information Processing, 31:334–352, 2023年4月. (doi: 10.2197/ipsjjip.31.344)
- 村岡 雅康, 岡崎 直観, 小比田 涼介, 石井 悦子. マルチモーダル文書におけるテキストと画像の整合タスクの提案. 自然言語処理, 29(4):1198–1232, 2022年12月. (doi: 10.5715/jnlp.29.1198)
- Tosho Hirasawa, Masahiro Kaneko, Aizhan Imankulova, Mamoru Komachi. Pre-Trained Word Embedding and Language Model Improve Multimodal Machine Translation: A Case Study in Multi30K. IEEE Access, 10:67653–67668, 2022年. (doi: 10.1109/ACCESS.2022.3185243)
- 飯田 大貴, 岡崎 直観. Zero-shotニューラル検索のための語彙一致と文脈の類似度による関連度スコアリング. 情報処理学会論文誌データベース(TOD), 15(3):20–35, 2022年10月.
- 古山 翔太, 高村 大也, 岡崎 直観. 多様な規則を活用した文法誤り訂正のデータ拡張に関する分析. 自然言語処理, 29(2):542–586, 2022年6月. (doi: 10.5715/jnlp.29.542)
- Zhishen Yang, Tosho Hirasawa, Mamoru Komachi, Naoaki Okazaki. Why videos do not guide translations in video-guided machine translation? An empirical evaluation of video-guided machine translation dataset. Journal of Information Processing, 30:388–396, 2022年5月. (doi: 10.2197/ipsjjip.30.388)
- Youmi Ma, Tatsuya Hiraoka, Naoaki Okazaki. Named Entity Recognition and Relation Extraction Using Enhanced Table Filling by Contextualized Representations. 自然言語処理, 29(1):187–223, 2022年3月. (doi: 10.5715/jnlp.29.187)
- 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. 単語分割と後段モデルの損失値を用いた同時最適化. 自然言語処理, 29(1):112–143, 2022年3月. (doi: 10.5715/jnlp.29.112)
- 甫立健悟, 金子正弘, 勝又智, 小町守. 文法誤り訂正における訂正度を考慮した多様な訂正文の生成. 自然言語処理, 28(2):428–449, 2021年6月. (doi: 10.5715/jnlp.28.428)
- 吉村綾馬, 金子正弘, 梶原智之, 小町守. 文法誤り訂正の参照文を用いない自動評価の人手評価への最適化. 自然言語処理, 28(2):404–427, 2021年6月. (doi: 10.5715/jnlp.28.404)
- 水木 栄, 岡崎 直観. 階層コード表現学習による上位下位関係の識別. 情報処理学会論文誌データベース(TOD), 14(4):8–23, 2021年10月.
- Ayana Niwa, Naoaki Okazaki, Kohei Wakimoto, Keisuke Nishiguchi, Masataka Mouri. Construction of a Corpus of Rhetorical Devices in Slogans and Structural Analysis of Antitheses. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 20(6), 2021年11月. (doi: 10.1145/3465218)
- Sangwhan Moon, Naoaki Okazaki. The Effects and Mitigation of Out-of-Vocabulary in Universal Language Models. Journal of Information Processing, 29:490–503, 2021年7月. (doi: 10.2197/ipsjjip.29.490)
- 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. テキストベクトルの重みづけを用いたタスクに対する単語分割の最適化. 自然言語処理, 28(2):479–507, 2021年6月. (doi: 10.5715/jnlp.28.479)
- Kaori Abe, Yuichiroh Matsubayashi, Naoaki Okazaki, Kentaro Inui. Multi-dialect Neural Machine Translation for 48 Low-resource Japanese Dialects. Journal of Natural Language Processing, 27(4):781–800, 2020年12月. (doi: 10.5715/jnlp.27.781)
- Hayate Iso, Yui Uehara, Tatsuya Ishigaki, Hiroshi Noji, Eiji Aramaki, Ichiro Kobayashi, Yusuke Miyao, Naoaki Okazaki, Hiroya Takamura. Learning to Select, Track, and Generate for Data-to-Text. Journal of Natural Language Processing, 27(3):599–626, 2020年9月. (doi: 10.5715/jnlp.27.599)
- Diana Galvan-Sosa, Koji Matsuda, Naoaki Okazaki, Kentaro Inui. Empirical Exploration of the Challenges in Temporal Relation Extraction from Clinical Text. Journal of Natural Language Processing, 27(2):383–409, 2020年6月. (doi: 10.5715/jnlp.27.383)
- Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, Kentaro Inui. Stance Detection Attending External Knowledge from Wikipedia. Journal of Information Processing, 27:499–506, 2019年8月. (doi: 10.2197/ipsjjip.27.499)
- Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki, Kentaro Inui. A Joint Neural Model for Fine-Grained Named Entity Classification of Wikipedia Articles. IEICE Transactions on Information and Systems, Special Section on Semantic Web and Linked Data, E101.D(1):73–81, 2018年1月. (doi: 10.1587/transinf.2017SWP0005)
- Ran Tian, Naoaki Okazaki, Kentaro Inui. The mechanism of additive composition. Machine Learning, 106(7):1083–1130, 2017年7月. (doi: 10.1007/s10994-017-5634-8)
- 高瀬 翔, 岡崎 直観, 乾 健太郎. 関係パタンの分散表現の計算. 人工知能学会論文誌, 32(4):D-G96_1-11, 2017年7月. (doi: 10.1527/tjsai.D-G96)
- Shuangshuang Zhou, Naoaki Okazaki, Koji Matsuda, Ran Tian, Kentaro Inui. Supervised Approaches for Japanese Wikification. Journal of Information Processing, 25:341–350, 2017年4月. (doi: 10.2197/ipsjjip.25.341)
国際会議論文
- Ryuto Koike, Masahiro Kaneko, and Naoaki Okazaki. How You Prompt Matters! Even Task-Oriented Constraints in Instructions Affect LLM-Generated Text Detection. In Findings of the Association for Computational Linguistics: EMNLP 2024 (EMNLP), pages (to appear), Miami, USA, November 2024.
- Marco Cognetta, Vilém Zouhar, and Naoaki Okazaki. Distributional Properties of Subword Regularization. In Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages (to appear), Miami, USA, November 2024.
- Shota Koyama, Ryo Nagata, Hiroya Takamura, and Naoaki Okazaki. n-gram F-score for Evaluating Grammatical Error Correction. In Proceedings of the 17th International Natural Language Generation Conference, pages (to appear), Tokyo, Japan, September 2024.
- Naoaki Okazaki, Kakeru Hattori, Hirai Shota, Hiroki Iida, Masanari Ohi, Kazuki Fujii, Taishi Nakamura, Mengsay Loem, Rio Yokota, and Sakae Mizuki. Building a Large Japanese Web Corpus for Large Language Models. In Proceedings of the First Conference on Language Modeling (COLM), pages (to appear), University of Pennsylvania, USA, October 2024.
- Kazuki Fujii, Taishi Nakamura, Mengsay Loem, Hiroki Iida, Masanari Ohi, Kakeru Hattori, Hirai Shota, Sakae Mizuki, Rio Yokota, and Naoaki Okazaki. Continual Pre-Training for Cross-Lingual LLM Adaptation: Enhancing Japanese Language Capabilities. In Proceedings of the First Conference on Language Modeling (COLM), pages (to appear), University of Pennsylvania, USA, October 2024.
- Mengsay Loem, Masahiro Kaneko, and Naoaki Okazaki. SAIE Framework: Support Alone Isn’t Enough - Advancing LLM Training with Adversarial Remarks. In Proceedings of the 27th European Conference on Artificial Intelligence (ECAI), pages (to appear), Santiago de Compostela, Spain, October 2024.
- Koki Maeda, Tosho Hirasawa, Atsushi Hashimoto, Jun Harashima, Leszek Rybicki, Fukasawa Yusuke, and Yoshitaka Ushiku. COM Kitchens: An Unedited Overhead-view Procedural Videos Dataset a Vision-Language Benchmark. In Proceedings of the European Conference on Computer Vision (ECCV), pages (to appear), Milan, Italy, September 2024.
- Masanari Ohi, Masahiro Kaneko, Ryuto Koike, Mengsay Loem, and Naoaki Okazaki. Likelihood-based Mitigation of Evaluation Bias in Large Language Models. In Lun-Wei Ku, Andre Martins, and Vivek Srikumar, editors, Findings of the Association for Computational Linguistics ACL 2024 (ACL 2024), pages 3237–3245, Bangkok, Thailand and virtual meeting, August 2024. (doi: 10.18653/v1/2024.findings-acl.193)
- Marco Cognetta, Tatsuya Hiraoka, Rico Sennrich, Yuval Pinter, and Naoaki Okazaki. An Analysis of BPE Vocabulary Trimming in Neural Machine Translation. In Shabnam Tafreshi, Arjun Akula, João Sedoc, Aleksandr Drozd, Anna Rogers, and Anna Rumshisky, editors, Proceedings of the Fifth Workshop on Insights from Negative Results in NLP, pages 48–50, Mexico City, Mexico, June 2024. (doi: 10.18653/v1/2024.insights-1.7)
- Marco Cognetta, Vilém Zouhar, Sangwhan Moon, and Naoaki Okazaki. Two Counterexamples to Tokenization and the Noiseless Channel. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 16897–16906, Torino, Italia, May 2024.
- Panatchakorn Anantaprayoon, Masahiro Kaneko, and Naoaki Okazaki. Evaluating Gender Bias of Pre-trained Language Models in Natural Language Inference by Considering All Labels. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 6395–6408, Torino, Italia, May 2024.
- Youmi Ma, An Wang, and Naoaki Okazaki. Building a Japanese Document-Level Relation Extraction Dataset Assisted by Cross-Lingual Transfer. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 2567–2579, Torino, Italia, May 2024.
- Masahiro Kaneko and Naoaki Okazaki. Controlled Generation with Prompt Insertion for Natural Language Explanations in Grammatical Error Correction. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages 3955–3961, Torino, Italia, May 2024.
- Ryuto Koike, Masahiro Kaneko, and Naoaki Okazaki. OUTFOX: LLM-generated Essay Detection through In-context Learning with Adversarially Generated Examples. In The 38th Annual AAAI Conference on Artificial Intelligence (AAAI), pages 21258–21266, February 2024.
- Koki Maeda, Shuhei Kurita, Taiki Miyanishi, and Naoaki Okazaki. Query-based Image Captioning from Multi-context 360° Images. In Findings of the Association for Computational Linguistics: EMNLP 2023 (EMNLP), pages 6940–6954, Singapore, December 2023. (doi: 10.18653/v1/2023.findings-emnlp.463)
- Taku Hasegawa, Kyosuke Nishida, Koki Maeda, and Kuniko Saito. DueT: Image-Text Contrastive Transfer Learning with Dual-adapter Tuning. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 13607–13624, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.839)
- Trang Nguyen and Naoaki Okazaki. Causal Reasoning through Two Layers of Cognition for Improving Generalization in Visual Question Answering. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 9221–9236, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.573)
- Masahiro Kaneko and Naoaki Okazaki. Reducing Sequence Length by Predicting Edit Operations with Large Language Models. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 10017–10029, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.619)
- Youmi Ma, Bhushan Kotnis, Carolin Lawrance, Goran Glavaš, and Naoaki Okazaki. Improving Cross-Lingual Transfer for Open Information Extraction with Linguistic Feature Projection. In Proceedings of the 3rd Workshop on Multi-lingual Representation Learning (MRL), pages 125–138, Singapore, December 2023. (doi: 10.18653/v1/2023.mrl-1.11)
- Trang Nguyen, Amin Mansouri, Kanika Madan, Khuong Duy Nguyen, Kartik Ahuja, Dianbo Liu, and Yoshua Bengio. Reusable Slotwise Mechanisms. In A. Oh, T. Naumann, A. Globerson, K. Saenko, M. Hardt, and S. Levine, editors, Advances in Neural Information Processing Systems (NeurIPS), volume 36, pages 23533–23556, 2023.
- Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. The Impact of Debiasing on the Performance of Language Models in Downstream Tasks is Underestimated. In Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (Volume 2: Short Papers) (AACL), pages 29–36, Nusa Dua, Bali, November 2023. (doi: 10.18653/v1/2023.ijcnlp-short.4)
- Masayasu Muraoka, Bishwaranjan Bhattacharjee, Michele Merler, Graeme Blackwood, Yulong Li, and Yang Zhao. Cross-Lingual Transfer of Large Language Model by Visually-Derived Supervision Toward Low-Resource Languages. In Proceedings of the 31th ACM International Conference on Multimedia (MM ’23), pages 3637–3646, October 2023. (doi: 10.1145/3581783.3611992)
- Yang Zhao, Tetsuya Nasukawa, Masayasu Muraoka, and Bishwaranjan Bhattacharjee. A Simple Yet Strong Domain-Agnostic De-bias Method for Zero-Shot Sentiment Classification. In Findings of the Association for Computational Linguistics: ACL 2023, pages 3923–3931, Toronto, Canada, July 2023.
- Mengsay Loem, Masahiro Kaneko, Sho Takase, and Naoaki Okazaki. Exploring Effectiveness of GPT-3 in Grammatical Error Correction: A Study on Performance and Controllability in Prompt-Based Methods. In Proceedings of the 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023) (BEA), pages 205–219, Toronto, Canada, July 2023.
- An Wang, Junfeng Jiang, Youmi Ma, Ao Liu, and Naoaki Okazaki. Generative Data Augmentation for Aspect Sentiment Quad Prediction. In Proceedings of the 12th Joint Conference on Lexical and Computational Semantics (*SEM), pages 128–140, Toronto, Canada, July 2023. (doi: 10.18653/v1/2023.starsem-1.12)
- Marco Cognetta, Sangwhan Moon, Lawrence Wolf-Sonkin, and Naoaki Okazaki. Parameter-Efficient Korean Character-Level Language Modeling. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 2350–2356, Dubrovnik, Croatia, May 2023.
- Hiyori Yoshikawa and Naoaki Okazaki. Selective-LAMA: Selective Prediction for Confidence-Aware Evaluation of Language Models. In Findings of the Association for Computational Linguistics: EACL 2023 (Findings of EACL), pages 2017–2028, Dubrovnik, Croatia, May 2023.
- Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Comparing Intrinsic Gender Bias Evaluation Measures without using Human Annotated Examples. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 2857–2863, Dubrovnik, Croatia, May 2023.
- Sakae Mizuki and Naoaki Okazaki. Semantic Specialization for Knowledge-based Word Sense Disambiguation. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 3457–3470, Dubrovnik, Croatia, May 2023.
- Youmi Ma, An Wang, and Naoaki Okazaki. DREEAM: Guiding Attention with Evidence for Improving Document-Level Relation Extraction. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 1971–1983, Dubrovnik, Croatia, May 2023.
- Zhishen Yang, Raj Dabre, Hideki Tanaka, and Naoaki Okazaki. SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning. In Proceedings of the Workshop on Scientific Document Understanding, co-located with 37th AAAI Conference on Artificial Intelligence (CEUR Workshop Proceedings), page (Paper13), Washington DC, USA, February 2023.
- Ao Liu, Haoyu Dong, Naoaki Okazaki, Shi Han, and Dongmei Zhang. PLOG: Table-to-Logic Pretraining for Logical Table-to-Text Generation. In Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 5531–5546, Abu Dhabi, United Arab Emirates, December 2022.
- Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Gender Bias in Meta-Embeddings. In Findings of the Association for Computational Linguistics: EMNLP 2022 (EMNLP), pages 3118–3133, Abu Dhabi, United Arab Emirates, December 2022.
- Hiroki Iida and Naoaki Okazaki. Unsupervised Domain Adaptation for Sparse Retrieval by Filling Vocabulary and Word Frequency Gaps. In Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing (Volume 1: Long Papers) (AACL), pages 752–765, Online, November 2022.
- Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Debiasing Isn’t Enough! – on the Effectiveness of Debiasing MLMs and Their Social Biases in Downstream Tasks. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 1299–1310, Gyeongju, Republic of Korea, October 2022.
- Koki Maeda, Masahiro Kaneko, and Naoaki Okazaki. IMPARA: Impact based Metric for GEC using Parallel Data. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 3578–3588, Gyeongju, Republic of Korea, October 2022.
- Yidong Wang, Hao Wu, Ao Liu, Wenxin Hou, Zhen Wu, Jindong Wang, Takahiro Shinozaki, Manabu Okumura, and Yue Zhang. Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 7075–7085, Gyeongju, Republic of Korea, October 2022.
- Hsuan-Yu Kuo, Youmi Ma, and Naoaki Okazaki. Annotating Entity and Causal Relationships on Japanese Vehicle Recall Information. In Proceedings of the 36th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 783–791, Manila, Philippines, October 2022.
- Vijay Daultani and Naoaki Okazaki. Improving Automatic Evaluation of Acceptability Based on Language Models with a Coarse Sentence Representation. In Proceedings of the 36th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 109–118, Manila, Philippines, October 2022.
- Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Overview of ChEMU 2022 Evaluation Campaign: Information Extraction in Chemical Patents. In International Conference of the Cross-Language Evaluation Forum for European Languages (CLEF), pages 521–540, September 2022.
- Mengsay Loem, Sho Takase, Masahiro Kaneko, and Naoaki Okazaki. ExtraPhrase: Efficient Data Augmentation for Abstractive Summarization. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop (NAACL SRW), pages 16–24, Hybrid: Seattle, Washington + Online, July 2022. (doi: 10.18653/v1/2022.naacl-srw.3)
- Haoyu Dong, Zhoujun Cheng, Xinyi He, Mengyu Zhou, Anda Zhou, Fan Zhou, Ao Liu, Shi Han, and Dongmei Zhang. Table Pre-training: A Survey on Model Architectures, Pre-training Objectives, and Downstream Tasks. In Proceedings of the Thirty-First International Joint Conference on Artificial Intelligence (IJCAI), pages 5426–5435, July 2022. (doi: 10.24963/ijcai.2022/761)
- Masahiro Kaneko, Aizhan Imankulova, Danushka Bollegala, and Naoaki Okazaki. Gender Bias in Masked Language Models for Multiple Languages. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), pages 2740–2750, Seattle, United States, July 2022. (doi: 10.18653/v1/2022.naacl-main.197)
- Yu Pan, Zeyong Su, Ao Liu, Wang Jingquan, Nannan Li, and Zenglin Xu. A Unified Weight Initialization Paradigm for Tensorial Convolutional Neural Networks. In International Conference on Machine Learning (ICML), pages 17238–17257, Baltimore, Maryland, United States, July 2022.
- Won Ik Cho, Sangwhan Moon, Jongin Kim, Seokmin Kim, and Nam Soo Kim. StyleKQC: A Style-Variant Paraphrase Corpus for Korean Questions and Commands. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 7122–7128, Marseille, France, June 2022.
- Hwichan Kim, Sangwhan Moon, Naoaki Okazaki, and Mamoru Komachi. Learning How to Translate North Korean through South Korean. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 6711–6718, Marseille, France, June 2022.
- Sangwhan Moon, Won Ik Cho, Hye Joo Han, Naoaki Okazaki, and Nam Soo Kim. OpenKorPOS: Democratizing Korean Tokenization with Voting-Based Open Corpus Annotation. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 4975–4983, Marseille, France, June 2022.
- Sho Takase and Naoaki Okazaki. Multi-Task Learning for Cross-Lingual Abstractive Summarization. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 3008–3016, Marseille, France, June 2022.
- Yujin Takahashi, Masahiro Kaneko, Masato Mita, and Mamoru Komachi. ProQE: Proficiency-wise Quality Estimation dataset for Grammatical Error Correction. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 5994–6000, Marseille, France, June 2022.
- Masahiro Kaneko, Sho Takase, Ayana Niwa, and Naoaki Okazaki. Interpretability for Language Learners Using Example-Based Grammatical Error Correction. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 7176–7187, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.496)
- Ao Liu, An Wang, and Naoaki Okazaki. Semi-Supervised Formality Style Transfer with Consistency Training. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 4689–4701, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.321)
- Yi Zhou, Masahiro Kaneko, and Danushka Bollegala. Sense Embeddings are also Biased – Evaluating Social Biases in Static and Contextualised Sense Embeddings. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 1924–1935, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.135)
- Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Word-level Perturbation Considering Word Length and Compositional Subwords. In Findings of the Association for Computational Linguistics: ACL 2022 (Findings of ACL), pages 3268–3275, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.findings-acl.258)
- Sho Takase, Tatsuya Hiraoka, and Naoaki Okazaki. Single Model Ensemble for Subword Regularized Models in Low-Resource Machine Translation. In Findings of the Association for Computational Linguistics: ACL 2022 (Findings of ACL), pages 2536–2541, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.findings-acl.199)
- Youmi Ma, Tatsuya Hiraoka, and Naoaki Okazaki. Joint Entity and Relation Extraction Based on Table Labeling Using Convolutional Neural Networks. In Proceedings of the Sixth Workshop on Structured Prediction for NLP (SPNLP), pages 11–21, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.spnlp-1.2)
- Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zenan Zhai, Zubair Afzal, Trevor Cohn, Timothy Baldwin, and Karin Verspoor. The ChEMU 2022 Evaluation Campaign: Information Extraction in Chemical Patents. In European Conference on Information Retrieval (ECIR), pages 400–407, April 2022.
- Qian Sun, Aili Shen, Hiyori Yoshikawa, Chunpeng Ma, Daniel Beck, Tomoya Iwakura, and Timothy Baldwin. Evaluating Hierarchical Document Categorisation. In Proceedings of the The 19th Annual Workshop of the Australasian Language Technology Association (ALTA), pages 179–184, December 2021.
- Hiroki Iida and Naoaki Okazaki. Incorporating Semantic Textual Similarity and Lexical Matching for Information Retrieval. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 582–591, Shanghai, China, November 2021.
- Shota Koyama, Hiroya Takamura, and Naoaki Okazaki. Various Errors Improve Neural Grammatical Error Correction. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 251–261, Shanghai, China, November 2021.
- Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Overview of ChEMU 2021: Reaction Reference Resolution and Anaphora Resolution in Chemical Patents. In Experimental IR Meets Multilinguality, Multimodality, and Interaction: 12th International Conference of the CLEF Association (CLEF), September 2021. (doi: 10.1007/978-3-030-85251-1_20)
- Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Extended Overview of ChEMU 2021: Reaction Reference Resolution and Anaphora Resolution in Chemical Patents. In Proceedings of the Working Notes of CLEF 2021, volume 2936, pages 693–709, September 2021.
- Kosuke Yamada, Yuta Hitomi, Hideaki Tamori, Ryohei Sasano, Naoaki Okazaki, Kentaro Inui, and Koichi Takeda. Transformer-based Lexically Constrained Headline Generation. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 4085–4090, Online and Punta Cana, Dominican Republic, November 2021. (doi: 10.18653/v1/2021.emnlp-main.335)
- Hiyori Yoshikawa, Tomoya Iwakura, Kimi Kaneko, Hiroaki Yoshida, Yasutaka Kumano, Kazutaka Shimada, Rafal Rzepka, and Patrycja Swieczkowska. Tell Me What You Read: Automatic Expertise-Based Annotator Assignment for Text Annotation in Expert Domains. In Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2021), pages 1575–1585, Held Online, September 2021.
- Ayana Niwa, Keisuke Nishiguchi, and Naoaki Okazaki. Predicting Antonyms in Context using BERT. In Proceedings of the 14th International Conference on Natural Language Generation (INLG), pages 48–54, Aberdeen, Scotland, UK, August 2021.
- Keiji Yasuda, Ichiro Yamada, Naoaki Okazaki, Hideki Tanaka, Hidehiro Asaka, Takeshi Anzai, and Fumiaki Sugaya. Field Experiments of Real Time Foreign News Distribution Powered by MT. In Proceedings of Machine Translation Summit XVIII: Users and Providers Track (MT Summit), pages 227–232, Virtual, August 2021.
- Raj Dabre, Aizhan Imankulova, and Masahiro Kaneko. Studying The Impact Of Document-level Context On Simultaneous Neural Machine Translation. In Proceedings of the 18th Biennial Machine Translation Summit (Volume 1: Research Track) (MT Summit), pages 202–214, Virtual, August 2021.
- Hiyori Yoshikawa, Saber A. Akhondi, Camilo Thorne, Christian Druckenbrodt, Ralph Hoessel, Zenan Zhai, Jiayuan He, Timothy Baldwin, and Karin Verspoor. Chemical Reaction Reference Resolution in Patents. In Proceedings of the 2nd Workshop on on Patent Text Mining and Semantic Technologies, pages 10–17, July 2021.
- Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Joint Optimization of Tokenization and Downstream Model. In Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021 (Findings of ACL), pages 244–255, Online, August 2021. (doi: 10.18653/v1/2021.findings-acl.21)
- Aomi Koyama, Kengo Hotate, Masahiro Kaneko, and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW), pages 126–135, Online, June 2021. (doi: 10.18653/v1/2021.naacl-srw.16)
- Seiichiro Kondo, Kengo Hotate, Tosho Hirasawa, Masahiro Kaneko, and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW), pages 143–149, Online, June 2021. (doi: 10.18653/v1/2021.naacl-srw.18)
- Sho Takase and Shun Kiyono. Rethinking Perturbations in Encoder-Decoders for Fast Training. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), pages 5767–5780, Online, June 2021. (doi: 10.18653/v1/2021.naacl-main.460)
- Chunpeng Ma, Aili Shen, Hiyori Yoshikawa, Tomoya Iwakura, Daniel Beck, and Timothy Baldwin. On the (In)Effectiveness of Images for Text Classification. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 42–48, Online, April 2021. (doi: 10.18653/v1/2021.eacl-main.4)
- Masahiro Kaneko and Danushka Bollegala. Dictionary-based Debiasing of Pre-trained Word Embeddings. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 212–223, Online, April 2021. (doi: 10.18653/v1/2021.eacl-main.16)
- Shin Kanouchi, Masato Neishi, Yuta Hayashibe, Hiroki Ouchi, and Naoaki Okazaki. You May Like This Hotel Because ...: Identifying Evidence for Explainable Recommendations. In Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing (AACL-IJCNLP), pages 890–899, Suzhou, China, December 2020.
- Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Optimizing Word Segmentation for Downstream Task. In Findings of the Association for Computational Linguistics: EMNLP 2020 (Findings of EMNLP), pages 1341–1351, Online, November 2020. (doi: 10.18653/v1/2020.findings-emnlp.120)
- Won Ik Cho, Youngki Moon, Sangwhan Moon, Seok Min Kim, and Nam Soo Kim. Machines Getting with the Program: Understanding Intent Arguments of Non-Canonical Directives. In Findings of the Association for Computational Linguistics: EMNLP 2020 (Findings of EMNLP), pages 329–339, Online, November 2020. (doi: 10.18653/v1/2020.findings-emnlp.31)
- Wiem Ben Rim and Naoaki Okazaki. SWAGex at SemEval-2020 Task 4: Commonsense Explanation as Next Event Prediction. In Proceedings of the Fourteenth Workshop on Semantic Evaluation (SemEval), pages 422–429, Barcelona (online), December 2020.
- Zhishen Yang, Lars Wolfsteller, and Naoaki Okazaki. TextLearner at SemEval-2020 Task 10: A Contextualized Ranking System in Solving Emphasis Selection in Text. In Proceedings of the Fourteenth Workshop on Semantic Evaluation (SemEval), pages 1691–1697, Barcelona (online), December 2020.
- Emanuele Bugliarello, Sabrina J. Mielke, Antonios Anastasopoulos, Ryan Cotterell, and Naoaki Okazaki. It’s Easier to Translate out of English than into it: Measuring Neural Translation Difficulty by Cross-Mutual Information. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1640–1649, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.149)
- Sangwhan Moon and Naoaki Okazaki. Jamo Pair Encoding: Subcharacter Representation-based Extreme Korean Vocabulary Compression for Efficient Subword Tokenization. In Proceedings of the 12th Language Resources and Evaluation Conference (LREC), pages 3490–3497, Marseille, France, May 2020.
- Sho Shimazu, Sho Takase, Toshiaki Nakazawa, and Naoaki Okazaki. Evaluation Dataset for Zero Pronoun in Japanese to English Translation. In Proceedings of the 12th Language Resources and Evaluation Conference (LREC), pages 3630–3634, Marseille, France, May 2020.
- Emanuele Bugliarello, Swayambhoo Jain, and Vineeth Rakesh. Matrix Completion in the Unit Hypercube via Structured Matrix Factorization. In Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI), pages 2038–2044, August 2019. (doi: 10.24963/ijcai.2019/282)
- Tatsuya Hiraoka, Hiroyuki Shindo, and Yuji Matsumoto. Stochastic Tokenization with a Language Model for Neural Text Classification. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1620–1629, Florence, Italy, July 2019. (doi: 10.18653/v1/P19-1158)
- Hayate Iso, Yui Uehara, Tatsuya Ishigaki, Hiroshi Noji, Eiji Aramaki, Ichiro Kobayashi, Yusuke Miyao, Naoaki Okazaki, and Hiroya Takamura. Learning to Select, Track, and Generate for Data-to-Text. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL), pages 2102–2113, Florence, Italy, July 2019. (doi: 10.18653/v1/P19-1202)
- Sho Takase and Naoaki Okazaki. Positional Encoding to Control Output Sequence Length. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers) (NAACL), pages 3999–4004, Minneapolis, Minnesota, June 2019. (doi: 10.18653/v1/N19-1401)
- Zhishen Yang, Sam Vijlbrief, and Naoaki Okazaki. TokyoTech_NLP at SemEval-2019 Task 3: Emotion-related Symbols in Emotion Detection. In Proceedings of the 13th International Workshop on Semantic Evaluation (SemEval), pages 350–354, Minneapolis, Minnesota, USA, June 2019. (doi: 10.18653/v1/S19-2061)
- Sho Takase, Jun Suzuki, and Masaaki Nagata. Character n-gram Embeddings to Improve RNN Language Models. In Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence (AAAI), pages 5074–5082, January 2019.
- Shun Kiyono, Sho Takase, Jun Suzuki, Naoaki Okazaki, Kentaro Inui, and Masaaki Nagata. Reducing Odd Generation from Neural Headline Generation. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation (PACLIC), Hong Kong, December 2018.
- Kaori Abe, Yuichiroh Matsubayashi, Naoaki Okazaki, and Kentaro Inui. Multi-dialect Neural Machine Translation and Dialectometry. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation (PACLIC), Hong Kong, December 2018.
- Shun Kiyono, Sho Takase, Jun Suzuki, Naoaki Okazaki, Kentaro Inui, and Masaaki Nagata. Unsupervised Token-wise Alignment to Improve Interpretation of Encoder-Decoder Models. In Proceedings of the 2018 EMNLP Workshop BlackboxNLP: Analyzing and Interpreting Neural Networks for NLP, pages 74–81, Brussels, Belgium, November 2018. (doi: 10.18653/v1/W18-5410)
- Diana Galvan, Naoaki Okazaki, Koji Matsuda, and Kentaro Inui. Investigating the Challenges of Temporal Relation Extraction from Clinical Text. In Proceedings of the Ninth International Workshop on Health Text Mining and Information Analysis (Louhi), pages 55–64, Brussels, Belgium, October 2018. (doi: 10.18653/v1/W18-5607)
- Akira Sasaki, Kazuaki Hanawa, Naoaki Okazaki, and Kentaro Inui. Predicting Stances from Social Media Posts using Factorization Machines. In Proceedings of the 27th International Conference on Computational Linguistics (COLING), pages 3381–3390, August 2018.
- Yuta Hitomi, Hideaki Tamori, Naoaki Okazaki, and Kentaro Inui. Proofread Sentence Generation as Multi-Task Learning with Editing Operation Prediction. In Proceedings of the Eighth International Joint Conference on Natural Language Processing (IJCNLP), pages 436–441, November 2017.
- Sosuke Kobayashi, Naoaki Okazaki, and Kentaro Inui. A Neural Language Model for Dynamically Representing the Meanings of Unknown Words and Entities in a Discourse. In Proceedings of the Eighth International Joint Conference on Natural Language Processing (IJCNLP), pages 473–483, November 2017.
- Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, and Kentaro Inui. A Crowdsourcing Approach for Annotating Causal Relation Instances in Wikipedia. In Proceedings of the 31st Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 336–345, November 2017.
- Shota Sasaki, Sho Takase, Naoya Inoue, Naoaki Okazaki, and Kentaro Inui. Handling Multiword Expressions in Causality Estimation. In IWCS 2017 — 12th International Conference on Computational Semantics — Short papers, pages (6 pages), 2017.
- Hideaki Tamori, Yuta Hitomi, Naoaki Okazaki, and Kentaro Inui. Analyzing the Revision Logs of a Japanese Newspaper for Article Quality Assessment. In Proceedings of the 2017 EMNLP Workshop: Natural Language Processing meets Journalism, pages 46–50, Copenhagen, Denmark, September 2017. (doi: 10.18653/v1/W17-4208)
- Sho Yokoi, Daichi Mochihashi, Ryo Takahashi, Naoaki Okazaki, and Kentaro Inui. Learning Co-Substructures by Kernel Dependence Maximization. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI), pages 3329–3335, August 2017.
- Akira Sasaki, Kazuaki Hanawa, Naoaki Okazaki, and Kentaro Inui. Other Topics You May Also Agree or Disagree: Modeling Inter-Topic Preferences using Tweets and Matrix Factorization. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 398–408, Vancouver, Canada, July 2017. (doi: 10.18653/v1/P17-1037)
書籍
- 岡崎 直観, 荒瀬 由紀, 鈴木 潤, 鶴岡 慶雅, 宮尾 祐介. IT Text 自然言語処理の基礎. オーム社, 2022年8月.
- Henry Brighton, 岡崎 直観(監訳), 浅野 ユカリ(翻訳). 人工知能グラフィックガイド. ニュートンプレス, 2019年10月.
解説記事
- 岡崎 直観. 大規模言語モデル.数理科学, volume 736, pp. (to appear). 2024年10月.
- 岡崎 直観. 大規模言語モデルの驚異と脅威 — ChatGPTの衝撃と大規模言語モデルの課題 —(特集 新時代の道具,ChatGPT:14の視点からその可能性を探る). 情報処理, 64(9):e1–e3, 2023年9月.
- 岡崎 直観. 深層学習がもたらした自然言語処理研究の発展と変革. 電子情報通信学会誌, 105(5):397–400, 2022年5月.
- 岡崎 直観, 矢田 勝俊. 研究会報告:国際シンポジウムJSAI International Symposia on AI 2020(JSAI-isAI 2020)開催報告. 人工知能, 36(3):374–376, 2021年5月. (doi: 10.11517/jjsai.36.3_374)
- 岡崎 直観, 清野 舜, 高橋 諒, 横井 祥. 言語処理100本ノック. 自然言語処理, 27(3):703–710, 2020年9月. (doi: 10.5715/jnlp.27.703)
- 坂本 真樹, 岡崎 直観. 国際シンポジウムJSAI International Symposia on AI 2019(JSAI-isAI 2019)開催報告. 人工知能, 35(2):282–285, 2020年3月. (doi: 10.11517/jjsai.35.2_282)
- 岡崎 直観. ロボットジャーナリズムの現状と課題. 映像情報メディア学会誌, 72(2):70–75, 2018年3月. (doi: 10.3169/itej.72.212)
- 高瀬 翔, 岡崎 直観. 自然言語文からの関係知識ベースの構築. 知能と情報(日本知能情報ファジィ学会誌), 29(2):55–64, 2017年4月. (doi: 10.3156/jsoft.29.2_55)
- 海野 裕也, 岡崎 直観, 西川 仁, 中澤 敏明. NLP 若手の会. 人工知能, 32(2):266–267, 2017年3月. (doi: 10.11517/jjsai.32.2_266)
招待講演 / 依頼講演
- 岡崎 直観. マルチモーダルWG. LLMシンポジウム2024「大規模言語モデルのあるべき姿とは?」, 2024年9月.
- 岡崎 直観. 大規模言語モデルSwallowの現状と展望. 学術変革B「身体記号学」領域会議 招待講演, 2024年9月.
- 岡崎 直観. 大規模言語モデルSwallowの現状と展望. 第23回弁護士業務改革シンポジウム 第1分科会「リーガルテクノロジーは弁護士業務をどう変えるか」, 2024年9月.
- 岡崎 直観. 大規模言語モデルの仕組みと生命医学分野での展望. 第34回日本心臓核医学会総会・学術大会 シンポジウム2「人工知能による診断支援の可能性:機械学習・深層学習・大規模言語モデル」, 2024年6月.
- 岡崎 直観. 大規模言語モデルの開発. 2024年度人工知能学会全国大会(第38回)チュートリアル講演1, 2024年5月.
- 岡崎 直観. 大規模言語モデルの現状と展望. スマートニュース メディア研究所 「AIと人間」研究会, 2024年5月.
- Naoaki Okazaki. Foundation to Build LLMs. AI Open Innovation Day Japan 2024, 2024年5月.
- 岡崎 直観, 曽根岡 侑也, 近江 崇宏. 大規模言語モデル開発の最前線. 生成AIカンファレンス パネルディスカッション Vol. 1, 2024年5月.
- 岡崎 直観. 大規模言語モデルの仕組みと翻訳新時代. ATIS特許翻訳分科会, 2024年4月.
- 岡崎 直観, 武藤 まい, 早川 健. 生成AIの現状とこれから 日本、EU、その先へ. 第一東京弁護士会セミナー, 2024年3月.
- 岡崎 直観. 自然言語処理の基礎. 言語処理学会第30回年次大会 (NLP2024) チュートリアルT1, 2024年3月.
- 岡崎 直観. 生成AIは創造の扉を開くのか~大規模言語モデルが産み出す新しい未来~. けいはんな「エジソンの会」第44回会合, 2024年1月.
- 岡崎 直観. 大規模言語モデルの進化の方向性・社会変革の可能性. 科学技術と経済の会 (JATES) 第27期・第3回 代表者懇談会, 2023年12月.
- 岡崎 直観. 大規模言語モデルと科学研究. 第46回日本分子生物学会年会 研究倫理委員会企画・研究倫理フォーラム, 2023年12月.
- 岡崎 直観. 生成AIの最前線と研究・開発の未来地図. GPU UNITE 2023 Day3: 生成AI Day, 2023年11月.
- 岡崎 直観. AIと共創する未来: 大規模言語モデルの開発、応用、そして私たちの役割. 2023年東工大メンバーシップ年次総会, 2023年10月.
- 岡崎 直観. 改めて知りたい自然言語処理技術 ~ AI チャットボットは翻訳のプロから仕事を奪うのか. 第32回JTF翻訳祭, 2023年10月.
- 岡崎 直観, 辻井 潤一, 松原 仁, 樋口 知之. 次世代AIの舵取り:進化するAI技術と未来への展望. データサイエンス協会10thシンポジウム〜データサイエンスの最前線〜, 2023年10月.
- 岡崎 直観. 大規模言語モデルの脅威. JEITAデバイス・ハードウェアセキュリティ技術分科会, 2023年9月.
- 岡崎 直観. 生成AIの仕組み・可能性・脅威. 2023年度蔵前工業会千葉県支部講演会, 2023年9月.
- 金子 正弘. 言語モデルの公平性. NLP若手の会 (YANS) 第18回シンポジウム, 2023年8月.
- 岡崎 直観. 自然言語生成の仕組みと最先端. 第6回機械学習工学研究会, MLSE夏合宿2023, 2023年6月.
- 岡崎 直観. ChatGPTをはじめとした生成AIとその社会実装について. 第7回 政治家と科学者の対話の会(日本工学アカデミー政策共創推進委員会), 2023年6月.
- 岡崎 直観. 大規模言語モデルの進展. JDLA緊急企画「生成AIの衝撃」〜ChatGPTで世界はどう変わるのか?〜, 2023年3月.
- 岡崎 直観. 自然言語処理技術の最先端. 第一東京弁護士会 100周年記念講演会, 2023年2月.
- 岡崎 直観. 自然言語生成における内容の制御. 第14回産業日本語研究会・シンポジウム(パネリスト講演), 2023年2月.
- 岡崎 直観. 近傍の事例を活用したニューラル言語生成. NAIST DSC NLP Seminar 2022 Summer, 2022年9月.
- Naoaki Okazaki. Towards controllable, faithful, and explainable text generation. Advances in Data Science and AI Conference 2022 (ADSAI 2022), 2022年6月.
- 丹羽 彩奈. 自然言語生成におけるテンプレートの導出と活用. 人工知能学会 合同研究会2021 第118回人工知能基本問題研究会, 2021年11月.
- 岡崎 直観. 自然言語生成の現状と展望. 第41回医療情報学連合大会(第22回日本医療情報学会学術大会) 共同企画セッション「医学医療におけるAI応用」, 2021年11月.
- 岡崎 直観. AIによる言語処理の革命. 第4回自動翻訳シンポジウム 〜自動翻訳と翻訳バンク〜, 2021年3月.
- 岡崎 直観. 深層ニューラルネットワークによる自然言語生成の制御. 日本大学 人工知能ソサイエティ(NUAIS)設立シンポジウム, 2021年3月.
- Naoaki Okazaki. Neural Machine Translation and Summarization for News. International Workshop on Speech to Speech Machine Translation (IWSSMT), 2020年11月.
- 岡崎 直観. 自然言語処理によるニュース記事執筆の現状と課題. 第11回産業日本語研究会・シンポジウム(COVID-19のため中止), 2020年3月.
- 岡崎 直観. 深層学習はなぜ重宝されるのか ― 自然言語処理の場合. 応用物理学会有機分子・バイオエレクトロニクス分科会講習会「情報技術と有機分子・バイオエレクトロニクス~機器制御からAI活用まで~」, 2019年11月.
- 高瀬 翔. ニューラル言語モデルの研究動向. 第240回自然言語処理研究会, 2019年6月.
- 岡崎 直観. 深層学習による自然言語処理の現状と展望. 第40回蔵前科学技術セミナー 「最新の情報理工学とは」 〜 AI、ビッグデータ、サイバーセキュリティは未来をどう変えるのか? 〜, 2019年2月.
- 岡崎 直観. 自然言語処理の現状と展望. 応用脳科学アカデミー 応用脳科学アドバンスコース「脳と人工知能・ロボット」第3回, 2019年1月.
- Naoaki Okazaki. Towards Natural Language Processing that Understands Context. AI Shooting Stars Session, Artificial Intelligence — International Research and Applications: 1st Japanese-German-French DWIH Symposium, 2018年11月.
- Naoaki Okazaki. How Deep Learning Changes Natural Language Processing. Fourth Asia Pacific Corpus Linguistics Conference (APCLC 2018), 2018年9月.
- 岡崎 直観. ウェブからの知識獲得と意見分析. 第131回 情報基礎とアクセス技術研究発表会, 2018年7月.
- Naoaki Okazaki. Bridging Knowledge and Text with Deep Neural Networks. Second International Workshop on Symbolic-Neural Learning (SNL-2018), 2018年7月.
- 岡崎 直観. 自然言語による状況理解. 第24回画像センシングシンポジウム, OS2: マルチモーダル深層学習:画像認識を越えて広がる世界 ~画像・自然言語・音声の共創~, 2018年6月.
- 岡崎 直観. 自然言語処理による議論マイニング. 2018年度人工知能学会全国大会 (第32回), OS-28 複雑化社会における意思決定・合意形成のためのAI技術, 2018年6月.
- Naoaki Okazaki. Generating Text with Deep Neural Networks. Deep Learning: Theory, Algorithms, and Applications, 2018年3月.
- 岡崎 直観. エンコーダ・デコーダモデルによるテキスト生成. 第211回情報処理学会コンピュータビジョンとイメージメディア(CVIM)研究会, 2018年3月.
- 岡崎 直観. 自然言語処理における深層学習の進展. 豊橋技術科学大学先端データサイエンス講演会, 2018年1月.
- 岡崎 直観. 深層学習の自然言語処理への応用. 情報処理学会連続セミナー2017 第4回:ディープラーニングの活用と基盤, 2017年10月.
- 岡崎 直観. 自然言語処理を支える大規模計算資源. 第2回データサイエンス支援サービスシンポジウム, 2017年6月.
- 岡崎 直観. 自然言語処理におけるDeep Learning. 電子情報通信学会総合大会 2017 企画セッション 「もっと知りたい! Deep Learning ~基礎から活用まで~」, 2017年3月.
口頭発表
- 高橋 侑成, Ma Youmi, 金子 正弘, 岡崎 直観. 大規模言語モデルに対する漏洩検出への敵対的なデータ隠蔽. 第19回YANSシンポジウム (YANS2024), S4-P22, 2024年9月.
- 服部 翔, 水木 栄, 藤井 一喜, 中村 泰士, 大井 聖也, Ma Youmi, 前田 航希, 塩谷 泰平, 齋藤 幸史郎, 岡本 拓己, 石田 茂樹, 横田 理央, 高村 大也, 岡崎 直観. 小規模で高性能なLLMのための高品質事前学習Webコーパスの構築. 第19回YANSシンポジウム (YANS2024), S3-P33, 2024年9月.
- 赤部 晃一, 前田 航希, 栗田 修平, 小田 悠介. ESG情報抽出データセットの検討. 第19回YANSシンポジウム (YANS2024), S3-P22, 2024年9月.
- 大井 聖也, 金子 正弘, 岡崎 直観, 井上 中順. マルチモーダルモデル自動評価のための複数タスク・複数基準評価データセット. 第19回YANSシンポジウム (YANS2024), S1-P28, 2024年9月.
- 塩谷 泰平, 金子 正弘, 岡崎 直観. 大規模言語モデルによる日本文化に沿った指示データ生成. 第19回YANSシンポジウム (YANS2024), S1-P25, 2024年9月.
- 齋藤 幸史郎, 小池 隆斗, 金子 正弘, 岡崎 直観. 強化学習を用いた、言語理解能力を維持したLLM検出器の性能向上. 第19回YANSシンポジウム (YANS2024), S1-P23, 2024年9月.
- 齋藤 幸史郎, 水木 栄, 大井 聖也, 中村 泰士, 塩谷 泰平, 前田 航希, Ma Youmi, 服部 翔, 藤井 一喜, 岡本 拓己, 石田 茂樹, 高村 大也, 横田 理央, 岡崎 直観. LLMに日本語テキストを学習させる意義. 情報処理学会 第261回自然言語処理研究会 研究報告 (2024-NL-261), 12, pp. 1–15, 2024年9月.
- 加藤 靖久, 金子 正弘, 岡崎 直観. 多言語プロンプト: 低資源言語での多言語例を用いたfew-shot推論. 2024年度人工知能学会全国大会 (JSAI2024), pp. 4Xin2110-4Xin2110, 2024年5月. (doi: 10.11517/pjsai.JSAI2024.0_4Xin2110)
- 栗原 健太郎, 三田 雅人, 張 培楠, 佐々木 翔大, 石上 亮介, 岡崎 直観. LCTG Bench: 日本語LLMの制御性ベンチマークの構築. 言語処理学会第30回年次大会 (NLP2024), D11-2, pp. 3113–3118, 2024年3月.
- 大井 聖也, 金子 正弘, 小池 隆斗, Mengsay Loem, 岡崎 直観. 大規模言語モデルにおける評価バイアスの尤度に基づく緩和. 言語処理学会第30回年次大会 (NLP2024), A11-4, pp. 3021–3026, 2024年3月.
- 綿 祐貴, 金子 正弘, Youmi Ma, 岡崎 直観. 大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃. 言語処理学会第30回年次大会 (NLP2024), A11-3, pp. 3015–3020, 2024年3月.
- 平岡 達也, 岡崎 直観. 事前学習済みの分散表現は表層的な知識を獲得しているか. 言語処理学会第30回年次大会 (NLP2024), P10-6, pp. 2880–2885, 2024年3月.
- Mengsay Loem, 金子 正弘, 岡崎 直観. 敵対的発言を取り入れた議論による言語モデルの学習強化と推論力の向上. 言語処理学会第30回年次大会 (NLP2024), B10-6, pp. 2750–2755, 2024年3月.
- 藤井 一喜, 中村 泰士, Mengsay Loem, 飯田 大貴, 大井 聖也, 服部 翔, 平井 翔太, 水木 栄, 横田 理央, 岡崎 直観. 継続事前学習による日本語に強い大規模言語モデルの構築. 言語処理学会第30回年次大会 (NLP2024), A8-5, pp. 2102–2107, 2024年3月.
- Zhishen Yang, Tosho Hirasawa, Edison Marrese-Tyalor, Naoaki Okazaki. Large Language Models as Manga Translators: A Case Study. 言語処理学会第30回年次大会 (NLP2024), P7-13, pp. 2012–2017, 2024年3月.
- 前田 航希, 栗田 修平, 宮西 大樹, 岡崎 直観. 視覚的文脈を利用した視覚言語モデルによる画像キャプション生成自動評価手法. 言語処理学会第30回年次大会 (NLP2024), P7-10, pp. 1996–2001, 2024年3月.
- 丹羽 彩奈, 磯 颯. AmbiNLG: 自然言語生成のための指示テキストの曖昧性解消. 言語処理学会第30回年次大会 (NLP2024), A7-6, pp. 1809–1814, 2024年3月.
- 水木 栄, 飯田 大貴, 藤井 一喜, 中村 泰士, Mengsay Loem, 大井 聖也, 服部 翔, 平井 翔太, 横田 理央, 岡崎 直観. 大規模言語モデルの日本語能力の効率的な強化: 継続事前学習における語彙拡張と対訳コーパスの活用. 言語処理学会第30回年次大会 (NLP2024), A6-4, pp. 1514–1519, 2024年3月.
- 岡崎 直観, 服部 翔, 平井 翔太, 飯田 大貴, 大井 聖也, 藤井 一喜, 中村 泰士, Mengsay Loem, 横田 理央, 水木 栄. Swallowコーパス: 日本語大規模ウェブコーパス. 言語処理学会第30回年次大会 (NLP2024), A6-1, pp. 1498–1503, 2024年3月.
- 古山 翔太, 永田 亮, 高村 大也, 岡崎 直観. 文法誤り訂正の自動評価のための原文・参照文・訂正文間のN-gram F-score. 言語処理学会第30回年次大会 (NLP2024), P4-25, pp. 1198–1203, 2024年3月.
- 小池 隆斗, 金子 正弘, 岡崎 直観. 制約が異なる指示で生成された文章に対するLLM生成検出の頑健性. 言語処理学会第30回年次大会 (NLP2024), A4-4, pp. 943–948, 2024年3月.
- Youmi Ma, An Wang, 岡崎 直観. 言語横断ラベル射影を用いた日本語文書レベル関係抽出データセットの構築. 言語処理学会第30回年次大会 (NLP2024), P3-4, pp. 783–788, 2024年3月.
- 小池 隆斗, 金子 正弘, 岡崎 直観. 敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出. 第18回NLP若手の会シンポジウム, S3-P13, 2023年8月.
- Youmi Ma, An Wang, 岡崎 直観. 日本語文書レベル関係抽出コーパスの構築. 第18回NLP若手の会シンポジウム, S5-P19, 2023年8月.
- 平井翔太, 村岡雅康, 岡崎 直観. 割り当て画像の多様性を考慮したVokenizationによるマスク言語モデルの改善. 2023年度人工知能学会全国大会 (JSAI2023), 4Xin1-38, pp. (4 pages), 2023年6月. (doi: 10.11517/pjsai.JSAI2023.0_4Xin138)
- 丹羽 彩奈, 岡崎 直観. 事前学習済みモデルT5における近傍分布の有効性の調査. 言語処理学会第29回年次大会 (NLP2023), P12-6, pp. 3048–3053, 2023年3月.
- 前田 航希, 栗田 修平, 宮西 大樹. QuIC-360◦: 360◦ 画像に対するクエリ指向画像説明文生成のためのデータセット構築. 言語処理学会第29回年次大会 (NLP2023), H12-5, pp. 3013–3018, 2023年3月.
- 浦川 通, 新妻 巧朗, 田口 雄哉, 田森 秀明, 岡崎 直観, 乾 健太郎. 短歌における言語モデルの実応用–歌人の視点を通した生成と作歌支援の実践から–. 言語処理学会第29回年次大会 (NLP2023), P11-6, pp. 2779–2784, 2023年3月.
- 谷口 大輔, 脇本 宏平, 丹羽 彩奈, 岡崎 直観. 大規模言語モデルにおける文生成方向に関する依存性の検証. 言語処理学会第29回年次大会 (NLP2023), H9-1, pp. 2200–2205, 2023年3月.
- 中本 裕大, 瀬在 恭介, 元川 凱喜, 麻生 英樹, 岡崎 直観. 日本語大規模言語モデルにおける知識グラフを活用した意味理解性能の向上. 言語処理学会第29回年次大会 (NLP2023), B9-4, pp. 2140–2145, 2023年3月.
- Mengsay Loem, 高瀬 翔, 金子 正弘, 岡崎 直観. マルチヘッドニューラルN-gramによる自己注意機構の代替. 言語処理学会第29回年次大会 (NLP2023), A9-1, pp. 2094–2099, 2023年3月.
- 西田 京介, 長谷川 拓, 前田 航希, 齋藤 邦子. DueT: 視覚・言語のDual-adapter Tuningによる基盤モデル. 言語処理学会第29回年次大会 (NLP2023), B7-3, pp. 1586–1591, 2023年3月.
- Trang Nguyen, Naoaki Okazaki. DAS-VQA: Dual Awareness Systems for Improving Generalization in Visual Question Answering. 言語処理学会第29回年次大会 (NLP2023), B7-1, pp. 1574–1579, 2023年3月.
- Panatchakorn Anantaprayoon, 金子 正弘, 岡崎 直観. 下流タスクでの日本語事前学習モデルの性別バイアスの評価. 言語処理学会第29回年次大会 (NLP2023), A7-3, pp. 1563–1568, 2023年3月.
- 服部 翔, Youmi Ma, 岡崎 直観. クエリ指向要約におけるクエリと要約の統合的な生成. 言語処理学会第29回年次大会 (NLP2023), H5-2, pp. 1244–1249, 2023年3月.
- 金子 正弘, Graham Neubig, 岡崎 直観. 人間とシステムの議論に基づくNLPタスクの問題に対する予測. 言語処理学会第29回年次大会 (NLP2023), H4-5, pp. 979–983, 2023年3月.
- 水木 栄, 岡崎 直観. 埋め込み表現の意味適応による知識ベース語義曖昧性解消. 言語処理学会第29回年次大会 (NLP2023), C3-1, pp. 622–627, 2023年3月.
- Youmi Ma, An Wang, 岡崎 直観. 文書レベル関係抽出における根拠認識の統合. 言語処理学会第29回年次大会 (NLP2023), B3-3, pp. 605–610, 2023年3月.
- Zhishen Yang, Raj Dabre, Hideki Tanaka, Naoaki Okazaki. Knowledge-Augmented Figure Caption Generation. 言語処理学会第29回年次大会 (NLP2023), P2-9, pp. 460–465, 2023年3月.
- 遠藤 洸亮, Zhishen Yang, 岡崎 直観. 画像キャプション生成におけるJPEG圧縮への頑健性の改善. 言語処理学会第29回年次大会 (NLP2023), P2-2, pp. 419–424, 2023年3月.
- 飯田 大貴, 岡崎 直観. 事前学習済みモデルに基づく検索モデルにおけるドメイン適応手法の比較と相乗効果の検証. 言語処理学会第29回年次大会 (NLP2023), P1-9, pp. 176–181, 2023年3月.
- 飯田 大貴, 岡崎 直観. 疎ベクトル検索における語彙と単語頻度のギャップ解消を通じた教師なしドメイン適合. 第17回NLP若手の会シンポジウム, P4-08, 2022年8月.
- 馬 尤咪, 王 安, 岡崎 直観. 文書レベル関係抽出における人間と注意機構の根拠文の対応付け. 第17回NLP若手の会シンポジウム, P2-03, 2022年8月.
- 古山 翔太, 永田 亮, 高村 大也, 岡崎 直観. 日本語誤り訂正のための誤り区間と誤り種類の自動アノテーションに向けて. 第17回NLP若手の会シンポジウム, P4-09, 2022年8月.
- Mengsay Loem, 高瀬 翔, 岡崎 直観. Are Neighbors Enough? Multi-Head Neural n-gram can be Alternative to Self-attention. 第17回NLP若手の会シンポジウム, P5-07, 2022年8月.
- 谷口 大輔, 脇本 宏平, 黒田 和矢, 川本 峻頌, 西口 佳佑, 丹羽 彩奈, 岡崎 直観. 商品レビューと商品特徴を用いた広告文制作支援. 2022年度人工知能学会全国大会 (JSAI2022), 3Yin2-07, pp. (4 pages), 2022年6月. (doi: 10.11517/pjsai.JSAI2022.0_3Yin207)
- 植木 滉一郎, 平岡 達也, 岡崎 直観. 記事に忠実ではない訓練事例も活用した見出し生成モデルの忠実性の改善法. 言語処理学会第28回年次大会 (NLP2022), pp. 2002–2007, 2022年3月.
- 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. 単語の長さと構成要素を考慮した単語レベルの摂動. 言語処理学会第28回年次大会 (NLP2022), pp. 1455–1460, 2022年3月.
- 前田 航希, 金子 正弘, 岡崎 直観. IMPARA: パラレルデータにおける修正の影響度に基づいた文法誤り訂正の自動評価法. 言語処理学会第28回年次大会 (NLP2022), pp. 328–333, 2022年3月.
- 吉川 和, 岡崎 直観. 確信度を考慮した言語モデルの関係知識評価. 言語処理学会第28回年次大会 (NLP2022), pp. 532–537, 2022年3月.
- Loem Mengsay, 高瀬 翔, 金子 正弘, 岡崎 直観. 抽出型要約と言い換えによる生成型要約の訓練データ拡張. 言語処理学会第28回年次大会 (NLP2022), pp. 1996–2001, 2022年3月.
- Youmi Ma, 平岡 達也, 岡崎 直観. 畳み込みニューラルネットワークを用いた表ラベリングによる固有表現認識と関係抽出 . 言語処理学会第28回年次大会 (NLP2022), pp. 1197–1202, 2022年3月.
- 石川 遼伍, 丹羽 彩奈, 水木 栄, 岡崎 直観. 疑似訓練データによる格助詞の省略に頑健な係り受け解析. 言語処理学会第28回年次大会 (NLP2022), pp. 1808–1813, 2022年3月.
- 丹羽 彩奈, 高瀬 翔, 岡崎 直観. 近傍の事例を用いた非自己回帰生成. 言語処理学会第28回年次大会 (NLP2022), pp. 1306–1311, 2022年3月.
- 嘉田 紗世, 山野 陽祐, 新美 茜, 田森 秀明, 小海 則人, 岡崎 直観, 乾 健太郎. 動画タイトルを用いたサムネイル画像の自動選択手法の提案. 言語処理学会第28回年次大会 (NLP2022), pp. 1366–1370, 2022年3月.
- 浦川 通, 新妻 巧朗, 田口 雄哉, 田森 秀明, 岡崎 直観, 乾 健太郎. モーラを考慮したFine-tuningによる口語短歌生成. 言語処理学会第28回年次大会 (NLP2022), pp. 1328–1332, 2022年3月.
- 高瀬 翔, 清野 舜, 小林 颯介, 鈴木 潤. Transformerを多層にする際の勾配消失問題と解決法について. 言語処理学会第28回年次大会 (NLP2022), pp. 173–178, 2022年3月.
- 小山 碧海, 金子 正弘, 小町 守. 学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析. 第16回NLP若手の会シンポジウム, P1-04, 2021年8月.
- 蘆田 真奈, 金子 正弘, 平澤 寅庄, 小町 守. QAタスクにおけるGPTの性差別的バイアスの評価及びプロンプトを用いたバイアス除去手法の検討. 第16回NLP若手の会シンポジウム, P2-02, 2021年8月.
- 丹羽 彩奈, 松田 寛. 個人間の感情理解の揺れを考慮した感情分析に向けた試み. 2021年度人工知能学会全国大会 (JSAI2021), pp. (4 pages), 2021年6月. (doi: pjsai.JSAI2021.0_2Yin506)
- 水木 栄, 岡崎 直観. 階層コード表現を用いた上位下位関係の識別. 言語処理学会第27回年次大会 (NLP2021), pp. 1236–1241, 2021年3月.
- 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. 後段モデルの損失値を用いた単語分割のタスクへの最適化. 言語処理学会第27回年次大会 (NLP2021), pp. 486–491, 2021年3月.
- 丹羽 彩奈, 西口 佳佑, 岡崎 直観. 文脈を考慮した対義語穴埋め. 言語処理学会第27回年次大会 (NLP2021), pp. 1702–1707, 2021年3月.
- 笹沢 裕一, 岡崎 直観. 属性情報を追加した事前学習済みモデルのファインチューニング. 言語処理学会第27回年次大会 (NLP2021), pp. 765–770, 2021年3月.
- 昇 夏海, 平岡 達也, 丹羽 彩奈, 西口 佳佑, 岡崎 直観. 企業情報を考慮したキャッチコピーの自動生成. 言語処理学会第27回年次大会 (NLP2021), pp. 450–454, 2021年3月.
- Youmi Ma, 平岡 達也, 岡崎 直観. BERTを用いたTable-Fillingによる固有表現抽出と関係抽出. 言語処理学会第27回年次大会 (NLP2021), pp. 1274–1279, 2021年3月.
- 古山 翔太, 高村 大也, 岡崎 直観. ニューラル文法誤り訂正のための多様な規則を用いる人工誤り生成. 言語処理学会第27回年次大会 (NLP2021), pp. 1017–1022, 2021年3月.
- 高瀬 翔, 清野 舜. エンコーダ・デコーダの学習に効果的な摂動の調査. 言語処理学会第27回年次大会 (NLP2021), pp. 1391–1396, 2021年3月.
- 那須川 哲哉, 鈴木 祥子, 村岡 雅康, 平野 真理. コロナ禍の状況を自由記述文で記録し分析する試み. 言語処理学会第27回年次大会 (NLP2021), pp. 585–589, 2021年3月.
- 金山 博, 岩本 蘭, 村岡 雅康, 大湖 卓也, 宮本 晃太郎. 名詞句の処理に頑健な構文解析器. 言語処理学会第27回年次大会 (NLP2021), pp. 492–496, 2021年3月.
- 山田 康輔, 人見 雄太, 田森 秀明, 岡崎 直観, 乾 健太郎. 指定語句を確実に含む見出し生成. 言語処理学会第27回年次大会 (NLP2021), pp. 1070–1074, 2021年3月.
- 叶内 晨, 根石 将人, 林部 祐太, 大内 啓樹, 岡崎 直観. 宿の推薦根拠説明システムにおける魅力度の考慮と実用を見据えた評価. 言語処理学会第27回年次大会 (NLP2021), pp. 461–465, 2021年3月.
- Yuichi Sasazawa, Naoaki Okazaki. WER99 at the NTCIR-15 QA Lab-PoliInfo-2 Classification Task. NTCIR-15, pp. 124–129, 2020年12月.
- 丹羽 彩奈, 西口 佳佑, 岡﨑 直観. マスク言語モデルを用いた対句キャッチコピー生成. 第15回NLP若手の会シンポジウム, 2020年8月.
- 昇 夏海, 平岡 達也, 丹羽 彩奈, 岡﨑 直観, 脇本 宏平, 黒田 和矢, 西口 佳佑. 企業情報を考慮した広告文の自動生成. 第15回NLP若手の会シンポジウム, 2020年8月.
- Zhishen Yang, Naoaki Okazaki. News Image Caption Generation. 第34回人工知能学会全国大会 (JSAI2020), pp. (4 pages), 2020年6月. (doi: 10.11517/pjsai.JSAI2020.0_2D1GS905)
- 丹羽 彩奈, 脇本 宏平, 西口 佳佑, 毛利 真崇, 岡崎 直観. 単語の対応関係を利用したスパン候補の絞り込みによるキャッチコピーの対句構造解析. 第34回人工知能学会全国大会 (JSAI2020), pp. (4 pages), 2020年6月. (doi: 10.11517/pjsai.JSAI2020.0_1E5GS901)
- 人見 雄太, 田口 雄哉, 田森 秀明, 岡崎 直観, 乾 健太郎. 小規模リソースにおける生成型要約のためのスタイル転移. 言語処理学会第26回年次大会 (NLP2020), pp. 929–932, 2020年3月.
- 叶内 晨, 根石 将人, 林部 祐太, 岡崎 直観. 旅行情報サイトのレビューを用いた抽象的な要求に対する根拠付き推薦文の生成. 言語処理学会第26回年次大会 (NLP2020), pp. 29–32, 2020年3月.
- 陳宏, 西田 典起, 朱中元, 岡崎 直観, 中山 英樹. RST Discourse Structure Improves Story Ending Generation. 言語処理学会第26回年次大会 (NLP2020), pp. 21–24, 2020年3月.
- 高瀬 翔, 岡崎 直観. 翻訳と見出し文生成の同時学習による言語横断見出し文生成モデル. 言語処理学会第26回年次大会 (NLP2020), pp. 1471–1474, 2020年3月.
- 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. RNNにより高次の依存を考慮したニューラル隠れマルコフモデル. 言語処理学会第26回年次大会 (NLP2020), pp. 1332–1335, 2020年3月.
- 松丸 和樹, 高瀬 翔, 岡崎 直観. 見出し生成の忠実性の改善. 言語処理学会第26回年次大会 (NLP2020), pp. 933–936, 2020年3月.
- 丹羽 彩奈, 脇本 宏平, 西口 佳佑, 毛利 真崇, 岡崎 直観. キャッチコピーにおける対句構造の解析. 言語処理学会第26回年次大会 (NLP2020), pp. 601–604, 2020年3月.
- 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. RNNによる遷移確率計算を用いた隠れマルコフモデル. 第242回自然言語処理研究会, 2019-NL-242(2), pp. 1–6, 2019年10月.
- 丹羽 彩奈, 岡崎 直観, 西口 佳佑, 亀山 千尋, 毛利 真崇. 修辞技法を考慮したキャッチコピー自動生成に向けた研究. 第14回NLP若手の会シンポジウム, 63, 2019年8月.
- 平岡 達也, 高瀬 翔, 岡崎 直観. RNNによる遷移確率計算を用いた隠れマルコフモデル. 第14回NLP若手の会シンポジウム, 79, 2019年8月.
- 高瀬 翔, 岡崎 直観. 機械翻訳と要約生成の統一モデルによる言語横断見出し文生成. 第14回NLP若手の会シンポジウム, 85, 2019年8月.
- 松丸 和樹, 高瀬 翔, 岡崎 直観. 含意関係に基づく見出し生成タスクの見直し. 第240回自然言語処理研究会, 2019-NL-240(1), pp. 1–8, 2019年6月.
- 島津 翔, 高瀬 翔, 中澤 敏明, 岡崎 直観. 文脈を考慮した日英機械翻訳に向けた評価データの構築. 言語処理学会第25回年次大会 (NLP2019), pp. 5–8, 2019年3月.
- 笹沢 裕一, 高瀬 翔, 岡崎 直観. 対話型質問応答の省略補完. 言語処理学会第25回年次大会 (NLP2019), pp. 163–166, 2019年3月.
- 晩 鴻翔, 岡崎 直観. 語りに基づく認知症傾向判別. 言語処理学会第25回年次大会 (NLP2019), pp. 501–504, 2019年3月.
- 丹羽 彩奈, 岡崎 直観, 西口 佳佑, 亀山 千尋, 毛利 真崇. キャッチコピーの自動生成に向けた分析. 言語処理学会第25回年次大会 (NLP2019), pp. 558–561, 2019年3月.
- 高瀬 翔, 岡崎 直観. 位置エンコーディングを用いた出力長制御. 言語処理学会第25回年次大会 (NLP2019), pp. 687–690, 2019年3月.
- 磯 颯, 上原 由衣, 石垣 達也, 能地 宏, 荒牧 英治, 小林 一郎, 宮尾 祐介, 岡崎 直観, 高村 大也. Data-to-Textにおける主題遷移のモデル化. 言語処理学会第25回年次大会 (NLP2019), pp. 727–730, 2019年3月.
- Erick Mendieta, Naoaki Okazaki, Hiroya Takamura. Generating Natural-Language Navigation Instructions from Panoramic Images. 言語処理学会第25回年次大会 (NLP2019), pp. 739–742, 2019年3月.
- 人見 雄太, 田口 雄哉, 田森 秀明, 菊田 洸, 西鳥 羽二郎, 岡崎 直観, 乾 健太郎, 奥村 学. 出力長制御を考慮した見出し生成モデルのための大規模コーパス. 言語処理学会第25回年次大会 (NLP2019), pp. 1225–1228, 2019年3月.
- 塙 一晃, 佐々木 彬, 岡崎 直観, 乾 健太郎. Wikipediaから獲得した外部知識を用いた賛否分類. 第237回自然言語処理研究会, 2018-NL-237(6), pp. 1–8, 2018年9月.
- 鈴木 正敏, 松田 耕史, 岡崎 直観, 乾 健太郎. 読解による解答可能性を付与した質問応答データセットの構築. 言語処理学会第24回年次大会 (NLP2018), pp. 702–705, 2018年3月.
- 伊藤 拓海, 山口 健史, 田 然, 松田 耕史, 岡崎 直観, 乾 健太郎. 自治体FAQの比較マイニング. 言語処理学会第24回年次大会 (NLP2018), pp. 536–539, 2018年3月.
- 阿部 香央莉, 松林 優一郎, 岡崎 直観, 乾 健太郎. ニューラルネットを用いた多方言の翻訳と類型分析. 言語処理学会第24回年次大会 (NLP2018), pp. 304–307, 2018年3月.
- 清野 舜, 高瀬 翔, 鈴木 潤, 岡崎 直観, 乾 健太郎, 永田 昌明. ニューラルヘッドライン生成における誤生成問題の改善. 言語処理学会第24回年次大会 (NLP2018), pp. 1–4, 2018年3月.
- 松田耕史, 岡崎直観, 乾健太郎. クラウドソーシングを系に組み込んだテキストからの関係知識抽出. 第12回NLP若手の会シンポジウム, P17, 2017年9月.
- 伊藤 拓海, 鈴木 正敏, 田 然, 山口 健史, 岡崎 直観, 乾 健太郎. 自治体QAサービスのためのFAQの自治体間の横断的解析. 第12回NLP若手の会シンポジウム, P19, 2017年9月.
- 塙 一晃, 佐々木 彬, 岡崎 直観, 乾 健太郎. トピックに関する因果関係知識を利用した賛否分類. 第12回NLP若手の会シンポジウム, P28, 2017年9月.
- 鈴木 正敏, 松田 耕史, 岡崎 直観, 乾 健太郎. Wikipediaを知識源に用いた文書検索と読解によるクイズ解答システム. 第12回NLP若手の会シンポジウム, P46, 2017年9月.
査読なし論文
- Masahiro Kaneko, Youmi Ma, Yuki Wata, and Naoaki Okazaki. Sampling-based Pseudo-Likelihood for Membership Inference Attacks, 2024.
- Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, and Naoaki Okazaki. Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction. In Proceedings of the Fifth Widening Natural Language Processing Workshop (WiNLP2021), November 2021.
- Zhishen Yang, Tosho Hirasawa, Mamoru Komachi, and Naoaki Okazaki. Do Videos Guide Translations? Evaluation on Video-guided Machine Translation dataset. In Visually Grounded Interaction and Language (ViGIL), 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL 2021) workshop, June 2021.
- Tosho Hirasawa, Zhishen Yang, Mamoru Komachi, and Naoaki Okazaki. Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020. In First Workshop on Advances in Language and Vision Research (ALVR 2020), ACL 2020, July 2020.
- Youmi Ma, Tatsuya Hiraoka, and Naoaki Okazaki. Named Entity Recognition and Relation Extraction using Enhanced Table Filling by Contextualized Representations, 2020.