発表

受賞

  1. 第30回言語処理学会 若手奨励賞 (2024-03-14)

    大井 聖也

    大規模言語モデルにおける評価バイアスの尤度に基づく緩和

    URL

  2. 第30回言語処理学会 若手奨励賞 (2024-03-14)

    綿 祐貴

    大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃

    URL

  3. 第30回言語処理学会 若手奨励賞 (2024-03-14)

    Mengsay Loem

    敵対的発言を取り入れた議論による言語モデルの学習強化と推論力の向上

    URL

  4. 第30回言語処理学会 若手奨励賞 (2024-03-14)

    丹羽 彩奈

    AmbiNLG:自然言語生成のための指示テキストの曖昧性解消

    URL

  5. 第30回言語処理学会 若手奨励賞 (2024-03-14)

    古山 翔太

    文法誤り訂正の自動評価のための原文・参照文・訂正文間のN-gram F-score

    URL

  6. 言語処理学会 第30回年次大会 優秀賞 (2024-03-14)

    岡崎 直観, 服部 翔, 平井 翔太, 飯田 大貴, 大井 聖也, 藤井 一喜, 中村 泰士, Mengsay Loem, 横田 理央, 水木 栄

    Swallowコーパス:日本語大規模ウェブコーパス

    URL

  7. 言語処理学会 第30回年次大会 優秀賞 (2024-03-14)

    藤井 一喜, 中村 泰士, Mengsay Loem, 飯田 大貴, 大井 聖也, 服部 翔, 平井 翔太, 水木 栄, 横田 理央, 岡崎 直観

    継続事前学習による日本語に強い大規模言語モデルの構築

    URL

  8. NLP若手の会 第18回シンポジウム 奨励賞 (2023-08-31)

    Youmi Ma, An Wang, 岡崎 直観

    日本語文書レベル関係抽出コーパスの構築

    URL

  9. NLP若手の会 第18回シンポジウム スポンサー賞(PKSHA Technology賞) (2023-08-31)

    小池 隆斗, 金子 正弘, 岡崎 直観

    敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出

    URL

  10. NLP若手の会 第18回シンポジウム スポンサー賞(博報堂テクノロジーズ賞) (2023-08-31)

    小池 隆斗, 金子 正弘, 岡崎 直観

    敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出

    URL

  11. 言語処理学会 第29回年次大会 最優秀賞 (2023-03-16)

    Youmi Ma, An Wang, 岡崎 直観

    文書レベル関係抽出における根拠認識の統合

    URL

  12. 言語処理学会 第29回年次大会 優秀賞 (2023-03-16)

    水木 栄, 岡崎 直観

    埋め込み表現の意味適応による知識ベース語義曖昧性解消

    URL

  13. 言語処理学会 第29回年次大会 スポンサー賞(日立製作所) (2023-03-16)

    服部 翔, Youmi Ma, 岡崎 直観

    クエリ指向要約におけるクエリと要約の統合的な生成

    URL

  14. 言語処理学会 第29回年次大会 委員特別賞 (2023-03-16)

    金子 正弘, Graham Neubig, 岡崎 直観

    人間とシステムの議論に基づくNLPタスクの問題に対する予測

    URL

  15. 言語処理学会 第29回年次大会 委員特別賞 (2023-03-16)

    西田 京介, 長谷川 拓, 前田 航希, 齋藤 邦子

    DueT: 視覚・言語のDual-adapter Tuningによる基盤モデル

    URL

  16. 言語処理学会論文賞 最優秀論文賞 (2022-03-17)

    平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観

    テキストベクトルの重みづけを用いたタスクに対する単語分割の最適化

    URL

  17. 言語処理学会 第28回年次大会 優秀賞 (2022-03-17)

    高瀬 翔, 清野 舜, 小林 颯介, 鈴木 潤

    Transformerを多層にする際の勾配消失問題と解決法について

    URL

  18. 言語処理学会 第28回年次大会 優秀賞 (2022-03-17)

    前田 航希, 金子 正弘, 岡崎 直観

    IMPARA: パラレルデータにおける修正の影響度に基づいた文法誤り訂正の自動評価法

    URL

  19. 言語処理学会 第28回年次大会 委員特別賞 (2022-03-17)

    丹羽 彩奈, 高瀬 翔, 岡崎 直観

    近傍の事例を用いた非自己回帰生成

    URL

  20. 言語処理学会 第28回年次大会 委員特別賞 (2022-03-17)

    吉川 和, 岡崎 直観

    確信度を考慮した言語モデルの関係知識評価

    URL

  21. 言語処理学会 第28回年次大会 委員特別賞 (2022-03-17)

    嘉田 紗世, 山野 陽祐, 新美 茜, 田森 秀明, 小海 則人, 岡崎 直観, 乾 健太郎

    動画タイトルを用いたサムネイル画像の自動選択手法の提案

    URL

  22. AKBC2021 Outstanding Paper Award (2021-10-05)

    Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, Naoaki Okazaki

    Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction

    URL

  23. 言語処理学会 第27回年次大会 優秀賞 (2021-03-18)

    水木 栄, 岡崎 直観

    階層コード表現を用いた上位下位関係の識別

    URL

  24. 第27回言語処理学会 若手奨励賞 (2021-03-18)

    平岡 達也

    後段モデルの損失値を用いた単語分割のタスクへの最適化

    URL

  25. 第27回言語処理学会 若手奨励賞 (2021-03-18)

    Youmi Ma

    BERTを用いたTable-Fillingによる固有表現抽出と関係抽出

    URL

  26. 第27回言語処理学会 委員特別賞 (2021-03-18)

    山田 康輔, 人見 雄太, 田森 秀明, 岡崎 直観, 乾 健太郎

    指定語句を確実に含む見出し生成

    URL

  27. 第27回言語処理学会 スポンサー賞 (2021-03-18)

    山田 康輔, 人見 雄太, 田森 秀明, 岡崎 直観, 乾 健太郎

    指定語句を確実に含む見出し生成

    URL

  28. 令和元年度東工大教育賞 (2021-03-02)

    三宅 美博, 岡崎 直観, 金森 敬文, 村田 剛志, 西崎 真也, 首藤 一幸, 吉瀬 謙二, 下坂 正倫, 関嶋 政和, 柳澤 渓甫, 久世 正弘, 三平 満司, 山中 一郎, 伊藤 武彦, 竹内 徹, 山口 猛央, 阪口 啓

    大学院を対象とするデータサイエンス・AI全学教育プログラム

    URL

  29. 第15回NTCIR プレゼンテーション賞 (2020-12-17)

    笹沢 裕一, 岡崎 直観

    WER99 at the NTCIR-15 QA Lab-PoliInfo-2 Classification Task

    URL

  30. Video-guided Machine Translation (VMT) Challenge 2020 優勝 (2020-07-13)

    Tosho Hirasawa, Zhishen Yang, Mamoru Komachi, and Naoaki Okazaki

    Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020

    URL

  31. 第26回言語処理学会 言語資源賞 (2020-03-20)

    人見雄太, 田口雄哉, 田森秀明, 岡崎直観, 乾健太郎

    小規模リソースにおける生成型要約のためのスタイル転移

    URL

  32. 第26回言語処理学会 若手奨励賞 (2020-03-20)

    松丸 和樹

    見出し生成の忠実性の改善

    URL

  33. 第242回自然言語処理研究会 若手奨励賞 (2019-10-25)

    平岡 達也

    RNNによる遷移確率計算を用いた隠れマルコフモデル

    URL

  34. 第240回自然言語処理研究会 優秀研究賞 (2019-06-14)

    松丸 和樹, 高瀬 翔, 岡崎 直観

    含意関係に基づく見出し生成タスクの見直し

    URL

  35. 人工知能学会 論文賞 (2018-06-27)

    高瀬 翔, 岡崎 直観, 乾 健太郎

    関係パタンの分散表現の計算

    URL

  36. 言語処理学会 第24回年次大会 優秀賞 (2018-03-15)

    清野 舜, 高瀬 翔, 鈴木 潤, 岡崎 直観, 乾 健太郎, 永田 昌明

    ニューラルヘッドライン生成における誤生成問題の改善

    URL

発表文献

ジャーナル論文

  1. Youmi Ma, An Wang, 岡崎 直観. 文書レベル関係抽出における根拠認識の統合. 自然言語処理, 31(1):105–133, 2024年3月.

  2. 松原 真弓, 麻場 直喜, 内藤 昭一, 川村 晋太郎, 井口 慎也, 能勢 将樹, 岡崎 直観. タスク指向対話システムにおけるユーザの特徴を考慮した話題導入. 情報処理学会論文誌デジタルプラクティス(DP), 4(3):98–106, 2023年7月.

    URL

  3. Mengsay Loem, Sho Takase, Masahiro Kaneko, Naoaki Okazaki. ExtraPhrase: 生成型要約のための効率的データ拡張. 自然言語処理, 30(2):489–506, 2023年6月. (doi: 10.5715/jnlp.30.489)

    DOI

  4. Ao Liu, Congjian Luo, Naoaki Okazaki. Improving Logical-Level Natural Language Generation with Topic-Conditioned Data Augmentation and Logical Form Generation. Journal of Information Processing, 31:332–343, 2023年4月. (doi: 10.2197/ipsjjip.31.332)

    DOI

  5. Ayana Niwa, Sho Takase, Naoaki Okazaki. Nearest Neighbor Non-autoregressive Text Generation. Journal of Information Processing, 31:334–352, 2023年4月. (doi: 10.2197/ipsjjip.31.344)

    DOI

  6. Chunpeng Ma, Aili Shen, Hiyori Yoshikawa, Tomoya Iwakura, Daniel Beck, Timothy Baldwin. On the Effectiveness of Images in Multi-Modal Text Classification: An Annotation Study. ACM Trans. Asian Low-Resour. Lang. Inf. Process., 22(3):1–19, 2023年3月. (doi: 10.1145/3565572)

    URL DOI

  7. 村岡 雅康, 岡崎 直観, 小比田 涼介, 石井 悦子. マルチモーダル文書におけるテキストと画像の整合タスクの提案. 自然言語処理, 29(4):1198–1232, 2022年12月. (doi: 10.5715/jnlp.29.1198)

    DOI

  8. Tosho Hirasawa, Masahiro Kaneko, Aizhan Imankulova, Mamoru Komachi. Pre-Trained Word Embedding and Language Model Improve Multimodal Machine Translation: A Case Study in Multi30K. IEEE Access, 10:67653–67668, 2022年. (doi: 10.1109/ACCESS.2022.3185243)

    DOI

  9. 飯田 大貴, 岡崎 直観. Zero-shotニューラル検索のための語彙一致と文脈の類似度による関連度スコアリング. 情報処理学会論文誌データベース(TOD), 15(3):20–35, 2022年10月.

    URL

  10. 古山 翔太, 高村 大也, 岡崎 直観. 多様な規則を活用した文法誤り訂正のデータ拡張に関する分析. 自然言語処理, 29(2):542–586, 2022年6月. (doi: 10.5715/jnlp.29.542)

    DOI

  11. Zhishen Yang, Tosho Hirasawa, Mamoru Komachi, Naoaki Okazaki. Why videos do not guide translations in video-guided machine translation? An empirical evaluation of video-guided machine translation dataset. Journal of Information Processing, 30:388–396, 2022年5月. (doi: 10.2197/ipsjjip.30.388)

    DOI

  12. Youmi Ma, Tatsuya Hiraoka, Naoaki Okazaki. Named Entity Recognition and Relation Extraction Using Enhanced Table Filling by Contextualized Representations. 自然言語処理, 29(1):187–223, 2022年3月. (doi: 10.5715/jnlp.29.187)

    DOI

  13. 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. 単語分割と後段モデルの損失値を用いた同時最適化. 自然言語処理, 29(1):112–143, 2022年3月. (doi: 10.5715/jnlp.29.112)

    DOI

  14. 甫立健悟, 金子正弘, 勝又智, 小町守. 文法誤り訂正における訂正度を考慮した多様な訂正文の生成. 自然言語処理, 28(2):428–449, 2021年6月. (doi: 10.5715/jnlp.28.428)

    DOI

  15. 吉村綾馬, 金子正弘, 梶原智之, 小町守. 文法誤り訂正の参照文を用いない自動評価の人手評価への最適化. 自然言語処理, 28(2):404–427, 2021年6月. (doi: 10.5715/jnlp.28.404)

    DOI

  16. Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, Naoaki Okazaki. Recurrent Neural Hidden Markov Model for High-Order Transition. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 21(2):1–15, 2022年3月. (doi: 10.1145/3476511)

    URL DOI

  17. 水木 栄, 岡崎 直観. 階層コード表現学習による上位下位関係の識別. 情報処理学会論文誌データベース(TOD), 14(4):8–23, 2021年10月.

    URL

  18. Emanuele Bugliarello, Ryan Cotterell, Naoaki Okazaki, Desmond Elliott. Multimodal Pretraining Unmasked: A Meta-Analysis and a Unified Framework of Vision-and-Language BERTs. Transactions of the Association for Computational Linguistics, 9:978–994, 2021年9月. (doi: 10.1162/tacl_a_00408)

    URL DOI

  19. Ayana Niwa, Naoaki Okazaki, Kohei Wakimoto, Keisuke Nishiguchi, Masataka Mouri. Construction of a Corpus of Rhetorical Devices in Slogans and Structural Analysis of Antitheses. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 20(6), 2021年11月. (doi: 10.1145/3465218)

    DOI

  20. Sangwhan Moon, Naoaki Okazaki. The Effects and Mitigation of Out-of-Vocabulary in Universal Language Models. Journal of Information Processing, 29:490–503, 2021年7月. (doi: 10.2197/ipsjjip.29.490)

    DOI

  21. 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. テキストベクトルの重みづけを用いたタスクに対する単語分割の最適化. 自然言語処理, 28(2):479–507, 2021年6月. (doi: 10.5715/jnlp.28.479)

    DOI

  22. Kaori Abe, Yuichiroh Matsubayashi, Naoaki Okazaki, Kentaro Inui. Multi-dialect Neural Machine Translation for 48 Low-resource Japanese Dialects. Journal of Natural Language Processing, 27(4):781–800, 2020年12月. (doi: 10.5715/jnlp.27.781)

    DOI

  23. Hayate Iso, Yui Uehara, Tatsuya Ishigaki, Hiroshi Noji, Eiji Aramaki, Ichiro Kobayashi, Yusuke Miyao, Naoaki Okazaki, Hiroya Takamura. Learning to Select, Track, and Generate for Data-to-Text. Journal of Natural Language Processing, 27(3):599–626, 2020年9月. (doi: 10.5715/jnlp.27.599)

    DOI

  24. Diana Galvan-Sosa, Koji Matsuda, Naoaki Okazaki, Kentaro Inui. Empirical Exploration of the Challenges in Temporal Relation Extraction from Clinical Text. Journal of Natural Language Processing, 27(2):383–409, 2020年6月. (doi: 10.5715/jnlp.27.383)

    DOI

  25. Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, Kentaro Inui. Stance Detection Attending External Knowledge from Wikipedia. Journal of Information Processing, 27:499–506, 2019年8月. (doi: 10.2197/ipsjjip.27.499)

    DOI

  26. Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki, Kentaro Inui. A Joint Neural Model for Fine-Grained Named Entity Classification of Wikipedia Articles. IEICE Transactions on Information and Systems, Special Section on Semantic Web and Linked Data, E101.D(1):73–81, 2018年1月. (doi: 10.1587/transinf.2017SWP0005)

    DOI

  27. Ran Tian, Naoaki Okazaki, Kentaro Inui. The mechanism of additive composition. Machine Learning, 106(7):1083–1130, 2017年7月. (doi: 10.1007/s10994-017-5634-8)

    DOI

  28. 高瀬 翔, 岡崎 直観, 乾 健太郎. 関係パタンの分散表現の計算. 人工知能学会論文誌, 32(4):D-G96_1-11, 2017年7月. (doi: 10.1527/tjsai.D-G96)

    DOI

  29. Shuangshuang Zhou, Naoaki Okazaki, Koji Matsuda, Ran Tian, Kentaro Inui. Supervised Approaches for Japanese Wikification. Journal of Information Processing, 25:341–350, 2017年4月. (doi: 10.2197/ipsjjip.25.341)

    DOI

国際会議論文

  1. Masanari Ohi, Masahiro Kaneko, Ryuto Koike, Mengsay Loem, and Naoaki Okazaki. Likelihood-based Mitigation of Evaluation Bias in Large Language Models. In Findings of the Association for Computational Linguistics: ACL 2024, pages (to appear), Bangkok, Thailand, August 2024.

  2. Marco Cognetta, Vilém Zouhar, Sangwhan Moon, and Naoaki Okazaki. Two Counterexamples to Tokenization and the Noiseless Channel. In Proceedings of The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages (to appear), May 2024.

  3. Panatchakorn Anantaprayoon, Masahiro Kaneko, and Naoaki Okazaki. Evaluating Gender Bias of Pre-trained Language Models in Natural Language Inference by Considering All Labels. In Proceedings of The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages (to appear), May 2024.

  4. Youmi Ma, An Wang, and Naoaki Okazaki. Building a Japanese Document-Level Relation Extraction Dataset Assisted by Cross-Lingual Transfer. In Proceedings of The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages (to appear), May 2024.

  5. Masahiro Kaneko and Naoaki Okazaki. Controlled Generation with Prompt Insertion for Natural Language Explanations in Grammatical Error Correction. In Proceedings of The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING), pages (to appear), May 2024.

  6. Ryuto Koike, Masahiro Kaneko, and Naoaki Okazaki. OUTFOX: LLM-generated Essay Detection through In-context Learning with Adversarially Generated Examples. In The 38th Annual AAAI Conference on Artificial Intelligence (AAAI), pages 21258–21266, February 2024.

  7. Koki Maeda, Shuhei Kurita, Taiki Miyanishi, and Naoaki Okazaki. Query-based Image Captioning from Multi-context 360° Images. In Findings of the Association for Computational Linguistics: EMNLP 2023 (EMNLP), pages 6940–6954, Singapore, December 2023. (doi: 10.18653/v1/2023.findings-emnlp.463)

    URL DOI

  8. Taku Hasegawa, Kyosuke Nishida, Koki Maeda, and Kuniko Saito. DueT: Image-Text Contrastive Transfer Learning with Dual-adapter Tuning. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 13607–13624, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.839)

    URL DOI

  9. Trang Nguyen and Naoaki Okazaki. Causal Reasoning through Two Layers of Cognition for Improving Generalization in Visual Question Answering. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 9221–9236, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.573)

    URL DOI

  10. Masahiro Kaneko and Naoaki Okazaki. Reducing Sequence Length by Predicting Edit Operations with Large Language Models. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 10017–10029, Singapore, December 2023. (doi: 10.18653/v1/2023.emnlp-main.619)

    URL DOI

  11. Youmi Ma, Bhushan Kotnis, Carolin Lawrance, Goran Glavaš, and Naoaki Okazaki. Improving Cross-Lingual Transfer for Open Information Extraction with Linguistic Feature Projection. In Proceedings of the 3rd Workshop on Multi-lingual Representation Learning (MRL), pages 125–138, Singapore, December 2023. (doi: 10.18653/v1/2023.mrl-1.11)

    URL DOI

  12. Trang Nguyen, Amin Mansouri, Kanika Madan, Khuong Nguyen, Kartik Ahuja, Dianbo Liu, and Yoshua Bengio. Reusable Slotwise Mechanisms. In Proceedings of the 37th Conference on Neural Information Processing System (NeurIPS), pages (to appear), December 2023.

  13. Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. The Impact of Debiasing on the Performance of Language Models in Downstream Tasks is Underestimated. In Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (AACL), pages (to appear), Bali, Indonesia, November 2023.

  14. Masayasu Muraoka, Bishwaranjan Bhattacharjee, Michele Merler, Graeme Blackwood, Yulong Li, and Yang Zhao. Cross-Lingual Transfer of Large Language Model by Visually-Derived Supervision Toward Low-Resource Languages. In Proceedings of the 31th ACM International Conference on Multimedia (MM ’23), pages 3637–3646, October 2023. (doi: 10.1145/3581783.3611992)

    DOI

  15. Yang Zhao, Tetsuya Nasukawa, Masayasu Muraoka, and Bishwaranjan Bhattacharjee. A Simple Yet Strong Domain-Agnostic De-bias Method for Zero-Shot Sentiment Classification. In Findings of the Association for Computational Linguistics: ACL 2023, pages 3923–3931, Toronto, Canada, July 2023.

    URL

  16. Mengsay Loem, Masahiro Kaneko, Sho Takase, and Naoaki Okazaki. Exploring Effectiveness of GPT-3 in Grammatical Error Correction: A Study on Performance and Controllability in Prompt-Based Methods. In Proceedings of the 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023) (BEA), pages 205–219, Toronto, Canada, July 2023.

    URL

  17. An Wang, Junfeng Jiang, Youmi Ma, Ao Liu, and Naoaki Okazaki. Generative Data Augmentation for Aspect Sentiment Quad Prediction. In Proceedings of the 12th Joint Conference on Lexical and Computational Semantics (*SEM), pages 128–140, Toronto, Canada, July 2023. (doi: 10.18653/v1/2023.starsem-1.12)

    URL DOI

  18. Marco Cognetta, Sangwhan Moon, Lawrence Wolf-Sonkin, and Naoaki Okazaki. Parameter-Efficient Korean Character-Level Language Modeling. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 2350–2356, Dubrovnik, Croatia, May 2023.

    URL

  19. Hiyori Yoshikawa and Naoaki Okazaki. Selective-LAMA: Selective Prediction for Confidence-Aware Evaluation of Language Models. In Findings of the Association for Computational Linguistics: EACL 2023 (Findings of EACL), pages 2017–2028, Dubrovnik, Croatia, May 2023.

    URL

  20. Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Comparing Intrinsic Gender Bias Evaluation Measures without using Human Annotated Examples. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 2857–2863, Dubrovnik, Croatia, May 2023.

    URL

  21. Sakae Mizuki and Naoaki Okazaki. Semantic Specialization for Knowledge-based Word Sense Disambiguation. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 3457–3470, Dubrovnik, Croatia, May 2023.

    URL

  22. Youmi Ma, An Wang, and Naoaki Okazaki. DREEAM: Guiding Attention with Evidence for Improving Document-Level Relation Extraction. In Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 1971–1983, Dubrovnik, Croatia, May 2023.

    URL

  23. Zhishen Yang, Raj Dabre, Hideki Tanaka, and Naoaki Okazaki. SciCap+: A Knowledge Augmented Dataset to Study the Challenges of Scientific Figure Captioning. In Proceedings of the Workshop on Scientific Document Understanding, co-located with 37th AAAI Conference on Artificial Intelligence (CEUR Workshop Proceedings), page (Paper13), Washington DC, USA, February 2023.

    URL

  24. Ao Liu, Haoyu Dong, Naoaki Okazaki, Shi Han, and Dongmei Zhang. PLOG: Table-to-Logic Pretraining for Logical Table-to-Text Generation. In Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 5531–5546, Abu Dhabi, United Arab Emirates, December 2022.

    URL

  25. Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Gender Bias in Meta-Embeddings. In Findings of the Association for Computational Linguistics: EMNLP 2022 (EMNLP), pages 3118–3133, Abu Dhabi, United Arab Emirates, December 2022.

    URL

  26. Hiroki Iida and Naoaki Okazaki. Unsupervised Domain Adaptation for Sparse Retrieval by Filling Vocabulary and Word Frequency Gaps. In Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing (Volume 1: Long Papers) (AACL), pages 752–765, Online, November 2022.

    URL

  27. Masahiro Kaneko, Danushka Bollegala, and Naoaki Okazaki. Debiasing Isn’t Enough! – on the Effectiveness of Debiasing MLMs and Their Social Biases in Downstream Tasks. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 1299–1310, Gyeongju, Republic of Korea, October 2022.

    URL

  28. Koki Maeda, Masahiro Kaneko, and Naoaki Okazaki. IMPARA: Impact based Metric for GEC using Parallel Data. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 3578–3588, Gyeongju, Republic of Korea, October 2022.

    URL

  29. Yidong Wang, Hao Wu, Ao Liu, Wenxin Hou, Zhen Wu, Jindong Wang, Takahiro Shinozaki, Manabu Okumura, and Yue Zhang. Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction. In Proceedings of the 29th International Conference on Computational Linguistics (COLING), pages 7075–7085, Gyeongju, Republic of Korea, October 2022.

    URL

  30. Hsuan-Yu Kuo, Youmi Ma, and Naoaki Okazaki. Annotating Entity and Causal Relationships on Japanese Vehicle Recall Information. In Proceedings of the 36th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 783–791, Manila, Philippines, October 2022.

    URL

  31. Vijay Daultani and Naoaki Okazaki. Improving Automatic Evaluation of Acceptability Based on Language Models with a Coarse Sentence Representation. In Proceedings of the 36th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 109–118, Manila, Philippines, October 2022.

    URL

  32. Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Overview of ChEMU 2022 Evaluation Campaign: Information Extraction in Chemical Patents. In International Conference of the Cross-Language Evaluation Forum for European Languages (CLEF), pages 521–540, September 2022.

  33. Mengsay Loem, Sho Takase, Masahiro Kaneko, and Naoaki Okazaki. ExtraPhrase: Efficient Data Augmentation for Abstractive Summarization. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop (NAACL SRW), pages 16–24, Hybrid: Seattle, Washington + Online, July 2022. (doi: 10.18653/v1/2022.naacl-srw.3)

    URL DOI

  34. Haoyu Dong, Zhoujun Cheng, Xinyi He, Mengyu Zhou, Anda Zhou, Fan Zhou, Ao Liu, Shi Han, and Dongmei Zhang. Table Pre-training: A Survey on Model Architectures, Pre-training Objectives, and Downstream Tasks. In Proceedings of the Thirty-First International Joint Conference on Artificial Intelligence (IJCAI), pages 5426–5435, July 2022. (doi: 10.24963/ijcai.2022/761)

    URL DOI

  35. Masahiro Kaneko, Aizhan Imankulova, Danushka Bollegala, and Naoaki Okazaki. Gender Bias in Masked Language Models for Multiple Languages. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), pages 2740–2750, Seattle, United States, July 2022. (doi: 10.18653/v1/2022.naacl-main.197)

    URL Code DOI

  36. Yu Pan, Zeyong Su, Ao Liu, Wang Jingquan, Nannan Li, and Zenglin Xu. A Unified Weight Initialization Paradigm for Tensorial Convolutional Neural Networks. In International Conference on Machine Learning (ICML), pages 17238–17257, Baltimore, Maryland, United States, July 2022.

    URL

  37. Won Ik Cho, Sangwhan Moon, Jongin Kim, Seokmin Kim, and Nam Soo Kim. StyleKQC: A Style-Variant Paraphrase Corpus for Korean Questions and Commands. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 7122–7128, Marseille, France, June 2022.

    URL

  38. Hwichan Kim, Sangwhan Moon, Naoaki Okazaki, and Mamoru Komachi. Learning How to Translate North Korean through South Korean. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 6711–6718, Marseille, France, June 2022.

    URL

  39. Sangwhan Moon, Won Ik Cho, Hye Joo Han, Naoaki Okazaki, and Nam Soo Kim. OpenKorPOS: Democratizing Korean Tokenization with Voting-Based Open Corpus Annotation. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 4975–4983, Marseille, France, June 2022.

    URL

  40. Sho Takase and Naoaki Okazaki. Multi-Task Learning for Cross-Lingual Abstractive Summarization. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 3008–3016, Marseille, France, June 2022.

    URL

  41. Yujin Takahashi, Masahiro Kaneko, Masato Mita, and Mamoru Komachi. ProQE: Proficiency-wise Quality Estimation dataset for Grammatical Error Correction. In Proceedings of the Thirteenth Language Resources and Evaluation Conference (LREC), pages 5994–6000, Marseille, France, June 2022.

    URL

  42. Masahiro Kaneko, Sho Takase, Ayana Niwa, and Naoaki Okazaki. Interpretability for Language Learners Using Example-Based Grammatical Error Correction. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 7176–7187, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.496)

    URL Code DOI

  43. Ao Liu, An Wang, and Naoaki Okazaki. Semi-Supervised Formality Style Transfer with Consistency Training. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 4689–4701, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.321)

    URL Code DOI

  44. Yi Zhou, Masahiro Kaneko, and Danushka Bollegala. Sense Embeddings are also Biased – Evaluating Social Biases in Static and Contextualised Sense Embeddings. In Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 1924–1935, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.acl-long.135)

    URL DOI

  45. Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Word-level Perturbation Considering Word Length and Compositional Subwords. In Findings of the Association for Computational Linguistics: ACL 2022 (Findings of ACL), pages 3268–3275, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.findings-acl.258)

    URL Code DOI

  46. Sho Takase, Tatsuya Hiraoka, and Naoaki Okazaki. Single Model Ensemble for Subword Regularized Models in Low-Resource Machine Translation. In Findings of the Association for Computational Linguistics: ACL 2022 (Findings of ACL), pages 2536–2541, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.findings-acl.199)

    URL DOI

  47. Youmi Ma, Tatsuya Hiraoka, and Naoaki Okazaki. Joint Entity and Relation Extraction Based on Table Labeling Using Convolutional Neural Networks. In Proceedings of the Sixth Workshop on Structured Prediction for NLP (SPNLP), pages 11–21, Dublin, Ireland, May 2022. (doi: 10.18653/v1/2022.spnlp-1.2)

    URL Code DOI

  48. Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zenan Zhai, Zubair Afzal, Trevor Cohn, Timothy Baldwin, and Karin Verspoor. The ChEMU 2022 Evaluation Campaign: Information Extraction in Chemical Patents. In European Conference on Information Retrieval (ECIR), pages 400–407, April 2022.

  49. Masahiro Kaneko and Danushka Bollegala. Unmasking the Mask – Evaluating Social Biases in Masked Language Models. In Proceedings of the Thirty-Sixth AAAI Conference on Artificial Intelligence (AAAI), pages 11954–11962, Vancouver, BC, Canada, February 2022. (doi: 10.1609/aaai.v36i11.21453)

    URL DOI

  50. Qian Sun, Aili Shen, Hiyori Yoshikawa, Chunpeng Ma, Daniel Beck, Tomoya Iwakura, and Timothy Baldwin. Evaluating Hierarchical Document Categorisation. In Proceedings of the The 19th Annual Workshop of the Australasian Language Technology Association (ALTA), pages 179–184, December 2021.

  51. Hiroki Iida and Naoaki Okazaki. Incorporating Semantic Textual Similarity and Lexical Matching for Information Retrieval. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 582–591, Shanghai, China, November 2021.

    URL

  52. Shota Koyama, Hiroya Takamura, and Naoaki Okazaki. Various Errors Improve Neural Grammatical Error Correction. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 251–261, Shanghai, China, November 2021.

    URL

  53. Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Overview of ChEMU 2021: Reaction Reference Resolution and Anaphora Resolution in Chemical Patents. In Experimental IR Meets Multilinguality, Multimodality, and Interaction: 12th International Conference of the CLEF Association (CLEF), September 2021. (doi: 10.1007/978-3-030-85251-1_20)

    URL DOI

  54. Yuan Li, Biaoyan Fang, Jiayuan He, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Timothy Baldwin, and Karin Verspoor. Extended Overview of ChEMU 2021: Reaction Reference Resolution and Anaphora Resolution in Chemical Patents. In Proceedings of the Working Notes of CLEF 2021, volume 2936, pages 693–709, September 2021.

    URL

  55. Kosuke Yamada, Yuta Hitomi, Hideaki Tamori, Ryohei Sasano, Naoaki Okazaki, Kentaro Inui, and Koichi Takeda. Transformer-based Lexically Constrained Headline Generation. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 4085–4090, Online and Punta Cana, Dominican Republic, November 2021. (doi: 10.18653/v1/2021.emnlp-main.335)

    URL Code DOI

  56. Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, and Naoaki Okazaki. Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction. In Proceedings of the 3rd Conference on Automated Knowledge Base Construction (AKBC), pages (19 pages), October 2021.

    URL Slides

  57. Hiyori Yoshikawa, Tomoya Iwakura, Kimi Kaneko, Hiroaki Yoshida, Yasutaka Kumano, Kazutaka Shimada, Rafal Rzepka, and Patrycja Swieczkowska. Tell Me What You Read: Automatic Expertise-Based Annotator Assignment for Text Annotation in Expert Domains. In Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2021), pages 1575–1585, Held Online, September 2021.

    URL

  58. Ayana Niwa, Keisuke Nishiguchi, and Naoaki Okazaki. Predicting Antonyms in Context using BERT. In Proceedings of the 14th International Conference on Natural Language Generation (INLG), pages 48–54, Aberdeen, Scotland, UK, August 2021.

    URL

  59. Keiji Yasuda, Ichiro Yamada, Naoaki Okazaki, Hideki Tanaka, Hidehiro Asaka, Takeshi Anzai, and Fumiaki Sugaya. Field Experiments of Real Time Foreign News Distribution Powered by MT. In Proceedings of Machine Translation Summit XVIII: Users and Providers Track (MT Summit), pages 227–232, Virtual, August 2021.

    URL

  60. Raj Dabre, Aizhan Imankulova, and Masahiro Kaneko. Studying The Impact Of Document-level Context On Simultaneous Neural Machine Translation. In Proceedings of the 18th Biennial Machine Translation Summit (Volume 1: Research Track) (MT Summit), pages 202–214, Virtual, August 2021.

    URL

  61. Hiyori Yoshikawa, Saber A. Akhondi, Camilo Thorne, Christian Druckenbrodt, Ralph Hoessel, Zenan Zhai, Jiayuan He, Timothy Baldwin, and Karin Verspoor. Chemical Reaction Reference Resolution in Patents. In Proceedings of the 2nd Workshop on on Patent Text Mining and Semantic Technologies, pages 10–17, July 2021.

    URL

  62. Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Joint Optimization of Tokenization and Downstream Model. In Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021 (Findings of ACL), pages 244–255, Online, August 2021. (doi: 10.18653/v1/2021.findings-acl.21)

    URL Code DOI

  63. Aomi Koyama, Kengo Hotate, Masahiro Kaneko, and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW), pages 126–135, Online, June 2021. (doi: 10.18653/v1/2021.naacl-srw.16)

    URL Video DOI

  64. Seiichiro Kondo, Kengo Hotate, Tosho Hirasawa, Masahiro Kaneko, and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW), pages 143–149, Online, June 2021. (doi: 10.18653/v1/2021.naacl-srw.18)

    URL DOI

  65. Sho Takase and Shun Kiyono. Rethinking Perturbations in Encoder-Decoders for Fast Training. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), pages 5767–5780, Online, June 2021. (doi: 10.18653/v1/2021.naacl-main.460)

    URL DOI

  66. Chunpeng Ma, Aili Shen, Hiyori Yoshikawa, Tomoya Iwakura, Daniel Beck, and Timothy Baldwin. On the (In)Effectiveness of Images for Text Classification. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 42–48, Online, April 2021. (doi: 10.18653/v1/2021.eacl-main.4)

    URL DOI

  67. Masahiro Kaneko and Danushka Bollegala. Debiasing Pre-trained Contextualised Embeddings. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 1256–1266, Online, April 2021.

    URL Code

  68. Masahiro Kaneko and Danushka Bollegala. Dictionary-based Debiasing of Pre-trained Word Embeddings. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume (EACL), pages 212–223, Online, April 2021. (doi: 10.18653/v1/2021.eacl-main.16)

    URL Code DOI

  69. Zhishen Yang and Naoaki Okazaki. Image Caption Generation for News Articles. In Proceedings of the 28th International Conference on Computational Linguistics (COLING), pages 1941–1951, Barcelona, Spain (Online), December 2020. (doi: 10.18653/v1/2020.coling-main.176)

    URL Code DOI

  70. Sho Takase and Sosuke Kobayashi. All Word Embeddings from One Embedding. In Proceedings of the 34th Conference on Neural Information Processing System (NeurIPS), pages 3775–3785, December 2020.

    URL arXiv Code

  71. Won Ik Cho, Sangwhan Moon, and Youngsook Song. Open Korean Corpora: A Practical Report. In Proceedings of Second Workshop for NLP Open Source Software (NLP-OSS), pages 85–93, Online, November 2020. (doi: 10.18653/v1/2020.nlposs-1.12)

    URL DOI

  72. Shin Kanouchi, Masato Neishi, Yuta Hayashibe, Hiroki Ouchi, and Naoaki Okazaki. You May Like This Hotel Because ...: Identifying Evidence for Explainable Recommendations. In Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing (AACL-IJCNLP), pages 890–899, Suzhou, China, December 2020.

    URL

  73. Tatsuya Hiraoka, Sho Takase, Kei Uchiumi, Atsushi Keyaki, and Naoaki Okazaki. Optimizing Word Segmentation for Downstream Task. In Findings of the Association for Computational Linguistics: EMNLP 2020 (Findings of EMNLP), pages 1341–1351, Online, November 2020. (doi: 10.18653/v1/2020.findings-emnlp.120)

    URL DOI

  74. Won Ik Cho, Youngki Moon, Sangwhan Moon, Seok Min Kim, and Nam Soo Kim. Machines Getting with the Program: Understanding Intent Arguments of Non-Canonical Directives. In Findings of the Association for Computational Linguistics: EMNLP 2020 (Findings of EMNLP), pages 329–339, Online, November 2020. (doi: 10.18653/v1/2020.findings-emnlp.31)

    URL DOI

  75. Sangwhan Moon and Naoaki Okazaki. PatchBERT: Just-in-Time, Out-of-Vocabulary Patching. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 7846–7852, Online, November 2020. (doi: 10.18653/v1/2020.emnlp-main.631)

    URL DOI

  76. Wiem Ben Rim and Naoaki Okazaki. SWAGex at SemEval-2020 Task 4: Commonsense Explanation as Next Event Prediction. In Proceedings of the Fourteenth Workshop on Semantic Evaluation (SemEval), pages 422–429, Barcelona (online), December 2020.

    URL

  77. Zhishen Yang, Lars Wolfsteller, and Naoaki Okazaki. TextLearner at SemEval-2020 Task 10: A Contextualized Ranking System in Solving Emphasis Selection in Text. In Proceedings of the Fourteenth Workshop on Semantic Evaluation (SemEval), pages 1691–1697, Barcelona (online), December 2020.

    URL

  78. Emanuele Bugliarello, Sabrina J. Mielke, Antonios Anastasopoulos, Ryan Cotterell, and Naoaki Okazaki. It’s Easier to Translate out of English than into it: Measuring Neural Translation Difficulty by Cross-Mutual Information. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1640–1649, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.149)

    URL DOI

  79. Emanuele Bugliarello and Naoaki Okazaki. Enhancing Machine Translation with Dependency-Aware Self-Attention. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1618–1627, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.147)

    URL DOI

  80. Zixia Jia, Youmi Ma, Jiong Cai, and Kewei Tu. Semi-Supervised Semantic Dependency Parsing Using CRF Autoencoders. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 6795–6805, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.607)

    URL DOI

  81. Kazuki Matsumaru, Sho Takase, and Naoaki Okazaki. Improving Truthfulness of Headline Generation. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1335–1346, Online, July 2020. (doi: 10.18653/v1/2020.acl-main.123)

    URL DOI

  82. Matsuno Shogo, Mizuki Sakae, and Sakaki Takeshi. Improved Advertisement Targeting via Fine-grained Location Prediction using Twitter. In Companion of The 2020 Web Conference 2020 (WWW), pages 527–532, Taipei, Taiwan, 2020. (doi: 10.1145/3366424.3382118)

    URL DOI

  83. Sangwhan Moon and Naoaki Okazaki. Jamo Pair Encoding: Subcharacter Representation-based Extreme Korean Vocabulary Compression for Efficient Subword Tokenization. In Proceedings of the 12th Language Resources and Evaluation Conference (LREC), pages 3490–3497, Marseille, France, May 2020.

    URL

  84. Sho Shimazu, Sho Takase, Toshiaki Nakazawa, and Naoaki Okazaki. Evaluation Dataset for Zero Pronoun in Japanese to English Translation. In Proceedings of the 12th Language Resources and Evaluation Conference (LREC), pages 3630–3634, Marseille, France, May 2020.

    URL

  85. Sakae Mizuki and Naoaki Okazaki. Analyzing the Variation Property of Contextualized Word Representations. In AI 2019: Advances in Artificial Intelligence, pages 393–405, December 2019. (doi: 10.1007/978-3-030-35288-2_32)

    URL DOI

  86. Yuichi Sasazawa, Sho Takase, and Naoaki Okazaki. Neural Question Generation using Interrogative Phrases. In Proceedings of the 12th International Conference on Natural Language Generation (INLG), pages 106–111, Tokyo, Japan, October 2019. (doi: 10.18653/v1/W19-8613)

    URL DOI

  87. Emanuele Bugliarello, Swayambhoo Jain, and Vineeth Rakesh. Matrix Completion in the Unit Hypercube via Structured Matrix Factorization. In Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI), pages 2038–2044, August 2019. (doi: 10.24963/ijcai.2019/282)

    URL DOI

  88. Tatsuya Hiraoka, Hiroyuki Shindo, and Yuji Matsumoto. Stochastic Tokenization with a Language Model for Neural Text Classification. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL), pages 1620–1629, Florence, Italy, July 2019. (doi: 10.18653/v1/P19-1158)

    URL DOI

  89. Hayate Iso, Yui Uehara, Tatsuya Ishigaki, Hiroshi Noji, Eiji Aramaki, Ichiro Kobayashi, Yusuke Miyao, Naoaki Okazaki, and Hiroya Takamura. Learning to Select, Track, and Generate for Data-to-Text. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL), pages 2102–2113, Florence, Italy, July 2019. (doi: 10.18653/v1/P19-1202)

    URL DOI

  90. Sho Takase and Naoaki Okazaki. Positional Encoding to Control Output Sequence Length. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers) (NAACL), pages 3999–4004, Minneapolis, Minnesota, June 2019. (doi: 10.18653/v1/N19-1401)

    URL DOI

  91. Zhishen Yang, Sam Vijlbrief, and Naoaki Okazaki. TokyoTech_NLP at SemEval-2019 Task 3: Emotion-related Symbols in Emotion Detection. In Proceedings of the 13th International Workshop on Semantic Evaluation (SemEval), pages 350–354, Minneapolis, Minnesota, USA, June 2019. (doi: 10.18653/v1/S19-2061)

    URL DOI

  92. Sho Takase, Jun Suzuki, and Masaaki Nagata. Character n-gram Embeddings to Improve RNN Language Models. In Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence (AAAI), pages 5074–5082, January 2019.

    arXiv

  93. Shun Kiyono, Sho Takase, Jun Suzuki, Naoaki Okazaki, Kentaro Inui, and Masaaki Nagata. Reducing Odd Generation from Neural Headline Generation. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation (PACLIC), Hong Kong, December 2018.

    URL

  94. Kaori Abe, Yuichiroh Matsubayashi, Naoaki Okazaki, and Kentaro Inui. Multi-dialect Neural Machine Translation and Dialectometry. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation (PACLIC), Hong Kong, December 2018.

    URL

  95. Sho Takase, Jun Suzuki, and Masaaki Nagata. Direct Output Connection for a High-Rank Language Model. In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 4599–4609, Brussels, Belgium, October 2018. (doi: 10.18653/v1/D18-1489)

    URL DOI

  96. Shun Kiyono, Sho Takase, Jun Suzuki, Naoaki Okazaki, Kentaro Inui, and Masaaki Nagata. Unsupervised Token-wise Alignment to Improve Interpretation of Encoder-Decoder Models. In Proceedings of the 2018 EMNLP Workshop BlackboxNLP: Analyzing and Interpreting Neural Networks for NLP, pages 74–81, Brussels, Belgium, November 2018. (doi: 10.18653/v1/W18-5410)

    URL DOI

  97. Diana Galvan, Naoaki Okazaki, Koji Matsuda, and Kentaro Inui. Investigating the Challenges of Temporal Relation Extraction from Clinical Text. In Proceedings of the Ninth International Workshop on Health Text Mining and Information Analysis (Louhi), pages 55–64, Brussels, Belgium, October 2018. (doi: 10.18653/v1/W18-5607)

    URL DOI

  98. Akira Sasaki, Kazuaki Hanawa, Naoaki Okazaki, and Kentaro Inui. Predicting Stances from Social Media Posts using Factorization Machines. In Proceedings of the 27th International Conference on Computational Linguistics (COLING), pages 3381–3390, August 2018.

    URL

  99. Yuta Hitomi, Hideaki Tamori, Naoaki Okazaki, and Kentaro Inui. Proofread Sentence Generation as Multi-Task Learning with Editing Operation Prediction. In Proceedings of the Eighth International Joint Conference on Natural Language Processing (IJCNLP), pages 436–441, November 2017.

    URL

  100. Sosuke Kobayashi, Naoaki Okazaki, and Kentaro Inui. A Neural Language Model for Dynamically Representing the Meanings of Unknown Words and Entities in a Discourse. In Proceedings of the Eighth International Joint Conference on Natural Language Processing (IJCNLP), pages 473–483, November 2017.

    URL

  101. Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, and Kentaro Inui. A Crowdsourcing Approach for Annotating Causal Relation Instances in Wikipedia. In Proceedings of the 31st Pacific Asia Conference on Language, Information and Computation (PACLIC), pages 336–345, November 2017.

    URL

  102. Shota Sasaki, Sho Takase, Naoya Inoue, Naoaki Okazaki, and Kentaro Inui. Handling Multiword Expressions in Causality Estimation. In IWCS 2017 — 12th International Conference on Computational Semantics — Short papers, pages (6 pages), 2017.

    URL

  103. Hideaki Tamori, Yuta Hitomi, Naoaki Okazaki, and Kentaro Inui. Analyzing the Revision Logs of a Japanese Newspaper for Article Quality Assessment. In Proceedings of the 2017 EMNLP Workshop: Natural Language Processing meets Journalism, pages 46–50, Copenhagen, Denmark, September 2017. (doi: 10.18653/v1/W17-4208)

    URL DOI

  104. Sho Yokoi, Daichi Mochihashi, Ryo Takahashi, Naoaki Okazaki, and Kentaro Inui. Learning Co-Substructures by Kernel Dependence Maximization. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI), pages 3329–3335, August 2017.

    URL

  105. Akira Sasaki, Kazuaki Hanawa, Naoaki Okazaki, and Kentaro Inui. Other Topics You May Also Agree or Disagree: Modeling Inter-Topic Preferences using Tweets and Matrix Factorization. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL), pages 398–408, Vancouver, Canada, July 2017. (doi: 10.18653/v1/P17-1037)

    URL DOI

書籍

  1. 岡崎 直観, 荒瀬 由紀, 鈴木 潤, 鶴岡 慶雅, 宮尾 祐介. IT Text 自然言語処理の基礎. オーム社, 2022年8月.

    URL

  2. Henry Brighton, 岡崎 直観(監訳), 浅野 ユカリ(翻訳). 人工知能グラフィックガイド. ニュートンプレス, 2019年10月.

    URL

解説記事

  1. 水木 栄. 「埋め込み表現の意味適応による知識ベース語義曖昧性解消」ができるまで. 自然言語処理, 30(3):1105–1109, 2023年9月. (doi: 10.5715/jnlp.30.1105)

    URL DOI

  2. 馬 尤咪. 「文書レベル関係抽出における根拠認識の統合」の完成まで. 自然言語処理, 30(3):1088–1093, 2023年9月. (doi: 10.5715/jnlp.30.1088)

    URL DOI

  3. 岡崎 直観. 大規模言語モデルの驚異と脅威 — ChatGPTの衝撃と大規模言語モデルの課題 —(特集 新時代の道具,ChatGPT:14の視点からその可能性を探る). 情報処理, 64(9):e1–e3, 2023年9月.

    URL

  4. 平岡 達也. 単語分割の最適化に関する研究は雑談と偶然の出会いに育まれた. 自然言語処理, 29(2):688–693, 2022年6月. (doi: 10.5715/jnlp.29.688)

    URL DOI

  5. 岡崎 直観. 深層学習がもたらした自然言語処理研究の発展と変革. 電子情報通信学会誌, 105(5):397–400, 2022年5月.

    URL

  6. 岡崎 直観, 矢田 勝俊. 研究会報告:国際シンポジウムJSAI International Symposia on AI 2020(JSAI-isAI 2020)開催報告. 人工知能, 36(3):374–376, 2021年5月. (doi: 10.11517/jjsai.36.3_374)

    DOI

  7. 岡崎 直観, 清野 舜, 高橋 諒, 横井 祥. 言語処理100本ノック. 自然言語処理, 27(3):703–710, 2020年9月. (doi: 10.5715/jnlp.27.703)

    DOI

  8. 坂本 真樹, 岡崎 直観. 国際シンポジウムJSAI International Symposia on AI 2019(JSAI-isAI 2019)開催報告. 人工知能, 35(2):282–285, 2020年3月. (doi: 10.11517/jjsai.35.2_282)

    DOI

  9. 岡崎 直観. ロボットジャーナリズムの現状と課題. 映像情報メディア学会誌, 72(2):70–75, 2018年3月. (doi: 10.3169/itej.72.212)

    DOI

  10. 高瀬 翔, 岡崎 直観. 自然言語文からの関係知識ベースの構築. 知能と情報(日本知能情報ファジィ学会誌), 29(2):55–64, 2017年4月. (doi: 10.3156/jsoft.29.2_55)

    DOI

  11. 海野 裕也, 岡崎 直観, 西川 仁, 中澤 敏明. NLP 若手の会. 人工知能, 32(2):266–267, 2017年3月. (doi: 10.11517/jjsai.32.2_266)

    DOI

招待講演 / 依頼講演

  1. 岡崎 直観. 大規模言語モデルの仕組みと生命医学分野での展望. 第34回日本心臓核医学会総会・学術大会 シンポジウム2「人工知能による診断支援の可能性:機械学習・深層学習・大規模言語モデル」, 2024年6月.

  2. 岡崎 直観. 大規模言語モデルの開発. 2024年度人工知能学会全国大会(第38回)チュートリアル講演1, 2024年5月.

    URL

  3. 岡崎 直観. 大規模言語モデルの現状と展望. スマートニュース メディア研究所 「AIと人間」研究会, 2024年5月.

  4. Naoaki Okazaki. Foundation to Build LLMs. AI Open Innovation Day Japan 2024, 2024年5月.

    URL

  5. 岡崎 直観, 曽根岡 侑也, 近江 崇宏. 大規模言語モデル開発の最前線. 生成AIカンファレンス パネルディスカッション Vol. 1, 2024年5月.

    URL

  6. 岡崎 直観. 大規模言語モデルの仕組みと翻訳新時代. ATIS特許翻訳分科会, 2024年4月.

  7. 岡崎 直観, 武藤 まい, 早川 健. 生成AIの現状とこれから 日本、EU、その先へ. 第一東京弁護士会セミナー, 2024年3月.

  8. 岡崎 直観. 自然言語処理の基礎. 言語処理学会第30回年次大会 (NLP2024) チュートリアルT1, 2024年3月.

    URL

  9. 岡崎 直観. 生成AIは創造の扉を開くのか~大規模言語モデルが産み出す新しい未来~. けいはんな「エジソンの会」第44回会合, 2024年1月.

    URL

  10. 岡崎 直観. 大規模言語モデルの進化の方向性・社会変革の可能性. 科学技術と経済の会 (JATES) 第27期・第3回 代表者懇談会, 2023年12月.

    URL

  11. 岡崎 直観. 大規模言語モデルと科学研究. 第46回日本分子生物学会年会 研究倫理委員会企画・研究倫理フォーラム, 2023年12月.

    URL

  12. 岡崎 直観. 生成AIの最前線と研究・開発の未来地図. GPU UNITE 2023 Day3: 生成AI Day, 2023年11月.

    URL

  13. 岡崎 直観. AIと共創する未来: 大規模言語モデルの開発、応用、そして私たちの役割. 2023年東工大メンバーシップ年次総会, 2023年10月.

  14. 岡崎 直観. 改めて知りたい自然言語処理技術 ~ AI チャットボットは翻訳のプロから仕事を奪うのか. 第32回JTF翻訳祭, 2023年10月.

    URL

  15. 岡崎 直観, 辻井 潤一, 松原 仁, 樋口 知之. 次世代AIの舵取り:進化するAI技術と未来への展望. データサイエンス協会10thシンポジウム〜データサイエンスの最前線〜, 2023年10月.

    URL

  16. 岡崎 直観. 大規模言語モデルの脅威. JEITAデバイス・ハードウェアセキュリティ技術分科会, 2023年9月.

  17. 岡崎 直観. 大規模言語モデル — 言語モデルと自然言語処理のフロンティア. 2023年度統計関連学会連合大会, 2023年9月.

    URL Slides

  18. 岡崎 直観. 生成AIの仕組み・可能性・脅威. 2023年度蔵前工業会千葉県支部講演会, 2023年9月.

    URL

  19. 金子 正弘. 言語モデルの公平性. NLP若手の会 (YANS) 第18回シンポジウム, 2023年8月.

    URL

  20. 岡崎 直観. 自然言語生成の仕組みと最先端. 第6回機械学習工学研究会, MLSE夏合宿2023, 2023年6月.

    URL

  21. 岡崎 直観. ChatGPTをはじめとした生成AIとその社会実装について. 第7回 政治家と科学者の対話の会(日本工学アカデミー政策共創推進委員会), 2023年6月.

    URL

  22. Jun Suzuki, Kyosuke Nishida, Naoaki Okazaki. A Gentle Introduction to Technologies Behind Language Models and Recent Achievement in ChatGPT. Tutorial 2, the 27nd Pacific-Asia Conference on Knowledge Discovery and Data Mining, PAKDD, 2023年5月.

    URL Slides

  23. 岡崎 直観. 大規模言語モデルの驚異と脅威. 2022年度AIPシンポジウム成果報告会, 2023年3月.

    URL Slides Video

  24. 岡崎 直観. 大規模言語モデルの進展. JDLA緊急企画「生成AIの衝撃」〜ChatGPTで世界はどう変わるのか?〜, 2023年3月.

    URL

  25. 岡崎 直観. 自然言語処理技術の最先端. 第一東京弁護士会 100周年記念講演会, 2023年2月.

  26. 岡崎 直観. 自然言語生成における内容の制御. 第14回産業日本語研究会・シンポジウム(パネリスト講演), 2023年2月.

    URL

  27. 岡崎 直観. 近傍の事例を活用したニューラル言語生成. NAIST DSC NLP Seminar 2022 Summer, 2022年9月.

    URL

  28. Naoaki Okazaki. Towards controllable, faithful, and explainable text generation. Advances in Data Science and AI Conference 2022 (ADSAI 2022), 2022年6月.

    URL

  29. 丹羽 彩奈. 自然言語生成におけるテンプレートの導出と活用. 人工知能学会 合同研究会2021 第118回人工知能基本問題研究会, 2021年11月.

    URL

  30. 岡崎 直観. 自然言語生成の現状と展望. 第41回医療情報学連合大会(第22回日本医療情報学会学術大会) 共同企画セッション「医学医療におけるAI応用」, 2021年11月.

    URL

  31. 岡崎 直観. AIによる言語処理の革命. 第4回自動翻訳シンポジウム 〜自動翻訳と翻訳バンク〜, 2021年3月.

    URL

  32. 岡崎 直観. 深層ニューラルネットワークによる自然言語生成の制御. 日本大学 人工知能ソサイエティ(NUAIS)設立シンポジウム, 2021年3月.

    URL

  33. Naoaki Okazaki. Neural Machine Translation and Summarization for News. International Workshop on Speech to Speech Machine Translation (IWSSMT), 2020年11月.

    URL

  34. 丹羽 彩奈. NeurIPS 2019における自然言語処理. 第78回人工知能セミナー AIトレンド・トップカンファレンス報告(NeurIPS 2019報告会), 2020年4月.

    Slides Video

  35. 岡崎 直観. 自然言語処理によるニュース記事執筆の現状と課題. 第11回産業日本語研究会・シンポジウム(COVID-19のため中止), 2020年3月.

    URL

  36. 岡崎 直観. 深層学習はなぜ重宝されるのか ― 自然言語処理の場合. 応用物理学会有機分子・バイオエレクトロニクス分科会講習会「情報技術と有機分子・バイオエレクトロニクス~機器制御からAI活用まで~」, 2019年11月.

    URL

  37. 高瀬 翔. ニューラル言語モデルの研究動向. 第240回自然言語処理研究会, 2019年6月.

    URL

  38. 岡崎 直観. 深層学習による自然言語処理の現状と展望. 第40回蔵前科学技術セミナー 「最新の情報理工学とは」 〜 AI、ビッグデータ、サイバーセキュリティは未来をどう変えるのか? 〜, 2019年2月.

    URL

  39. 岡崎 直観. 自然言語処理の現状と展望. 応用脳科学アカデミー 応用脳科学アドバンスコース「脳と人工知能・ロボット」第3回, 2019年1月.

    URL

  40. Naoaki Okazaki. Towards Natural Language Processing that Understands Context. AI Shooting Stars Session, Artificial Intelligence — International Research and Applications: 1st Japanese-German-French DWIH Symposium, 2018年11月.

    URL

  41. Naoaki Okazaki. How Deep Learning Changes Natural Language Processing. Fourth Asia Pacific Corpus Linguistics Conference (APCLC 2018), 2018年9月.

    URL

  42. 岡崎 直観. ウェブからの知識獲得と意見分析. 第131回 情報基礎とアクセス技術研究発表会, 2018年7月.

    URL

  43. Naoaki Okazaki. Bridging Knowledge and Text with Deep Neural Networks. Second International Workshop on Symbolic-Neural Learning (SNL-2018), 2018年7月.

    URL

  44. 岡崎 直観. 自然言語による状況理解. 第24回画像センシングシンポジウム, OS2: マルチモーダル深層学習:画像認識を越えて広がる世界 ~画像・自然言語・音声の共創~, 2018年6月.

    URL

  45. 岡崎 直観. 自然言語処理による議論マイニング. 2018年度人工知能学会全国大会 (第32回), OS-28 複雑化社会における意思決定・合意形成のためのAI技術, 2018年6月.

    URL

  46. Naoaki Okazaki. Generating Text with Deep Neural Networks. Deep Learning: Theory, Algorithms, and Applications, 2018年3月.

    URL

  47. 岡崎 直観. エンコーダ・デコーダモデルによるテキスト生成. 第211回情報処理学会コンピュータビジョンとイメージメディア(CVIM)研究会, 2018年3月.

    URL

  48. 岡崎 直観. 自然言語処理における深層学習の進展. 豊橋技術科学大学先端データサイエンス講演会, 2018年1月.

    URL

  49. 岡崎 直観. 深層学習の自然言語処理への応用. 情報処理学会連続セミナー2017 第4回:ディープラーニングの活用と基盤, 2017年10月.

    URL

  50. 岡崎 直観. 自然言語処理を支える大規模計算資源. 第2回データサイエンス支援サービスシンポジウム, 2017年6月.

    URL

  51. 岡崎 直観. 自然言語処理におけるDeep Learning. 電子情報通信学会総合大会 2017 企画セッション 「もっと知りたい! Deep Learning ~基礎から活用まで~」, 2017年3月.

    URL

口頭発表

  1. 加藤 靖久, 金子 正弘, 岡崎 直観. 多言語プロンプト: 低資源言語での多言語例を用いたfew-shot推論. 2024年度人工知能学会全国大会 (JSAI2024), 4Xin2-110, pp. (4 pages), 2024年5月.

  2. 栗原 健太郎, 三田 雅人, 張 培楠, 佐々木 翔大, 石上 亮介, 岡崎 直観. LCTG Bench: 日本語LLMの制御性ベンチマークの構築. 言語処理学会第30回年次大会 (NLP2024), D11-2, pp. 3113–3118, 2024年3月.

    URL

  3. 大井 聖也, 金子 正弘, 小池 隆斗, Mengsay Loem, 岡崎 直観. 大規模言語モデルにおける評価バイアスの尤度に基づく緩和. 言語処理学会第30回年次大会 (NLP2024), A11-4, pp. 3021–3026, 2024年3月.

    URL

  4. 綿 祐貴, 金子 正弘, Youmi Ma, 岡崎 直観. 大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃. 言語処理学会第30回年次大会 (NLP2024), A11-3, pp. 3015–3020, 2024年3月.

    URL

  5. 平岡 達也, 岡崎 直観. 事前学習済みの分散表現は表層的な知識を獲得しているか. 言語処理学会第30回年次大会 (NLP2024), P10-6, pp. 2880–2885, 2024年3月.

    URL

  6. Mengsay Loem, 金子 正弘, 岡崎 直観. 敵対的発言を取り入れた議論による言語モデルの学習強化と推論力の向上. 言語処理学会第30回年次大会 (NLP2024), B10-6, pp. 2750–2755, 2024年3月.

    URL

  7. 藤井 一喜, 中村 泰士, Mengsay Loem, 飯田 大貴, 大井 聖也, 服部 翔, 平井 翔太, 水木 栄, 横田 理央, 岡崎 直観. 継続事前学習による日本語に強い大規模言語モデルの構築. 言語処理学会第30回年次大会 (NLP2024), A8-5, pp. 2102–2107, 2024年3月.

    URL

  8. Zhishen Yang, Tosho Hirasawa, Edison Marrese-Tyalor, Naoaki Okazaki. Large Language Models as Manga Translators: A Case Study. 言語処理学会第30回年次大会 (NLP2024), P7-13, pp. 2012–2017, 2024年3月.

    URL

  9. 前田 航希, 栗田 修平, 宮西 大樹, 岡崎 直観. 視覚的文脈を利用した視覚言語モデルによる画像キャプション生成自動評価手法. 言語処理学会第30回年次大会 (NLP2024), P7-10, pp. 1996–2001, 2024年3月.

    URL

  10. 丹羽 彩奈, 磯 颯. AmbiNLG: 自然言語生成のための指示テキストの曖昧性解消. 言語処理学会第30回年次大会 (NLP2024), A7-6, pp. 1809–1814, 2024年3月.

    URL

  11. 水木 栄, 飯田 大貴, 藤井 一喜, 中村 泰士, Mengsay Loem, 大井 聖也, 服部 翔, 平井 翔太, 横田 理央, 岡崎 直観. 大規模言語モデルの日本語能力の効率的な強化: 継続事前学習における語彙拡張と対訳コーパスの活用. 言語処理学会第30回年次大会 (NLP2024), A6-4, pp. 1514–1519, 2024年3月.

    URL

  12. 岡崎 直観, 服部 翔, 平井 翔太, 飯田 大貴, 大井 聖也, 藤井 一喜, 中村 泰士, Mengsay Loem, 横田 理央, 水木 栄. Swallowコーパス: 日本語大規模ウェブコーパス. 言語処理学会第30回年次大会 (NLP2024), A6-1, pp. 1498–1503, 2024年3月.

    URL

  13. 古山 翔太, 永田 亮, 高村 大也, 岡崎 直観. 文法誤り訂正の自動評価のための原文・参照文・訂正文間のN-gram F-score. 言語処理学会第30回年次大会 (NLP2024), P4-25, pp. 1198–1203, 2024年3月.

    URL

  14. 小池 隆斗, 金子 正弘, 岡崎 直観. 制約が異なる指示で生成された文章に対するLLM生成検出の頑健性. 言語処理学会第30回年次大会 (NLP2024), A4-4, pp. 943–948, 2024年3月.

    URL

  15. Youmi Ma, An Wang, 岡崎 直観. 言語横断ラベル射影を用いた日本語文書レベル関係抽出データセットの構築. 言語処理学会第30回年次大会 (NLP2024), P3-4, pp. 783–788, 2024年3月.

    URL

  16. 小池 隆斗, 金子 正弘, 岡崎 直観. 敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出. 第18回NLP若手の会シンポジウム, S3-P13, 2023年8月.

  17. Youmi Ma, An Wang, 岡崎 直観. 日本語文書レベル関係抽出コーパスの構築. 第18回NLP若手の会シンポジウム, S5-P19, 2023年8月.

  18. 平井翔太, 村岡雅康, 岡崎 直観. 割り当て画像の多様性を考慮したVokenizationによるマスク言語モデルの改善. 2023年度人工知能学会全国大会 (JSAI2023), 4Xin1-38, pp. (4 pages), 2023年6月. (doi: 10.11517/pjsai.JSAI2023.0_4Xin138)

    DOI

  19. 丹羽 彩奈, 岡崎 直観. 事前学習済みモデルT5における近傍分布の有効性の調査. 言語処理学会第29回年次大会 (NLP2023), P12-6, pp. 3048–3053, 2023年3月.

    URL

  20. 前田 航希, 栗田 修平, 宮西 大樹. QuIC-360◦: 360◦ 画像に対するクエリ指向画像説明文生成のためのデータセット構築. 言語処理学会第29回年次大会 (NLP2023), H12-5, pp. 3013–3018, 2023年3月.

    URL

  21. 浦川 通, 新妻 巧朗, 田口 雄哉, 田森 秀明, 岡崎 直観, 乾 健太郎. 短歌における言語モデルの実応用–歌人の視点を通した生成と作歌支援の実践から–. 言語処理学会第29回年次大会 (NLP2023), P11-6, pp. 2779–2784, 2023年3月.

    URL

  22. 谷口 大輔, 脇本 宏平, 丹羽 彩奈, 岡崎 直観. 大規模言語モデルにおける文生成方向に関する依存性の検証. 言語処理学会第29回年次大会 (NLP2023), H9-1, pp. 2200–2205, 2023年3月.

    URL

  23. 中本 裕大, 瀬在 恭介, 元川 凱喜, 麻生 英樹, 岡崎 直観. 日本語大規模言語モデルにおける知識グラフを活用した意味理解性能の向上. 言語処理学会第29回年次大会 (NLP2023), B9-4, pp. 2140–2145, 2023年3月.

    URL

  24. Mengsay Loem, 高瀬 翔, 金子 正弘, 岡崎 直観. マルチヘッドニューラルN-gramによる自己注意機構の代替. 言語処理学会第29回年次大会 (NLP2023), A9-1, pp. 2094–2099, 2023年3月.

    URL

  25. 西田 京介, 長谷川 拓, 前田 航希, 齋藤 邦子. DueT: 視覚・言語のDual-adapter Tuningによる基盤モデル. 言語処理学会第29回年次大会 (NLP2023), B7-3, pp. 1586–1591, 2023年3月.

    URL

  26. Trang Nguyen, Naoaki Okazaki. DAS-VQA: Dual Awareness Systems for Improving Generalization in Visual Question Answering. 言語処理学会第29回年次大会 (NLP2023), B7-1, pp. 1574–1579, 2023年3月.

    URL

  27. Panatchakorn Anantaprayoon, 金子 正弘, 岡崎 直観. 下流タスクでの日本語事前学習モデルの性別バイアスの評価. 言語処理学会第29回年次大会 (NLP2023), A7-3, pp. 1563–1568, 2023年3月.

    URL

  28. 服部 翔, Youmi Ma, 岡崎 直観. クエリ指向要約におけるクエリと要約の統合的な生成. 言語処理学会第29回年次大会 (NLP2023), H5-2, pp. 1244–1249, 2023年3月.

    URL

  29. 金子 正弘, Graham Neubig, 岡崎 直観. 人間とシステムの議論に基づくNLPタスクの問題に対する予測. 言語処理学会第29回年次大会 (NLP2023), H4-5, pp. 979–983, 2023年3月.

    URL

  30. 水木 栄, 岡崎 直観. 埋め込み表現の意味適応による知識ベース語義曖昧性解消. 言語処理学会第29回年次大会 (NLP2023), C3-1, pp. 622–627, 2023年3月.

    URL

  31. Youmi Ma, An Wang, 岡崎 直観. 文書レベル関係抽出における根拠認識の統合. 言語処理学会第29回年次大会 (NLP2023), B3-3, pp. 605–610, 2023年3月.

    URL

  32. Zhishen Yang, Raj Dabre, Hideki Tanaka, Naoaki Okazaki. Knowledge-Augmented Figure Caption Generation. 言語処理学会第29回年次大会 (NLP2023), P2-9, pp. 460–465, 2023年3月.

    URL

  33. 遠藤 洸亮, Zhishen Yang, 岡崎 直観. 画像キャプション生成におけるJPEG圧縮への頑健性の改善. 言語処理学会第29回年次大会 (NLP2023), P2-2, pp. 419–424, 2023年3月.

    URL

  34. 飯田 大貴, 岡崎 直観. 事前学習済みモデルに基づく検索モデルにおけるドメイン適応手法の比較と相乗効果の検証. 言語処理学会第29回年次大会 (NLP2023), P1-9, pp. 176–181, 2023年3月.

    URL

  35. 飯田 大貴, 岡崎 直観. 疎ベクトル検索における語彙と単語頻度のギャップ解消を通じた教師なしドメイン適合. 第17回NLP若手の会シンポジウム, P4-08, 2022年8月.

  36. 馬 尤咪, 王 安, 岡崎 直観. 文書レベル関係抽出における人間と注意機構の根拠文の対応付け. 第17回NLP若手の会シンポジウム, P2-03, 2022年8月.

  37. 古山 翔太, 永田 亮, 高村 大也, 岡崎 直観. 日本語誤り訂正のための誤り区間と誤り種類の自動アノテーションに向けて. 第17回NLP若手の会シンポジウム, P4-09, 2022年8月.

  38. Mengsay Loem, 高瀬 翔, 岡崎 直観. Are Neighbors Enough? Multi-Head Neural n-gram can be Alternative to Self-attention. 第17回NLP若手の会シンポジウム, P5-07, 2022年8月.

  39. 谷口 大輔, 脇本 宏平, 黒田 和矢, 川本 峻頌, 西口 佳佑, 丹羽 彩奈, 岡崎 直観. 商品レビューと商品特徴を用いた広告文制作支援. 2022年度人工知能学会全国大会 (JSAI2022), 3Yin2-07, pp. (4 pages), 2022年6月. (doi: 10.11517/pjsai.JSAI2022.0_3Yin207)

    DOI

  40. 植木 滉一郎, 平岡 達也, 岡崎 直観. 記事に忠実ではない訓練事例も活用した見出し生成モデルの忠実性の改善法. 言語処理学会第28回年次大会 (NLP2022), pp. 2002–2007, 2022年3月.

    URL

  41. 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. 単語の長さと構成要素を考慮した単語レベルの摂動. 言語処理学会第28回年次大会 (NLP2022), pp. 1455–1460, 2022年3月.

    URL

  42. 前田 航希, 金子 正弘, 岡崎 直観. IMPARA: パラレルデータにおける修正の影響度に基づいた文法誤り訂正の自動評価法. 言語処理学会第28回年次大会 (NLP2022), pp. 328–333, 2022年3月.

    URL

  43. 吉川 和, 岡崎 直観. 確信度を考慮した言語モデルの関係知識評価. 言語処理学会第28回年次大会 (NLP2022), pp. 532–537, 2022年3月.

    URL

  44. Loem Mengsay, 高瀬 翔, 金子 正弘, 岡崎 直観. 抽出型要約と言い換えによる生成型要約の訓練データ拡張. 言語処理学会第28回年次大会 (NLP2022), pp. 1996–2001, 2022年3月.

    URL

  45. Youmi Ma, 平岡 達也, 岡崎 直観. 畳み込みニューラルネットワークを用いた表ラベリングによる固有表現認識と関係抽出 . 言語処理学会第28回年次大会 (NLP2022), pp. 1197–1202, 2022年3月.

    URL

  46. 石川 遼伍, 丹羽 彩奈, 水木 栄, 岡崎 直観. 疑似訓練データによる格助詞の省略に頑健な係り受け解析. 言語処理学会第28回年次大会 (NLP2022), pp. 1808–1813, 2022年3月.

    URL

  47. 丹羽 彩奈, 高瀬 翔, 岡崎 直観. 近傍の事例を用いた非自己回帰生成. 言語処理学会第28回年次大会 (NLP2022), pp. 1306–1311, 2022年3月.

    URL

  48. 嘉田 紗世, 山野 陽祐, 新美 茜, 田森 秀明, 小海 則人, 岡崎 直観, 乾 健太郎. 動画タイトルを用いたサムネイル画像の自動選択手法の提案. 言語処理学会第28回年次大会 (NLP2022), pp. 1366–1370, 2022年3月.

    URL

  49. 浦川 通, 新妻 巧朗, 田口 雄哉, 田森 秀明, 岡崎 直観, 乾 健太郎. モーラを考慮したFine-tuningによる口語短歌生成. 言語処理学会第28回年次大会 (NLP2022), pp. 1328–1332, 2022年3月.

    URL

  50. 高瀬 翔, 清野 舜, 小林 颯介, 鈴木 潤. Transformerを多層にする際の勾配消失問題と解決法について. 言語処理学会第28回年次大会 (NLP2022), pp. 173–178, 2022年3月.

    URL

  51. 小山 碧海, 金子 正弘, 小町 守. 学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析. 第16回NLP若手の会シンポジウム, P1-04, 2021年8月.

  52. 蘆田 真奈, 金子 正弘, 平澤 寅庄, 小町 守. QAタスクにおけるGPTの性差別的バイアスの評価及びプロンプトを用いたバイアス除去手法の検討. 第16回NLP若手の会シンポジウム, P2-02, 2021年8月.

  53. 丹羽 彩奈, 松田 寛. 個人間の感情理解の揺れを考慮した感情分析に向けた試み. 2021年度人工知能学会全国大会 (JSAI2021), pp. (4 pages), 2021年6月. (doi: pjsai.JSAI2021.0_2Yin506)

    DOI

  54. 水木 栄, 岡崎 直観. 階層コード表現を用いた上位下位関係の識別. 言語処理学会第27回年次大会 (NLP2021), pp. 1236–1241, 2021年3月.

    URL

  55. 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. 後段モデルの損失値を用いた単語分割のタスクへの最適化. 言語処理学会第27回年次大会 (NLP2021), pp. 486–491, 2021年3月.

    URL

  56. 丹羽 彩奈, 西口 佳佑, 岡崎 直観. 文脈を考慮した対義語穴埋め. 言語処理学会第27回年次大会 (NLP2021), pp. 1702–1707, 2021年3月.

    URL

  57. 笹沢 裕一, 岡崎 直観. 属性情報を追加した事前学習済みモデルのファインチューニング. 言語処理学会第27回年次大会 (NLP2021), pp. 765–770, 2021年3月.

    URL

  58. 昇 夏海, 平岡 達也, 丹羽 彩奈, 西口 佳佑, 岡崎 直観. 企業情報を考慮したキャッチコピーの自動生成. 言語処理学会第27回年次大会 (NLP2021), pp. 450–454, 2021年3月.

    URL

  59. Youmi Ma, 平岡 達也, 岡崎 直観. BERTを用いたTable-Fillingによる固有表現抽出と関係抽出. 言語処理学会第27回年次大会 (NLP2021), pp. 1274–1279, 2021年3月.

    URL

  60. 古山 翔太, 高村 大也, 岡崎 直観. ニューラル文法誤り訂正のための多様な規則を用いる人工誤り生成. 言語処理学会第27回年次大会 (NLP2021), pp. 1017–1022, 2021年3月.

    URL

  61. 高瀬 翔, 清野 舜. エンコーダ・デコーダの学習に効果的な摂動の調査. 言語処理学会第27回年次大会 (NLP2021), pp. 1391–1396, 2021年3月.

    URL

  62. 那須川 哲哉, 鈴木 祥子, 村岡 雅康, 平野 真理. コロナ禍の状況を自由記述文で記録し分析する試み. 言語処理学会第27回年次大会 (NLP2021), pp. 585–589, 2021年3月.

    URL

  63. 金山 博, 岩本 蘭, 村岡 雅康, 大湖 卓也, 宮本 晃太郎. 名詞句の処理に頑健な構文解析器. 言語処理学会第27回年次大会 (NLP2021), pp. 492–496, 2021年3月.

    URL

  64. 山田 康輔, 人見 雄太, 田森 秀明, 岡崎 直観, 乾 健太郎. 指定語句を確実に含む見出し生成. 言語処理学会第27回年次大会 (NLP2021), pp. 1070–1074, 2021年3月.

    URL

  65. 叶内 晨, 根石 将人, 林部 祐太, 大内 啓樹, 岡崎 直観. 宿の推薦根拠説明システムにおける魅力度の考慮と実用を見据えた評価. 言語処理学会第27回年次大会 (NLP2021), pp. 461–465, 2021年3月.

    URL

  66. Yuichi Sasazawa, Naoaki Okazaki. WER99 at the NTCIR-15 QA Lab-PoliInfo-2 Classification Task. NTCIR-15, pp. 124–129, 2020年12月.

    URL

  67. 丹羽 彩奈, 西口 佳佑, 岡﨑 直観. マスク言語モデルを用いた対句キャッチコピー生成. 第15回NLP若手の会シンポジウム, 2020年8月.

  68. 昇 夏海, 平岡 達也, 丹羽 彩奈, 岡﨑 直観, 脇本 宏平, 黒田 和矢, 西口 佳佑. 企業情報を考慮した広告文の自動生成. 第15回NLP若手の会シンポジウム, 2020年8月.

  69. Zhishen Yang, Naoaki Okazaki. News Image Caption Generation. 第34回人工知能学会全国大会 (JSAI2020), pp. (4 pages), 2020年6月. (doi: 10.11517/pjsai.JSAI2020.0_2D1GS905)

    DOI

  70. 丹羽 彩奈, 脇本 宏平, 西口 佳佑, 毛利 真崇, 岡崎 直観. 単語の対応関係を利用したスパン候補の絞り込みによるキャッチコピーの対句構造解析. 第34回人工知能学会全国大会 (JSAI2020), pp. (4 pages), 2020年6月. (doi: 10.11517/pjsai.JSAI2020.0_1E5GS901)

    DOI

  71. 人見 雄太, 田口 雄哉, 田森 秀明, 岡崎 直観, 乾 健太郎. 小規模リソースにおける生成型要約のためのスタイル転移. 言語処理学会第26回年次大会 (NLP2020), pp. 929–932, 2020年3月.

    URL

  72. 叶内 晨, 根石 将人, 林部 祐太, 岡崎 直観. 旅行情報サイトのレビューを用いた抽象的な要求に対する根拠付き推薦文の生成. 言語処理学会第26回年次大会 (NLP2020), pp. 29–32, 2020年3月.

    URL

  73. 陳宏, 西田 典起, 朱中元, 岡崎 直観, 中山 英樹. RST Discourse Structure Improves Story Ending Generation. 言語処理学会第26回年次大会 (NLP2020), pp. 21–24, 2020年3月.

    URL

  74. 高瀬 翔, 岡崎 直観. 翻訳と見出し文生成の同時学習による言語横断見出し文生成モデル. 言語処理学会第26回年次大会 (NLP2020), pp. 1471–1474, 2020年3月.

    URL

  75. 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. RNNにより高次の依存を考慮したニューラル隠れマルコフモデル. 言語処理学会第26回年次大会 (NLP2020), pp. 1332–1335, 2020年3月.

    URL

  76. 松丸 和樹, 高瀬 翔, 岡崎 直観. 見出し生成の忠実性の改善. 言語処理学会第26回年次大会 (NLP2020), pp. 933–936, 2020年3月.

    URL

  77. 丹羽 彩奈, 脇本 宏平, 西口 佳佑, 毛利 真崇, 岡崎 直観. キャッチコピーにおける対句構造の解析. 言語処理学会第26回年次大会 (NLP2020), pp. 601–604, 2020年3月.

    URL

  78. 平岡 達也, 高瀬 翔, 内海 慶, 欅 惇志, 岡崎 直観. RNNによる遷移確率計算を用いた隠れマルコフモデル. 第242回自然言語処理研究会, 2019-NL-242(2), pp. 1–6, 2019年10月.

    URL

  79. 丹羽 彩奈, 岡崎 直観, 西口 佳佑, 亀山 千尋, 毛利 真崇. 修辞技法を考慮したキャッチコピー自動生成に向けた研究. 第14回NLP若手の会シンポジウム, 63, 2019年8月.

    Poster

  80. 平岡 達也, 高瀬 翔, 岡崎 直観. RNNによる遷移確率計算を用いた隠れマルコフモデル. 第14回NLP若手の会シンポジウム, 79, 2019年8月.

  81. 高瀬 翔, 岡崎 直観. 機械翻訳と要約生成の統一モデルによる言語横断見出し文生成. 第14回NLP若手の会シンポジウム, 85, 2019年8月.

  82. 松丸 和樹, 高瀬 翔, 岡崎 直観. 含意関係に基づく見出し生成タスクの見直し. 第240回自然言語処理研究会, 2019-NL-240(1), pp. 1–8, 2019年6月.

    URL

  83. 島津 翔, 高瀬 翔, 中澤 敏明, 岡崎 直観. 文脈を考慮した日英機械翻訳に向けた評価データの構築. 言語処理学会第25回年次大会 (NLP2019), pp. 5–8, 2019年3月.

    URL

  84. 笹沢 裕一, 高瀬 翔, 岡崎 直観. 対話型質問応答の省略補完. 言語処理学会第25回年次大会 (NLP2019), pp. 163–166, 2019年3月.

    URL

  85. 晩 鴻翔, 岡崎 直観. 語りに基づく認知症傾向判別. 言語処理学会第25回年次大会 (NLP2019), pp. 501–504, 2019年3月.

    URL

  86. 丹羽 彩奈, 岡崎 直観, 西口 佳佑, 亀山 千尋, 毛利 真崇. キャッチコピーの自動生成に向けた分析. 言語処理学会第25回年次大会 (NLP2019), pp. 558–561, 2019年3月.

    URL

  87. 高瀬 翔, 岡崎 直観. 位置エンコーディングを用いた出力長制御. 言語処理学会第25回年次大会 (NLP2019), pp. 687–690, 2019年3月.

    URL

  88. 磯 颯, 上原 由衣, 石垣 達也, 能地 宏, 荒牧 英治, 小林 一郎, 宮尾 祐介, 岡崎 直観, 高村 大也. Data-to-Textにおける主題遷移のモデル化. 言語処理学会第25回年次大会 (NLP2019), pp. 727–730, 2019年3月.

    URL

  89. Erick Mendieta, Naoaki Okazaki, Hiroya Takamura. Generating Natural-Language Navigation Instructions from Panoramic Images. 言語処理学会第25回年次大会 (NLP2019), pp. 739–742, 2019年3月.

    URL

  90. 人見 雄太, 田口 雄哉, 田森 秀明, 菊田 洸, 西鳥 羽二郎, 岡崎 直観, 乾 健太郎, 奥村 学. 出力長制御を考慮した見出し生成モデルのための大規模コーパス. 言語処理学会第25回年次大会 (NLP2019), pp. 1225–1228, 2019年3月.

    URL

  91. 塙 一晃, 佐々木 彬, 岡崎 直観, 乾 健太郎. Wikipediaから獲得した外部知識を用いた賛否分類. 第237回自然言語処理研究会, 2018-NL-237(6), pp. 1–8, 2018年9月.

    URL

  92. 鈴木 正敏, 松田 耕史, 岡崎 直観, 乾 健太郎. 読解による解答可能性を付与した質問応答データセットの構築. 言語処理学会第24回年次大会 (NLP2018), pp. 702–705, 2018年3月.

    URL

  93. 伊藤 拓海, 山口 健史, 田 然, 松田 耕史, 岡崎 直観, 乾 健太郎. 自治体FAQの比較マイニング. 言語処理学会第24回年次大会 (NLP2018), pp. 536–539, 2018年3月.

    URL

  94. 阿部 香央莉, 松林 優一郎, 岡崎 直観, 乾 健太郎. ニューラルネットを用いた多方言の翻訳と類型分析. 言語処理学会第24回年次大会 (NLP2018), pp. 304–307, 2018年3月.

    URL

  95. 清野 舜, 高瀬 翔, 鈴木 潤, 岡崎 直観, 乾 健太郎, 永田 昌明. ニューラルヘッドライン生成における誤生成問題の改善. 言語処理学会第24回年次大会 (NLP2018), pp. 1–4, 2018年3月.

    URL

  96. 松田耕史, 岡崎直観, 乾健太郎. クラウドソーシングを系に組み込んだテキストからの関係知識抽出. 第12回NLP若手の会シンポジウム, P17, 2017年9月.

  97. 伊藤 拓海, 鈴木 正敏, 田 然, 山口 健史, 岡崎 直観, 乾 健太郎. 自治体QAサービスのためのFAQの自治体間の横断的解析. 第12回NLP若手の会シンポジウム, P19, 2017年9月.

  98. 塙 一晃, 佐々木 彬, 岡崎 直観, 乾 健太郎. トピックに関する因果関係知識を利用した賛否分類. 第12回NLP若手の会シンポジウム, P28, 2017年9月.

  99. 鈴木 正敏, 松田 耕史, 岡崎 直観, 乾 健太郎. Wikipediaを知識源に用いた文書検索と読解によるクイズ解答システム. 第12回NLP若手の会シンポジウム, P46, 2017年9月.

査読なし論文

  1. Masahiro Kaneko, Youmi Ma, Yuki Wata, and Naoaki Okazaki. Sampling-based Pseudo-Likelihood for Membership Inference Attacks, 2024.

    arXiv

  2. Wiem Ben Rim, Carolin Lawrence, Kiril Gashteovski, Mathias Niepert, and Naoaki Okazaki. Behavioral Testing of Knowledge Graph Embedding Models for Link Prediction. In Proceedings of the Fifth Widening Natural Language Processing Workshop (WiNLP2021), November 2021.

  3. Zhishen Yang, Tosho Hirasawa, Mamoru Komachi, and Naoaki Okazaki. Do Videos Guide Translations? Evaluation on Video-guided Machine Translation dataset. In Visually Grounded Interaction and Language (ViGIL), 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL 2021) workshop, June 2021.

    URL

  4. Tosho Hirasawa, Zhishen Yang, Mamoru Komachi, and Naoaki Okazaki. Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020. In First Workshop on Advances in Language and Vision Research (ALVR 2020), ACL 2020, July 2020.

    arXiv

  5. Youmi Ma, Tatsuya Hiraoka, and Naoaki Okazaki. Named Entity Recognition and Relation Extraction using Enhanced Table Filling by Contextualized Representations, 2020.

    arXiv