SmartHRのML(機械学習)エンジニアの井上です。
SmartHRは2026年3月9日〜3月13日にライトキューブ宇都宮で開催された「言語処理学会第32回年次大会(NLP2026)」にシルバースポンサーとして協賛、および2件の研究発表を行いました!
SmartHRでは多くのAI機能の開発を進める中、実務上の課題が学術的にも未解決なもので、今回の研究発表に至りました。
結果としてポスターセッションでは90分間途切れることなく来訪者が続き、2人とものどを枯らしてヘトヘトになるほどの反響をいただきました!
本記事ではその模様をレポートします!
言語処理学会とは
言語処理学会は自然言語処理(NLP)の研究成果発表の場として設立された学会です。
年に一度の年次大会では、基礎研究から応用研究まで幅広い発表が行われ、国内NLP研究の最新動向を把握できる貴重な機会となっており、今年は第32回の年次大会です。

今年のトレンド
筆者がNLP2026の全発表タイトルから主要なカテゴリへざっくり分類し、傾向を分析しました!
- マルチモーダルAIが全体の約32%を占め、視覚言語モデルや音声・画像との統合が最大の関心領域となっています
- 次いでLLM(大規模言語モデル)評価・安全性(約24%)が続き、バイアス検出や形式検証など、LLMの信頼性を担保する研究が活発です
- RAG・検索拡張生成(約20%)も引き続き高い注目を集めており、埋め込みモデルの構築や検索精度の向上に関する発表が多く見られました
上記の傾向から、言語処理に限らずマルチモーダル化の進展と、安全性や運用面といった応用領域への関心が非常に強かった年と感じます。

SmartHRからの発表
SmartHRからはデータセットおよびLLM評価や安全性の領域で2件の研究発表を行いました!
Japanese HR NIAH: 架空データを用いた日本語人事労務領域のロングコンテキスト性能評価ベンチマーク
- 発表者: 久保田 崇文
- セッション: Q4-1(3/10 16:55-18:25)
LLMが長いコンテキストの中から必要な情報を正確に取り出せるかを評価する「Needle in a Haystack(NIAH)」テストを、日本語の人事労務領域に特化して構築したベンチマークの発表です。架空の人事データを用いることで、プライバシーの問題を回避しつつ、実務に近い条件での評価を可能にしています。SmartHRの機能開発で直面する実課題から生まれた研究です。

P2LD: 隠れ状態差分による Few-shot ハルシネーション検知
- 発表者: 井上 耕太朗
- セッション: B7-7(3/12 9:30-11:00)
LLMが事実と異なる内容を生成してしまうハルシネーションを、モデルの隠れ状態の変化から少数サンプル(Few-shot)の学習で検知する手法の発表です。LLM推論時の内部表現をPCA(主成分分析)とPLS(部分的最小二乗回帰)をかけ合わせて数十程度の数値で表現することで、外部知識ベースに依存せず、低コストかつ低レイテンシの検知を目指しています。チャットアプリのようなLLMアプリケーションにおける回答品質を担保するうえで重要な技術的課題に取り組んだ研究です。

We Are Hiring!
今年の言語処理学会の熱気、皆さんはどのように感じられたでしょうか?
SmartHRでは最新技術に明るいメンバーが集まった環境で、革新的なAIプロダクトづくりに取り組んでいます。
ぜひ一度SmartHRのAIチームにご興味をお持ちの方へをご覧いただき、お気軽にお問い合わせください!