「LLMアプリの品質保証って何すればいいの?」の全体像を整理して勉強会をやりました

社内で開催したLLMアプリの品質保証に関する勉強会について、内容と開催背景をまとめました。

くつしたいぬ
  • AI
  • テスト

こんにちは!サイボウズOfficeという製品でQAをしているくつしたいぬ(@dog_dog_3dog)です。

社内で「LLMアプリの品質保証 ~LLMの特性から全体像まで~」というテーマで勉強会を主催しました。
この記事では、勉強会の内容と開催の背景を簡単に紹介します。

勉強会の内容

勉強会では、ざっくり以下のような流れで話をしています。

  1. COMPASからのケーススタディ

まずAIの品質問題の実例を見て、なぜAI独自の品質保証が必要となる背景をさらっています。

  1. LLMアプリ独自の品質特性

生成AI品質マネジメントガイドラインをもとに、機能要求満足性・信頼性・安全性・公平性など10の品質特性を見ています。

  1. リスク分析

品質特性をどうやってテスト戦略に落とし込むか、一つのやり方としてリスク分析を紹介しています。

  1. LLMアプリ全体の品質保証

LLMアプリはLLMの部分と従来通りのシステムで出来上がっています。LLMアプリの品質保証というとLLMに注目されがちですが、これまで通りのテストも変わらず重要だよね、という話をしています。

勉強会資料

当日の勉強会で使った資料です。

1 / 35
LLMアプリの品質保証 スライド 1 LLMアプリの品質保証 スライド 2 LLMアプリの品質保証 スライド 3 LLMアプリの品質保証 スライド 4 LLMアプリの品質保証 スライド 5 LLMアプリの品質保証 スライド 6 LLMアプリの品質保証 スライド 7 LLMアプリの品質保証 スライド 8 LLMアプリの品質保証 スライド 9 LLMアプリの品質保証 スライド 10 LLMアプリの品質保証 スライド 11 LLMアプリの品質保証 スライド 12 LLMアプリの品質保証 スライド 13 LLMアプリの品質保証 スライド 14 LLMアプリの品質保証 スライド 15 LLMアプリの品質保証 スライド 16 LLMアプリの品質保証 スライド 17 LLMアプリの品質保証 スライド 18 LLMアプリの品質保証 スライド 19 LLMアプリの品質保証 スライド 20 LLMアプリの品質保証 スライド 21 LLMアプリの品質保証 スライド 22 LLMアプリの品質保証 スライド 23 LLMアプリの品質保証 スライド 24 LLMアプリの品質保証 スライド 25 LLMアプリの品質保証 スライド 26 LLMアプリの品質保証 スライド 27 LLMアプリの品質保証 スライド 28 LLMアプリの品質保証 スライド 29 LLMアプリの品質保証 スライド 30 LLMアプリの品質保証 スライド 31 LLMアプリの品質保証 スライド 32 LLMアプリの品質保証 スライド 33 LLMアプリの品質保証 スライド 34 LLMアプリの品質保証 スライド 35
LLMアプリの品質保証 ~LLMの特性から全体像まで~

開催の背景

私がLLMアプリの品質保証に取り組み始めた頃、全体像を俯瞰できる情報が少なく、テストの枠組みを考えるのに苦労しました。
そこで、今後社内で別のLLMアプリが開発される時に全体感を掴むための一つのきっかけになればと思い、勉強会を実施しました。

なお、この勉強会は、産業技術総合研究所(産総研)が主催する「AI品質マネジメント講座」に参加させていただいたことに影響を受けて企画したものです。
講座で多くのことを学ばせていただきました。産総研と講師の皆さまには大変お世話になりました。

おわりに

自分自身もまだまだ試行錯誤の途中ですが、この記事がこれからLLMアプリの品質保証を考える方のとっかかりになれば嬉しいです。