ドキュメント検索クエリの精度を向上させるために、データをアップロードして、モデルをトレーニングさせることが可能です。ナレッジベースでのドキュメント検索の利用方法についてはこちらのユーザーガイドをご参照ください。

モデルをトレーニングする理由

Alliのドキュメント検索は、事前にトレーニングされたAIモデルを使用して、クエリーに対してドキュメントから該当箇所を抽出することが可能です。ただし、ユースケースにおいて、より業界特化(金融、保険、法律など)させ、精度を向上させたいという場合もあるかと思います。AIモデルのトレーニングを行うことで、ドキュメント検索の精度をより向上させることが可能です。

特定の業界(金融、保険、法律など)のドキュメントを対象にした、AIモデルのトレーニング実施前後の簡単な例を下記に示します。
なお、トレーニングに用いたデータは1つとなります。

トレーニング前
トレーニングの後

トレーニングに用いるデータを複数追加することで、さらに良い結果を得ることが可能です。

モデルをトレーニングする方法

トレーニングデータを管理するには、[ナレッジベース]-> [ドキュメント]-> [AIモデル管理]-> [トレーニングデータ管理]を開きます。

ここでは、トレーニングデータを手動で入力したり、既存のトレーニングデータを変更/削除することができます。アップロードアイコンをクリックして、トレーニングデータをまとめてアップロードすることも可能です。質問とドキュメントのペアは一意であるため、同じ質問とドキュメント名を持つ2つのトレーニングデータを設定することはできません。

トレーニングデータの管理

Excel形式でトレーニングデータをアップロードする場合、最初の列に「Question」、2番目の列に「Document Title」、3番目の列に「Answer」というラベルを付けてください。「Qestion」と「Document Title」は必須フィールドです。正しい形式のサンプルファイルをダウンロードすることも可能です。ファイルをアップロードした場合、Alliは失敗した行を通知します。(適切なフォーマットに記載したトレーニングデータは、別のトレーニングデータのアップロードの失敗に関係なく追加されます。)

誤った形式でトレーニングデータをアップロードすると注意が表示されます。

未回答の質問リストからトレーニングデータを追加することもできます。未回答の質問において、質問のみを、トレーニングデータに追加はできないことに注意してください。

未回答の質問をトレーニングデータに追加する方法

トレーニングデータの準備ができたら、モデルをトレーニングする必要があります。[ドキュメント]ページに戻り、[AIデータ管理]-> [ドキュメントトレーニング]をクリックします。

トレーニングが実行中であることを示します。

トレーニング中は、自由に他の機能を利用することが可能です。トレーニングが完了すると、「トレーニング中」のバーが消えます。

トレーニング設定

トレーニング設定を変更することが可能です。これらは、[ドキュメント]ページの設定アイコンをクリックし、[モデルトレーニング設定]タブにて設定できます。

ドキュメント検索のモデルトレーニング設定について

各設定について簡単に説明します。

  • 検索時にドキュメント名を反映:オンにすると、Alliはドキュメント検索を実行するときにドキュメントのタイトル(ファイル名)を考慮します。
  • ドキュメント名の影響度:ドキュメント検索のドキュメント名の影響度を変更できます。この設定を適用するには、[検索時にドキュメント名を反映]がオンになっている必要があります。
  • ドキュメントごとに抽出する回答候補の最大数:この設定は、1つのドキュメントから抽出される結果の最大数を決定します。
  • 類似した検索結果を除去:類似のドキュメント検索結果がある場合、非表示にすることができます。全ての類似した結果、ハッシュタグが同一の場合の結果、または同じドキュメントから抽出された結果を除去することが可能です。

ドキュメント検索を最適化するその他の方法

検索結果からの顧客フィードバックやクエリトレーニングからのエージェントフィードバックを使用して、ドキュメント検索をさらに改善することもできます。詳細については、以下のユーザーガイドを参照してください。

ドキュメント検索の一般的な説明については、以下のユーザーガイドを参照してください。

AllganizeのAIソリューション