Aller au contenu principal

Smart Document Access

Dans cette section


Smart Document Access est le module complémentaire d'Algho pour télécharger et gérer la documentation à fournir aux assistants afin de répondre aux utilisateurs finaux.

Le module est accessible directement depuis Algho, en sélectionnant Modules puis SDA 2.0.

image.png

Gestion des documents

La section « Gestion des documents » vous permet de créer et gérer des dossiers et sous-dossiers ainsi que de télécharger et gérer la documentation.

La documentation est accessible en sélectionnant « Gestion des documents » dans le menu de gauche.

image.png

Création d'un dossier

Pour créer un nouveau dossier, sélectionnez l'option « Ajouter » et attribuez un nom au dossier.

image.png

image.png

Création d'un sous-dossier

Pour créer un nouveau sous-dossier, sélectionnez l'option « Ajouter ».

image.png

Attribuez un nom au sous-dossier et sélectionnez la langue des documents qui seront téléchargés à l'intérieur.

Vous pouvez spécifier la durée de validité des liens qui sont fournis aux utilisateurs finaux lors de l'interaction avec un assistant.

image.png

info

Les options « Métadonnées » et « Activer l'extraction d'images » peuvent être activées ultérieurement.

Gestion des sous-dossiers

Un double-clic sur le sous-dossier ouvre son contenu.

image.png

Dans chaque sous-dossier, vous pouvez appliquer les filtres suivants :

  • Statut, c'est-à-dire si le document est indexé, en cours d'indexation ou en erreur ;
  • Tri, c'est-à-dire par date de création, date de modification, nom, nombre de pages, taille et statut ;
  • Ordre de tri, c'est-à-dire ascendant ou descendant ;

Vous pouvez également effectuer des recherches textuelles pour :

Téléchargement de documents

Pour télécharger un ou plusieurs documents, sélectionnez l'option « Télécharger un fichier ».

image.png

info

Vous pouvez télécharger des documents aux formats .pdf, .doc, .docx, .xlsx

Sélectionnez « Parcourir » pour visualiser les fichiers sur votre appareil. Vous pouvez également télécharger plusieurs fichiers à la fois.

image.png

info

Lors du téléchargement de plusieurs fichiers à la fois, les options supplémentaires ne seront pas disponibles pendant le téléchargement. Elles resteront accessibles une fois l'indexation terminée.

Vous pouvez également spécifier :

  • Nom du fichier
  • Version
  • URL de référence
  • Description

image.png

info

L'URL de référence est la page vers laquelle les utilisateurs seront dirigés lorsqu'ils sélectionneront le document dans la liste des sources utilisées par un assistant pour générer sa réponse.

Une fois téléchargé, le fichier s'affichera comme « Enregistré ». Il passera ensuite à « Indexation en cours » puis à « Indexation terminée ».

Enregistré > Indexation en cours > Indexation terminée

Gestion des documents

Pour chaque document, vous pouvez effectuer les opérations suivantes :

  • Modifier
  • Remplacer
  • Supprimer

Pour modifier un document, sélectionnez le document et cliquez sur « Modifier ».

image.png

Les options sélectionnables sont les mêmes que celles présentes lors du téléchargement d'un fichier.

Pour remplacer le fichier actuel par un nouveau, sélectionnez simplement « Parcourir » et téléchargez le nouveau fichier.

L'ancien fichier passera au statut « Suppression » et sera définitivement supprimé lorsque le nouveau fichier aura terminé l'indexation.

image.png

Pour supprimer un document, sélectionnez le document et cliquez sur « Supprimer la sélection ».

image.png

Vous pouvez sélectionner plus d'un document pour la suppression. Pour ce faire, sélectionnez l'option « Sélection multiple » et choisissez tous les documents. Une fois choisis, sélectionnez « Supprimer la sélection ».

image.png

Smart Document Crawler

Dans Smart Document Access, vous pouvez configurer le crawler pour indexer le contenu d'un site web.

Le crawler fonctionne en deux phases distinctes : une première phase de navigation de liens, qui cartographie la structure du site sans extraire le contenu, et une seconde phase d'extraction de contenu, qui génère des documents PDF indexés.

Activation et création de structure

À l'intérieur d'un sous-dossier déjà créé, sélectionnez l'option « Configurer Smart Crawler ».

image.png

Activez la case à cocher « Activer sur le sous-dossier ».

image.png

Sélectionnez « Ajouter une configuration »

image.png

Attribuez un nom à la configuration et sélectionnez « Enregistrer ».

image.png

info

À ce stade, vous pouvez importer des configurations précédemment téléchargées ou télécharger des configurations existantes.

Configuration du Crawler

La sélection de « Modifier les champs » ouvre la configuration du Crawler.

image.png

Général

Saisissez l'URL de départ du site dans le champ « Adresse ».

image.png

Saisissez d'autres URLs dans « Pages supplémentaires » si nécessaire.

Activez l'option « Exclure les sites hors domaine » pour limiter la navigation aux seuls liens internes du domaine principal.

Activez l'option « Inclure les documents PDF, doc, docx » si vous souhaitez également naviguer dans les documents joints aux pages web.

Dans le champ « Adresses à inclure », saisissez la liste des pages du site à naviguer.

Dans le champ « Adresses à exclure », saisissez la liste des pages du site à ne pas naviguer.

info

Vous pouvez utiliser des expressions régulières (regex) pour indiquer plusieurs pages.

image.png

Définissez la profondeur maximale et le nombre maximal de pages à naviguer.

image.png

Extraction

Dans la section « Extraction », les règles que le Crawler suivra pour transformer les pages web en documentation sont configurées.

Dans le champ « Filtre d'adresses à inclure », saisissez la liste des pages à extraire et à convertir en documentation.

info

Les pages à extraire peuvent coïncider avec les pages à naviguer.

Dans le champ « Filtre d'adresses à exclure », saisissez la liste des pages à ne pas extraire.

image.png

Ajoutez des sélecteurs prédéfinis dans le champ « Supprimer les éléments ».

info

Les éléments à supprimer avant l'extraction peuvent également être spécifiés manuellement, en fournissant un sélecteur compatible CSS, XPATH ou Puppeteer.

image.png

Planification

Sélectionnez « Activer la planification » et définissez la fréquence d'exécution du Crawler (hebdomadaire ou mensuelle) ainsi que le jour et l'heure de début ; vous pouvez définir plusieurs jours de la semaine ou du mois pour une exécution répétée.

image.png

Visualisation des documents

Pour vérifier les documents PDF générés par le crawler, revenez à l'intérieur du sous-dossier dans Smart Document Access.

La liste des documents indexés sera disponible dans la section dédiée au sous-dossier configuré.

Chaque document a l'URL à partir de laquelle le document a été généré associée comme « Fichier source ».

image.png

Connecter un assistant à la documentation

Pour connecter un assistant à la documentation de Smart Document Access, accédez aux « Paramètres de l'assistant » (voir Paramètres de l'assistant) puis à la section « SDA ».

Avant de procéder, il est utile de comprendre comment l'assistant interroge Smart Document Access.

Recherche et réponse

Lorsqu'un utilisateur pose une question à un assistant connecté à Smart Document Access, une recherche est effectuée dans la documentation, puis une réponse est générée.

La phase de recherche peut fonctionner selon 3 modes : hybride (recommandé), vectoriel et sémantique. L'objectif de la recherche est d'identifier les paragraphes les plus pertinents par rapport à la question de l'utilisateur.

Une fois les paragraphes identifiés, ils sont utilisés par l'IA pour générer une réponse, en suivant les instructions du prompt ; l'IA utilisera également le contexte de la conversation pour fournir la meilleure réponse.

Connexion des sous-dossiers

Chaque assistant peut être connecté à un ou plusieurs sous-dossiers, à condition qu'ils appartiennent au même dossier.

image.png

Paramètres de recherche

En sélectionnant l'option « Acronymes », vous pouvez saisir des associations de mots pour aider Smart Document Access lors de la phase de recherche.

Par exemple, en saisissant « book » et « reserve » comme acronymes de « schedule » :

  • Question de l'utilisateur : « How can I schedule an appointment? »
  • Question utilisée pour la recherche : « How can I book or schedule an appointment? »

image.png

L'option « Nombre de paragraphes par document » vous permet de définir le nombre maximal de paragraphes pouvant être sélectionnés pour chaque document.

Un nombre faible de paragraphes peut accélérer les temps de réponse mais peut compromettre la pertinence de la réponse. Un nombre plus élevé de paragraphes peut améliorer la qualité de la réponse mais peut entraîner des temps de réponse plus longs.

Le « Type de recherche » vous permet de sélectionner le type de recherche que Smart Document Access effectuera :

  • Vectoriel : convertit les questions et les intentions en représentations mathématiques appelées vecteurs. La similarité entre une question et une intention est déterminée en calculant la distance entre leurs vecteurs : plus ils sont proches, plus la réponse est considérée comme pertinente.
  • Sémantique : analyse les informations sémantiques contenues dans la question de l'utilisateur et dans les intentions définies, en retournant la réponse la plus pertinente. Elle est basée sur la compréhension du sens des mots et des phrases, en priorisant le contexte et les relations linguistiques.
  • Hybride (recommandé) : intègre la recherche sémantique et vectorielle, combinant leurs forces pour fournir des réponses plus précises et plus complètes.

image.png

Génération de réponse

L'activation de l'option « Utiliser AI Gen pour générer les réponses » active l'éditeur de prompt de réponse.

image.png

Des instructions que l'IA utilisera pour générer la réponse à la question de l'utilisateur peuvent être saisies dans le prompt.

info

Il n'est pas nécessaire d'inclure des instructions sur la façon d'effectuer la recherche, car celles-ci ne sont pas personnalisables.

Tokens et nombre de mots

À l'aide du curseur « Nombre maximal de tokens d'entrée pour AI Gen », vous pouvez définir le nombre de tokens à utiliser comme entrée pour l'IA.

info

Une valeur plus élevée correspond à davantage d'informations envoyées à l'IA générative, ce qui peut générer des réponses plus précises, mais peut entraîner des temps de réponse plus longs.

À l'aide du curseur « Longueur de la réponse générée », vous pouvez définir (approximativement) le nombre maximal de mots pour la réponse générée.

info

Le nombre de mots est un paramètre approximatif dont l'IA tiendra compte mais qu'elle peut ne pas respecter exactement.

image.png

Options de documentation

Dans cette section, vous pouvez définir l'utilisation et l'affichage de la documentation.

image.png

L'option « Ne pas afficher l'option « Afficher les documents » après la réponse » désactivera la possibilité pour les utilisateurs de visualiser les documents utilisés pour générer la réponse.

Si l'option est désactivée, l'interaction dans le chat se présentera comme suit :

image.png

Si l'option est activée, l'interaction dans le chat se présentera comme suit :

image.png

L'option « Utiliser uniquement la documentation la plus pertinente pour générer la réponse » demande à l'IA d'afficher dans « Afficher les documents » uniquement les paragraphes les plus pertinents utilisés pour générer la réponse.

info

L'activation de cette option peut entraîner des temps de réponse plus longs.

L'option « Paramètres avancés pour l'aperçu des documents » vous permet de définir plus précisément quels documents peuvent être affichés dans la liste « Afficher les documents ».

info

Cette option et l'option « Ne pas afficher l'option « Afficher les documents » après la réponse » s'excluent mutuellement.

Vous pouvez donc choisir de ne pas afficher les documents provenant de « Smart Document Crawler » ou les documents « Standard », c'est-à-dire les documents téléchargés manuellement.

image.png

Options supplémentaires

Dans cette section, vous pouvez définir des fonctions supplémentaires à activer ou désactiver après la réponse générée.

image.png

L'option « Masquer la documentation utilisée pour générer la réponse si un lien est présent » masquera l'option « Afficher les documents » si la réponse contient un lien comme pièce jointe multimédia.

L'option « Paramètres avancés pour l'affichage des liens » vous permet de définir plus précisément quels documents peuvent être affichés dans la liste « Afficher les documents » en fonction du type de source du document.

image.png

L'option « Désactiver la navigation automatique pour les liens insérés dans la réponse » vous permet de désactiver la navigation automatique si la réponse générée comporte un lien comme élément multimédia (voir Intent pour plus d'informations sur la navigation automatique).

Lancement d'un formulaire et d'un Intent

Les deux dernières options vous permettent de définir le lancement d'un formulaire ou d'un Intent après la réponse générée.

image.png

info

Les deux options s'excluent mutuellement.

« Lancer le formulaire défini par AI Gen » vous permet de connecter un ou plusieurs formulaires et de spécifier via le prompt les conditions dans lesquelles ils doivent être lancés.

image.png

image.png

« Lancer un Intent après chaque réponse générée » vous permet de définir un Intent qui doit être lancé après chaque réponse générée.

image.png