Saltar al contenido principal

Acceso Inteligente a Documentos

En esta sección


Smart Document Access es el módulo adicional de Algho para cargar y gestionar documentación para proporcionar a los asistentes con el fin de responder a los usuarios finales.

El módulo es accesible directamente desde Algho, seleccionando Módulos y luego SDA 2.0.

image.png

Gestión de Documentos

La sección "Gestión de Documentos" le permite crear y gestionar Carpetas y Subcarpetas, así como cargar y gestionar documentación.

La documentación es accesible seleccionando "Gestión de Documentos" en el menú izquierdo.

image.png

Creación de una carpeta

Para crear una nueva carpeta, seleccione la opción "Añadir" y asigne un nombre a la carpeta.

image.png

image.png

Creación de una subcarpeta

Para crear una nueva subcarpeta, seleccione la opción "Añadir".

image.png

Asigne un nombre a la subcarpeta y seleccione el idioma de los documentos que se cargarán dentro.

Puede especificar la duración de validez de los enlaces que se proporcionan a los usuarios finales durante la interacción con un asistente.

image.png

información

Las opciones "Metadatos" y "Habilitar extracción de imágenes" pueden activarse más tarde.

Gestión de subcarpetas

Al hacer doble clic en la subcarpeta se abre su contenido.

image.png

En cada subcarpeta puede aplicar los siguientes filtros:

  • Estado, es decir, si el documento está indexado, en proceso de indexación o en error;
  • Ordenación, es decir, por fecha de creación, fecha de modificación, nombre, número de páginas, tamaño y estado;
  • Dirección de ordenación, es decir, ascendente o descendente;

También puede realizar búsquedas de texto para:

Carga de documentos

Para cargar uno o más documentos, seleccione la opción "Subir archivo".

image.png

información

Puede cargar documentos en formato .pdf, .doc, .docx, .xlsx

Seleccione "Examinar" para ver los archivos en su dispositivo. También puede cargar más de un archivo a la vez.

image.png

información

Al cargar más de un archivo a la vez, las opciones adicionales no estarán disponibles durante la carga. Seguirán siendo accesibles una vez que la indexación esté completa.

También puede especificar:

  • Nombre del archivo
  • Versión
  • URL de referencia
  • Descripción

image.png

información

La URL de referencia es la página a la que serán dirigidos los usuarios cuando seleccionen el documento de la lista de fuentes utilizadas por un asistente para generar su respuesta.

Una vez cargado, el archivo se mostrará como "Guardado". Luego cambiará a "Indexación en curso" y finalmente a "Indexación completada".

Guardado > Indexación en curso > Indexación completada

Gestión de documentos

Para cada documento, puede realizar las siguientes operaciones:

  • Editar
  • Reemplazar
  • Eliminar

Para modificar un documento, seleccione el documento y haga clic en "Editar".

image.png

Las opciones seleccionables son las mismas que las presentes al cargar un archivo.

Para reemplazar el archivo actual por uno nuevo, simplemente seleccione "Examinar" y suba el nuevo archivo.

El archivo antiguo cambiará al estado "Eliminando" y se eliminará permanentemente cuando el nuevo archivo haya completado la indexación.

image.png

Para eliminar un documento, seleccione el documento y haga clic en "Eliminar seleccionado".

image.png

Puede seleccionar más de un documento para eliminar. Para hacerlo, seleccione la opción "Selección múltiple" y elija todos los documentos. Una vez elegidos, seleccione "Eliminar seleccionados".

image.png

Smart Document Crawler

Dentro de Smart Document Access, puede configurar el crawler para indexar los contenidos de un sitio web.

El crawler opera en dos fases distintas: una primera fase de navegación de enlaces, que mapea la estructura del sitio sin extraer contenidos, y una segunda fase de extracción de contenido, que genera documentos PDF indexados.

Activación y creación de estructura

Dentro de una subcarpeta ya creada, seleccione la opción "Configurar Smart Crawler".

image.png

Active la casilla "Habilitar en subcarpeta".

image.png

Seleccione "Añadir configuración"

image.png

Asigne un nombre a la configuración y seleccione "Guardar".

image.png

información

En esta etapa puede importar configuraciones descargadas previamente o descargar las existentes.

Configuración del Crawler

Seleccionando "Editar campos" se abre la configuración del Crawler.

image.png

General

Ingrese la URL de inicio del sitio en el campo "Dirección".

image.png

Ingrese otras URLs en "Páginas adicionales" si es necesario.

Active la opción "Excluir sitios fuera del dominio" para limitar la navegación solo a enlaces internos del dominio principal.

Active la opción "Incluir documentos PDF, doc, docx" si también desea navegar por documentos adjuntos a páginas web.

En el campo "Direcciones a incluir", ingrese la lista de páginas del sitio a navegar.

En el campo "Direcciones a excluir", ingrese la lista de páginas del sitio a no navegar.

información

Puede usar expresiones regulares (regex) para indicar múltiples páginas.

image.png

Establezca la profundidad máxima y el número máximo de páginas a navegar.

image.png

Extracción

En la sección "Extracción", se configuran las reglas que el Crawler seguirá para transformar páginas web en documentación.

En el campo "Filtro de direcciones a incluir", ingrese la lista de páginas a extraer y convertir en documentación.

información

Las páginas a extraer pueden coincidir con las páginas a navegar.

En el campo "Filtro de direcciones a excluir", ingrese la lista de páginas a no extraer.

image.png

Añada selectores predefinidos en el campo "Eliminar elementos".

información

Los elementos a eliminar antes de la extracción también se pueden especificar manualmente, proporcionando un selector CSS, XPATH o compatible con Puppeteer.

image.png

Programación

Seleccione "Habilitar programación" y establezca la frecuencia de ejecución del Crawler (semanal o mensual) y establezca el día y la hora de inicio; puede establecer múltiples días de la semana o del mes para la ejecución repetida.

image.png

Visualización de documentos

Para verificar los documentos PDF generados por el crawler, regrese dentro de la subcarpeta en Smart Document Access.

La lista de documentos indexados estará disponible en la sección dedicada a la subcarpeta configurada.

Cada documento tiene asociada como "Archivo fuente" la URL desde la cual se generó el documento.

image.png

Conectar un asistente a la documentación

Para conectar un asistente a la documentación de Smart Document Access, acceda a la "Configuración del asistente" (consulte Configuración del asistente) y luego a la sección "SDA".

Antes de continuar, es útil entender cómo el asistente consulta Smart Document Access.

Búsqueda y respuesta

Cuando un usuario hace una pregunta a un asistente conectado a Smart Document Access, se realiza una búsqueda dentro de la documentación y luego se genera una respuesta.

La fase de búsqueda puede operar en 3 modos: híbrido (recomendado), vectorial y semántico. El objetivo de la búsqueda es identificar los párrafos más relevantes en relación con la pregunta del usuario.

Una vez identificados los párrafos, la IA los utiliza para generar una respuesta, siguiendo las instrucciones del prompt; la IA también utilizará el contexto de la conversación para proporcionar la mejor respuesta.

Conexión de subcarpetas

Cada asistente puede conectarse a una o más subcarpetas, siempre que pertenezcan a la misma carpeta.

image.png

Configuración de búsqueda

Al seleccionar la opción "Acrónimos", puede introducir asociaciones de palabras para ayudar a Smart Document Access durante la fase de búsqueda.

Por ejemplo, introducir "book" y "reserve" como acrónimos de "schedule":

  • Pregunta del usuario: "How can I schedule an appointment?"
  • Pregunta utilizada para la búsqueda: "How can I book or schedule an appointment?"

image.png

La opción "Número de párrafos por documento" le permite establecer el número máximo de párrafos que se pueden seleccionar para cada documento.

Un número bajo de párrafos puede acelerar los tiempos de respuesta, pero puede comprometer la relevancia de la respuesta. Un número mayor de párrafos puede mejorar la calidad de la respuesta, pero puede resultar en tiempos de respuesta más largos.

El "Tipo de búsqueda" le permite seleccionar el tipo de búsqueda que Smart Document Access realizará:

  • Vectorial: convierte las preguntas y las intenciones en representaciones matemáticas llamadas vectores. La similitud entre una pregunta y una intención se determina calculando la distancia entre sus vectores: cuanto más cercanos están, más relevante se considera la respuesta.
  • Semántico: analiza la información semántica contenida en la pregunta del usuario y en las intenciones definidas, devolviendo la respuesta más pertinente. Se basa en la comprensión del significado de las palabras y las oraciones, priorizando el contexto y las relaciones lingüísticas.
  • Híbrido (recomendado): integra la búsqueda semántica y vectorial, combinando sus fortalezas para proporcionar respuestas más precisas y completas.

image.png

Generación de respuestas

Al habilitar la opción "Usar AI Gen para generar respuestas" se habilita el editor de prompt de respuesta.

image.png

En el prompt se pueden introducir las instrucciones que la IA utilizará para generar la respuesta a la pregunta del usuario.

información

No es necesario incluir instrucciones sobre cómo realizar la búsqueda, ya que estas no son personalizables.

Tokens y recuento de palabras

Usando el control deslizante "Número máximo de tokens de entrada para AI Gen", puede establecer la cantidad de tokens para usar como entrada para la IA.

información

Un valor más alto corresponde a más información enviada a la IA Generativa, lo que puede generar respuestas más precisas, pero puede resultar en tiempos de respuesta más largos.

Usando el control deslizante "Longitud de la respuesta generada", puede establecer (aproximadamente) el número máximo de palabras para la respuesta generada.

información

El recuento de palabras es un parámetro aproximado que la IA tendrá en cuenta pero que puede no cumplir exactamente.

image.png

Opciones de documentación

En esta sección puede configurar el uso y la visualización de la documentación.

image.png

La opción "No mostrar la opción 'Mostrar documentos' después de la respuesta" deshabilitará la capacidad de los usuarios para ver los documentos utilizados para generar la respuesta.

Si la opción está deshabilitada, la interacción en el chat será la siguiente:

image.png

Si la opción está habilitada, la interacción en el chat será la siguiente:

image.png

La opción "Usar solo la documentación más relevante para generar la respuesta" indica a la IA que muestre en "Mostrar documentos" solo los párrafos más relevantes utilizados para generar la respuesta.

información

Habilitar esta opción puede resultar en tiempos de respuesta más largos.

La opción "Configuración avanzada para la vista previa de documentos" le permite definir con mayor precisión qué documentos se pueden mostrar en la lista "Mostrar documentos".

información

Esta opción y "No mostrar la opción 'Mostrar documentos' después de la respuesta" son mutuamente excluyentes.

Por lo tanto, puede optar por no mostrar documentos de "Smart Document Crawler" o documentos "Estándar", es decir, documentos cargados manualmente.

image.png

Opciones adicionales

En esta sección puede configurar funciones adicionales para habilitar o deshabilitar después de la respuesta generada.

image.png

La opción "Ocultar la documentación utilizada para generar la respuesta si hay un enlace presente" ocultará la opción "Mostrar documentos" si la respuesta contiene un enlace como adjunto multimedia.

La opción "Configuración avanzada para la visualización de enlaces" le permite definir con mayor precisión qué documentos se pueden mostrar en la lista "Mostrar documentos" según el tipo de origen del documento.

image.png

La opción "Deshabilitar la navegación automática para los enlaces insertados en la respuesta" le permite deshabilitar la navegación automática si la respuesta generada tiene un enlace como elemento multimedia (consulte Intención para obtener más información sobre la navegación automática).

Formulario de inicio e Intención

Las dos últimas opciones le permiten configurar el lanzamiento de un formulario o una intención después de la respuesta generada.

image.png

información

Las dos opciones son mutuamente excluyentes.

"Lanzar formulario establecido por AI Gen" le permite conectar uno o más formularios y especificar mediante prompt las condiciones bajo las cuales deben lanzarse.

image.png

image.png

"Lanzar intención después de cada respuesta generada" le permite establecer una intención que debe lanzarse después de cada respuesta generada.

image.png