Saltar al contenido principal

Paso 2: Colecciones y documentos

Para dotar a nuestro asistente de conocimiento, es esencial integrar una amplia documentación que sirva como base para su aprendizaje continuo. Esta tarea se llevará a cabo mediante la carga estratégica de documentos que formarán parte de diversas colecciones.

Para nuestro ejemplo cargaremos documentos con información de museos. Lo primero que debemos hacer es crear una colección para dichos documentos.

Crear colección

Vamos a la sección de colecciones desde el menu lateral y una vez allí hacemos click en el botón .

New collectionNew collection

Se nos abrirá una ventana para rellenar la información de nuestra colección. Introduciremos la siguiente información:

CampoDescripciónValor
TítuloNombre de nuestra coleccion.Museos
DescripciónBreve descripción de la colección.Documentos con información sobre museos
EtiquetasListado de etiquetas relacionadas con la colección.
Modo de accesoSelecciona el modo de acceso a los documentos de la colección. Acceso público o solo miembros.Acceso público
MiembrosLista de miembros que tendrán acceso a los documentos y su privilegio asociado.

Una vez proprocionada toda la informacion necesaria hacemos click en el botón Crear.

Create museums collectionCreate museums collection

Ahora tendremos nuestra colección vacía lista para poder cargar nuestros documentos sobre museos.

Cargar documentos

En nuestra nueva colección de museos, hacemos click en el botón para añadir nuestros documentos con toda la información que queramos que nuestro futuro asistente aprenda.

tip

En este ejemplo hemos usado documentos sobre museos españoles que podemos encontrar en el siguiente enlace: documentos de museos.

Mediante una ventana podremos proporcionar toda la información sobre el documento que estamos cargando. Puedes cargar un fichero externo (PDF, Word, Presentación, Hoja de cálculo) o puedes escribir el texto utilizando el editor de Markdown.

Veamos a continuación toda la información que podemos proporcionar sobre nuestro documento y que valores estableceremos para nuestro ejemplo:

Create museum docCreate museum doc

CampoDescripciónValor
ColecciónColección asociada al documento.Museos
TítuloNombre del documento.Guggenheim
DescripciónBreve descripción del documento.Información sobre el museo Guggenheim
Fuente del documentoSeleccionar la procedencia del documento. Editor markdown o fichero existente.Fichero existente
AudienciasAudiencias a las que se dirige el documento.global
IdiomaIdioma del documento.Español
No publicitarIndica si el documento debe publicitarse o no.Deshabilitado
EtiquetasListado de etiquetas relacionadas con el documento.

Realizaremos este procedimiento con todos los documentos que deseemos cargar en nuestra colección sobre museos. Una vez subidos todos los documentos en nuestra colección podremos consultarlos tanto en la sección de colecciones como en la seccion de documentos del menu lateral.

Museums collectionMuseums collectionMuseums documentsMuseums documents
Colección museosDocumentos museos

Método de división

Una vez cargado el documento, en su página de detalle puedes ver toda su información relacionada. También podrás editar diferentes campos como el título, descripción, audiencias,...

Un campo importante a tener en cuenta de tus documentos es el método de división. Este campo determina cómo Ainhoa extraerá la información del documento en función de su estructura.

Disponemos de las siguientes opciones:

Split methodSplit method

OpciónDescripción
AutoAinhoa selecciona el método más apropiado según el documento.
NingunoNo se realiza ningún tipo de división en el texto del documento. Es útil cuando el documento es simple y no requiere separación por secciones o estructuras definidas.
PárrafoEste método se emplea cuando el documento está organizado en secciones claras con títulos distintivos. Ainhoa extraerá la información en forma de párrafos, facilitando la comprensión y permitiendo una lectura más coherente de la información.
BloqueCuando un documento carece de una estructura evidente o es un documento escaneado, este método resulta útil. Ainhoa extraerá el texto en bloques.

Seleccionar el método de división adecuado es crucial para que Ainhoa comprenda y procese la información del documento de manera óptima, adaptándose a la disposición y formato específicos para ofrecer resultados precisos y coherentes.

En nuestro ejemplo seleccionaremos la opción Auto para todos los documentos.

Entrenar colección

Despues de subir nuestros documentos debemos entrenarlos. Esta etapa es fundamental, ya que habilita a Ainhoa para aprender y comprender el contenido de dichos documentos, permitiéndole asimilar la información de manera efectiva. Durante este proceso, Ainhoa procesará activamente los datos, identificando patrones, conceptos y relaciones entre la información presente en los documentos. Este aprendizaje le permite responder de manera precisa y contextual a las consultas o solicitudes de los usuarios basándose en la información contenida en esos documentos.

Podemos realizar el proceso de entrenamiento documento a documento o, como es nuestro caso, entrenar todos los documentos de la colección.

En la página de la colección de museos hacemos click en el botón Entrenar y en poco tiempo tendremos todos sus documentos listos para su uso.

Musseums trainedMusseums trained

tip

Podemos ir a la ficha de uno de los documentos y comprobar en la pestaña Pasajes como Ainhoa ha extraido la información del documento.

Document passagesDocument passages

Bien, ya tenemos lista toda nuestra información sobre museos. A continuación, veremos como poder hacer búsquedas sobre ésta información.