Saltar al contenido

Los juristas y la cultura del documento

Los juristas consumen información en la cultura del documento y su máxima expresión es la existencia del vademécum. Aunque el formato está en declive, no se puede decir que esté totalmente obsoleto.

Esta misma cultura lleva a que los tribunales publiquen su reglamento interno en formato pdf, no en páginas web. Así que, de alguna manera, nos quedamos atrapados en la metáfora documental y no hay una salida fácil de ella. Y es que, dentro del universo del derecho, se han construido pocos sistemas de información y seguimos apegados a los documentos como punto de partida de nuestro trabajo.

Cuando la fiebre de la TRAPO , incluso probé la viabilidad de transponer los datos de este tipo de documentos a un banco de vectores, con el objetivo de consumir esta información a través de un chatbot. Pero, por supuesto, se trata de una transposición desafortunada, ya que, en el caso del vademécum, se pierde toda la información sobre la estructura del compendio. En la práctica, La IA responde conociendo el contenido, pero sin saber de qué ley se trata .

En el caso de las normativas (y de los pequeños documentos en general), el propio ChatGPT ya ha aportado la solución, permitiendo la subida de pequeños documentos para que el bot pueda consultar su información. Entonces puede elegir una solución Chat2PDF de las muchas que hay en el mercado para resolver su propia vida rápidamente.

Por otro lado, una solución satisfactoria para casos más complejos requeriría la organización de los documentos (y sus partes) a fin de reflejar su estructura. Que yo sepa, todavía no hay una solución comercial para esto.

De cualquier manera, si desea hacer su propio intento de conversar con los textos en general, le recomiendo que aloje una instancia de Evaira como su banco vectorial, si pagar USD 25 por mes no es un problema. La interfaz de chat se puede prototipar en el Flowise , que es una herramienta de código abierto para crear rutinas basadas en LanchChain.

Dado que cargar documentos grandes en la base de datos puede ser un problema, recomiendo el VectorAdmin para gestionar la inclusión de estas entradas. Y para completar la pila de código abierto, Weaviate-UI Le ayuda a ver la información ingresada en su base de datos.

Descarto el uso de otras bases de datos, como Pinecone (por su precio), Qdrant (por las limitaciones del endpoint que ofrece la versión de código abierto) y Chroma (porque no tiene interfaz). Con eso, recomiendo la pila centrada en Weaviate

Si tienes éxito indexando este tipo de contenido en una base de datos vectorial, por favor dímelo. Personalmente, el resultado me pareció insatisfactorio, excepto cuando el contenido indexado tiene la forma de entradas (que es el caso de los resúmenes y los boletines informativos). Por lo tanto, no considero que el enfoque de hablar con un pdf grande como un vademécum sea productivo. Y para textos pequeños, cualquier aplicación (como ChatGPT) ya te resolvería la vida.

Comentarios