Saltar al contenido principal

Los dos modos

GRAIL tiene una sola arquitectura y dos formas de alimentarla. Esa es la decisión de diseño que más te conviene entender antes de empezar.

Comparación directa

Modo · Base de conocimiento
Modo · Memoria agéntica
Quién escribeUn LLM lee tus documentos y extrae entidadesTu agente escribe directamente lo que sabe
Qué entrainput/ con PDFs, markdown, códigomemories/<categoría>/ con observaciones markdown
Costo de escrituraUna llamada a LLM por chunk de documentoCero llamadas a LLM — el agente ya sabe lo que quiso decir
Cuándo procesarIndexación batch (grail index)Incremental, una observación a la vez
Origen de comunidadesAlgoritmo Leiden sobre el grafoCarpetas declaradas + propuestas revisadas
Modo de búsqueda extrarecall: filtro estructural sin LLM
Comando para creargrail init mi-proyectograil init mi-proyecto --memory
API en PythonGRAIL.from_config(...)MemoryProject(...)

Misma capa de búsqueda en ambos lados

Esta es la parte crítica: los seis modos de búsqueda funcionan idénticamente en ambos. Cuando preguntas en lenguaje natural, no importa por qué puerta entraron los hechos.

  • local — encuentra entidades parecidas a tu pregunta, ensambla su contexto, responde.
  • cascade — combina filtrado por entidades con rescate de texto por BM25/coseno.
  • global — map-reduce sobre reportes temáticos de comunidades.
  • document — acota la búsqueda a un solo archivo fuente.
  • agent — el LLM elige qué modo usar por cada pregunta, con varias iteraciones.
  • recall — filtro puro sobre fecha, categoría, tags. Solo memoria. Cero LLM.

Ver Modos de búsqueda para detalle de cada uno.

¿Cuándo elegir cuál?

Elige base de conocimiento si…

  • Tienes un corpus existente que quieres hacer consultable: una biblioteca legal, manuales técnicos, papers, código heredado.
  • Las fuentes son autoritativas (no las escribió tu agente).
  • Vas a indexar una vez o periódicamente y consultar muchas veces.
  • Te importa la procedencia exacta a archivos fuente para citas verificables.

Elige memoria agéntica si…

  • Tu agente necesita recordar entre sesiones lo que decidió, observó o aprendió.
  • Las "fuentes" no existen como documentos — son observaciones del agente sobre la conversación, el código, las decisiones del usuario.
  • Quieres que el agente mismo controle qué entidades y relaciones crear (no un LLM intermedio adivinando).
  • Necesitas que las escrituras sean incrementales y baratas — sin ciclo de re-indexación.

O ambos a la vez

Nada te impide mezclar los dos. Un proyecto puede tener input/ con PDFs de referencia y memories/ con observaciones que el agente acumula en uso. Las dos rutas alimentan el mismo grafo, y los seis modos consultan ambas fuentes a la vez.

Lo que comparten

CapaComportamiento
ArtefactosMismos parquet (final_entities, final_relationships, final_text_units, …)
GrafoMismo NetworkX bajo el capó
Vector storeMismo (FAISS / LanceDB / ChromaDB)
EmbeddingsMismo modelo
ProcedenciaCada unidad de texto guarda un puntero al archivo fuente
Modos de búsquedaLos 5 modos LLM funcionan idéntico; recall es el sexto, solo memoria

Siguiente paso