La IA es poderosa.
Los humanos siguen al mando.
Diseñamos lo que va entremedio — IA práctica en la que se puede confiar, y el código de alto rendimiento que la sostiene. Ingeniería real, en producción, para equipos donde alguien todavía le pone la firma a cada decisión.
En qué trabajamos
Tres áreas en las que vamos a fondo — y tomamos cualquier problema que necesite ingeniería de verdad.
-
Reductor de costos de IA
AgendandoTus costos de LLM están fuera de control. Auditamos todo el flujo de inferencia, encontramos el desperdicio y bajamos los costos drásticamente — entre 40 y 70 % típicamente, sin sacrificar calidad.
- Auditoría e instrumentación de costos de inferencia
- Optimización de routing, caching y selección de modelo
- Dashboards y guardrails que evitan el próximo descalabro
-
Automatización con agentes IA
AgendandoAgentes que funcionan en producción, no demos. Diseñamos y construimos agentes que sacan trabajo repetitivo del equipo — con la integración correcta, supervisión humana donde corresponde y observabilidad desde el día uno.
- Arquitectura de agentes y diseño de protocolos / herramientas
- Integración con flujos de trabajo (CRM, ERP, APIs internas)
- Confiabilidad, evaluaciones y revisión humana en el bucle
-
Sistemas críticos centrales
AgendandoLos sistemas que tu producto no puede permitirse que fallen. Diseñamos y construimos los motores de alto rendimiento, seguros y confiables que están detrás — generalmente en Rust, siempre con la ingeniería que el problema merece.
- Servicios de alto rendimiento y reescritura de hot paths
- Backends e infraestructura seguros por diseño
- Confiabilidad, observabilidad y endurecimiento operacional
Cómo trabajamos
Laboratorio chico, proceso adulto.
- 01
Escuchar
Una llamada corta para entender el problema, las restricciones y qué significa "terminado". Si no somos lo que necesitas, te lo decimos al tiro.
- 02
Definir
Una propuesta escrita: entregables, plazos, precio y los supuestos detrás de cada uno. Sin sorpresas, sin facturación por hora.
- 03
Construir
Lo construimos, lo enviamos a producción y nos quedamos lo suficiente para verificar que la métrica que te importaba realmente se movió.
Trabajo seleccionado
Ingeniería real, en producción, a escala.
Sistemas de producción en IA, infraestructura distribuida e ingeniería de sistemas críticos.
Algunos de los sistemas que hemos diseñado y enviado a producción
-
Runtime local-first de agentes IA
Diseño y construcción desde cero de un runtime de agentes de IA local-first, con foco en privacidad, en Rust — enviado como aplicación de escritorio multiplataforma (macOS, Windows, Linux). Trabajo de ingeniería fundadora: arquitectura del runtime, capa de protocolos / herramientas, y capacidades basadas en OAuth (una arquitectura similar a MCP, antes de que MCP fuera un estándar público).
-
Red Layer-2 con privacidad
Arquitectura y construcción de una red Layer-2 con privacidad selectiva y más de 1K TPS, usando el sistema open-source de pruebas zero-knowledge Ligero. Construida sobre el Sovereign SDK con divergencia sustancial para soportar el diseño de privacidad y throughput.
-
Apps móviles a escala país
Construcción desde cero de las aplicaciones móviles oficiales para una agencia nacional de registro civil e identificación — software de alta seguridad y alta confiabilidad sirviendo a ciudadanía a escala país.
-
Plataforma empresarial de agentes IA
Bootstrapping desde cero de una plataforma empresarial de agentes IA hasta el primer producto — certifica, integra y mide el ROI de agentes IA en operaciones de negocio (ERP, CRM, mensajería y más).
-
Gestor multiplataforma de servidores IA
Diseño y entrega de un instalador y gestor de servidores de agentes IA / MCP — empaquetado como app de escritorio multiplataforma (macOS, Windows, Linux), CLI y librería, usado por desarrolladores de IA del ecosistema.
-
Arquitectura de entrega en dos capas
Arquitectura de un sistema de entrega en dos capas para una app de escritorio multiplataforma usada por millones de usuarios — separando el código en una capa de UI de envío rápido vía actualizaciones over-the-air (saltándose la revisión de las app stores) y un núcleo nativo de cadencia más lenta que sí pasa por las stores de Apple y Microsoft. Desacopló la velocidad de iteración de UI del cuello de botella de revisión de las stores.
-
Simulación de ciudad con agentes on-chain
Diseño y construcción de la capa de agentes IA para una simulación de ciudad — NPCs agénticos razonando sobre estado on-chain, integrados de punta a punta con la red Layer-2 subyacente y los servicios de IA.
-
Modernización de codebase a gran escala
Migración de más de 100K líneas de FlowJS a TypeScript en semanas, manteniendo el uptime de producción, además del mismo tipo de upgrade en un codebase de escritorio de 10 años (React, Electron, herramientas de build) — desbloqueando desarrollo nuevo encima de stacks legacy.
En qué creemos
Opiniones que estamos dispuestos a defender en producción.
-
Ingeniería real, no parches con LLM.
La mayoría de las "funcionalidades de IA" hoy son un prompt y una plegaria. Tratamos a la IA como el problema de ingeniería de sistemas que realmente es — con evaluaciones, instrumentación y arquitectura que se pueda defender.
-
El rendimiento es un feature.
El software lento cuesta dinero, atención y confianza del usuario. Cuando el ciclo crítico importa, vamos por Rust y diseñamos según los recursos reales del sistema.
-
Local-first, cuando importa.
Algunas cargas corren mejor en tus servidores; otras, en la máquina del usuario; otras, en ninguno de los dos. Decidimos dónde vive el cómputo en función de privacidad, latencia y costo — no de lo que esté de moda.
-
La IA aumenta. El humano decide.
Construimos sistemas que potencian a las personas — no sistemas que pretenden reemplazar el juicio humano del que alguien tiene que responder.
Preguntas frecuentes
Cosas que usualmente la gente quiere saber al tiro.
¿Cómo cobran — precio fijo, retainer u hora?
Precio fijo siempre que el alcance se pueda definir — ambas partes saben qué esperar. Retainer para relaciones continuas. Evitamos cobrar por hora porque castiga al ingeniero por ir rápido.
¿En qué zonas horarias trabajan?
Operamos desde Chile (UTC−3 / UTC−4) y trabajamos cómodamente con equipos de América, Europa y la mayor parte de EMEA. Somos asíncronos por defecto, y lo hacemos bien.
¿Qué tan rápido pueden empezar?
Normalmente entre dos y tres semanas después de acordar el alcance. Tomamos pocos proyectos a la vez, así que el cupo que reservas es el cupo que recibes.
¿Y si mi problema no encaja con uno de los tres servicios?
Conversémoslo igual. Los tres servicios son el trabajo en el que vamos más a fondo, pero la mayoría de los proyectos tocan los tres en algún punto. Si no somos lo que necesitas, te lo decimos en la primera llamada.
¿Trabajan solo remoto?
Sí. Somos remote-first y hemos enviado a producción así durante años. Podemos viajar para kickoffs o revisiones críticas cuando realmente vale la pena.
¿Qué tamaño tienen sus proyectos típicos?
Desde auditorías enfocadas de dos semanas (por ejemplo, reducción de costos de IA) hasta proyectos de varios meses (plataformas de agentes, sistemas críticos en Rust). Felices de definir algo más acotado si es el punto de partida correcto.
¿Tienes un problema que vale la pena
resolver con buena ingeniería?
Somos un equipo chico y con criterio propio. Tomamos pocos proyectos a la vez y nos quedamos hasta que la métrica que te importaba realmente se mueve.