$ humano-lab --status

La IA es poderosa.
Producción es más difícil.

Un laboratorio de ingeniería de IA. Reducción de costos, evals y arquitectura de agentes y workflows — la ingeniería de sistemas que la mayoría de los equipos no logra sacar del prototipo. Enviamos en semanas, no en trimestres.

Iniciar un proyecto Ver en qué trabajamos →

humano-lab.audience-fit 6 signals

// para líderes de ingeniería y fundadores cuya empresa…

tiene costos de tokens que crecen más rápido que sus ingresos
tiene un prototipo de IA que funciona en demo pero se cae en producción
ha enviado 3 PoCs y 0 features de IA en producción
quiere agregar features o capacidades de IA a un producto existente
quiere automatizar sus operaciones con agentes de IA, end-to-end
no logra decidir entre arquitectura de agente o workflow

En qué trabajamos

Tres engagements de IA, cada uno con alcance acotado. Elige el que coincide con el dolor que tienes realmente.

01 ai-cost-reducer agendando
Tus costos de LLM están creciendo más rápido que tus ingresos. Auditamos todo el flujo de inferencia, encontramos el desperdicio y bajamos los costos drásticamente.

scope

auditoría 2 sem · precio fijo

price

desde $15k

typical

40–70 % menos costos de inferencia · sin regresión
entregamos/
- Encontramos el 40-70 % que estás sobrepagando
- Cambiamos solo lo que mueve la cuenta, nada más
- Guardrails para que no vuelva a explotar el próximo trimestre
basado en: runtimes de IA en producción que hemos enviado con presupuestos reales de inferencia
Hablemos de costos
02 evals-and-reliability agendando
Tu feature de IA funciona en el demo y se cae en producción. La instrumentamos, diseñamos los evals y enviamos los cambios que la transforman de "funciona la mayor parte del tiempo" a una métrica que puedes defender.

scope

2–4 sem · precio fijo

price

desde $25k

typical

evals con golden-set + observabilidad en producción
entregamos/
- Atrapa regresiones de calidad antes que tus usuarios
- Detecta en minutos cuando un cambio de modelo rompe algo
- Deja de re-correr prompts a mano para verificar que sigue funcionando
basado en: confiabilidad para productos de IA y software a escala país (millones de usuarios)
Hablemos de confiabilidad
03 agents-and-workflows agendando
¿Agente o workflow? Diseñamos y enviamos la respuesta. Arquitectura production-grade para features de IA que hacen trabajo real — uso de herramientas, razonamiento multi-paso, integración con el resto de tu stack.

scope

build 2–6 meses · precio fijo

price

desde $75k

typical

agente o workflow en producción
entregamos/
- Decidimos por ti: agente o workflow, con razones
- Integración real con tu CRM, ERP y APIs internas
- Los humanos intervienen en el paso correcto, no al azar
basado en: el runtime de agentes de IA en Rust que enviamos (estilo MCP, pre-MCP)
Hablemos de agentes

Cómo trabajamos

Proyectos enfocados en resultados, no en horas.

humano-lab.process 3 pasos

01 Escuchar Llamada de 30 minutos

Entendemos el problema, las restricciones y qué significa "terminado". Si no somos lo que necesitas, te lo decimos de inmediato.

02 Definir Precio fijo, sin reloj corriendo

Una propuesta escrita: entregables, plazos, precio y los supuestos detrás de cada uno. Sin sorpresas.

03 Construir Hasta que la métrica se mueva

Lo construimos, lo enviamos a producción y nos quedamos lo suficiente para verificar que la métrica que te importaba realmente se movió.

Nuestro trabajo

Sistemas de IA, enviados a producción.

Runtimes de agentes, LLMs in-browser sobre WebGPU, RAG local-first, marketplaces de agentes y companions de IA en tiempo real — diseñados y enviados a producción.

01 local-first-agent-runtime en producción

Diseñamos y construimos un runtime de agentes de IA local-first, con foco en privacidad, en Rust, enviado como aplicación de escritorio multiplataforma. El runtime, la capa de protocolos / herramientas y las capacidades basadas en OAuth — una arquitectura similar a MCP, enviada antes de que MCP fuera un estándar público.

stack

rust · tauri · oauth · agents

surface

escritorio multiplataforma

destacado: arquitectura MCP-style enviada antes de que MCP fuera estándar público
02 enterprise-agent-platform producto temprano

Hicimos el bootstrapping de una plataforma empresarial de agentes IA desde cero hasta el primer producto. Certifica, integra y mide el ROI de agentes IA en operaciones de negocio — ERP, CRM, mensajería y más.

stack

typescript · agents · b2b-integrations

surface

web · b2b

destacado: agentes certificados, integrados y con ROI medido en operaciones de negocio
03 agent-server-manager open-source

Diseñamos y enviamos un instalador y gestor de servidores de agentes IA / MCP, empaquetado como app de escritorio multiplataforma, CLI y librería. Usado por desarrolladores de IA del ecosistema.

stack

rust · cli · multiplatform · mcp

surface

escritorio · cli · librería

destacado: usado por desarrolladores de IA del ecosistema
04 agentic-city-sim enviado

Construimos la capa de agentes IA para una simulación de ciudad. NPCs agénticos razonan sobre estado on-chain, integrados de punta a punta con la red Layer-2 subyacente y los servicios de IA.

stack

agents · layer-2 · on-chain-state

surface

simulación · on-chain

destacado: NPCs agénticos razonando sobre estado on-chain, integración end-to-end
05 agent-marketplace-x402 enviado

Sumamos una capa de marketplace a un runtime de agentes local-first: los usuarios publican sus propios agentes y otros los descubren y pagan por uso mediante el protocolo de micropagos x402. Descubrimiento, medición y liquidación corren junto al loop del agente, no encima.

stack

rust · x402 · agents · payments

surface

escritorio · marketplace

destacado: agentes IA pay-per-use sobre el protocolo de micropagos x402
06 in-browser-agent-extension enviado

Versión como extensión de navegador de un stack de agentes local-first: modelos, uso de herramientas, RAG sobre el DOM de la página y el loop completo del agente corren dentro del navegador. Sin instalador, sin salto al servidor — el agente vive donde el usuario ya está.

stack

typescript · webextensions · webgpu · agents

surface

extensión de navegador

destacado: loop de agente e inferencia on-device dentro del navegador
07 webgpu-in-browser-llm enviado

Llevamos features de LLM y de IA generativa locales a una experiencia in-browser usando WebGPU. La inferencia corre en la GPU del jugador; los tokens nunca salen del dispositivo y no hay round-trip al servidor por llamada.

stack

webgpu · transformers.js · typescript

surface

navegador

destacado: inferencia LLM client-side a latencia interactiva
08 local-rag-knowledge-base enviado

Sistemas de RAG y bases de conocimiento local-first sobre archivos del usuario: ingesta, embeddings, recuperación y generación grounded — todo corriendo en la máquina del usuario. Los documentos nunca salen del dispositivo.

stack

rust · embeddings · vector-search · rag

surface

escritorio

destacado: RAG privado sobre archivos del usuario, sin round-trip a la nube
09 realtime-game-coach en desarrollo

Un coach IA para un juego online competitivo: análisis situacional en tiempo real sobre el estado del juego, retroalimentación de decisiones en el momento y revisión post-partida adaptada al nivel del jugador.

stack

ai · realtime · game-telemetry

surface

escritorio · companion

destacado: coaching en tiempo real junto al gameplay en vivo

posicionamiento

La mayoría de las features de IA son un prompt y una plegaria. Somos el laboratorio al que contratas en vez de rezar.

costpresupuestado evalsinstrumentado agentstool-correct workflowsdeterministas

cuéntanos qué está atascado en tu stack →

En qué creemos

Opiniones que estamos dispuestos a defender en producción.

humano-lab.beliefs 4 entradas

belief/01 Ingeniería real, no parches con LLM.

La mayoría de las "funcionalidades de IA" hoy son un prompt y una plegaria. Tratamos a la IA como el problema de ingeniería de sistemas que realmente es: evaluaciones, instrumentación y arquitectura que se pueda defender.

belief/02 El rendimiento es un feature.

El software lento cuesta dinero, atención y confianza del usuario. Cuando el ciclo crítico importa, vamos por Rust y diseñamos según los recursos reales del sistema.

belief/03 Local-first, cuando importa.

Algunas cargas corren mejor en tus servidores; otras, en la máquina del usuario; otras, en ninguno de los dos. Decidimos dónde vive el cómputo en función de privacidad, latencia y costo. No de lo que esté de moda.

belief/04 La IA aumenta. El humano decide.

Construimos sistemas que potencian a las personas. No sistemas que pretenden reemplazar el juicio humano del que alguien tiene que responder.

Preguntas frecuentes

Lo que la gente suele querer saber de entrada.

humano-lab.faq 10 entradas

01 ¿Cómo cobran: precio fijo, retainer u hora?

Precio fijo siempre que el alcance se pueda definir: ambas partes saben qué esperar. Retainer para relaciones continuas. Evitamos cobrar por hora porque castiga al ingeniero por ir rápido.

02 ¿En qué zonas horarias trabajan?

Operamos desde Chile (UTC−3 / UTC−4) y trabajamos cómodamente con equipos de América, Europa y la mayor parte de EMEA. Somos asíncronos por defecto, y lo hacemos bien.

03 ¿Qué tan rápido pueden empezar?

Normalmente entre dos y tres semanas después de acordar el alcance. Tomamos pocos proyectos a la vez, así que el cupo que reservas es el cupo que recibes.

04 ¿Y si mi problema de IA no encaja con uno de los tres servicios?

Conversémoslo igual. Los tres servicios son el trabajo en el que vamos más a fondo, pero la mayoría de los engagements de IA tocan los tres en algún punto. Si no somos lo que necesitas, te lo decimos en la primera llamada.

05 ¿Trabajan solo remoto?

Sí. Somos remote-first y hemos enviado a producción así durante años. Podemos viajar para kickoffs o revisiones críticas cuando realmente vale la pena.

06 ¿Qué tamaño tienen sus proyectos típicos?

Desde auditorías enfocadas de dos semanas (reducción de costos de LLM, diseño de evals) hasta builds de varios meses (plataformas de agentes en producción, features de IA de punta a punta). Felices de definir algo más acotado si es el punto de partida correcto.

07 ¿Hacen Rust? ¿Ingeniería no-IA?

Sí a Rust — lo usamos cuando latencia, seguridad o memoria importan (el runtime local-first de agentes de IA en nuestro trabajo está en Rust). No a no-IA como oferta independiente: nos enfocamos en ingeniería de IA, y traemos Rust e infraestructura cuando potencian ese trabajo.

08 ¿De quién son la IP y el código que entregamos?

Tuyo. Todo lo que enviamos bajo el engagement — código, modelos, prompts, evals, documentación — es tuyo. Retenemos solo nuestra metodología genérica y el tooling interno reutilizable. Separación clara, sin sorpresas.

09 ¿Firman NDA?

Sí. Firmamos NDA mutua antes de definir alcance o ver código. No la necesitamos para la primera llamada de discovery, pero siempre la firmamos antes de intercambiar algo específico.

10 ¿Y si no quedamos contentos con el trabajo?

Precio fijo significa que cubrimos los overruns. Si acordamos que el engagement movería la métrica X a Y y no lo hace, seguimos trabajando hasta lograrlo, sin segunda factura. Definimos los alcances con cuidado para que esto pase poco, pero el compromiso es el compromiso.

contact

Cuéntanos qué está atascado
en tu stack.

Tomamos pocos proyectos por trimestre. El cupo que reservas es el cupo que recibes.

qué sigue
01 respondemos en 1 día hábil, al correo que dejaste.
02 llamada de discovery 30 minutos, sin pitch — mapeamos el problema y las restricciones.
03 propuesta escrita precio fijo, alcance fijo, plazo fijo — o un honesto "no somos lo que necesitas."

o escríbenos directamente · agenda 30 minutos de discovery

La IA es poderosa. Producción es más difícil. Tu feature de IA llega a producción en semanas. No en trimestres.

La mayoría de las features de IA son un prompt y una plegaria. Somos el laboratorio al que contratas en vez de rezar.

La IA es poderosa.
Producción es más difícil.