¿Necesito una computadora potente para correr IA local?

No para empezar. Con 8 GB de RAM movés los modelos chicos como llama3.2; sin placa de video dedicada las respuestas salen lentas (palabra por palabra) pero funcionan. Cuanta más RAM y mejor GPU tengas, más grandes y rápidos los modelos que podés usar.

¿Es 100% gratis y legal?

Sí. Ollama es gratuito y los modelos abiertos (Llama, Gemma, Mistral y otros) se publican justamente para que cualquiera los descargue y los use. Tus únicos costos reales son el espacio en disco y la electricidad de tu compu.

¿La IA local es tan buena como ChatGPT?

No, y es importante saberlo antes: los modelos que entran en una computadora hogareña son notablemente menos capaces que los grandes de la nube en razonamiento complejo. Para resúmenes, borradores, traducciones y preguntas generales rinden muy bien; para tareas difíciles, la nube sigue ganando.

¿Funciona de verdad sin internet?

Sí. Internet solo hace falta la primera vez, para descargar Ollama y el modelo. Después, todo el procesamiento ocurre en tu máquina: podés chatear en un avión o sin señal, y nada de lo que escribís viaja a ningún servidor.

¿Cuánto espacio en disco ocupan los modelos?

Los chicos rondan los 2 GB, los medianos 4 o 5 GB y los grandes decenas de GB. Conviene mirar tu espacio libre antes de descargar varios; con ollama list ves lo que tenés instalado y con ollama rm borrás los que no uses.

IA local con Ollama: gratis y sin internet

Todas las IA que usaste hasta ahora —ChatGPT, Gemini, Claude— viven en servidores de otros: vos escribís, tu texto viaja, y la respuesta vuelve. Pero existe otro camino que poca gente conoce: correr la IA adentro de tu propia computadora. Gratis, sin límites de mensajes, sin cuenta y hasta sin internet. Se llama IA local, la herramienta estrella para hacerlo fácil se llama Ollama, y en esta guía te cuento cómo probarla hoy mismo y —con total honestidad— qué esperar y qué no.

Qué es la IA local

Los modelos de lenguaje son, al final del día, archivos: montañas de números entrenados que se pueden descargar. Meta, Google, Mistral, DeepSeek y otros liberan versiones "abiertas" de sus modelos para que cualquiera las baje y las use. La IA local es exactamente eso: bajás el modelo a tu disco y tu propia compu hace el trabajo de "pensar". Nada de lo que escribís sale de tu máquina.

La contracara, dicha de entrada: los modelos abiertos que entran en una computadora hogareña son más chicos y menos capaces que los gigantes de la nube. No esperes el nivel de los modelos top; esperá un asistente sorprendentemente útil que vive en tu disco y no le rinde cuentas a nadie.

Ollama: la puerta de entrada más fácil

Ollama es un programa gratuito (para Windows, Mac y Linux) que hace todo el trabajo sucio: descarga los modelos, los configura y te deja chatear con ellos. Así arrancás:

Descargá Ollama desde su sitio oficial, ollama.com, e instalalo como cualquier programa.
Abrí la terminal (en Windows: menú de inicio, escribí "PowerShell" y abrilo).
Corré tu primer modelo escribiendo: ollama run llama3.2
Esperá la descarga. La primera vez baja el modelo (unos 2 GB en este caso), así que va a tardar según tu conexión. Las siguientes veces arranca al instante.
Chateá. Cuando aparece el cursor, escribile como a cualquier IA: "explicame qué es la inflación en 3 oraciones". Para salir escribís /bye.

Eso es todo. Acabás de correr inteligencia artificial en tu propia máquina, sin cuenta, sin registro y sin dar ningún dato.

¿Y si la terminal no es lo tuyo? Hay alternativas con ventana y botones: las versiones nuevas de Ollama vienen sumando su propia interfaz gráfica, y programas gratuitos como LM Studio hacen lo mismo con un aspecto de chat tradicional. La mecánica de fondo no cambia —bajás un modelo, corre en tu máquina—, así que elegí el formato que te resulte cómodo y listo.

La verdad sobre la velocidad y tu hardware

Acá va la parte que muchos tutoriales esquivan:

Sin placa de video potente, funciona pero lento. En una compu común (sin GPU dedicada), el modelo corre sobre el procesador y las respuestas salen goteando, palabra por palabra. Usable, no instantáneo.
La memoria RAM manda. Con 8 GB movés los modelos chicos como llama3.2; para medianos conviene 16 GB; los grandes directamente no entran en una máquina normal.
Modelo chico = cerebro chico. Los modelos locales son notablemente menos capaces que ChatGPT o Claude en razonamiento complejo. Para resumir, redactar borradores, traducir, responder preguntas generales y practicar prompts andan muy bien; para tareas difíciles se quedan cortos.

La estrategia correcta: empezá con el chico. Si tu máquina lo mueve cómoda, probá uno más grande y comparás vos mismo.

Los GB: cuánto disco te come

Cada modelo pesa en serio: los chicos rondan los 2 GB, los medianos 4 o 5 GB, y los grandes decenas de GB. Antes de bajar varios, mirá tu espacio libre. Dos comandos útiles: ollama list te muestra los modelos instalados y ollama rm seguido del nombre borra el que no uses. En el catálogo de ollama.com vas a encontrar las familias populares para probar: Llama (de Meta), Gemma (de Google), Mistral, Qwen y versiones reducidas de DeepSeek, el modelo abierto que hizo ruido mundial.

La gran ventaja: privacidad de verdad

Este es el motivo número uno para tener IA local aunque uses la nube todos los días. Todo lo que escribís se procesa en tu máquina y muere ahí: nada viaja a ningún servidor. Eso la vuelve ideal para trabajar con información sensible que jamás pegarías en un chat online: documentos privados, datos de clientes, temas personales. Además funciona en un avión, en el campo sin señal o cuando se cae internet, y no tiene topes de mensajes: podés pedirle mil borradores sin que nadie te corte.

Veredicto honesto: ¿nube o local?

La nube gana en inteligencia: las mejores IA gratis online son más capaces que cualquier cosa que corras en una compu hogareña. Para el día a día de la mayoría, la nube sigue siendo la mejor opción.
Lo local gana en privacidad, costo y control: gratis para siempre, sin límites, sin cuenta, sin internet. Imbatible para datos sensibles y para experimentar sin culpa.
La jugada inteligente es tener ambas: la nube para lo difícil, lo local para lo privado y lo masivo. Y si algún día necesitás modelos top para tus propios proyectos, ahí aparece la API paga como tercera vía.

Probalo hoy

Instalar Ollama y correr ollama run llama3.2 te lleva menos de media hora, la mayor parte descargando. Es la forma más barata que existe de entender qué es un modelo de lenguaje: lo tenés vivo en tu disco, sin intermediarios. Y si querés el mapa completo —cuándo usar la nube, cuándo lo local, y cómo pedirle a cualquiera de las dos para que rinda de verdad— en la Guía IA lo tenés explicado desde cero, en español y sin humo. Entre lo gratis de la nube y lo gratis de tu propia máquina, hoy no hay excusa para no aprender: la guía completa te ordena el camino y tu compu pone el resto.

IA local con Ollama: gratis, privada y sin internet (guía honesta)

Qué es la IA local

Ollama: la puerta de entrada más fácil

La verdad sobre la velocidad y tu hardware

Los GB: cuánto disco te come

La gran ventaja: privacidad de verdad

Veredicto honesto: ¿nube o local?

Probalo hoy

Preguntas frecuentes

IA local con Ollama: gratis, privada y sin internet (guía honesta)

Qué es la IA local

Ollama: la puerta de entrada más fácil

La verdad sobre la velocidad y tu hardware

Los GB: cuánto disco te come

La gran ventaja: privacidad de verdad

Veredicto honesto: ¿nube o local?

Probalo hoy

Preguntas frecuentes

Seguí aprendiendo