MANUAL COMPLETO DE KAGGLE – HANDS-ON
Más Videos
-
Aptos apuesta USD $50 millones a la AI y los mercados institucionales on-chain
-
Binance Lanza la Agentic Wallet: La Era de las Carteras Diseñadas para Agentes de IA
-
Midnight (NIGHT) Avanza en Abril 2026: Nuevos Proyectos de I+D, Bitcoin Yield Privado y Adopción Institucional
-
Ethereum avanza en su roadmap 2026 con upgrades modulares: Glamsterdam (H1) y Hegota (H2)
Publicado
6 meses agoon
Data Science | Machine Learning | GPU Gratuita | Competencias | IA
Guía Definitiva para Principiantes y Practicantes Avanzados Versión 2025-2026 | Optimizado para SEO | Con Fuentes Citadas
| 18.5M+ Usuarios | 194 Países | 300K+ Datasets | 30 hrs GPU/semana |
TABLA DE CONTENIDO
- Qué es Kaggle y Por Qué Importa
- Todo lo que Puedes Hacer en Kaggle
- Computación con GPU en Kaggle
- Guía Completa Paso a Paso para Empezar
- Estrategias para Maximizar tu Aprendizaje
- Recursos Esenciales y Herramientas
- Cómo Hacer tus Notebooks SEO-Friendly y Visibles
- Referencias y Fuentes Citadas
CAPÍTULO 1: QUÉ ES KAGGLE Y POR QUÉ IMPORTA
1.1 Definición y Origen
Kaggle es la plataforma líder mundial de Data Science, Machine Learning e Inteligencia Artificial. Fundada en 2010 por Anthony Goldbloom y Jeremy Howard en Melbourne, Australia, fue adquirida por Google en marzo de 2017. Hoy es una subsidiaria de Google LLC y el punto de encuentro más importante para científicos de datos, ingenieros e investigadores de todo el mundo.
La plataforma comenzó exclusivamente como un sitio de competencias de Machine Learning, pero ha evolucionado hasta convertirse en un ecosistema completo que integra aprendizaje, colaboración, computación en la nube y visibilidad profesional.
Dato Clave (2024): Al 28 de mayo de 2024, Kaggle contaba con más de 18.5 millones de cuentas registradas, con 2.745 usuarios que habían alcanzado el estatus de Maestro y 530 que habían alcanzado el estatus de Gran Maestro. La comunidad abarca 194 países. [Fuente 1]
1.2 Crecimiento Histórico
| Año | Hito | Significado |
|---|---|---|
| 2010 | Fundación de Kaggle | Inicia con competencias de ML |
| 2017 | Adquisición por Google | Respaldo de infraestructura global |
| Jun 2017 | 1 millón de usuarios | Primera gran comunidad de DS |
| Oct 2023 | 15 millones de usuarios | Crecimiento masivo post-pandemia |
| May 2024 | 18.5 millones de cuentas | Plataforma dominante global |
| 2025 | 5-Day Gen AI Course | 30.000 usuarios nuevos en 1 día |
Según el estudio «Kaggle Chronicles: 15 Years of Competitions», eventos como el 5-Day Gen AI Intensive Course con Google atrajeron la mayor cantidad de usuarios nuevos en un solo día, con 30.000 nuevos registros. [Fuente 2]
1.3 La Metáfora del Ecosistema
Una forma útil de entender Kaggle es como la unión de varias plataformas en una sola:
| Kaggle equivale a… | Por qué |
|---|---|
| GitHub | Repositorio público de notebooks y código |
| Coursera | Cursos gratuitos con ejercicios prácticos |
| Leetcode | Competencias con problemas reales del sector |
| Google Colab | Computación en la nube con GPU/TPU gratis |
| Portafolio profesional visible para reclutadores |
CAPÍTULO 2: TODO LO QUE PUEDES HACER EN KAGGLE
2.1 Notebooks con GPU Gratuita
Los Kaggle Notebooks son entornos Jupyter alojados en la nube que te permiten escribir y ejecutar código Python o R sin instalar nada en tu computadora. La característica más poderosa es el acceso gratuito a GPUs NVIDIA de alto rendimiento.
| Recurso | Especificaciones | Límite Semanal |
|---|---|---|
| GPU T4 / P100 | 16 GB VRAM, NVIDIA Tesla | ~30 horas/semana |
| TPU v3-8 | Unidad de procesamiento tensorial | ~20 horas/semana |
| CPU | 4 núcleos | Sin límite |
| RAM | 32 GB (aumentado desde 29 GB) | Por sesión |
| Almacenamiento | 20 GB por notebook | Por proyecto |
| Sesión máxima GPU | 9 horas continuas | Por ejecución |
| Sesión máxima CPU | 12 horas continuas | Por ejecución |
Kaggle proporciona acceso a GPUs Tesla T4 y P100, junto con TPUs. Cada sesión permite hasta 12 horas de tiempo de ejecución para sesiones de CPU y GPU, y 9 horas para sesiones TPU, con una cuota semanal de aproximadamente 30 horas de tiempo de GPU. Estos límites son predecibles y consistentes: siempre sabes lo que obtendrás. [Fuente 3]
2.2 Competencias (Competitions)
Las competencias son el corazón histórico de Kaggle. Empresas, gobiernos y organizaciones publican sus desafíos de datos más complejos con premios en dinero. Los participantes compiten para construir el mejor modelo predictivo o analítico.
Tipos de Competencias
| Tipo | Descripción | Premio |
|---|---|---|
| Featured | Patrocinadas por empresas u organizaciones. Las más prestigiosas. | Miles a cientos de miles de USD |
| Research | Orientadas a investigación científica. Proceso de envío no tradicional. | Pequeño o ninguno |
| Playground | Para diversión y práctica. Un paso más difícil que Getting Started. | Kudos o pequeños premios |
| Getting Started | Para principiantes absolutos. Sin deadline, con tutoriales abundantes. | Sin premio (aprendizaje) |
| Recruitment | Patrocinadas por empresas que buscan reclutar científicos de datos. | Oferta laboral potencial |
Un ejemplo de la magnitud de los premios: la competencia ARC Prize 2025 ofrece $725.000 USD para quien logre avanzar en el razonamiento abstracto de IA. [Fuente 4]
Consejo para Principiantes: Empieza SIEMPRE con competencias tipo «Getting Started». La más recomendada para comenzar es «Titanic: Machine Learning from Disaster», que tiene cientos de notebooks guía, una comunidad activa y sin límite de tiempo para participar.
2.3 Datasets Públicos
Kaggle alberga más de 300.000 datasets gratuitos cubriendo prácticamente cualquier dominio imaginable. Desde imágenes médicas hasta datos financieros, desde textos literarios hasta registros climáticos.
- Datos estructurados (CSV, JSON, SQL)
- Imágenes y video (clasificación, detección)
- Texto y lenguaje natural (NLP, sentiment analysis)
- Series de tiempo (finanzas, meteorología, IoT)
- Datos geoespaciales y mapas
- Datos médicos y biológicos
- Datos de competencias históricas (Titanic, MNIST, CIFAR)
Los datasets de Kaggle incluyen características de comunidad donde puedes discutir técnicas y compartir código. El veredicto de expertos es que Kaggle es mejor para descubrir y usar datasets públicos que cualquier otra plataforma comparada. [Fuente 5]
2.4 Cursos Gratuitos (Kaggle Learn)
Kaggle Learn ofrece cursos de alta calidad con ejercicios prácticos directamente en el navegador. No requieren instalación y están diseñados para ser completados rápidamente.
| Curso | Nivel | Contenido Principal |
|---|---|---|
| Python | Principiante | Sintaxis, funciones, listas, POO |
| Intro to Machine Learning | Principiante | Árboles de decisión, validación, CV |
| Intermediate ML | Intermedio | XGBoost, pipelines, missing values |
| Data Visualization | Principiante | Seaborn, matplotlib, gráficos |
| Pandas | Principiante/Intermedio | DataFrames, groupby, merge |
| SQL | Principiante/Intermedio | Consultas, joins, funciones de ventana |
| Deep Learning | Avanzado | Redes neuronales, CNN, transfer learning |
| NLP | Avanzado | Tokenización, embeddings, transformers |
| Intro to AI Ethics | Todos | Sesgo, equidad, privacidad en IA |
| Generative AI | Intermedio | LLMs, prompting, APIs de IA generativa |
El formato de los cursos es ideal para principiantes: aprendes un concepto, lo practicas, y avanzas al siguiente. Los cursos de Kaggle Learn no explican las matemáticas detrás de los algoritmos, sino que enseñan los principios prácticos necesarios para un científico de datos. [Fuente 6]
2.5 Sistema de Rankings y Medallas
Kaggle tiene un sistema de progresión por rangos que recompensa la participación en cuatro categorías independientes: Competencias, Notebooks, Datasets y Discusiones.
| Rango | Requisito General | Beneficio |
|---|---|---|
| Novice | Cuenta creada | Acceso básico a la plataforma |
| Contributor | Completar perfil y acciones básicas | GPU desbloqueada, API activa |
| Expert | Medallas en competencias o notebooks | Reconocimiento comunitario |
| Master | Múltiple medallas de oro | Alta visibilidad para empleadores |
| Grandmaster | Élite global (530 personas en 2024) | El máximo honor en Kaggle |
CAPÍTULO 3: COMPUTACIÓN CON GPU EN KAGGLE
3.1 Por Qué la GPU es Fundamental en ML/DL
Las GPUs (Unidades de Procesamiento Gráfico) son esenciales en Deep Learning porque pueden ejecutar miles de operaciones matemáticas en paralelo. Mientras una CPU moderna tiene 8-32 núcleos, una GPU Tesla T4 tiene 2.560 núcleos CUDA. Esto la hace entre 10x y 100x más rápida para entrenar redes neuronales.
| Característica | CPU (típica) | GPU T4 (Kaggle) |
|---|---|---|
| Núcleos | 8-32 núcleos | 2.560 núcleos CUDA |
| Memoria | RAM del sistema | 16 GB VRAM dedicada |
| Operaciones FP32 | ~500 GFLOPS | ~8 TFLOPS |
| Entrenamiento ResNet-50 | ~2 horas | ~5 minutos |
| Costo en Kaggle | Gratis | Gratis (30h/semana) |
Habilitar y utilizar una GPU en Kaggle puede mejorar drásticamente el rendimiento de tus flujos de trabajo de Machine Learning, particularmente para Deep Learning y otras tareas de alto consumo de recursos. [Fuente 7]
3.2 Cómo Activar la GPU Paso a Paso
- Ve a kaggle.com y haz clic en «Code» en el menú principal.
- Selecciona «New Notebook» para crear un nuevo entorno.
- En el panel derecho busca la sección «Accelerator».
- Selecciona «GPU T4 x2» o «GPU P100» según disponibilidad.
- Verifica tu número de teléfono si aún no lo has hecho (requisito para GPU).
- El notebook se reiniciará automáticamente con la GPU activa.
3.3 Verificación de GPU en Python
python
# Celda 1: Verificar GPU con nvidia-smi
!nvidia-smi
# Celda 2: Verificar con PyTorch
import torch
print("CUDA disponible:", torch.cuda.is_available())
print("Nombre GPU:", torch.cuda.get_device_name(0))
print("VRAM total:", round(torch.cuda.get_device_properties(0).total_memory / 1e9, 2), "GB")
# Celda 3: Verificar con TensorFlow
import tensorflow as tf
gpus = tf.config.experimental.list_physical_devices("GPU")
print("GPUs disponibles:", len(gpus))
for gpu in gpus:
print("GPU:", gpu.name)
3.4 Hola Mundo con CUDA en Kaggle
Para programación directa en CUDA (C/C++) en Kaggle, usa la extensión nvcc4jupyter:
bash
# Paso 1: Instalar la extensión CUDA para Jupyter
!pip install nvcc4jupyter
%load_ext nvcc4jupyter
cuda
%%cuda
#include <stdio.h>
__global__ void saludo_gpu() {
int idx = blockIdx.x * blockDim.x + threadIdx.x;
printf("Hola desde hilo %d, bloque %d del GPU!\n", threadIdx.x, blockIdx.x);
}
int main() {
printf("Inicio desde la CPU\n");
// Lanzar 3 bloques con 8 hilos cada uno = 24 hilos paralelos
saludo_gpu<<<3, 8>>>();
cudaDeviceSynchronize();
printf("Fin desde la CPU\n");
return 0;
}
Este ejemplo demuestra el modelo SIMT (Single Instruction, Multiple Threads) de CUDA: un solo kernel se ejecuta en paralelo en todos los hilos definidos, cada uno con su propio threadIdx y blockIdx.
3.5 Ventajas de Kaggle para Computación NVIDIA
- Acceso a GPU real sin necesidad de comprar hardware costoso
- Soporte completo de CUDA y cuDNN preinstalados
- Compatible con TensorRT para inferencia optimizada
- Posibilidad de trabajar con datasets de cientos de GB en la nube
- Entorno estable con PyTorch, TensorFlow y JAX preconfigurados
- Comparado con Google Colab, Kaggle ofrece límites de GPU predecibles y consistentes [Fuente 3]
CAPÍTULO 4: GUÍA COMPLETA PASO A PASO PARA EMPEZAR
4.1 Registro y Configuración Inicial
Paso 1 — Registro Ve a www.kaggle.com. Puedes registrarte con tu cuenta de Google (recomendado) o con un email. El proceso toma menos de 2 minutos.
Paso 2 — Completar Perfil (Obligatorio para GPU) Ve a tu perfil > Settings. Completa tu nombre, ocupación y experiencia. Luego verifica tu número de teléfono: esto es OBLIGATORIO para activar el acceso a GPU. Ve a Account > Phone Verification.
Paso 3 — Explorar la Plataforma Familiarízate con el menú: Competitions, Datasets, Code, Models, Learn y Discussions. Pasa 20 minutos navegando sin presión antes de empezar a trabajar.
Paso 4 — Tu Primer Notebook Ve a Code > New Notebook. Selecciona Python como lenguaje. En el panel derecho activa GPU. Escribe print("Hola Kaggle!") y presiona Run All. Ya estás ejecutando código en la nube.
Paso 5 — Primera Competencia: El Titanic Busca «Titanic» en Competitions. Es la competencia de introducción clásica. Tiene miles de notebooks guía, no tiene deadline y es perfecta para aprender el flujo completo: datos → modelo → submission.
4.2 Anatomía de una Competencia de Kaggle
Entender la estructura de una competencia es esencial para participar con éxito. Cada competencia tiene estas secciones:
- Overview: Descripción del problema, contexto real y objetivos específicos.
- Data: Datasets de entrenamiento y prueba para descargar y analizar.
- Evaluation: Métrica con la que se mide tu modelo (Accuracy, RMSE, AUC, etc.).
- Rules: Elegibilidad, formación de equipos, límites de envíos diarios.
- Notebooks: Código público compartido por otros participantes.
- Discussion: Foro activo con preguntas, estrategias e ideas.
- Leaderboard: Ranking en tiempo real de todos los participantes.
En una competencia típica de Kaggle existen tanto un leaderboard público como uno privado. El público es visible durante la competencia; el privado revela los resultados finales. Esta estructura prueba que tu modelo no solo memorice los datos de prueba. [Fuente 4]
CAPÍTULO 5: ESTRATEGIAS PARA MAXIMIZAR TU APRENDIZAJE
5.1 Hoja de Ruta Recomendada para Principiantes
| Semana | Tarea | Objetivo |
|---|---|---|
| 1-2 | Curso Python en Kaggle Learn | Dominar sintaxis básica |
| 3-4 | Curso Intro to Machine Learning | Entender el ciclo ML |
| 5-6 | Explorar 3 datasets públicos | Practicar análisis EDA |
| 7-8 | Competencia Titanic | Primer submission real |
| 9-12 | Curso Intermediate ML + Pandas | Mejorar pipelines |
| 13-16 | 2da competencia Getting Started | Consolida técnicas |
| 17-24 | Primera competencia Playground | Competir con premios |
| 25+ | Featured competitions | Portafolio profesional |
5.2 Cómo Aprovechar los Notebooks Públicos
Una de las prácticas más valiosas en Kaggle es estudiar los notebooks de otros participantes. El botón «Copy and Edit» (o Fork) te permite clonar cualquier notebook público a tu cuenta y modificarlo libremente.
- Busca notebooks con muchos votos (medalla de plata u oro).
- Lee el código línea por línea sin ejecutarlo primero.
- Anota las técnicas que no reconoces y búscalas.
- Modifica parámetros y observa cómo cambian los resultados.
- Publica tu versión mejorada con notas propias para ganar visibilidad.
Según DataCamp, estudiar los notebooks compartidos en competencias es una de las formas más efectivas de aprender enfoques diferentes para resolver el mismo problema. Las discusiones con los ganadores sirven como mentoría gratuita. [Fuente 8]
5.3 Construir un Portafolio Profesional
Kaggle funciona como un portafolio activo que los reclutadores de empresas de tecnología conocen y valoran. Un perfil sólido en Kaggle puede abrirte puertas que un CV tradicional no puede.
Estrategia de Portafolio: Publica al menos 3 notebooks de alta calidad con: descripción detallada del problema, análisis exploratorio visual, modelo bien comentado y conclusiones claras. Usa markdown para explicar tus razonamientos. Un notebook bien documentado vale más que diez códigos sin contexto.
5.4 Tendencias Tecnológicas en Kaggle (2022-2025)
Según el estudio «Kaggle Chronicles» que analizó 15 años de datos de la plataforma, las tendencias más significativas son:
- Python domina con ~95% de todos los notebooks. R ha declinado sostenidamente desde 2016.
- Hay una fuerte transición de métodos basados en árboles hacia Deep Learning y arquitecturas Transformer.
- Los frameworks más recientes (2022-2025) reflejan un cambio hacia modelos generativos y pipelines AutoML.
- Los temas más discutidos incluyen interpretabilidad, reproducibilidad y automatización.
- Las competencias de «Code Competitions» son cada vez más comunes, requiriendo enviar código en lugar de predicciones.
[Fuente 2: Kaggle Chronicles: 15 Years of Competitions, Community and Data Science Innovation, ResearchGate 2025]
CAPÍTULO 6: RECURSOS ESENCIALES Y HERRAMIENTAS
6.1 Recursos Oficiales de Kaggle
| Recurso | URL | Para qué sirve |
|---|---|---|
| Kaggle Learn | kaggle.com/learn | Cursos gratuitos oficiales |
| Competitions | kaggle.com/competitions | Todas las competencias activas |
| Datasets | kaggle.com/datasets | 300K+ datasets gratuitos |
| Code (Notebooks) | kaggle.com/code | Notebooks públicos y propios |
| Models | kaggle.com/models | Modelos pre-entrenados |
| Discussions | kaggle.com/discussions | Foros y comunidad |
| Kaggle API | github.com/Kaggle/kaggle-api | CLI para automatización |
| Blog Oficial | medium.com/kaggle-blog | Noticias y winner writeups |
6.2 Competencias Emblemáticas para Aprender
| Competencia | Tipo de Problema | Nivel | Por qué Hacerla |
|---|---|---|---|
| Titanic: ML from Disaster | Clasificación binaria | Principiante | Clásico inicial, miles de guías |
| House Prices: Advanced Regression | Regresión | Principiante | Feature engineering real |
| Digit Recognizer | Visión por computadora | Principiante | Intro a CNN con MNIST |
| NLP with Disaster Tweets | NLP / Clasificación | Intermedio | Primer proyecto NLP real |
| Dogs vs Cats | Visión Computacional | Intermedio | Transfer learning práctico |
| ARC Prize 2025 | IA de propósito general | Experto | Premio $725.000 USD |
6.3 Herramientas y Bibliotecas Esenciales
| Categoría | Bibliotecas Clave | Uso Principal |
|---|---|---|
| Datos | pandas, numpy, polars | Manipulación y análisis de datos |
| Visualización | matplotlib, seaborn, plotly | Gráficos y EDA |
| ML Clásico | scikit-learn, xgboost, lightgbm | Modelos no neuronales |
| Deep Learning | PyTorch, TensorFlow, Keras | Redes neuronales |
| NLP | HuggingFace transformers, NLTK | Procesamiento de texto |
| Visión | OpenCV, Pillow, albumentations | Procesamiento de imágenes |
| CUDA | cuDNN, cuBLAS, nvcc4jupyter | Programación GPU directa |
| AutoML | optuna, hyperopt, FLAML | Optimización automática |
6.4 Recursos de Aprendizaje Complementarios
| Plataforma | Tipo de Contenido | Costo |
|---|---|---|
| fast.ai | Cursos top-down de DL práctico | Gratuito |
| Coursera ML Specialization (Andrew Ng) | Fundamentos ML | Auditoría gratuita |
| Deep Learning.AI | Especialización DL completa | Auditoría gratuita |
| HuggingFace Course | NLP y transformers modernos | Gratuito |
| StatQuest (YouTube) | Estadística y ML con ejemplos visuales | Gratuito |
| NVIDIA DLI | Cursos oficiales de GPU y CUDA | Algunos gratuitos |
| Papers With Code | Papers + código de los mejores modelos | Gratuito |
| Towards Data Science | Artículos prácticos de comunidad DS | Freemium |
CAPÍTULO 7: CÓMO HACER TUS NOTEBOOKS SEO-FRIENDLY Y VISIBLES
7.1 Por Qué la Visibilidad Importa en Kaggle
Un notebook excelente pero invisible no te ayudará a conseguir empleo ni a construir reputación. Kaggle utiliza su propio sistema de ranking que premia la calidad, originalidad y engagement de tus contribuciones.
7.2 Mejores Prácticas para Notebooks con Alta Visibilidad
- Título descriptivo: Usa palabras clave del problema + técnica + resultado. Ej: «XGBoost + Feature Engineering: 0.892 AUC en Titanic»
- Descripción en markdown: Explica el problema, tu enfoque y las conclusiones principales al inicio del notebook.
- Sección de EDA visual: Los notebooks con muchas visualizaciones reciben más votos.
- Código comentado: Cada celda importante debe tener una explicación en texto.
- Resultados reproducibles: Fija semillas aleatorias (
random_state,torch.manual_seed). - Compartir en Discussion: Publica tu notebook en el foro de la competencia con una breve descripción.
- Responder comentarios: La interacción aumenta tu visibilidad en el algoritmo de Kaggle.
- Tags relevantes: Agrega todos los tags pertinentes (pytorch, xgboost, nlp, etc.).
7.3 Palabras Clave SEO Relevantes para Kaggle
| Keyword Principal | Keyword Secundaria | Intención de Búsqueda |
|---|---|---|
| kaggle tutorial | kaggle para principiantes | Aprendizaje |
| kaggle competitions | kaggle machine learning | Competencias |
| kaggle gpu gratis | gpu cloud gratuita | Computación |
| kaggle notebook python | jupyter en la nube | Herramientas |
| kaggle dataset | datasets públicos ml | Datos |
| kaggle titanic | primer proyecto data science | Principiantes |
| kaggle grandmaster | como ganar en kaggle | Avanzados |
REFERENCIAS Y FUENTES CITADAS
[1] Wikipedia. «Kaggle». Consultado en mayo 2025. Estadísticas al 28 de mayo de 2024: 18.5 millones de cuentas, 2.745 Masters, 530 Grandmasters, presencia en 194 países. https://es.wikipedia.org/wiki/Kaggle
[2] Kaggle Chronicles: 15 Years of Competitions, Community and Data Science Innovation. ResearchGate, noviembre 2025. Incluye análisis de crecimiento, tecnologías dominantes y estadísticas de eventos. https://www.researchgate.net/publication/397480703
[3] Lalatendu Keshari Swain. «Kaggle vs Google Colab: Which Cloud Notebook Platform Should You Choose in 2026?» Medium, febrero 2026. GPU T4/P100, 30 horas/semana, sesiones de hasta 12 horas. https://lalatenduswain.medium.com
[4] DS@GT ARC Notes. «Kaggle Competitions Guide», 2025. Tipos de competencias, estructura de leaderboard, ARC Prize 2025 ($725.000). https://notes.dsgt-arc.org/competition/venues/kaggle/
[5] Lalatendu Keshari Swain. «Kaggle vs Google Colab 2026». Medium. Comparativa de plataformas, datasets, reproducibilidad y GPU.
[6] TeckBakers. «Kaggle 101: A Beginner’s Guide to Data Science Competitions». Hashnode, febrero 2024. Descripción de Kaggle Learn, tipos de usuarios, sistema de rangos. https://teckbakers.hashnode.dev
[7] GeeksforGeeks. «How to Use GPU in Kaggle?», julio 2025. Pasos para activar GPU, verificación con TensorFlow y PyTorch. https://www.geeksforgeeks.org/machine-learning/how-to-use-gpu-in-kaggle/
[8] DataCamp. «Kaggle Competitions: The Complete Guide», 2022-2025. Estrategias de aprendizaje, tipos de competencias, mentoría a través de notebooks. https://www.datacamp.com/blog/kaggle-competitions-the-complete-guide
[9] Murat Karakaya Akademi. «Free GPU Services for LLM Enthusiasts», marzo 2025. Comparativa de plataformas GPU gratuitas. https://www.muratkarakaya.net/2025/03/free-gpu-services-for-llm-enthusiasts.html
[10] GMI Cloud. «Where Can I Get Free GPU Cloud Trials in 2026». Guía de recursos GPU gratuitos, incluyendo Kaggle (30h P100). https://www.gmicloud.ai/blog/where-can-i-get-free-gpu-cloud-trials-in-2026-a-complete-guide
[11] Coursera Staff. «What Is Kaggle and What Is It Used For?», octubre 2025. Definición, competencias, datasets y uso profesional. https://www.coursera.org/articles/kaggle
[12] Cambridge Spark. «A Beginners Guide to Kaggle Competitions», abril 2025. Tipos de competencias, recomendaciones para principiantes. https://www.cambridgespark.com/blog/a-beginners-guide-to-kaggle-competitions
[13] Elite Data Science. «The Beginner’s Guide to Kaggle». Diferencias entre Kaggle y DS típico, cómo aprender con competencias. https://elitedatascience.com/beginner-kaggle
[14] Chiang Rai Times. «Kaggle Guide For Beginners», mayo 2026. Datasets, competencias, rankings y primeros pasos. https://www.chiangraitimes.com/ai/kaggle-guide-for-beginners/
Manual Completo de Kaggle | Versión 2025-2026 | Documento elaborado con información verificada y fuentes citadas. Para uso educativo.
You may like
AI
Qué piensa NVIDIA de RFID, blockchain, IoT y otras tecnologías
Publicado
6 días agoon
25 de junio de 2026
La postura general de NVIDIA: todo pasa por la IA
Antes de ir tecnología por tecnología, hay que entender el lente con el que NVIDIA mira el mundo. Jensen Huang tiene un único mensaje central: los datos centers ya no son instalaciones de IT sino «fábricas de IA», sistemas industriales diseñados para convertir electricidad en tokens. «Los tokens son la nueva commodity», dijo en el GTC 2026. Todo lo que no encaja en esa visión, NVIDIA lo ignora. Lo que sí encaja, lo abraza. Data Center Frontier
IoT — Aquí sí están metidos a fondo
IoT es el territorio donde NVIDIA tiene más presencia concreta. Su apuesta se llama Jetson, la familia de computadoras de borde para IA industrial.
La serie Jetson de NVIDIA es la plataforma dominante para inferencia de IA de alto rendimiento en el borde, con el Jetson AGX Orin entregando 275 TOPS, posicionado como el módulo de IA en el borde de mayor rendimiento disponible actualmente, orientado a robótica, vehículos autónomos y sistemas de visión industrial. E&ICT Academy
En el Computex 2026, NVIDIA anunció JetPack 7.2 y soporte de NemoClaw en Jetson, haciendo la plataforma «agentic-ready» para robótica, inspección y automatización industrial. NVIDIA Blog
Los casos de uso reales ya están desplegados: inspección de fábricas con visión artificial, cámaras inteligentes en retail, monitoreo en tiempo real de infraestructura de salud, agricultura inteligente y vehículos autónomos. Socios como ABB, KUKA, Caterpillar y Medtronic ya usan Jetson en sus productos.
La visión de NVIDIA para IoT es clara: no le interesa el IoT de sensores baratos que mandan datos a la nube. Le interesa el IoT con IA embebida en el borde, donde el dispositivo mismo procesa, razona y actúa. Eso requiere sus chips.
RFID — Silencio total
Este es el dato más revelador. NVIDIA no habla de RFID. En ningún anuncio, keynote, blog post ni comunicado oficial de 2025/2026 Jensen Huang o algún ejecutivo de NVIDIA menciona la tecnología de identificación por radiofrecuencia.
¿Por qué? Porque RFID es una tecnología de identificación pasiva, de bajísimo cómputo, que no necesita GPUs ni IA sofisticada para funcionar. Es el opuesto de lo que NVIDIA vende. Para NVIDIA, si un sistema de logística usa RFID para trackear pallets, la parte interesante no es el RFID — es el modelo de IA que analiza los patrones de movimiento, predice demanda o detecta anomalías. El RFID es infraestructura previa que simplemente alimenta datos a sus sistemas.
En la visión de NVIDIA, RFID es un sensor más en el ecosistema de datos que sus plataformas consumen. No es un competidor ni un aliado — es invisible.
Blockchain y crypto — Una relación peculiar
Acá la postura es interesante y un poco esquiva. En ningún momento durante el earnings call ni en el GTC 2026 Huang hizo referencia a blockchain, criptomonedas o activos digitales. Crypto Briefing
Sin embargo, hay dos conexiones indirectas que el mercado crypto aprovecha permanentemente:
1. Las GPUs de NVIDIA son la infraestructura de minería. La empresa nunca lo promueve activamente, pero sus chips son los que mueven una parte del ecosistema crypto. Huang una vez describió el bitcoin mining como «tomar energía excedente y almacenarla en una nueva forma llamada moneda» — una descripción técnica neutral, no un endoso. The Cool Down
2. La IA descentralizada lo entusiasma más. En el podcast All-In, Huang comparó a Bittensor — una red de entrenamiento de IA descentralizada en blockchain — con «una versión moderna de folding@home», el proyecto de computación distribuida para investigación científica. Dentro de las 48 horas del episodio, el sector de tokens de IA saltó un 40% en un solo día. Fue el comentario más cercano a un endoso que jamás dio sobre crypto. Phemex
Lo que sí quedó claro en el GTC 2026 es que cuando Huang habla de «tokens» no habla de blockchain: habla de unidades de output de modelos de IA. «Los tokens son ahora rentables» declaró en la conferencia de resultados — refiriéndose a que las empresas cobran más por la inferencia de IA de lo que les cuesta generarla. Crypto Briefing
La postura real de NVIDIA sobre blockchain: no le importa la tecnología en sí. Le importa si usa sus GPUs. El mining lo acepta sin entusiasmo. La IA descentralizada sobre blockchain le parece fascinante porque requiere exactamente lo que vende.
Quantum computing — Presente pero todavía lejos
En el GTC 2026, quantum computing apareció en el programa como vertical propio, con sesiones específicas sobre computación cuántica y su intersección con IA. NVIDIA está desarrollando NVQLink para conectar GPUs con QPUs (unidades de procesamiento cuántico) en sistemas híbridos. No es el centro de su negocio hoy, pero lo están monitoreando de cerca. NVIDIA Corporation
El patrón de fondo
NVIDIA tiene una regla no escrita muy consistente: si una tecnología necesita sus GPUs para escalar, la abraza. Si no, la ignora. IoT con IA en el borde: sí. Telco con AI-RAN: sí. Robots, autos autónomos, digital twins: sí. RFID, blockchain sin IA, sensores pasivos, bases de datos tradicionales: indiferencia total.
Jensen Huang lo resume en una frase que repite constantemente: «La IA está redefiniendo la computación e impulsando la mayor construcción de infraestructura de la historia de la humanidad.» Todo lo que no es parte de esa construcción, sencillamente no está en su radar.
AI
Por qué NVIDIA quiere meterse en las redes telco — y qué está haciendo
Publicado
6 días agoon
25 de junio de 2026
La razón estratégica de fondo: el edge es la próxima gran oportunidad
NVIDIA ya ganó la batalla de los centros de datos. Ahora necesita el siguiente frente. Y ese frente es el borde de la red — el lugar donde los datos se crean, antes de llegar a cualquier servidor.
Jensen Huang lo dijo sin vueltas: «La IA está redefiniendo la computación e impulsando la mayor construcción de infraestructura de la historia de la humanidad — y las telecomunicaciones son las siguientes.» NVIDIA Corporation
La lógica es la siguiente: hoy la IA corre mayormente en centros de datos en la nube. Pero la próxima ola — robots, vehículos autónomos, drones, fábricas inteligentes, ciudades conectadas — necesita que la IA corra cerca de donde pasan las cosas, con latencia mínima. Y quien controla esa infraestructura de borde son las telcos, con sus miles de antenas distribuidas por todo el mundo.
«Las telecomunicaciones poseen el espacio más valioso para la IA: el borde, donde se crean los datos. Los operadores que modernicen su infraestructura serán las fábricas distribuidas de la red de IA», dijo Michael Dell de Dell Technologies, parte del ecosistema que NVIDIA está construyendo. Nokia
La plataforma de edge computing de NVIDIA generó 6.400 millones de dólares en ingresos en un trimestre, con un crecimiento del 29% interanual, impulsado por workstations Blackwell y contribuciones crecientes de robótica y automotive. El telco es la extensión natural de ese negocio. SiliconANGLE
Qué es AI-RAN y por qué es el corazón de la estrategia
RAN significa Radio Access Network — la red de acceso por radio, es decir, las antenas base que conectan los celulares. Tradicionalmente, esas antenas corren con hardware propietario especializado y cerrado.
NVIDIA quiere reemplazar ese hardware con sus GPUs, convirtiendo las antenas en plataformas de computación general que puedan hacer dos cosas al mismo tiempo: manejar el tráfico de radio y correr cargas de trabajo de IA. Eso es AI-RAN.
La propuesta de NVIDIA busca convertir la red celular en un ordenador distribuido de alto rendimiento — una de las piedras angulares de la visión de «IA física» de Jensen Huang. Laecuaciondigital
La ventaja es enorme para las telcos: en lugar de tener infraestructura de red ociosa en horarios de baja demanda, esa capacidad de cómputo podría venderse como servicio de IA a terceros. SoftBank demostró en el MWC 2026 cómo la capacidad de cómputo sobrante en sus antenas, identificada por su orquestador AITRAS, puede usarse para correr tareas de IA de terceros — una señal de cómo los operadores podrían monetizar su infraestructura RAN más allá de la conectividad. Artificial Intelligence News
La inversión de 1.000 millones en Nokia
En octubre de 2025, NVIDIA hizo su movimiento más concreto: invirtió 1.000 millones de dólares en Nokia a 6,01 dólares por acción, anunciando una alianza estratégica para incorporar productos AI-RAN de grado comercial con tecnología NVIDIA en la cartera de RAN de Nokia, el mayor proveedor de equipos de red del mundo. AppsUser
«El próximo salto en telecomunicaciones no se limita al paso del 5G al 6G, sino a un rediseño fundamental de la red para ofrecer conectividad impulsada por IA capaz de procesar inteligencia desde el centro de datos hasta el borde», declaró Justin Hotard, CEO de Nokia. «Nuestra alianza con NVIDIA pondrá un centro de datos de IA al alcance de todos.» Infobae
Con esa inversión, NVIDIA no solo compra acciones — compra acceso directo a la cadena de suministro global de infraestructura de red y se posiciona como tecnología habilitante dentro de los equipos que las telcos ya despliegan.
La coalición del MWC 2026: el club más selecto de las telco
En el Mobile World Congress de Barcelona en marzo de 2026, NVIDIA formalizó la alianza más ambiciosa del sector. Anunció el compromiso de Booz Allen, BT Group, Cisco, Deutsche Telekom, Ericsson, MITRE, Nokia, SK Telecom, SoftBank y T-Mobile para construir la próxima generación de redes inalámbricas sobre plataformas abiertas, nativas de IA, seguras y confiables. NVIDIA Newsroom
La AI-RAN Alliance, el organismo que nuclea este ecosistema, ya cuenta con más de 130 empresas participantes. En el MWC 2026 se presentaron el triple de demos de AI-RAN que el año anterior, con 26 de las 33 demos del evento construidas sobre la plataforma NVIDIA AI Aerial. Crnasia
Los resultados de campo ya no son promesas: T-Mobile demostró procesamiento simultáneo de IA y RAN en la plataforma de NVIDIA corriendo streaming de video, IA generativa y subtítulos automáticos junto con 5G en vivo. SoftBank logró un hito técnico histórico: el primer Massive MIMO de 16 capas totalmente definido por software en hardware NVIDIA. Crnasia
El modelo para 6G y las herramientas de red autónoma
Más allá del 5G, NVIDIA está construyendo la arquitectura base para el 6G. En el MWC 2026, la compañía lanzó el Nemotron Large Telco Model (LTM), un modelo open source de 30 mil millones de parámetros desarrollado junto con AdaptKey AI, entrenado en datasets abiertos de telecomunicaciones, diseñado para razonar sobre flujos de trabajo de gestión de red y avanzar hacia redes autónomas que no solo automatizan tareas predefinidas sino que entienden la intención del operador y toman decisiones propias. Crnasia
La plataforma que NVIDIA construyó para esto se llama NVIDIA ARC — un stack tecnológico de wireless nativo de IA para 6G centrado en tecnología estadounidense, que integra CPUs Grace, GPUs Blackwell y componentes de red avanzados. 36Kr
Por qué a las telcos les conviene
El negocio tradicional de las telcos está en presión: los ingresos por conectividad pura se estancan mientras los costos de red suben. La reconversión de sus antenas en plataforma de cómputo distribuido les abre un negocio completamente nuevo. Según el propio reporte de NVIDIA sobre el estado de la IA en telecomunicaciones, el 77% de los encuestados anticipa un cronograma de despliegue significativamente más rápido para la arquitectura de redes nativas de IA que para generaciones de red anteriores. Crnasia
La apuesta de NVIDIA en telco no es filantropía tecnológica: es el intento de convertirse en la capa de GPU de toda la infraestructura inalámbrica del planeta — exactamente lo que hizo con los centros de datos entre 2020 y 2025, pero ahora repartido en millones de antenas distribuidas por el mundo.
AI
Skills y agentes de IA: el nuevo estándar que cambió cómo trabaja la industria
Publicado
6 días agoon
25 de junio de 2026
El formato Agent Skills, creado por Anthropic y liberado como estándar abierto en diciembre de 2025, se convirtió en cuestión de meses en la manera dominante de darle memoria procedimental a los agentes de inteligencia artificial. Más de 35 herramientas lo adoptaron, el ecosistema creció de cero a más de 500.000 skills disponibles en menos de seis meses, y gigantes como Google, Microsoft, OpenAI y Elastic ya lo integraron en sus plataformas. La pregunta que define el trabajo con IA en 2026 ya no es «¿puede el modelo hacer esto?», sino «¿sabe el modelo cómo hacerlo de la forma correcta para mi contexto?».
El problema que Agent Skills vino a resolver es uno que cualquier persona que trabaje con herramientas de IA reconoce de inmediato: cada vez que abrís una conversación, empezás de cero. Tenés que volver a explicar quién sos, qué hacés, cómo querés las cosas, cuál es el formato de salida esperado. La IA produce algo brillante. Y al día siguiente, amnesia total. Este ciclo de repetición constante no es solo frustrante: tiene un costo económico real. Cuando se paga por uso de API en dólares, cargar el mismo contexto una y otra vez significa tokens tirados a la basura antes de que el agente haga nada productivo. Un servidor MCP con muchas herramientas puede consumir más de 50.000 tokens solo en definiciones al inicio de cada sesión. Los skills resolvieron esto con una lógica elegante que la industria abrazó a una velocidad inusual.
La mecánica es simple al punto de parecer obvia en retrospectiva. Un skill es una carpeta con un archivo obligatorio llamado SKILL.md, que contiene metadatos mínimos (nombre y descripción) e instrucciones sobre cómo ejecutar una tarea específica. Opcionalmente puede incluir subcarpetas con scripts ejecutables, documentación de referencia, templates y otros recursos. Lo central del diseño es el concepto de «progressive disclosure»: los agentes no cargan el contenido completo de todos los skills al arrancar, sino que en la etapa de descubrimiento solo leen el nombre y la descripción de cada skill disponible, lo que consume apenas entre 30 y 50 tokens por skill inactivo. Cuando una tarea coincide con la descripción de un skill, recién entonces el agente carga el SKILL.md completo al contexto, con instrucciones de entre 500 y 5.000 tokens. Esto permite tener decenas de skills instalados sin que el costo de contexto explote. La comparación con el enfoque anterior es contundente: un desarrollador puede tener 40 skills disponibles con un impacto mínimo en el contexto cuando no son relevantes, algo que antes era estructuralmente imposible.
Anthropic publicó la especificación como estándar abierto el 18 de diciembre de 2025, replicando el mismo movimiento que había hecho con el Model Context Protocol (MCP), que también fue donado como estándar abierto a la Agentic AI Foundation bajo la Linux Foundation junto con OpenAI y Block. La reacción del ecosistema fue inmediata y masiva. En las primeras 24 horas del lanzamiento, un repositorio de skills en GitHub pasó de 85 a más de 250 entradas. Vercel Labs publicó skills oficiales de Next.js y React el mismo día. En las semanas siguientes, Google adoptó el formato en Gemini CLI y en su IDE Antigravity, construido sobre el equipo de Windsurf que adquirió por 2.400 millones de dólares. Microsoft lo integró nativamente en VS Code y GitHub Copilot. OpenAI, competidor directo de Anthropic, adoptó una arquitectura idéntica en ChatGPT y Codex CLI, replicando la estructura de archivos y metadatos de forma exacta. Hoy el formato es compatible con más de 35 herramientas, entre ellas Claude Code, Cursor, Gemini CLI, GitHub Copilot, Roo Code, Goose, Amp, Tabnine, Letta, OpenHands, Spring AI, Laravel Boost, Kiro, Factory, Qodo, Databricks Genie Code, Snowflake Cortex Code y varias más. La ruta más compatible entre agentes es .claude/skills/, que reconocen Cursor, OpenCode y GitHub Copilot además de su propio directorio nativo.
La dimensión empresarial del formato es donde el impacto se vuelve más tangible. En la mayoría de los equipos de desarrollo, el conocimiento sobre «cómo hacemos las cosas acá» vive en la memoria de las personas: convenciones no escritas, decisiones de arquitectura tomadas años atrás, criterios de code review que varían según quién los aplica. Cuando alguien se va, se lleva sus prompts. Cuando alguien nuevo entra, empieza de cero. Los skills permiten externalizar ese conocimiento en artefactos versionables y compartibles que el agente aplica automáticamente. Un desarrollador nuevo puede instalar el set de skills de la empresa y tener acceso inmediato a los estándares y convenciones vigentes sin que ningún colega tenga que explicárselos. Elastic, por ejemplo, lanzó un conjunto de skills bajo licencia Apache 2.0 que cubre cinco áreas del Elastic Stack, desde interacciones con la API de Elasticsearch hasta la gestión de dashboards en Kibana, y lo publicó bajo el argumento de que «el conocimiento de los agentes debe ser abierto». La comunidad de ciberseguridad, por su parte, ya cuenta con un repositorio de 754 skills en producción repartidas en 26 dominios, que incluyen desde Cloud Security y Threat Hunting hasta Web Application Security, todas siguiendo la especificación abierta de agentskills.io y compatibles con Claude Code, Codex CLI, Cursor y OpenCode.
El uso práctico demuestra hasta dónde puede llegar el formato cuando está bien implementado. Un skill correctamente escrito permite pedirle al agente que entre a Stripe, recopile datos de un trimestre completo y genere automáticamente los importes para las declaraciones impositivas con el detalle por casilla, o que limpie y deduplique un dataset de scraping en JSON y produzca un informe Excel listo para presentar, o que siga el proceso interno de code review del equipo sin que el desarrollador tenga que volver a explicarlo. Las únicas reglas que la comunidad identificó como críticas para que un skill funcione bien son dos: la descripción tiene que ser específica sobre qué hace y cuándo se activa (una descripción genérica como «ayuda con datos» confunde al agente), y no puede haber dos skills con descripciones superpuestas dentro del mismo proyecto. Un skill mal escrito no solo no ayuda: consume tokens sin aportar valor y puede producir resultados inconsistentes. La especificación recomienda que el SKILL.md completo no supere los 5.000 tokens para mantener el balance entre riqueza de instrucciones y eficiencia de contexto. Para instalar skills desde repositorios externos, el ecosistema cuenta con una CLI que se ejecuta con npx skills y detecta automáticamente qué agentes están instalados en el sistema para colocar los archivos en el lugar correcto sin intervención manual.
El equipo de Claude Code en Anthropic, que desarrolló el formato originalmente, tiene hoy cientos de skills en uso activo interno y lo describe como el punto de extensión más utilizado de la herramienta. La especificación vive en agentskills.io, con documentación pública que cubre el quickstart, la especificación completa del formato, buenas prácticas de escritura, evaluación de calidad de output, optimización de descripciones para activación confiable, uso de scripts dentro de skills, y una guía para desarrolladores que quieren integrar el formato en sus propios agentes. El código fuente y la comunidad se concentran en github.com/agentskills/agentskills, con un servidor de Discord activo para discusión y soporte. En menos de seis meses, lo que empezó como una feature de Claude Code se convirtió en el estándar de facto para darle expertise de dominio a los agentes de IA, independientemente de qué modelo o herramienta se use.
Fuentes:
Agent Skills (sitio oficial): https://agentskills.io/home
Neuronic — Guía definitiva Agent Skills 2026: https://neuronic.com.ar/blog/agent-skills-guia-definitiva
Web Reactiva — Agent Skills para Claude Code, Codex, Cursor y OpenCode: https://www.webreactiva.com/blog/skills-programadores-agentes-ia
Ecosistema Startup — Agent Skills el estándar abierto: https://ecosistemastartup.com/agent-skills-el-estandar-abierto-ia-para-startups-tech/
AI Mafia Substack — Skills: guía definitiva: https://aimafia.substack.com/p/skills-ia
Tacos de Datos — Agent Skills: más poder, menos tokens: https://www.tacosdedatos.com/p/agent-skills-mas-poder-menos-tokens
Elastic Labs — Agent Skills para Elastic: https://www.elastic.co/search-labs/es/blog/agent-skills-elastic
Web Reactiva — 754 skills de ciberseguridad: https://www.webreactiva.com/blog/skills-ciberseguridad
onext — Skills para agentes de IA, guía práctica: https://www.onext.es/es/insights/skills-ia-agentes-guia-practica-equipos-desarrollo/
OpenReplay — Capacidades reutilizables con skills.sh: https://blog.openreplay.com/es/capacidades-reutilizables-agentes-ia-skills-sh/
Qué piensa NVIDIA de RFID, blockchain, IoT y otras tecnologías
Por qué NVIDIA quiere meterse en las redes telco — y qué está haciendo
Skills y agentes de IA: el nuevo estándar que cambió cómo trabaja la industria
CRISPR Parte I: Avances en Terapias Génicas con CRISPR para 2025 – Transformando la Medicina
Vercel: La Plataforma Líder en Desarrollo Web y AI Cloud
¡El Futuro es Ahora! Los Avances Más Impactantes en Hologramas para 2025
Aptos apuesta USD $50 millones a la AI y los mercados institucionales on-chain
Binance Lanza la Agentic Wallet: La Era de las Carteras Diseñadas para Agentes de IA
Midnight (NIGHT) Avanza en Abril 2026: Nuevos Proyectos de I+D, Bitcoin Yield Privado y Adopción Institucional
TENDENCIAS
-
Bio1 año agoCRISPR Parte I: Avances en Terapias Génicas con CRISPR para 2025 – Transformando la Medicina
-
EmpresasTech7 meses agoVercel: La Plataforma Líder en Desarrollo Web y AI Cloud
-
Researchland1 año ago¡El Futuro es Ahora! Los Avances Más Impactantes en Hologramas para 2025
-
AI1 año ago¿Qué es Hugging Face? Guía Actualizada a Mayo 2025
-
Nano1 año agoLas últimas innovaciones en nanotecnología
-
AI7 meses agoGoogle Antigravity: La Herramienta IA Multiagentes que Revoluciona el Desarrollo de Software
-
AI1 año agoAgentes de IA y Workflows Agénticos: La Revolución de la Automatización
-
AI1 año agoAgentes de IA vs. Agentic AI : Diferencias, Ejemplos y Avances Recientes
