Guia 2026-04-17

Integrar aduana Colombia (DIAN) a tu ERP con API SonarTrade

Como obtener datos de importaciones y exportaciones de Colombia via API en lugar de scrapear los archivos SharePoint de la DIAN manualmente.

El problema: la DIAN no publica API

La Direccion de Impuestos y Aduanas Nacionales (DIAN) de Colombia publica sus datos de comercio exterior en archivos XLSX cargados a un SharePoint publico. Los archivos son acumulativos por ano y se actualizan mensualmente, normalmente entre el 15 y el 20 del mes siguiente. No hay endpoint REST, no hay webhook, no hay autenticacion. Si queres integrar este dato a tu ERP tenes que scrapear el SharePoint, bajar XLSX pesados (100-200 MB cada uno), parsearlos y normalizar.

Estructura de los archivos DIAN

Cada XLSX tiene un prefijo de mes (01_ para enero, 02_ para febrero) y contiene todas las operaciones acumuladas desde el 1 de enero del ano hasta el cierre de ese mes. Las columnas incluyen NIT del importador, razon social, subpartida NANDINA, pais de origen, aduana, cantidad, peso, FOB USD, flete, seguro y CIF USD. El formato cambio al menos 3 veces entre 2020 y 2025, lo que complica parsers naive.

Scraping manual: que implica

Si optas por el camino manual, necesitas: (1) un crawler que detecte archivos nuevos en el SharePoint, (2) un parser XLSX que maneje los cambios de formato, (3) un sistema de deduplicacion porque los archivos son acumulativos (el archivo de febrero incluye enero), (4) normalizacion de NIT (algunos vienen con digito de verificacion, otros no), (5) un pipeline que maneje fallos (los archivos a veces se suben corruptos). Mantener este stack cuesta entre 20 y 40 horas mensuales de ingenieria.

La alternativa: API SonarTrade

SonarTrade ya corre ese pipeline en produccion. El ingest filtra por prefijo mensual (01_*, 02_*, etc.) para evitar reprocesar datos acumulativos, normaliza NITs al estandar de 9 digitos sin digito de verificacion, unifica los cambios de schema historicos y escribe en la tabla canonica public.movements. Vos consumis el dato ya limpio via API REST con autenticacion por API Key.

Endpoint de empresas: /api-proxy/companies/{nit}

El endpoint principal para integrar con un ERP es el de empresas por NIT. Devuelve operaciones historicas, resumen por HS, top paises de origen y tendencia mensual. Ejemplo basico con curl:

curl -H "X-Api-Key: tu_api_key" \
  https://sonartrade.app/api-proxy/companies/900123456?country=CO&limit=100

La respuesta es JSON con operaciones, cada una con fecha, HS, producto, pais origen, cantidad, FOB y CIF. El rate limit en plan Business es 120 requests/minuto.

Endpoint de busqueda por HS

Para alimentar modulos de market intelligence conviene usar busqueda por subpartida:

curl -H "X-Api-Key: tu_api_key" \
  "https://sonartrade.app/api-proxy/search?country=CO&hs=8471.30&tipo=IMPO&from=2025-01-01"

Este query devuelve todas las importaciones colombianas de portatiles (HS 8471.30) desde enero 2025. Se puede paginar con offset y limit, y filtrar por pais de origen, aduana o rango de CIF.

Webhooks y alertas

Para pipelines ETL que se disparan cuando hay data nueva, SonarTrade ofrece webhooks en plan Business+ que notifican cuando se ingesta un nuevo mes de Colombia. El payload incluye el rango de fechas procesado y el conteo de filas. Con eso podes disparar tu job de sincronizacion al ERP sin tener que hacer polling.

Frecuencia de actualizacion

El worker de SonarTrade corre un IngestScheduler que detecta archivos nuevos en DIAN cada 24 horas y los procesa en caliente. Esto significa que la latencia tipica entre publicacion DIAN y disponibilidad via API es de menos de 48 horas. Si necesitas SLA ajustado, el plan Enterprise permite priorizacion de ingests y canales dedicados.

Casos de uso tipicos

Agencias de aduana colombianas usan la API para enriquecer fichas de clientes con historial de operaciones. ERPs sectoriales (textil, agroindustria) integran el endpoint de HS para mostrar benchmarks de precio dentro de su propia app. Consultoras de trade arman dashboards mensuales alimentados por el endpoint de busqueda. Empresas extranjeras con presencia regional consolidan datos de 6 paises LATAM en un solo data warehouse gracias a que public.movements tiene schema unificado.

Planes y precios

El acceso a API empieza en plan Starter (USD 29/mes, 1.000 requests/dia), pero el endpoint de companies y los webhooks estan disponibles desde plan Business (USD 179/mes). Enterprise (desde USD 499/mes) incluye SLA, soporte dedicado y rate limits custom. Revisa /pricing para comparativa completa y /embed/docs para la referencia tecnica de los endpoints.

Ahorro concreto vs scraping propio

Un equipo tipico que decide scrapear DIAN invierte 80-120 horas en setup inicial (scraper, parser, normalizacion, deploy) y 20-40 horas/mes en mantenimiento. A USD 50/hora de ingenieria eso son USD 5.000-7.000 de setup y USD 1.000-2.000 mensuales. El plan Business de SonarTrade cuesta USD 179/mes con data de los 6 paises LATAM, no solo Colombia. El payback es inmediato.

Revisa los planes en /pricing y la documentacion de endpoints en /embed/docs. Si necesitas un caso de integracion custom, escribinos.

¿Quieres analizar estos datos en detalle?

Explorar datos en SonarTrade