Microsoft lanza MarkItDown, el conversor “todo en uno” a Markdown para tuberías de IA
Microsoft acaba de poner el foco en una pieza discreta pero clave en cualquier proyecto con modelos de lenguaje: la ingesta y normalización de documentos. Su nueva utilidad en Python, MarkItDown, convierte decenas de formatos —desde PDF, Word, Excel o PowerPoint hasta HTML, CSV/JSON/XML, imágenes y audio con OCR y transcripción— en Markdown limpio, preservando títulos, listas, tablas, enlaces y