Detecta y elimina caracteres Unicode invisibles: espacio de ancho cero, guión suave y más
Los caracteres invisibles son puntos de código Unicode que no ocupan espacio visible pero pueden causar problemas significativos en el procesamiento de texto, bases de datos, APIs e interfaces de usuario. Los más comunes: Espacio de Ancho Cero (U+200B), Espacio de Ancho Cero Sin Ruptura (U+FEFF, el BOM), Unificador de Ancho Cero (U+200D), y marcas de dirección.
Esta herramienta detecta y elimina caracteres invisibles del texto, resaltando exactamente dónde ocurren y qué punto de código Unicode es cada uno. Las fuentes comunes incluyen: copiar texto de PDFs, pegar desde documentos Word, o copiar desde sitios web que usan espacios de ancho cero para el kerning de fuentes.
El BOM (U+FEFF) al inicio de un archivo UTF-8 es técnicamente un carácter invisible. En UTF-8, el BOM es innecesario y causa problemas. Puedes eliminar BOM de texto UTF-8 y archivos HTML UTF-8 de forma segura.
El Unificador de Ancho Cero (U+200D) se usa legítimamente en secuencias de emoji: 👨👩👧👦 es en realidad cuatro emoji separados unidos por U+200D. Eliminar ZWJ de secuencias de emoji las divide en sus emoji componentes.
El Espacio de Ancho Cero (U+200B) se usa en tipografía web como "oportunidad de ajuste suave" — un punto donde el navegador puede dividir una palabra larga entre líneas. Son visualmente invisibles pero rompen la coincidencia de cadenas.
Regex: `/[\u200B-\u200D\uFEFF\u00AD\u200E\u200F]/g` cubre los más comunes. En Python: `import unicodedata; unicodedata.category(c)` para identificar categorías Cf, Cc y Zs.
Mayúsculas / Minúsculas · Contador de palabras · Contador de caracteres · Generador Lorem Ipsum · Eliminar espacios extra · Ordenar líneas de texto