Normalizar cadenas con python, elimina símbolos y caracteres extraños

Hola Pythoneros, es sábado y saben me siento motivado para compartir una librería que me ayudado en estas últimas semanas.

Que hace y para que sirve esta librería?

Tal como dice el título de la entrada, nos ayudará a limpiar un texto ya sea ingresado por el usuario o por que de alguna manera cuenta con caracteres extraños tales como tildes, eñes, etc.

Estoy hablando de https://github.com/un33k/python-slugify

Pero como funciona? – Verán en realidad es muy simple, desde que ingresas al repositorio este te muestra ejemplos de como aplicar la librería, pero si quieres algo rápido dejo una breve guía de instalación y dos usos.

Instalación de la libreria:
$ #en la terminal en un entorno virtualenv o en tu entorno general, tienes que tener instalado el gestor de paquetes: pip
$ pip install python-slugify
Ejemplo 1:

Uso en la shell de python, tenemos un texto con tildes:

$ python
> from slugify import slugify 
> txt = 'jaja---lol-méméméoo--a'
> r = slugify(txt)
> print r # imprime: jaja-lol-mememeoo-a
Ejemplo 2:

Uso en la shell de python, tenemos un texto con %, y queremos que se conserve:

$ python
> from slugify import slugify 
> txt = '100% algodón'
> r = slugify(txt, separator=" ", regex_pattern = r'[^-a-z0-9%]+')
> print r # imprime: 100% algodon

Bueno como pueden ver tiene algunos parámetros de ayuda, como el “separator” que nos dice cual será el carácter para separar los textos, y también tiene el parámetro “regex_pattern”, el cual nos ayudará como un filtro de que caracteres queremos respetar y cuales queremos eliminar.

Bueno, espero haber ayudado un poco con esto, ya saben si desean conocer más sobre la librería pueden visitar la página en github, o si tienen dudas solo dejen un comentario. Gracias.

Leave a Reply