Open Refine: Extensión String-Transformers

Seguimos con este interesante software.

Tras el post en el que vimos cómo instalar y usar las capacidades básicas de Open Refine, hoy nos centramos en una extensión sencilla pero que nos da una idea de cómo podemos extender este software.

Extensión String-Transformers

OpenRefine puede extenderse con extensiones, que pueden desarrollarse ad-hoc siguiendo unas normas

Además tiene un catálogo (algo desactualizado de momento) de extensiones: https://openrefine.org/download.html#list-of-extensions

Una sencilla pero interesante es esta que nos permite ejecutar transformaciones sobre tipos de campos String:

Para instalar String-Transformers basta con descargar estos 2 JARS:

https://repo1.maven.org/maven2/org/kew/rmf/string-transformers/0.2.0/string-transformers-0.2.0.jar

https://repo1.maven.org/maven2/org/apache/commons/commons-lang3/3.3.2/commons-lang3-3.3.2.jar

y copiarlos (con OpenRefine parado) en la carpeta %OPENREFINE_HOME%/webapp/extensions/jython/module/MOD-INF/lib

Como podéis ver es una extensión Jython. Una vez instalada puedo usarla, elegiré una columna sobre la que quiera hacer transformaciones (en mi caso Directorate), seleccionaré Edit column>Add column based on this column

Y en el formulario marcaré Jython como lenguaje:

Y elegiré uno de los Extractors, por ejemplo si elijo CapitalLettersExtractor tendré:

En la documentación del API podéis encontrar todos los transformadores que ofrece la librería:

https://rbgkew.github.io/String-Transformers/apidocs/0.2.0/overview-tree.html

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s