Seguimos con este interesante software.
Tras el post en el que vimos cómo instalar y usar las capacidades básicas de Open Refine, hoy nos centramos en una extensión sencilla pero que nos da una idea de cómo podemos extender este software.
Extensión String-Transformers
OpenRefine puede extenderse con extensiones, que pueden desarrollarse ad-hoc siguiendo unas normas
Además tiene un catálogo (algo desactualizado de momento) de extensiones: https://openrefine.org/download.html#list-of-extensions
Una sencilla pero interesante es esta que nos permite ejecutar transformaciones sobre tipos de campos String:
Para instalar String-Transformers basta con descargar estos 2 JARS:
https://repo1.maven.org/maven2/org/kew/rmf/string-transformers/0.2.0/string-transformers-0.2.0.jar
https://repo1.maven.org/maven2/org/apache/commons/commons-lang3/3.3.2/commons-lang3-3.3.2.jar
y copiarlos (con OpenRefine parado) en la carpeta %OPENREFINE_HOME%/webapp/extensions/jython/module/MOD-INF/lib
Como podéis ver es una extensión Jython. Una vez instalada puedo usarla, elegiré una columna sobre la que quiera hacer transformaciones (en mi caso Directorate), seleccionaré Edit column>Add column based on this column
Y en el formulario marcaré Jython como lenguaje:
Y elegiré uno de los Extractors, por ejemplo si elijo CapitalLettersExtractor tendré:
En la documentación del API podéis encontrar todos los transformadores que ofrece la librería:
https://rbgkew.github.io/String-Transformers/apidocs/0.2.0/overview-tree.html