Práctica 13. Esto no lo puedo hacer sin IA. Secuencia didáctica

 


Os presentamos a continuación nuestra práctica sobre una herramienta un tanto heterodoxa: UDPipe. Esperamos que os sirva.

Presentación herramienta

La herramienta de inteligencia artificial que hemos elegido se llama UDPipe y la utilizaremos en relación con la didáctica de la lengua, ya que es su fin prototípico, a pesar de que podría encajar en alguna actividad sobre literatura, pero requeriría de un conocimiento que, bajo nuestro juicio, sobrepasaría el nivel general de secundaria. Aunque su funcionamiento se explicará más adelante, en resumidas cuentas UDPipe sirve para analizar morfosintácticamente cualquier texto.

Antes de dar paso al desarrollo de los siguientes puntos, consideramos conveniente aclarar un punto de partida gracias al cual se justifica nuestra decisión. UDPipe es una herramienta de una complejidad muy elevada que funciona con softwares de procesamiento de lenguaje natural, lo que implica conocimientos informáticos, lingüísticos, estadísticos… Frente a ello, debemos apuntar dos factores, aparentemente contradictorios, pero complementarios: a) no resulta absolutamente necesario conocer todos los detalles en profundidad para sacar partido y beneficio de una herramienta; y b) para el correcto funcionamiento de cualquier dinámica, sea como fuere, es el o la docente quien ha de haber aprendido y preparado el trabajo; es decir, por mucha dificultad que pueda ocultar la herramienta, el alumnado se quedará en un nivel o suficientemente superficial como para obviar esa complejidad y, sin embargo, aprender con su uso, siempre y cuando el profesorado esté bien formado para crear propuestas en relación con la herramienta.

 

Enlaces significativos

1. https://lindat.mff.cuni.cz/services/udpipe/run.php

Este primer enlace, bien sencillo, da simplemente acceso a la herramienta UDPipe, página en la que se deberá seleccionar el idioma spanish-ancora-ud-2.15-241121 y, con ello, ya bastará para lanzarle cualquier texto o cargar cualquier corpus que quieras analizar (sea una sola frase o cinco novelas).

 

2. Tutorial: https://www.youtube.com/watch?v=LWZfU4CIjHM

El enlace a YouTube permite ver un tutorial básico y no excesivamente largo. Está en inglés y no lo mandaría a ver al alumnado, pero creemos que es un buen recurso para el docente para que entienda el funcionamiento de manera rápida y eficaz en la línea de lo que comentábamos antes.

 

3. https://ufal.mff.cuni.cz/udpipe/2

El siguiente enlace conduce a la página web más extensa que ofrece más información, de manera ordenada y sistemática, sobre todo el proyecto que envuelve a la creación y a la evolución de la herramienta UDPipe. Desde ella se puede acceder a diferentes enlaces para obtener muchos más detalles minuciosos, a publicaciones, a la página del principal creador (Milan Straka)…

 

4. https://aclanthology.org/L16-1680/

Este paper de 2016 constituye un trabajo breve, sintético y directo sobre las ideas más relevantes para comprender el funcionamiento de las diferentes utilidades de la herramienta y algo de contexto sobre ellas. Así, con una mirada universal que incluye numerosas lenguas, se explica, sobre todo, el proceso automático para tokenizar los textos, analizarlos morfológicamente (información de género, número y persona principalmente), identificar la part of speech (más o menos equivalente a la categoría gramatical) y reconocer la relación de dependencia jerárquica entre los constituyentes (parsing).

 

5. https://www.mendeley.com/catalogue/9575e9a0-e82e-359a-ac5a-717365f902f7/

El análisis que ofrece la herramienta UDPipe está basado en las Universal Dependencies (UD) (de ahí el nombre), por lo que incluimos este artículo que revisa y critica alguno de los principios de esta teoría lingüística con relación a la anotación de esquemas sintácticos o treebanks. El paper presta mayor atención a la problemática de identificar los procesos de subordinación dentro de este marco teórico y de esta metodología.

 

6. file:///C:/Users/smm22/Downloads/118-347-1-PB.pdf

Si las UD se pueden definir como una iniciativa universal de establecer generalizaciones tipológicas para el análisis automático independientemente de la lengua del texto, la Gramática de Dependencias es la base teórica lingüística que subyace y respalda esa motivación. El artículo del enlace, el primero en español, repasa esta coyuntura, para lo que recurre a las aportaciones del lingüista francés Lucien Tesnière, cuya obra (póstuma) que más impacto ha tenido en la academia es Éléments de syntaxe structurale (1959).

 

7. https://universaldependencies.org/

Dejando atrás enlaces bibliográficos pertinentes, la familiarización con la página web de las UD resulta imprescindible para poder interpretar los resultados del análisis automático que proporciona la herramienta UDPipe, especialmente por la anotación y las etiquetas que emplea. Incluye desde información referida a la historia del proyecto hasta una guía para usuarios, otros proyectos relacionados… Basta con un vistazo rápido para comprobar la cantidad de idiomas que ambiciona aunar.

 

8. https://universaldependencies.org/es/index.html

Como la página web no termina de ser transparente del todo, hemos decidido adjuntar el enlace que da acceso directo a la sección más importante para llevar la herramienta al aula, pues ahí aparece la información sobre el uso de la herramienta con textos en español. Recoge, desde diferentes enlaces, tablas que resumen, por ejemplo, las etiquetas morfológicas de las que dispone para analizar las palabras, las propiedades que tiene en cuenta a diferencia de otras lenguas, etc. Para ejemplificar lo dicho, desde este enlace se puede comprobar que, para los verbos, te da información sobre el modo y el tiempo, y prescinde del aspecto porque se supone que queda incluido en el tiempo, así como la voz aparece en formas perifrásticas.

 

9. https://clic.ub.edu/corpus/es/ancora

Por último, vemos interesante incluir el proyecto AnCora porque su resultado es un corpus en catalán y castellano con anotación morfosintáctica y semántica realizada manualmente con el que se ha entrenado la máquina (la herramienta) para que se entrene y aprenda a realizar el análisis automático en español.

 

Tutorial herramienta

UDPipe es un programa para lematizar y realizar un análisis morfosintáctico automáticamente cualquier input en formato de texto. Lo único que hay que modificar manualmente es el idioma (spanish-ancora-ud-2.15-241121) y el software ya está listo para recibir los inputs, pues el resto conviene dejarlo en predeterminado. El texto puede ser escrito al momento (input text) o puede ser un archivo limpio, preferiblemente en .txt (input file). En cualquier caso, es tan sencillo como, una vez subido, procesar los datos (process input) y esperar los resultados.

Interfaz de usuario gráfica, Texto, Aplicación

El contenido generado por IA puede ser incorrecto.

Existen tres opciones para visualizar y descargar los resultados. La primera (output text) la olvidamos y nos interesan las siguientes. En show table, se nos muestran los resultados en formato tabla, con una fila para cada palabra. En cada columna hay información relevante: form = palabra, lemma = lema (por ejemplo, de “quiere” es “querer”, el infinitivo), UPosTag = categoría gramatical, feats = propiedades de esa categoría gramatical, head = de qué palabra depende, DepRel = función sintáctica. Toda la información sobre el significado de los datos se encuentra en el enlace 9 y será labor del profesorado conocer las equivalencias entre los nombres para poder ajustarlo a la nomenclatura gramatical española (por ejemplo, al Glosario de términos gramaticales). Dentro de ese enlace 9, véase, por ejemplo, el listado de funciones sintácticas para español con explicación breve y ejemplos: https://universaldependencies.org/es/dep/index.html. El apartado show trees es de utilidad para observar gráficamente las relaciones de dependencia, con lo que sería más sencillo ver cuál es el verbo principal de una oración, o los núcleos de diferentes sintagmas. He aquí un ejemplo de la oración “Me dijo que no me quería”, donde se identifica como root (verbo principal) “dijo”, y “quería” como clausal complement (oración que depende de un verbo = subordinada), entre otros.

Interfaz de usuario gráfica, Texto, Aplicación, Correo electrónico

El contenido generado por IA puede ser incorrecto.

Interfaz de usuario gráfica

El contenido generado por IA puede ser incorrecto.

 

 

Propuesta didáctica

La propuesta didáctica aquí presentada será un tanto flexible y abstracta en la medida en que nos interesa plantear un escenario abierto que se debiera ajustar con arreglo a las necesidades específicas de cada grupo. En cualquier caso, trataremos de ofrecer la información necesaria que avale nuestro trabajo y justifique que pudiera ser aplicable a diferentes niveles con ligeras modificaciones. Buscamos, además, fomentar la reflexión gramatical[1] gracias al uso de la IA, en este caso para el análisis morfosintáctico automático.

            Sin embargo, sí que matizamos que contamos con que el alumnado tenga ya cierto dominio sobre las categorías gramaticales y las funciones sintácticas presentes en los predicados de la oración simple. No serían ligeras modificaciones, sino un reenfoque completo, lo que necesitaríamos realizar en caso de que lo que nos interesara fuera presentar por primera vez esas categorías o funciones sintácticas. No es ese nuestro objetivo, sino reflexionar sobre lo que el alumnado ya conoce para afianzar el contenido y vincularlo a la inteligencia artificial y demás competencias.

Así pues, sin ánimo alguno de sobrepasarnos con las sesiones que plantearíamos debido a los límites de este trabajo, emplearemos únicamente dos sesiones de 55 minutos. Insistimos en que exponemos aquí un esqueleto flexible, esto es, un esquema maleable que podría reducirse o ampliarse según las conveniencias y los ritmos particulares. Huelga decir que damos por descontado que cada alumno poseería, bien ordenador bien Tablet, un dispositivo electrónico con que seguir la clase.

 

1.ª SESIÓN

30 min: sin necesidad de plantearlo como una explicación teórica clásica, sí dedicaríamos los primeros 30 minutos a presentar de manera clara la herramienta y, sobre todo, el lenguaje que ofrece como resultados para convertirlo en terminología cercana al alumnado (por ejemplo, obj sería CD). Por supuesto, en este fragmento de tiempo se incluiría una explicación de carácter más práctica que ejemplifique lo que habrán de hacer posteriormente.

10 min: el siguiente paso es lanzar, por parejas, una oración a UDPipe. La finalidad es conseguir que la herramienta haga un análisis “correcto”, sin fallos, pues todos los análisis automáticos tienen margen de error. El mérito está, entonces, en la capacidad de ofrecer una oración carente de ambigüedades morfológicas y sintácticas. El docente permitirá la invención de oraciones y, aparte, dejará libros en la mesa y permitirá acceso a redes sociales o foros que puedan servir como fuente (citada) de las oraciones. Siempre es más atractivo trabajar con ejemplos reales. Véase el análisis de la siguiente frase que escuché oralmente hace unos días:

Interfaz de usuario gráfica, Texto, Aplicación, Correo electrónico

El contenido generado por IA puede ser incorrecto.

La máquina ha reconocido perfectamente que los núcleos “hoy”, “fútbol” y “familia” (de sus respectivos sintagmas) son complementos del verbo “veo”. Además, “con mi familia” es obl, es decir, un complemento no argumental, mientras que “el fútbol”, obj, CD, sí lo es. Esta diferenciación está ganando mucho éxito en las aulas de secundaria a partir de la NGLE (RAE y ASALE) y el GTG (RAE).

15 min: se dedicarían 15 minutos a explicar de manera redactada el análisis realizado por UDPipe. Habrá que justificar, entonces, por qué el CD es CD, por ejemplo. La redacción se debe, en cierta medida, a la superación de la mera etiquetación estructural de funciones sintácticas de manera mecánica. El análisis debería acercarse a que el verbo “ver” necesita y exige [algo] que sea visto, pero no [alguien] con quien verlo.

 

2.ª SESIÓN

25 min: la primera parte de la clase buscará avanzar la complejidad de la tarea con una correcta secuenciación progresiva. Así, ahora el alumnado, con otra pareja diferente, deberá inventar o extraer una oración con vistas a que falle la máquina. La capacidad de crear o de reconocer una oración con cierta ambigüedad problemática o dificultad de cara al análisis automático demuestra una gran capacidad de reflexión gramatical por parte de los y las discentes. Veamos un ejemplo para una oración tan sencilla como “Hago películas sin presupuesto” (frase de la canción “Tardes”, de Amaral).

Interfaz de usuario gráfica, Texto, Aplicación, Correo electrónico

El contenido generado por IA puede ser incorrecto.

UDPipe ha interpretado que el sintagma “sin presupuesto” depende de la palabra número 2 (véase la segunda columna empezando por la derecha), lo que se traduciría en que es un sintagma nominal del núcleo “películas”. Nuestra lectura es que “sin presupuesto” complementa al verbo en la medida en que se refiere a cómo se hacen las películas, en vez de entender “películas sin presupuesto” como un conjunto que se hace. Esta es una ambigüedad sintáctica por la relación jerárquica de dependencias, pero esperaríamos aquí otros casos dudosos, por ejemplo, del análisis de “estas” en diferentes contextos (“Esta casa” / “La casa esta”). Sería interesante aquí errores en la lectura de oraciones compuestas, especialmente subordinadas, pero siendo realistas solo encajaría en 2.º bachillerato o en universidad.

25 min: la segunda mitad de la clase la dedicaríamos a compartir el resultado de cada pareja. En cuestión de dos minutos aproximadamente (ajustables, recordamos), cada pareja debería compartir su oración y explicar con brevedad por qué “confunde” a la herramienta utilizando terminología gramatical adecuada. Depende del tiempo dedicado y del nivel, pero merecería la pena contemplar la posibilidad de que exporten los datos (la tabla) a Excel para compartirlo con el resto, y así se fomenta más aún la competencia digital.

5 min: nos interesaría, aunque sean solo 5 minutos, preguntar al alumnado si le ha gustado la dinámica, cómo la mejorarían y, en definitiva, qué les ha parecido esta forma de abordar la gramática empleando una herramienta de IA.

 

Conclusiones

Para concluir, el funcionamiento de UDPipe la convierte en una herramienta con mucho potencial para el mundo de la investigación en humanidades digitales, procesamiento del lenguaje natural y lingüística computacional; sin embargo, si el o la docente dispone de la formación adecuada, esta vertiente didáctica aplicada a un aula de secundaria constituye una opción de sumo interés para trabajar de manera integrada e interdisciplinar la gramática, campo de estudio que suele resultar tedioso tanto a alumnado como a profesorado.



[1] La reflexión explícita sobre el funcionamiento de la lengua parece ir de la mano con la mejora “en los procesos de expresión, comprensión y recepción crítica” (R. D. 217/2022: 41697)


Comentarios

Entradas populares de este blog

Práctica 1. 10 herramientas digitales #INVTICUA25.

Práctica 1. 10 herramientas digitales para la docencia y la investigación. #INVTICUA25

Práctica 2. La canción de los lunes: un silencio a voces