Práctica 13. Esto no lo puedo hacer sin IA. Secuencia didáctica
Os presentamos a continuación nuestra práctica sobre una herramienta un tanto heterodoxa: UDPipe. Esperamos que os sirva.
Presentación herramienta
La herramienta de inteligencia artificial que hemos elegido
se llama UDPipe y la utilizaremos en relación con la didáctica de la lengua, ya
que es su fin prototípico, a pesar de que podría encajar en alguna actividad
sobre literatura, pero requeriría de un conocimiento que, bajo nuestro juicio,
sobrepasaría el nivel general de secundaria. Aunque su funcionamiento se
explicará más adelante, en resumidas cuentas UDPipe sirve para analizar
morfosintácticamente cualquier texto.
Antes de dar paso al desarrollo
de los siguientes puntos, consideramos conveniente aclarar un punto de partida
gracias al cual se justifica nuestra decisión. UDPipe es una herramienta de una
complejidad muy elevada que funciona con softwares de procesamiento de lenguaje
natural, lo que implica conocimientos informáticos, lingüísticos, estadísticos…
Frente a ello, debemos apuntar dos factores, aparentemente contradictorios,
pero complementarios: a) no resulta absolutamente necesario conocer todos los
detalles en profundidad para sacar partido y beneficio de una herramienta; y b)
para el correcto funcionamiento de cualquier dinámica, sea como fuere, es el o
la docente quien ha de haber aprendido y preparado el trabajo; es decir, por mucha
dificultad que pueda ocultar la herramienta, el alumnado se quedará en un nivel
o suficientemente superficial como para obviar esa complejidad y, sin embargo, aprender
con su uso, siempre y cuando el profesorado esté bien formado para crear
propuestas en relación con la herramienta.
Enlaces significativos
1. https://lindat.mff.cuni.cz/services/udpipe/run.php
Este primer enlace, bien sencillo, da simplemente acceso a
la herramienta UDPipe, página en la que se deberá seleccionar el idioma spanish-ancora-ud-2.15-241121
y, con ello, ya bastará para lanzarle cualquier texto o cargar cualquier corpus
que quieras analizar (sea una sola frase o cinco novelas).
2. Tutorial: https://www.youtube.com/watch?v=LWZfU4CIjHM
El enlace a YouTube permite ver un tutorial básico y no
excesivamente largo. Está en inglés y no lo mandaría a ver al alumnado, pero
creemos que es un buen recurso para el docente para que entienda el
funcionamiento de manera rápida y eficaz en la línea de lo que comentábamos
antes.
3. https://ufal.mff.cuni.cz/udpipe/2
El siguiente enlace conduce a la página web más extensa que
ofrece más información, de manera ordenada y sistemática, sobre todo el
proyecto que envuelve a la creación y a la evolución de la herramienta UDPipe. Desde
ella se puede acceder a diferentes enlaces para obtener muchos más detalles
minuciosos, a publicaciones, a la página del principal creador (Milan Straka)…
4. https://aclanthology.org/L16-1680/
Este paper de 2016 constituye un trabajo breve,
sintético y directo sobre las ideas más relevantes para comprender el
funcionamiento de las diferentes utilidades de la herramienta y algo de
contexto sobre ellas. Así, con una mirada universal que incluye numerosas
lenguas, se explica, sobre todo, el proceso automático para tokenizar los
textos, analizarlos morfológicamente (información de género, número y persona
principalmente), identificar la part of speech (más o menos equivalente
a la categoría gramatical) y reconocer la relación de dependencia jerárquica
entre los constituyentes (parsing).
5. https://www.mendeley.com/catalogue/9575e9a0-e82e-359a-ac5a-717365f902f7/
El análisis que ofrece la herramienta UDPipe está basado en
las Universal Dependencies (UD) (de ahí el nombre), por lo que incluimos
este artículo que revisa y critica alguno de los principios de esta teoría
lingüística con relación a la anotación de esquemas sintácticos o treebanks.
El paper presta mayor atención a la problemática de identificar los
procesos de subordinación dentro de este marco teórico y de esta metodología.
6. file:///C:/Users/smm22/Downloads/118-347-1-PB.pdf
Si las UD se pueden definir como una iniciativa
universal de establecer generalizaciones tipológicas para el análisis
automático independientemente de la lengua del texto, la Gramática de
Dependencias es la base teórica lingüística que subyace y respalda esa
motivación. El artículo del enlace, el primero en español, repasa esta
coyuntura, para lo que recurre a las aportaciones del lingüista francés Lucien
Tesnière, cuya obra (póstuma) que más impacto ha tenido en la academia es Éléments
de syntaxe structurale (1959).
7. https://universaldependencies.org/
Dejando atrás enlaces bibliográficos pertinentes, la
familiarización con la página web de las UD resulta imprescindible para
poder interpretar los resultados del análisis automático que proporciona la
herramienta UDPipe, especialmente por la anotación y las etiquetas que emplea.
Incluye desde información referida a la historia del proyecto hasta una guía
para usuarios, otros proyectos relacionados… Basta con un vistazo rápido para
comprobar la cantidad de idiomas que ambiciona aunar.
8. https://universaldependencies.org/es/index.html
Como la página web no termina de ser transparente del todo, hemos
decidido adjuntar el enlace que da acceso directo a la sección más importante
para llevar la herramienta al aula, pues ahí aparece la información sobre el
uso de la herramienta con textos en español. Recoge, desde diferentes enlaces,
tablas que resumen, por ejemplo, las etiquetas morfológicas de las que dispone
para analizar las palabras, las propiedades que tiene en cuenta a diferencia de
otras lenguas, etc. Para ejemplificar lo dicho, desde este enlace se puede
comprobar que, para los verbos, te da información sobre el modo y el tiempo, y
prescinde del aspecto porque se supone que queda incluido en el tiempo, así
como la voz aparece en formas perifrásticas.
9. https://clic.ub.edu/corpus/es/ancora
Por último, vemos interesante incluir el proyecto AnCora
porque su resultado es un corpus en catalán y castellano con anotación
morfosintáctica y semántica realizada manualmente con el que se ha entrenado la
máquina (la herramienta) para que se entrene y aprenda a realizar el análisis
automático en español.
Tutorial herramienta
UDPipe es un programa para lematizar y realizar un análisis
morfosintáctico automáticamente cualquier input en formato de texto. Lo
único que hay que modificar manualmente es el idioma (spanish-ancora-ud-2.15-241121)
y el software ya está listo para recibir los inputs, pues el resto
conviene dejarlo en predeterminado. El texto puede ser escrito al momento (input
text) o puede ser un archivo limpio, preferiblemente en .txt (input file).
En cualquier caso, es tan sencillo como, una vez subido, procesar los datos (process
input) y esperar los resultados.
Existen tres opciones para visualizar y descargar los
resultados. La primera (output text) la olvidamos y nos interesan las
siguientes. En show table, se nos muestran los resultados en formato
tabla, con una fila para cada palabra. En cada columna hay información
relevante: form = palabra, lemma = lema (por ejemplo, de “quiere”
es “querer”, el infinitivo), UPosTag = categoría gramatical, feats =
propiedades de esa categoría gramatical, head = de qué palabra depende, DepRel
= función sintáctica. Toda la información sobre el significado de los datos se
encuentra en el enlace 9 y será labor del profesorado conocer las equivalencias
entre los nombres para poder ajustarlo a la nomenclatura gramatical española
(por ejemplo, al Glosario de términos gramaticales). Dentro de ese
enlace 9, véase, por ejemplo, el listado de funciones sintácticas para español con
explicación breve y ejemplos: https://universaldependencies.org/es/dep/index.html.
El apartado show trees es de utilidad para observar gráficamente las
relaciones de dependencia, con lo que sería más sencillo ver cuál es el verbo
principal de una oración, o los núcleos de diferentes sintagmas. He aquí un
ejemplo de la oración “Me dijo que no me quería”, donde se identifica como root
(verbo principal) “dijo”, y “quería” como clausal complement (oración
que depende de un verbo = subordinada), entre otros.
Propuesta didáctica
La propuesta didáctica aquí presentada será un tanto
flexible y abstracta en la medida en que nos interesa plantear un escenario
abierto que se debiera ajustar con arreglo a las necesidades específicas de
cada grupo. En cualquier caso, trataremos de ofrecer la información necesaria
que avale nuestro trabajo y justifique que pudiera ser aplicable a diferentes
niveles con ligeras modificaciones. Buscamos, además, fomentar la reflexión
gramatical[1]
gracias al uso de la IA, en este caso para el análisis morfosintáctico
automático.
Sin
embargo, sí que matizamos que contamos con que el alumnado tenga ya cierto
dominio sobre las categorías gramaticales y las funciones sintácticas presentes
en los predicados de la oración simple. No serían ligeras modificaciones, sino
un reenfoque completo, lo que necesitaríamos realizar en caso de que lo que nos
interesara fuera presentar por primera vez esas categorías o funciones
sintácticas. No es ese nuestro objetivo, sino reflexionar sobre lo que el
alumnado ya conoce para afianzar el contenido y vincularlo a la inteligencia
artificial y demás competencias.
Así pues, sin ánimo alguno de sobrepasarnos con las sesiones
que plantearíamos debido a los límites de este trabajo, emplearemos únicamente
dos sesiones de 55 minutos. Insistimos en que exponemos aquí un esqueleto
flexible, esto es, un esquema maleable que podría reducirse o ampliarse según
las conveniencias y los ritmos particulares. Huelga decir que damos por
descontado que cada alumno poseería, bien ordenador bien Tablet, un dispositivo
electrónico con que seguir la clase.
1.ª SESIÓN
30 min: sin necesidad de plantearlo como una
explicación teórica clásica, sí dedicaríamos los primeros 30 minutos a
presentar de manera clara la herramienta y, sobre todo, el lenguaje que ofrece
como resultados para convertirlo en terminología cercana al alumnado (por
ejemplo, obj sería CD). Por supuesto, en este fragmento de tiempo se
incluiría una explicación de carácter más práctica que ejemplifique lo que
habrán de hacer posteriormente.
10 min: el siguiente paso es lanzar, por parejas, una
oración a UDPipe. La finalidad es conseguir que la herramienta haga un análisis
“correcto”, sin fallos, pues todos los análisis automáticos tienen margen de
error. El mérito está, entonces, en la capacidad de ofrecer una oración carente
de ambigüedades morfológicas y sintácticas. El docente permitirá la invención
de oraciones y, aparte, dejará libros en la mesa y permitirá acceso a redes
sociales o foros que puedan servir como fuente (citada) de las oraciones.
Siempre es más atractivo trabajar con ejemplos reales. Véase el análisis de la
siguiente frase que escuché oralmente hace unos días:
La máquina ha reconocido
perfectamente que los núcleos “hoy”, “fútbol” y “familia” (de sus respectivos
sintagmas) son complementos del verbo “veo”. Además, “con mi familia” es obl,
es decir, un complemento no argumental, mientras que “el fútbol”, obj,
CD, sí lo es. Esta diferenciación está ganando mucho éxito en las aulas de
secundaria a partir de la NGLE (RAE y ASALE) y el GTG (RAE).
15 min: se dedicarían 15 minutos a explicar de manera
redactada el análisis realizado por UDPipe. Habrá que justificar, entonces, por
qué el CD es CD, por ejemplo. La redacción se debe, en cierta medida, a la
superación de la mera etiquetación estructural de funciones sintácticas de
manera mecánica. El análisis debería acercarse a que el verbo “ver” necesita y
exige [algo] que sea visto, pero no [alguien] con quien verlo.
2.ª SESIÓN
25 min: la primera parte de la clase buscará avanzar la
complejidad de la tarea con una correcta secuenciación progresiva. Así, ahora
el alumnado, con otra pareja diferente, deberá inventar o extraer una oración con
vistas a que falle la máquina. La capacidad de crear o de reconocer una oración
con cierta ambigüedad problemática o dificultad de cara al análisis automático
demuestra una gran capacidad de reflexión gramatical por parte de los y las
discentes. Veamos un ejemplo para una oración tan sencilla como “Hago películas
sin presupuesto” (frase de la canción “Tardes”, de Amaral).
UDPipe ha interpretado que el
sintagma “sin presupuesto” depende de la palabra número 2 (véase la segunda
columna empezando por la derecha), lo que se traduciría en que es un sintagma nominal
del núcleo “películas”. Nuestra lectura es que “sin presupuesto” complementa al
verbo en la medida en que se refiere a cómo se hacen las películas, en vez de
entender “películas sin presupuesto” como un conjunto que se hace. Esta es una
ambigüedad sintáctica por la relación jerárquica de dependencias, pero
esperaríamos aquí otros casos dudosos, por ejemplo, del análisis de “estas” en
diferentes contextos (“Esta casa” / “La casa esta”). Sería interesante aquí errores
en la lectura de oraciones compuestas, especialmente subordinadas, pero siendo
realistas solo encajaría en 2.º bachillerato o en universidad.
25 min: la segunda mitad de la clase la dedicaríamos
a compartir el resultado de cada pareja. En cuestión de dos minutos
aproximadamente (ajustables, recordamos), cada pareja debería compartir su
oración y explicar con brevedad por qué “confunde” a la herramienta utilizando
terminología gramatical adecuada. Depende del tiempo dedicado y del nivel, pero
merecería la pena contemplar la posibilidad de que exporten los datos (la
tabla) a Excel para compartirlo con el resto, y así se fomenta más aún la
competencia digital.
5 min: nos interesaría, aunque sean solo 5 minutos, preguntar
al alumnado si le ha gustado la dinámica, cómo la mejorarían y, en definitiva, qué
les ha parecido esta forma de abordar la gramática empleando una herramienta de
IA.
Conclusiones
Para concluir, el funcionamiento de UDPipe la convierte en
una herramienta con mucho potencial para el mundo de la investigación en
humanidades digitales, procesamiento del lenguaje natural y lingüística
computacional; sin embargo, si el o la docente dispone de la formación
adecuada, esta vertiente didáctica aplicada a un aula de secundaria constituye
una opción de sumo interés para trabajar de manera integrada e interdisciplinar
la gramática, campo de estudio que suele resultar tedioso tanto a alumnado como
a profesorado.
[1] La reflexión explícita
sobre el funcionamiento de la lengua parece ir de la mano con la mejora “en los
procesos de expresión, comprensión y recepción crítica” (R. D. 217/2022: 41697)
Comentarios
Publicar un comentario