Nos levantamos por la
mañana y preguntamos a nuestra Alexa: ¿Qué tal día hará hoy? Alexa nos da el
parte meteorológico con su voz impersonal dulzona y metálica. Seguidamente
pulsamos en nuestro dispositivo de telefonía móvil y miramos que noticias
seleccionaron para nosotros.
Cuando era estudiante de
ingeniería me explicaron lo que era una red neuronal y apenas entendí nada de
lo que el profesor puso en la pizarra, esto hace ya casi cincuenta años. Después,
por mi cuenta, miré y busqué artículos que me hablaron de la Inteligencia
Artificial (IA) y aprendí términos en inglés que ahora, de una manera milagrosa,
empiezo a ver escritos en internet y en las redes sociales. Machine
Learning, Backpropagation, fuzzy logic, entre otros muchos términos. Seguidamente
mi horizonte tecnológico se fue abriendo y a lo largo de esos cincuenta años he
visto aparecer cantidad de avances que nunca han dejado de fascinarme. Que
suerte la mía, con poder estar vivo ante esta revolución. Pero centremos
nuestra atención en un interesante tema: La lingüística computacional.
Redes neuronales integradas en la IA Generativa (ChatGPT)
Las redes neuronales
ahora son protagonistas, en primera línea, del desarrollo de los llamados Chat
Bots (máquinas con las que conversar). Detrás de los algoritmos de
aprendizaje (Maching Learnng) hay un complejo entramado de redes
neuronales que aprenden de patrones que reciben y son capaces de gestionar de
modo conversacional, mediante lenguaje natural, un dialogo seudo inteligente
con los usuarios. Dije seudo porque lo es. No se asusten, porque de momento,
antes de seguir, dejaré claro que las máquinas no son capaces de pensar y
razonar de forma creativa.
Para empezar, se me ocurre
una pregunta que seguro que a ustedes también se les está ocurriendo. Veamos.
¿Si se sientan delante de Alexa, o cualquier chat bot al que quieren
preguntarle algo y lo hacen como lo harían si se tratara de preguntarle a un
humano la respuesta sería igualmente lógica y coherente? Quizá no, seguramente
hay que interrogar a la máquina con unos patrones lingüísticos apropiados. ¿Cómo
debemos dirigirnos a la máquina para que nos entienda bien y, por tanto, su
respuesta sea aceptada como “razonable”?
Cuando estudiábamos se
nos hablaba del llamado “lenguaje de máquina” y todos entendíamos que
era el lenguaje con el que se programaban los algoritmos digitales lógicos para
que los microprocesadores atendieran nuestras demandas. Pero ahora la cosa ha
cambiado y los lenguajes han ido evolucionando hacia los llamados “lenguajes
naturales” que, quizá por el termino natural, se prestan a confusión. Desde
el punto de vista de las ciencias de la computación los lenguajes naturales son
aquellos con los que las nos dirigimos a las máquinas y estas se dirigen
a nosotros. Pero no deben confundirse en su exactitud funcional con los que
usamos para comunicarnos entre los humanos. Ciertamente son parecidos, claro
que sí, pero existen matices que debemos ir entendiendo para que nuestras “prompts”
(preguntas) a la máquina sean bien entendidas.
Todos sabemos más a o
menos lo que es la lingüística: La RAE define el término “Lingüística computacional”
como la aplicación de los métodos de la inteligencia artificial en el
tratamiento de cuestiones lingüísticas.
Nunca fui muy bueno en
los idiomas y bien que lo he pagado, porque me he perdido la posibilidad de
interaccionar de un modo más eficaz con comunidades científicas y tecnológicas
con las que hubiese deseado compartir conocimiento. El inglés, esa lengua que nació
desligada de las lenguas latinas en “dudosos parnasos lingüísticos” (sus
orígenes no fueron de una lengua culta), se ha adueñado del mundo de la comunicación
y hoy, para bien o para mal, hay que leer y comunicarse en esta lengua, que a mí
particularmente me parece bastante más pobre que la nuestra, el español. Sin
embargo, ahora empiezo a respirar mejor, porque empieza a no ser tan necesario
el uso del inglés para interaccionar con las máquinas. Los grandes fabricantes
de dispositivos de computación son conscientes de que no es precisamente el
inglés la lengua más hablada en el planeta, mucho más lo es, por ejemplo, el
español; esto me alegra, porque siempre he soñado con que nuestra lengua dejara
de ser la lengua para hablar con Dios o para escribir novelas de caballería.
Las máquinas, mis queridos lectores, no hablarán en inglés, lo harán en lenguajes
intermedios de computación a base de patrones lingüísticos bien estructurados e
incorporados en una “arquitectura de pensamiento” totalmente nueva. Ha
llegado la era de la “lingüística computacional” y debemos prepararnos
para que en los centros educativos se enseñe una nueva asignatura que se
llamará, por ejemplo, “LECOM”, (lenguaje de computadores).
No le den a la cabeza, de
un lado a otro, los menos aficionados a la tecnología. No, de ninguna manera, más
bien entiendan que en el futuro se considerará “analfabeto computacional”
a aquel que no sepa conversar con los sistemas de IA. No será necesario
comprarse un pequeño diccionario para viajar. Entre un español y un chino habrá
una IA que se encargará de que se entiendan perfectamente.
La Lingüística
Computacional, también conocida como Procesamiento del Lenguaje Natural
(NLP, por sus siglas en inglés), es una disciplina de la inteligencia
artificial que se centra en la interacción entre las computadoras y el lenguaje
humano. Su objetivo principal es permitir que las computadoras comprendan,
interpreten y generen texto y habla de manera similar a como lo hacen los
humanos.
Vamos a comentar algunas
aplicaciones prácticas de la Lingüística Computacional con el fin de clarificar
el concepto.
En primer lugar, nos
preguntaremos ¿qué entendemos por procesamiento de lenguaje natural (NLP)? Es
una parte importante de la lingüística computacional que se enfoca en el
procesamiento de texto y habla en lenguaje humano. Esto incluye tareas como la
traducción automática, el análisis de sentimientos, la generación de lenguaje
natural, la búsqueda de información y la extracción de información, entre
otras. El NLP utiliza una gran variedad de técnicas y herramientas, incluyendo
la tokenización (dividir el texto en palabras o unidades más pequeñas),
el análisis gramatical (identificar la estructura sintáctica de una
oración), la desambiguación semántica (resolver el significado de
palabras con varios sentidos) y el aprendizaje automático para entrenar
modelos que pueden comprender y generar texto de manera más precisa.
Las Aplicaciones de la
Lingüística Computacional más conocidas son las siguientes:
Motores de búsqueda en
línea. Los motores de búsqueda utilizan algoritmos de procesamiento de lenguaje
natural para mejorar los resultados de búsqueda y comprender las consultas de
los usuarios.
Chatbots y asistentes virtuales
Imagen creada por el autor con IA. Herramienta Microsoft Designer
Los chatbots y asistentes
virtuales, como Siri de Apple o Alexa de Amazon, utilizan NLP para comprender y
responder preguntas de los usuarios realizando la traducción automática de un
idioma a otro, en los casos requeridos.
El análisis de sentimientos
es otra aplicación muy importante del NLP. Las empresas utilizan el NLP para
analizar las opiniones y los comentarios de los clientes en las redes sociales
y en las reseñas de productos para comprender el sentimiento de los usuarios
hacia sus productos o servicios. Una de las fuentes mas importantes para
entrenar una IA es recoger y analizar los mensajes que se intercambian en los
chats y redes sociales. Para extraer la información de los repositorios en
donde se encuentra se utilizan sistemas entrenados que usan NPL.
La generación de lenguaje
natural puede utilizarse para crear contenido de manera automática, como
resúmenes de noticias, informes financieros o incluso obras literarias.
Una de las más
interesantes aplicaciones de la NPL es el reconocimiento de voz: A través del
procesamiento de señales de audio, el NLP puede convertir el habla en texto, lo
que permite a las máquinas comprender y responder a comandos de voz.
A pesar de los avances,
la lingüística computacional aún tiene muchas fronteras que conquistar, por ejemplo,
la polisemia (dirimir el significado de una palabra o expresión lingüística
que tenga varias acepciones), la interpretación del contexto, la falta
de datos etiquetados adecuados y la equidad y sesgos en los
modelos de NLP.
En resumen, la Lingüística
Computacional es una disciplina interdisciplinar que combina la lingüística
y la informática para desarrollar aplicaciones que permitan a las computadoras
comprender y generar lenguaje humano. Tiene una amplia gama de aplicaciones en
campos como la traducción, la atención al cliente, la investigación de mercado
y mucho más.
José Manuel Ruiz Gutiérrez es Ingeniero de Telecomunicaciones y Profesor Catedrático de Tecnología de EE.MM.
{{comentario.contenido}}
"{{comentariohijo.contenido}}"
Miércoles, 4 de Diciembre del 2024
Miércoles, 4 de Diciembre del 2024