{"id":311,"date":"2024-02-05T02:59:11","date_gmt":"2024-02-05T02:59:11","guid":{"rendered":"https:\/\/vr-news.net\/?p=311"},"modified":"2024-02-05T02:59:11","modified_gmt":"2024-02-05T02:59:11","slug":"latxa-el-modelo-de-lenguaje-que-abre-puertas-digitales","status":"publish","type":"post","link":"https:\/\/vr-news.net\/?p=311","title":{"rendered":"Latxa, el modelo de lenguaje que abre puertas digitales"},"content":{"rendered":"<p><\/p>\n<div>\n<p>En el \u00e1mbito de la tecnolog\u00eda ling\u00fc\u00edstica, la Universidad del Pa\u00eds Vasco (UPV-EHU) ha alcanzado un hito significativo con el desarrollo de <strong>Latxa<\/strong>, un avanzado modelo de lenguaje dedicado al euskera. Este logro demuestra el compromiso con la preservaci\u00f3n y promoci\u00f3n del idioma, present\u00e1ndose tambi\u00e9n como una soluci\u00f3n clave para superar desaf\u00edos digitales espec\u00edficos de la lengua vasca.<\/p>\n<p>Latxa se cimienta en los innovadores <strong>modelos LLaMA de Meta<\/strong>, abarcando una gama que va desde los 7 hasta los 70 mil millones de par\u00e1metros. Esta amplitud de par\u00e1metros se\u00f1ala la complejidad y la potencialidad del modelo para entender y generar lenguaje humano de manera eficaz, abriendo as\u00ed un abanico de posibilidades para el desarrollo de herramientas digitales en euskera, como los chatbots, que son aplicaciones capaces de simular conversaciones reales.<\/p>\n<p>Uno de los mayores desaf\u00edos que enfrenta el euskera en el \u00e1mbito digital es la <strong>brecha tecnol\u00f3gica<\/strong> existente entre idiomas con amplios recursos y aquellos menos difundidos. Esta disparidad limita significativamente el desarrollo y la implementaci\u00f3n de tecnolog\u00edas avanzadas de procesamiento del lenguaje natural para idiomas como el euskera. El proyecto Latxa nace precisamente para enfrentar esta problem\u00e1tica, buscando no solo equiparar, sino tambi\u00e9n potenciar la presencia del euskera en la tecnolog\u00eda moderna.<\/p>\n<p>El corpus utilizado para entrenar Latxa, denominado EusCrawl, comprende 1,72 millones de documentos y 288 millones de palabras extra\u00eddas de 33 sitios web en euskera, asegurando as\u00ed una base de datos de alta calidad y relevancia cultural. Este enfoque meticuloso en la selecci\u00f3n de datos garantiza que Latxa no solo sea capaz de comprender y generar texto en euskera, sino que tambi\u00e9n refleje el uso actual y aut\u00e9ntico del idioma.<\/p>\n<p>La estrategia para maximizar el impacto de Latxa, que est\u00e1 ya en huggingface.co,\u00a0 incluye la <strong>publicaci\u00f3n de modelos abiertos<\/strong>, permitiendo as\u00ed que desarrolladores y t\u00e9cnicos especializados puedan crear o adaptar aplicaciones espec\u00edficas. Esta apertura hacia la colaboraci\u00f3n y la innovaci\u00f3n subraya la importancia de una comunidad activa y comprometida en el proceso de enriquecimiento tecnol\u00f3gico del euskera.<\/p>\n<p>El director de HiTZ, Eneko Agirre, ha sido claro al respecto, reconociendo que, aunque el camino por delante es desafiante, el potencial para transformar el panorama tecnol\u00f3gico del euskera es inmenso.<\/p>\n<blockquote>\n<p>A pesar del entusiasmo que rodea al lanzamiento de Latxa, estamos conscientes de que nos encontramos apenas en los albores de este emocionante viaje. La ambici\u00f3n de alcanzar un nivel de calidad y funcionalidad comparable al de los modelos de lenguaje para el ingl\u00e9s o el espa\u00f1ol con GPTs es alta, pero tambi\u00e9n lo es nuestro compromiso con la investigaci\u00f3n continua.<\/p>\n<\/blockquote>\n<p>Los modelos de Latxa, si bien son versiones b\u00e1sicas y a\u00fan no est\u00e1n optimizados para instrucciones o preferencias espec\u00edficas dirigidas a usuarios finales, constituyen la piedra angular para el desarrollo de herramientas digitales avanzadas en euskera. La decisi\u00f3n de publicar estos modelos como recursos abiertos subraya un compromiso con la colaboraci\u00f3n y el avance tecnol\u00f3gico, permitiendo a expertos t\u00e9cnicos personalizar y desarrollar soluciones espec\u00edficas que respondan a las necesidades y particularidades del idioma.<\/p>\n<p>Con Latxa, la UPV-EHU\u00a0 ha puesto de relieve el valor del euskera en el contexto digital, estableciendo un precedente para c\u00f3mo las lenguas con menos recursos pueden seguir avanzando en la era de la inteligencia artificial. Este es un testimonio del poder de la tecnolog\u00eda para fomentar la diversidad ling\u00fc\u00edstica y cultural en nuestro mundo interconectado.<\/p>\n<\/div>\n<p> Latxa, el modelo de lenguaje que abre puertas digitales<br \/>\n<br \/>#Latxa #modelo #lenguaje #abre #puertas #digitales<\/p>\n","protected":false},"excerpt":{"rendered":"<p>En el \u00e1mbito de la tecnolog\u00eda ling\u00fc\u00edstica, la Universidad del Pa\u00eds Vasco (UPV-EHU) ha alcanzado un hito significativo con el desarrollo de Latxa, un avanzado modelo de lenguaje dedicado al euskera. Este logro demuestra el compromiso con la preservaci\u00f3n y promoci\u00f3n del idioma, present\u00e1ndose tambi\u00e9n como una soluci\u00f3n clave para superar desaf\u00edos digitales espec\u00edficos de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":312,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[45],"tags":[409,411,406,408,407,410],"class_list":["post-311","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ciencia-y-tecnologia","tag-abre","tag-digitales","tag-latxa","tag-lenguaje","tag-modelo","tag-puertas"],"_links":{"self":[{"href":"https:\/\/vr-news.net\/index.php?rest_route=\/wp\/v2\/posts\/311","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vr-news.net\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vr-news.net\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vr-news.net\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/vr-news.net\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=311"}],"version-history":[{"count":0,"href":"https:\/\/vr-news.net\/index.php?rest_route=\/wp\/v2\/posts\/311\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/vr-news.net\/index.php?rest_route=\/wp\/v2\/media\/312"}],"wp:attachment":[{"href":"https:\/\/vr-news.net\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=311"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vr-news.net\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=311"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vr-news.net\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=311"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}