000162264 001__ 162264
000162264 005__ 20251017144558.0
000162264 0247_ $$2doi$$a10.16995/dscn.16533
000162264 0248_ $$2sideral$$a144828
000162264 037__ $$aART-2025-144828
000162264 041__ $$aeng
000162264 100__ $$aBordonaba-Plou, David
000162264 245__ $$aCharacterizing Asymmetries in the TenTen Corpus Family Membership: An Implicit Hierarchy in Multilingual Digital Tools
000162264 260__ $$c2025
000162264 5060_ $$aAccess copy available to the general public$$fUnrestricted
000162264 5203_ $$aIn this work, we examine the limitations of digital tools in facilitating cross-linguistic and cross-cultural research from a humanistic perspective. Our primary objective is to draw comparisons between the TenTen corpora, assessing their degree of similarity. In order to achieve this goal, we will conduct cluster analysis on the 43 corpora within the TenTen Corpus Family using a set of parameters that characterize this family membership. This analysis pinpoints the TenTen corpora that exhibit the most similar characteristics within the family, bringing to the surface an implicit hierarchy within the Sketch Engine platform, a multilingual digital tool environment. This hierarchy is structured into four distinct clusters, definable by size, number of functional tools, versions, and Part-of-Speech (PoS) tagging. The findings of the current study call for prudence when comparing the TenTen corpora, but also suggest a way of improving a multilingual environment; the examination and establishment of connections among the TenTen corpora are imperative for a comprehensive understanding of multilingualism in Digital Humanities.

Dans ce travail, nous examinons les limites des outils numériques dans la facilitation de la recherche interlinguistique et interculturelle d’un point de vue humaniste. Notre objectif principal est de comparer les corpus TenTen, en évaluant leur degré de similarité. Pour atteindre cet objectif, nous réaliserons une analyse de regroupement sur les 43 corpus de la famille des corpus TenTen en utilisant un ensemble de paramètres caractérisant cette appartenance familiale. Cette analyse identifie les corpus TenTen qui présentent les caractéristiques les plus similaires au sein de la famille, révélant une hiérarchie implicite au sein de la plateforme Sketch Engine, un environnement d’outils numériques multilingues. Cette hiérarchie est structurée en quatre groupes distincts, définis par la taille, le nombre d’outils fonctionnels, les versions et le marquage des parties du discours (PoS). Les résultats de l’étude actuelle appellent à la prudence lors de la comparaison des corpus TenTen, mais suggèrent également un moyen d’améliorer un environnement multilingue ; l’examen et l’établissement de connexions entre les corpus TenTen sont impératifs pour une compréhension complète du multilinguisme dans les Humanités Numériques.
000162264 536__ $$9info:eu-repo/grantAgreement/ES/DGA/H34$$9info:eu-repo/grantAgreement/ES/MICINN/PID2021-122872NB-C21$$9info:eu-repo/grantAgreement/ES/MICIU/PID2023-150396OA-I00
000162264 540__ $$9info:eu-repo/semantics/openAccess$$aby$$uhttps://creativecommons.org/licenses/by/4.0/deed.es
000162264 655_4 $$ainfo:eu-repo/semantics/article$$vinfo:eu-repo/semantics/publishedVersion
000162264 700__ $$0(orcid)0000-0003-4455-4745$$aJreis-Navarro, Laila M.$$uUniversidad de Zaragoza
000162264 7102_ $$13013$$2285$$aUniversidad de Zaragoza$$bDpto. Lingüíst.y Liter.Hispán.$$cÁrea Estudios Arabes Islámicos
000162264 773__ $$g15, 1 (2025), [18 pp.]$$tDigital Studies/ Le Champ Numerique$$x1918-3666
000162264 8564_ $$s975072$$uhttps://zaguan.unizar.es/record/162264/files/texto_completo.pdf$$yVersión publicada
000162264 8564_ $$s2200806$$uhttps://zaguan.unizar.es/record/162264/files/texto_completo.jpg?subformat=icon$$xicon$$yVersión publicada
000162264 909CO $$ooai:zaguan.unizar.es:162264$$particulos$$pdriver
000162264 951__ $$a2025-10-17-14:13:41
000162264 980__ $$aARTICLE