الخلاصة:
من مُنطلق فلسفة الحوسبة القائمة على تكامل وتعاضُد العمل بين النّظم والبرمجيات الموجّهة لمعالجة اللّغات الطبيعية آلياً، والمصادر اللّغوية المُــهيّـئـــة حاسوبيـاً، وفق المبدأ المعروف في عالم الحوسبة بتدوير المصادر المتاحة،من أجل خلق نفعيّـــة تبادليّـــة تجمع هذه الموارد البيانية (المعيارية) بتلك النّظم والأدوات المعلوماتية دونما اعتبار لطبيعتها أو نهجها أو حتى للمجال الذي طوّرت لأجله أو تُوظف فيه. حيث تَظهر براغماتية هذا المبدأ في نزوعه إلى توسيع وتنويع نطاقات الإفادة من هذه الموارد النَّصية المُحوسبة، بتوظيفها إمّــــــا لرفع كفاءة بعض التطبيقات الحاسوبية وتحسين مُخرجاتها، أو لاختبارها وتقييم عملها وأدائها. عندها تصبح المدوّنات المحوسبة (corpus) عُمدة المصادر اللّغوية توظيفــــــاً واستخدامــــاً ضمن إجراءات الاختبـــار والتّدريب، للكثير من النّظم والبرمجيات وفي مقدمتها المحلّلات الصّرفية، لتقييـــم أدائها وقياس نسبة وثوقيّتهــــا على مستويــات عدّة: -التّحليل -التّشكيل -الوَسم...الخ، واختبـــار جاهزيّتها في تقديم تحليلات صحيحـــة ووُســوم دقيقـــة للمُدخـــلات، قيــاساً على ما هُيّئــت ووُسمت به قبـــــــلاً هذه المدوّنات.
Within the realm of computing philosophy, which emphasizes the synergy between systems and software for automated natural language processing and computationally ready linguistic resources, a key principle is the efficient recycling of resources. This approach fosters a reciprocal benefit, merging standardized data resources with diverse informational systems and tools, irrespective of their origin or purpose. This principle’s pragmatism is evident in its aim to broaden and diversify the use of these digital textual resources. They are employed to boost the effectiveness of computer applications and their outcomes or to assess and improve their functionality. Central to this are Computed corpora, pivotal for testing and training various systems, notably morphological analyzers. These are assessed for performance and reliability in analysis, formation, and tagging, ensuring their capacity to deliver accurate and precise analyses and tags, reflecting the previously prepared and annotated content in these corpora