عرض مشاركة واحدة
قديم 2017- 1- 7   #167
حماااده
متميز بالمستوى 7 E
الملف الشخصي:
رقم العضوية : 135776
تاريخ التسجيل: Tue Feb 2013
المشاركات: 3,335
الـجنــس : ذكــر
عدد الـنقـاط : 46000
مؤشر المستوى: 0
حماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond reputeحماااده has a reputation beyond repute
بيانات الطالب:
الكلية: ll
الدراسة: غير طالب
التخصص: انجليزي
المستوى: دكتوراه
 الأوسمة و جوائز  بيانات الاتصال بالعضو  اخر مواضيع العضو
حماااده غير متواجد حالياً
رد: تجمع اللغــة وتقنية المعلومات | الاختبار :الأحـد | | الفتره الثانيه | 10 - 4 -1438هـ |

بالنسبه لـ corpus < هي واضحه من تعريفها في محاضره 8 اعتقد
بس علشان توصل المعلومة

هذا من ويكيبيديا
في علم اللغويات الـ corpus وترجمته بالعربية المتن او المحتوى او المكنز النصي هو مجموعة كبيرة من النصوص المنظمة والمهيكلة (وفي الوقت الحالي عادة ما تكون مجمعة ومعالجة إلكترونيا) تستخدم لعمل تحليل إحصائي واختبار فرضي, لفحص مقدار ظهور أو صحة القواعد اللغوية في مجال محدد. المتن قد يحتوي على نصوص من لغة واحدة ويسمى (monolingual corpus) أو نصوص بيانية من لغات متعددة ويسمى (multilingual corpus) والمتون التي تحتوي على نصوص من اكثر من لغة وتكون قد نسقت من أجل المقارنة تسمى (aligned parallel corpora.). لجعل المتون أكثر فائدة للبحوث اللغوية غالبا ما تخضع لعملية تسمى (ِAnnotation). مثال على ذلك إدخال معلومات مع كل كلمة في المتن عن نوع هذه الكلمة (اسم , فعل , حرف .... الخ) تضاف إلى المتن في شكل وسوم (Tags). مثال آخر إدخال كل كلمة مع أصلها (يذهب , ذهب). بعض المتون تكون معالجة ومحللة بشكل أعمق من ذلك فهناك عدد من المتون الصغيرة تكون قد خضعت لعملية تحليل نحوي كامل (Parsing) وعادة ما تسمى ب Treebank. وهذه العملية صعبة لذلك المتون المحللة نحويا بالكامل عادة ما تكون صغيرة تحوي على ما يقارب الواحد إلى الثلاثة مليون كلمة. وهناك انواع عديدة لتحليل النصوص مثل التحليل المورفولوجي والدلالي.