RESULTS IN GENERAL: THREE STATISTICAL THINGS TO DO WITH RESULTS
(a) Presentation. Mainly presentation consists of making easy to understand tables, and especially graphs of various sorts, to go in the main text and show the key features of the results (e.g. histograms, bar charts, scatterplots, line graphs of various sorts). For these tables and/or graphs, frequencies of people falling in a category may be converted to %, etc., for easy understanding, and often what will be presented are descriptive statistics derived from the data (see b), rather than scores or whatever of each case separately.
نتائج:
نتائج عامة: ثلاثة الإحصائية مما ينبغي فعله مع النتائج (عرضاً). يتكون أساسا من العرض التقديمي من مما يجعل من السهل أن نفهم الجداول، والرسوم البيانية خاصة من مختلف الأنواع، الذهاب في النص الرئيسي، وإظهار الملامح الرئيسية للنتائج (مثل رسوم بيانية، المخططات الشريطية، سكاتيربلوتس، خط الرسومات البيانية بأنواعها المختلفة). قد يتم تحويل هذه الجداول و/أو الرسوم البيانية، ترددات الناس التي تقع في فئة %، إلخ، لفهم سهل، وغالباً ما سيتم عرضه وصفية الإحصاءات المستمدة من البيانات (انظر ب)، بدلاً من عشرات أو أيا كان لكل حالة على حدة
(b) Descriptive statistics. These are figures you (get the computer to) calculate from a lot of specific figures which arise from data. Essentially they summarise certain facts just about the specific cases you studied. Hence they are referred to as 'statistical measures' based on 'observed' data, sometimes referred to as O (=observed) figures for short (cf. 'statistical tests' in c which go beyond just what has been observed about samples). Mainly they are of one of the following types, depending on what kind of thing about your people/words/etc. they measure:
(ب) إحصاءات وصفية. هذه هي الأرقام تحصل (جهاز الكمبيوتر) على حساب من الكثير من الأرقام المحددة التي تنشأ من البيانات. أساسا أنها تلخص وقائع معينة فقط عن الحالات المحددة لك درس. ومن ثم يشار إليها ك 'التدابير الإحصائية' استناداً إلى بيانات 'المشاهدة'، يشار إليها أحياناً بس (= لاحظ) الأرقام لفترة قصيرة (انظر 'الاختبارات الإحصائية' في ج التي تذهب إلى أبعد من مجرد ما قد لوحظ حول عينات). وأساساً من أحد الأنواع التالية، اعتماداً على أي نوع من الشيء الخاص بك الناس/الكلمات/إلخ أنها تقيس:
-- (b1) Measures of centrality. These in some way indicate the one score or category that you might choose to represent a whole set of scores or categorisations for one group of cases on one variable. These are mostly familiar measures from everyday life. One example is the "average" score of a set of interval scores (technically the Mean). Another, where you have cases that have been put in categories, is the category that the greatest proportion of people chose or fell in
(b1) تدابير لمركزية. هذه بطريقة تشير إلى 01:20 ص أو الفئة التي قد تختار لتمثيل مجموعة كاملة من عشرات أو categorisations لمجموعة واحدة من الحالات على متغير واحد. هذه معظمها من تدابير مألوفة من الحياة اليومية. مثال واحد هو درجة "متوسط" من مجموعة من عشرات الفاصل الزمني (يعني من الناحية التقنية). آخر، حيث لديك الحالات التي وضعت في فئات، هي الفئة التي أكبر نسبة من الناس اختيار أو سقطت
-- (b2) Measures of variation. These summarise how far the individual scores were closely spread round some central measure, how far they were widely spread. In a way they measure how closely the scores (or people who scored the scores) "agreed" within a group, on a scale running upwards from 0. The higher the figure, the greater the variation. Examples of such measures are the Standard Deviation (and related notions Variance and Error) for scores, Index of Commonality for categories.
-التدابير (b2) من التباين. وتلخص هذه مدى انتشرت عشرات الفردية عن كثب جولة المركزية قدرا، كيف الآن أنها كانت منتشرة على نطاق واسع. بطريقة أنها تقيس مدى قرب عشرات (أو الأشخاص الذين سجل العشرات) "المتفق عليها" ضمن مجموعة ما، في نطاق يمتد صعودا من 0. كلما ارتفع الرقم، كلما زاد التباين. أمثلة لمثل هذه التدابير هي الانحراف المعياري (والمفاهيم المتصلة الفرق والخطأ) لعشرات، "فهرس القواسم المشتركة" لفئات.
(b3) Measures of difference. These summarise the amount of difference between pairs of samples or groups measured, or between scores the same group obtained in different conditions, usually by a figure that is the 'difference between two means', or the 'difference between two percentages' (percentage difference). Again such figures normally run upwards from 0 (= no difference) to any size.
(b3) تدابير للفرق. تلخص هذه مقدار الفرق بين أزواج من العينات أو المجموعات قياس، أو بين درجات نفس المجموعة التي تم الحصول عليها في ظروف مختلفة، عادة بهذا رقم الذي هو 'الفرق بين وسيلتين'، أو 'الفرق بين النسب المئوية اثنين' (الفرق بالنسبة المئوية). مرة أخرى هذه الأرقام عادة تشغيل صعودا من 0 (= لا فرق) إلى أي حجم.
(b4) Measures of relationship. These quantify the amount of relationship between two (or more) variables as measured in the same group of people or whatever. They are usually on a scale 0-1 (in some instances they run from -1 through 0 to +1). I.e. if such a measure comes out near 1 (or -1 where relevant), that indicates that those cases that scored a particular value on one variable also tended to score a particular value on the other. E.g. those who scored high on motivation also scored high on proficiency. If it comes out near 0, that indicates that cases that scored a particular way on one variable scored all over the other variable, and vice versa. Examples are the Pearson 'r' Correlation Coefficient, the Spearman 'rho' Correlation Coefficient, Kendall's W, the 'phi' Correlation Coefficient, Kruskal's 'gamma'. (Remember that relationship and difference are really the same thing looked at from different points of view. If there is a difference between men and women - the two values of the gender variable - in attitude to RP accent, then there is a relationship between the variables gender and attitude to RP accent. It is just that for technical reasons sometimes statistics approaches the matter more via measuring difference, sometimes via measuring relationship).
(b4) تدابير للعلاقة. هذه تحديد مقدار العلاقة بين المتغيرات اثنين (أو أكثر) كما يقاس في نفس المجموعة من الناس أو أيا كان. وهم عادة في نطاق 0-1 (في بعض الحالات أنها تخترق من-1 0 إلى + 1). أي إذا كان هذا تدبير يخرج 1 القريب (أو-1 حيثما كان ذلك مناسباً)، التي تشير إلى أن تلك الحالات التي سجلت قيمة معينة في متغير واحد تميل أيضا إلى نقاط قيمة معينة على أخرى. مثل أولئك الذين سجل بارتفاع الدافع أيضا سجل عالية في الكفاءة. إذا كان يأتي القرب من 0، الذي يشير إلى أن الحالات التي سجل طريقة معينة على متغير واحد وسجل في جميع أنحاء المتغير الآخر، والعكس بالعكس. ومن أمثلة ث بيرسون 'r' معامل الارتباط، معامل الارتباط سبيرمان 'رو' كيندال، 'phi' معامل الارتباط، 'غاما كروسكال 's'. (تذكر أن العلاقة والفرق هي في الحقيقة نفس الشيء ينظر إليها من وجهات نظر مختلفة. إذا كان هناك فرق بين الرجال والنساء--اثنين قيم متغير نوع الجنس-في الموقف إلى اكسنت RP، ثم هناك علاقة بين متغيرات الجنس والموقف من اكسنت RP. أنها مجرد أنه لأسباب فنية في بعض الأحيان إحصاءات تقترب هذه المسألة أكثر عن طريق قياس الفرق في بعض الأحيان عن طريق قياس العلاقة).
If you are only interested in the particular cases or groups of cases you measured in themselves (e.g. because they are the whole population of interest), then (a) and (b) probably provide the answer to any questions or hypotheses you had about them. But usually in research you have not measured everyone/thing of interest directly, but only samples, and wish to generalise, hence inferential statistics are also needed.
إذا كنت مهتما فقط في حالات معينة أو مجموعات من الحالات يمكنك قياسه في حد ذاتها (مثلاً لأنها جميع السكان لمصلحة)، ثم (أ) و (ب) ربما توفر الإجابة على أي أسئلة أو الفرضيات التي كنت قد حول لهم. لكن عادة في البحث كنت قد لا يقاس كل شخص/شيء من الفائدة مباشرة، ولكن فقط عينات، والرغبة في التعميم، إحصاءات استنتاجي ومن ثم هناك حاجة أيضا إلى
(c) Inferential statistics. These in some way enable you to generalise from the specific sample(s) you measured, and the descriptive measures of them (O's), to a wider 'population' that you sampled (if that is of interest to you, of course). Most descriptive statistical measures have associated inferential statistics.
In effect then, the input to inferential
- the level of certainty is about what inferential stats tells you that you will be satisfied with. No inferential stats give you 100% certainty of anything. I.e. statistics can never tell you that, based on the difference between 3rd graders and 4th graders you found in your samples, it is 100% certain that there is a difference between 3rd and 4th graders in the populations your samples represent. You have to choose to be satisfied with something less than 100%. 95% is commonly taken as adequate in language research: this is the same as choosing the .05 (or 5%) level of significance as the one you will be satisfied with. (Statistics actually works with the chances of being wrong about a difference rather than being correct, hence 5% not 95%). If you adopt that level, then if a statistical test comes up with a significance of less than .05 for some difference or relationship you are interested in, then that is the same as saying that there is a 95% or more certainty that there is a population difference/relationship, not just one in the sample. So you will take it that a difference or relationship is proved to be real in the population(s) as well as the sample(s). If you adopted .01 as the threshold then you would only be satisfied if the test came out with a significance smaller than that (You would be demanding 99% or more certainty).
(ج) Inferential الإحصاءات. هذه طريقة تمكنك من التعميم من sample(s) محددة يمكنك قياسه، والتدابير وصفي منهم (يا)، على نطاق أوسع 'سكان' التي قمت بالنسخ (إذا كان هذا من مصلحة لكم، بطبيعة الحال). وقد انضم المقاييس الإحصائية الوصفية الأكثر استنتاجي الإحصاءات.
سارية المفعول بعد ذلك، مدخلاً استنتاجي-مستوى اليقين حول ما يقول لك التي سوف تكون راضية عن إحصائيات استنتاجي. لا توجد إحصائيات استنتاجي تعطيك اليقين 100 ٪ من أي شيء. أي إحصاءات يمكن ابدأ أن أقول لكم أن، على أساس الفرق بين طلاب السنة الثالثة وطلاب الصف الرابع كنت وجدت في العينات الخاصة بك، 100 ٪ معينة من أن هناك فرقا بين طلاب السنة الثالثة والرابعة في السكان في العينات الخاصة بك تمثل. عليك أن تختار أن تكون راضية عن ما هو أقل من 100%. 95% هو عادة المتخذة كافية في بحوث اللغة: هذا هو نفس اختيار.05 (أو 5 في المائة) مستوى من الأهمية كواحد سوف تكون راضية. (إحصائيات يعمل فعلا مع فرص يجري خاطئ عن فرق بدلاً من أن تكون صحيحة، ومن ثم 5% لا 95%). إذا كنت تعتمد هذا المستوى، ثم إذا كان اختبار إحصائية حتى يأتي مع ذو أهمية أقل من.05 لبعض الفرق أو العلاقة التي كنت مهتما في، ثم هذا هو نفس القول بأن هناك 95 في المائة أو قدرا أكبر من اليقين أن هناك سكان فرق/علاقة، لا مجرد واحدة في العينة. حتى يمكنك سوف اعتبر أن الفرق أو العلاقة ثبت الحقيقية في طوعيين، فضلا عن sample(s). إذا كنت اعتمدت 01 العتبة، ثم يكون إلا راضيا إذا خرج الاختبار مع دلالة أصغر من ذلك (هل سوف يكون يطالب 99% أو قدرا أكبر من اليقين).
Significance tests. These deal with hypotheses about 'differences' or 'relationships', which is why it was a good idea to think in these terms when formulating hypotheses and planning what to do in the first place - before actually starting gathering data. They tell us if a difference or relationship we have observed in samples is strong enough to indicate a 'real' difference/ relationship in the populations sampled or not.
أهمية الاختبارات. هذه التعامل مع فرضيات حول 'الخلافات' أو 'علاقات'، الذي السبب في أنها فكرة جيدة التفكير في هذه الشروط عند صياغة الفرضيات وتخطيط ما يجب فعله في المقام الأول-قبل البدء فعلياً بجمع البيانات. يقولون لنا إذا الفرق أو العلاقة أننا لاحظنا في عينات قوية بما يكفي للإشارة إلى فارق 'حقيقية'/العلاقة في السكان عينات أو لا.
Suppose you are comparing the attitudes of men and women to RP. You find an observed difference between the results for two samples (one of men and one of women) - i.e. the sample difference between the two average scores for attitude to RP English is not zero. So clearly the samples are, descriptively, different, but what can you say about the hypothesis about the populations of men and women that you sampled (since it is this "large-scale" hypothesis that you are really interested in)? Common sense says that you could get small differences between samples of men and women without there being any real population difference between men and women, just because samples from populations don't exactly reflect those populations in microcosm. Something called 'sampling error' always comes in. What you want (though you may not realise it!) is to be told a probability: you need to know the probability that you would get a difference the size of your observed one between samples if there were no population difference. If the probability is remote (say 5% or less (p<.05) - the common threshold chosen), then you will conclude that your samples are evidence for a population difference and will say that the difference is, technically, 'significant'. But if the probability is reasonably large (bigger than 5%, p>.05 say), then it is not safe to regard the "no difference" hypothesis as rejectable. The main bit of information you get from any significance test is therefore a probability, which may be referred to as p or sig.
لنفترض أنك مقارنة مواقف الرجال والنساء إلى البرنامج العادي. يمكنك العثور فرق الملاحظ بين النتائج للعينات اثنين (واحد من الرجال) وواحدة من النساء-أي عينة الفرق بين عشرات متوسط اثنين للموقف إلى الإنجليزية RP ليست صفراً. ذلك بوضوح العينات، صفيا، مختلفة، ولكن ماذا يمكن القول حول الفرضية حول السكان من الرجال والنساء أن قمت بالنسخ (نظراً لأنها هذه الفرضية "الواسعة النطاق" التي كنت مهتما حقاً)؟ الحس السليم يقول أن يمكن أن تحصل الخلافات الصغيرة بين عينات رجال والنساء دون وجود أي اختلاف السكان الحقيقية بين الرجل والمرأة، فقط لعينات من السكان لا تعكس بالضبط هؤلاء السكان في صورة مصغرة. ويأتي ما يسمى 'خطأ أخذ العينات' دائماً. ما تريد (على الرغم من أن كنت قد لا يدركون ذلك!) أن يقال احتمالاً: أنت بحاجة إلى معرفة احتمالية أن تحصل فرق حجم الخاص بك واحد ملاحظتها بين العينات إذا كان هناك أي اختلاف السكان. إذا كان الاحتمال بعيد (نقول 5% أو أقل (ف <.05)-عتبة المشترك المختار)، ثم يمكنك سيتم استنتاج أن العينات الخاصة بك أدلة لاختلاف سكان وسوف أقول أن الفرق، من الناحية الفنية، 'كبير'. ولكن إذا كان الاحتمال كبير معقول (أكبر من 5%، ف > قل 05)، ثم أنها ليست آمنة لاعتبار فرضية "لا فرق" ريجيكتابل. بت الرئيسية من المعلومات التي تحصل عليها من أي اختبار أهمية هو ذلك احتمال، التي قد يشار إليها باسم p أو sig.
بعدين فتح السايت وكان فيه رسم بياني ارجوا الاطلاع على الرسم ومهم تسمعون المحاضرات لان في اشياء كثيرة تنقال بالمحاضرة زايدة على اللي مكتوب تقبلوا جهدي المتواضع 
المحاضرة 14 مراجعة