معلومة

هل هناك مصطلح لمقياس تعتبر فيه الدرجة العالية أو المنخفضة للغاية سيئة؟

هل هناك مصطلح لمقياس تعتبر فيه الدرجة العالية أو المنخفضة للغاية سيئة؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أكتب نتائج مقياس الإدارة العاطفية ، وأفترض أن الإدارة السيئة أو المفرطة للعواطف تؤدي إلى عواقب سلبية.

أنا أبحث عن مصطلح يعبر عن أن كلا من الدرجة العالية جدًا أو المنخفضة جدًا ، وفقًا لهذا المقياس ، هي دون المستوى الأمثل (على عكس ، على سبيل المثال ، معدل الذكاء ، حيث تعتبر الدرجة الأعلى دائمًا أعلى من الدرجة الأدنى) ، لكن لا يمكنني التفكير أو العثور على المصطلح المناسب.

اقترح عليّ أحد الزملاء استخدام مصطلح "curvilinear" ، لكنني لا أعتقد أن هذا يعبر عما أريد.


أوصي بالنظر في الكتابة غير العلمية التي تصف عندما يكون الكثير من الشيء وقليله غير جيد - عندما يكون المتوسط ​​/ في المنتصف هو الأفضل لنتيجة معينة. هذا صحيح في العديد من جوانب الحياة ، لذلك ستجد مجموعة متنوعة من الكلمات التي قد تعبر عما تريد نقله حول هذه الدرجات عالية المستوى دون المستوى الأمثل ومنخفضة المستوى دون المستوى الأمثل.

قد تعرف كلمات StackExchage الإنجليزية اسمًا / صفة حالية لما تريده بالضبط. إذا لم تكن هناك كلمة تعبر عما تقصده ، فأنت حر في إنشاء واحدة. ربما اقتران البادئة "إضافي-" بمعنى "خارج النطاق الأمثل" ، أو البادئة "dys-" بمعنى "الدرجات غير المواتية" مع الكلمة (الكلمات) ذات الصلة بالقياس.


أعتقد أن Inverted U هو ما تبحث عنه.

المثال المحدد الذي قدمته ويكيبيديا هو قانون Yerkes-Dodson ، الذي ينص بشكل أساسي على أن مستويات الإثارة المرتفعة والمنخفضة جدًا لها تأثيرات سلبية على أداء مهام معينة.

هناك العديد من الأمثلة الأخرى لهذا النوع من العلاقات. فيما يلي مثال آخر ، يوضح أن مستوى ألفا (التذبذبات العصبية 10 هرتز) قبل التحفيز البصري له علاقة مقلوبة على شكل حرف U مع الاستجابة المستثارة للمثير.


الموثوقية [عدل | تحرير المصدر]

الموثوقية: 1) نصف موثوقية الانقسام: تم إجراء اختبارات الموثوقية الداخلية لكل من الاستبيان والنماذج الموسعة على مقدمي الرعاية للأطفال دون سن 19. استمارة المسح قسمت معاملات نصفية للفئات العمرية الأقل من 3 سنوات تراوحت من .82 إلى .95 للفئة العمرية. المجالات و .96 إلى .98 لمركب السلوك التكيفي ، وتراوحت معاملات تقسيم النموذج الموسع من .90 إلى .97 للنطاقات و .98 إلى .99 للمركب. (2) موثوقية إعادة الاختبار - الاختبار (متوسط ​​17 يومًا بين الاختبارات): معاملات موثوقية نموذج الاستطلاع لمقدمي الرعاية للأطفال الذين تتراوح أعمارهم بين 6 أشهر وسنتين ، وتراوحت 11 شهرًا من .78 إلى .92 للمجالات و 90. لمركب السلوك التكيفي. لم تكن هناك اختبارات موثوقية للاختبار وإعادة الاختبار للنموذج الموسع. (3) موثوقية Interrater: معاملات موثوقية interrater في نموذج الاستطلاع ، بمتوسط ​​8 أيام بين المقابلات مع مقدمي الرعاية للأطفال الذين تتراوح أعمارهم بين 6 أشهر و 18 عامًا ، و 11 شهرًا ، وتراوحت من .62 إلى .78 للنطاقات وكانت .74 لمركب السلوك التكيفي. لم تكن هناك اختبارات موثوقية interrater للنموذج الموسع.

الاتساق الداخلي: نموذج الاستطلاع: يُقصد بالنصف المنقسم المجالات .83 إلى .90 لمركب السلوك التكيفي .94 النموذج الموسع: يُقصد بالنصف المنقسم المجالات .91 إلى .95 لمركب السلوك التكيفي .97 إصدار الفصل الدراسي: يعني معامل ألفا للنطاقات .80 إلى. 95 لمركب السلوك التكيفي .98

الاختبار - إعادة الاختبار:استمارة المسح: الوسائل الخاصة بالمجالات .81 إلى .86 لمركب السلوك التكيفي .88 (العدد = 484)

Interrater: نموذج urvey: الارتباطات بين اثنين من المحاورين المختلفين ، للنطاقات .62 إلى .78 لمركب السلوك التكيفي .74 (العدد = 160)

يوفر الدليل بيانات شاملة بشأن الموثوقية


الحلول الصحية من رعاتنا

فادي ، R. "تصفية الكرياتينين." ميدسكيب. 7 مايو 2013. & lth https://emedicine.medscape.com/article/2117892-overview>

أعلى مقالات اختبار الدم الكرياتينين ذات الصلة

ارتفاع ضغط الدم (ارتفاع ضغط الدم)

ارتفاع ضغط الدم هو مرض يرتفع فيه الضغط داخل شرايين الجسم. يعاني حوالي 75 مليون شخص في الولايات المتحدة من ارتفاع ضغط الدم (1 من كل 3 بالغين) ، ونصفهم فقط قادر على إدارته. كثير من الناس لا يعرفون أنهم مصابون بارتفاع ضغط الدم لأنه غالبًا لا توجد به علامات أو أعراض تحذيرية.

الضغط الانقباضي والانبساطي هما القراءات التي يقاس فيها ضغط الدم. أصدرت الكلية الأمريكية لأمراض القلب إرشادات جديدة لارتفاع ضغط الدم في عام 2017. وتنص الإرشادات الآن على أن ضغط الدم الطبيعي هو 120/80 ملم زئبق. إذا كان أي من هذين الرقمين أعلى ، فأنت مصاب بارتفاع ضغط الدم.

تعرف الأكاديمية الأمريكية لأمراض القلب ارتفاع ضغط الدم بشكل مختلف قليلاً. يعتبر AAC 130/80 ملم زئبق. أو أكبر (أي رقم) المرحلة 1 من ارتفاع ضغط الدم. يعتبر ارتفاع ضغط الدم في المرحلة الثانية 140/90 ملم زئبق. أو أكبر.

إذا كنت تعاني من ارتفاع ضغط الدم ، فأنت معرض لخطر الإصابة بأمراض تهدد الحياة مثل السكتة الدماغية والنوبات القلبية.


مصداقية

مصداقية يشير إلى اتساق التدبير. ينظر علماء النفس في ثلاثة أنواع من الاتساق: بمرور الوقت (موثوقية الاختبار - إعادة الاختبار) ، وعبر العناصر (الاتساق الداخلي) ، وعبر الباحثين المختلفين (الموثوقية بين المقيمين).

موثوقية الاختبار وإعادة الاختبار

عندما يقيس الباحثون بناءًا يفترضون أنه ثابت عبر الزمن ، فإن الدرجات التي يحصلون عليها يجب أن تكون متسقة أيضًا عبر الزمن. موثوقية الاختبار وإعادة الاختبار هو مدى هذا هو الحال في الواقع. على سبيل المثال ، يُعتقد عمومًا أن الذكاء يكون ثابتًا عبر الزمن. الشخص الذي يتمتع بذكاء عالٍ اليوم سيكون شديد الذكاء الأسبوع المقبل. هذا يعني أن أي مقياس جيد للذكاء يجب أن ينتج عنه نفس الدرجات تقريبًا لهذا الفرد الأسبوع المقبل كما هو الحال اليوم. من الواضح أن المقياس الذي ينتج درجات غير متسقة للغاية بمرور الوقت لا يمكن أن يكون مقياسًا جيدًا جدًا للبنية التي من المفترض أن تكون متسقة.

يتطلب تقييم موثوقية الاختبار وإعادة الاختبار استخدام المقياس على مجموعة من الأشخاص في وقت واحد ، واستخدامه مرة أخرى في نفس مجموعة من الأشخاص في وقت لاحق ، ثم ينظرون إليها ارتباط الاختبار بإعادة الاختبار بين مجموعتي الدرجات. يتم ذلك عادةً عن طريق رسم البيانات في مخطط مبعثر وحساب بيرسون ص. يوضح الشكل 5.2 العلاقة بين مجموعتين من درجات العديد من طلاب الجامعات على مقياس روزنبرغ لتقدير الذات ، يتم إجراؤها مرتين ، كل أسبوع على حدة. تبلغ قيمة r لـ Pearson لهذه البيانات +.95. بشكل عام ، يعتبر ارتباط الاختبار-إعادة الاختبار بمقدار 80+ أو أكثر للإشارة إلى الموثوقية الجيدة.

الشكل 5.2 ارتباط الاختبار-إعادة الاختبار بين مجموعتين من درجات العديد من طلاب الكلية على مقياس روزنبرغ لتقدير الذات ، معطى مرتين في الأسبوع على حدة

مرة أخرى ، تكون الارتباطات العالية بين الاختبار وإعادة الاختبار منطقية عندما يُفترض أن البنية التي يتم قياسها متسقة بمرور الوقت ، وهو ما ينطبق على أبعاد الذكاء واحترام الذات وأبعاد الشخصية الخمسة الكبار. لكن لا يُفترض أن تكون البنى الأخرى مستقرة بمرور الوقت. طبيعة الحالة المزاجية ، على سبيل المثال ، هي أنها تتغير. لذا فإن قياس الحالة المزاجية الذي أنتج ارتباطًا منخفضًا بين الاختبار وإعادة الاختبار على مدى شهر لن يكون مدعاة للقلق.

الاتساق الداخلي

النوع الثاني من الموثوقية هو الاتساق الداخلي، وهو اتساق استجابات الأشخاص عبر العناصر على مقياس متعدد العناصر. بشكل عام ، من المفترض أن تعكس جميع العناصر الموجودة في هذه المقاييس نفس البنية الأساسية ، لذلك يجب ربط درجات الأشخاص في هذه العناصر ببعضها البعض. على مقياس روزنبرغ لتقدير الذات ، يجب على الأشخاص الذين يوافقون على أنهم شخص ذو قيمة أن يميلوا إلى الموافقة على أن لديهم عددًا من الصفات الجيدة. إذا كانت ردود الأشخاص على العناصر المختلفة غير مرتبطة ببعضها البعض ، فلن يكون من المنطقي بعد الآن الادعاء بأنهم يقيسون نفس البنية الأساسية. هذا صحيح بالنسبة للتدابير السلوكية والفسيولوجية كما هو الحال بالنسبة لمقاييس التقرير الذاتي. على سبيل المثال ، قد يقوم الأشخاص بسلسلة من الرهانات في لعبة محاكاة للروليت كمقياس لمستوى بحثهم عن المخاطر. سيكون هذا المقياس متسقًا داخليًا لدرجة أن رهانات المشاركين الفردية كانت عالية أو منخفضة باستمرار عبر التجارب.

مثل موثوقية الاختبار وإعادة الاختبار ، لا يمكن تقييم الاتساق الداخلي إلا من خلال جمع البيانات وتحليلها. نهج واحد هو إلقاء نظرة على علاقة انقسام النصف. يتضمن ذلك تقسيم العناصر إلى مجموعتين ، مثل النصف الأول والثاني من العناصر أو العناصر ذات الأرقام الزوجية والفردية. ثم يتم حساب الدرجة لكل مجموعة من العناصر ، ويتم فحص العلاقة بين مجموعتي الدرجات. على سبيل المثال ، يوضح الشكل 5.3 ارتباط النصف بين درجات العديد من طلاب الجامعات على العناصر ذات الأرقام الزوجية ودرجاتهم على العناصر ذات الأرقام الفردية لمقياس تقدير الذات في روزنبرج. بيرسون ص لهذه البيانات هو +.88. يعتبر ارتباط النصف المنقسم بمقدار +.80 أو أكبر بشكل عام تناسقًا داخليًا جيدًا.

الشكل 5.3 الارتباط نصف الجزئي بين درجات العديد من طلاب الكلية في العناصر ذات الأرقام الزوجية ودرجاتهم على العناصر ذات الأرقام الفردية لمقياس تقدير الذات في روزنبرغ

ربما يكون مقياس الاتساق الداخلي الأكثر شيوعًا الذي يستخدمه الباحثون في علم النفس هو الإحصاء الذي يُطلق عليه α كرونباخ (الحرف اليوناني ألفا). من الناحية المفاهيمية ، فإن α هو متوسط ​​جميع الارتباطات النصفية الممكنة لمجموعة من العناصر. على سبيل المثال ، هناك 252 طريقة لتقسيم مجموعة من 10 عناصر إلى مجموعتين من خمسة. سيكون α كرونباخ هو متوسط ​​252 نصف ارتباط. لاحظ أن هذه ليست الطريقة التي يتم بها حساب α بالفعل ، ولكنها طريقة صحيحة لتفسير معنى هذه الإحصائية. مرة أخرى ، يتم أخذ القيمة +.80 أو أكبر بشكل عام للإشارة إلى تناسق داخلي جيد.

موثوقية Interrater

تتضمن العديد من التدابير السلوكية حكمًا مهمًا من جانب المراقب أو المقيم. موثوقية بين المقيم هو مدى توافق المراقبين المختلفين في أحكامهم. على سبيل المثال ، إذا كنت مهتمًا بقياس المهارات الاجتماعية لطلاب الجامعة ، فيمكنك تسجيل مقاطع فيديو لهم أثناء تفاعلهم مع طالب آخر يلتقون به للمرة الأولى. بعد ذلك ، يمكن أن يكون لديك مراقبان أو أكثر يشاهدان مقاطع الفيديو ويقيمان مستوى المهارات الاجتماعية لكل طالب. إلى الحد الذي يتمتع فيه كل مشارك في الواقع بمستوى معين من المهارات الاجتماعية التي يمكن اكتشافها من قبل المراقب اليقظ ، يجب أن تكون تقييمات المراقبين المختلفة مرتبطة ارتباطًا وثيقًا ببعضها البعض. كان من الممكن أيضًا قياس موثوقية Inter-rater في دراسة Bandura's Bobo doll. في هذه الحالة ، كان يجب أن تكون تقييمات المراقبين لعدد الأعمال العدوانية التي ارتكبها طفل معين أثناء اللعب بدمية بوبو مرتبطة بشكل إيجابي للغاية. غالبًا ما يتم تقييم موثوقية Interrater باستخدام α كرونباخ عندما تكون الأحكام كمية أو إحصائية مماثلة تسمى Cohen’s κ (الحرف اليوناني كابا) عندما تكون قاطعة.


ماذا تعني درجة Z العالية والمنخفضة؟

تعني الدرجة # z # العالية احتمالًا منخفضًا جدًا للبيانات فوق هذه الدرجة # z # وتعني الدرجة المنخفضة # z # -score احتمال ضئيل جدًا للبيانات أقل من هذه الدرجة # z # ..

تفسير:

تعني الدرجة # z # العالية احتمالًا منخفضًا جدًا للبيانات فوق هذه الدرجة # z #. على سبيل المثال ، يوضح الشكل أدناه احتمال # z # -score أعلى # 2.6 #.

الاحتمال لهذا هو # 0.47٪ # ، وهو أقل من نصف بالمائة. لاحظ أنه إذا ارتفعت # z # -score أكثر ، فإن المنطقة الواقعة تحت المنحنى تنخفض والاحتمال ينخفض ​​أكثر.

تعني الدرجة المنخفضة # z # احتمالية منخفضة جدًا للبيانات أقل من هذه الدرجة # z #. يوضح الشكل أدناه احتمال # z # -score أقل من # -2.5 #.

الاحتمال لهذا هو # 0.62٪ # ولاحظ أنه إذا انخفض # z # -score أكثر ، فإن المنطقة الواقعة تحت المنحنى تنخفض والاحتمال ينخفض ​​أكثر.


مراجع

كاسيوبو ، جي تي ، وأمبير بيتي ، آر إي (1982). الحاجة للإدراك. مجلة الشخصية وعلم النفس الاجتماعي ، 42, 116–131.

Nosek، B. A.، Greenwald، A.G، & amp Banaji، M.R (2006). اختبار الارتباط الضمني في سن السابعة: مراجعة منهجية ومفاهيمية. في JA Bargh (محرر) ، علم النفس الاجتماعي واللاوعي: آلية العمليات العقلية العليا (ص 265 - 292). لندن ، إنجلترا: مطبعة علم النفس.

بيتي ، آر إي ، برينول ، بي ، لويرش ، سي ، وأم مكاسلين ، إم جي (2009). الحاجة للإدراك. في M.R Leary & amp R. H.Hoyle (محرران) ، كتيب الفروق الفردية في السلوك الاجتماعي (ص 318 - 329). نيويورك ، نيويورك: مطبعة جيلفورد.


ما هو تقلب معدل ضربات القلب؟

تقلب معدل ضربات القلب هو قياس الجهاز العصبي اللاإرادي (ANS) الذي يُعتقد إلى حد كبير أنه أحد أفضل المقاييس الموضوعية للقوة البدنية وتحديد مدى استعداد الجسم لأداء أي إجراء.

HRV هو حرفيا الفرق في الوقت بين دقات القلب. لذلك ، إذا كان معدل ضربات القلب 60 نبضة في الدقيقة ، فهو في الواقع لا ينبض مرة واحدة في الثانية. خلال تلك الدقيقة يمكن أن يكون هناك 0.9 ثانية بين دقاتين ، على سبيل المثال ، و 1.15 ثانية بين دقاتين أخريين. وكلما زاد هذا الاختلاف ، زاد "استعداد" الجسم للتصرف على مستوى أعلى.

ما هو تقلب معدل ضربات القلب الطبيعي؟

يمكن أن يتراوح معدل ضربات القلب القياسي للبالغين في أي مكان من أقل من 20 إلى أكثر من 200 مللي ثانية. أفضل طريقة لمعرفة مستوى HRV الطبيعي لديك هي استخدام وحدة يمكن ارتداؤها تقيس HRV في إعداد مضبوط مثل النوم وإنشاء خط أساسي في غضون بضعة أسابيع.

يختلف معدل ضربات القلب لكل شخص ، لذا لا تقارن & # 8217t بالآخرين ، وبدلاً من ذلك ، قم بقياس HRV الخاص بك إلى متوسط ​​الأرقام الخاصة بك. من الطبيعي جدًا ملاحظة الاختلافات الموسمية في معدل ضربات القلب كل يوم.

لاحظ أيضًا أن هناك عوامل مختلفة تؤثر على ANS لديك والتي تؤثر على HRV الخاص بك

تقلب معدل ضربات القلب منخفض

بشكل عام ، يشير انخفاض معدل ضربات القلب (أو اختلاف أقل في ضربات القلب) إلى أن جسمك يتعرض لضغط لسبب ما قد يكون بسبب التمارين أو الإجراءات النفسية أو أي ضغوط خارجية وداخلية أخرى.

أسباب انخفاض معدل ضربات القلب

ترجع أسباب تقلب معدل ضربات القلب المنخفض كما هو مذكور أعلاه إلى العديد من الأسباب وعادةً ما يكون ذلك بسبب المواقف التالية

  • ممارسة
  • الظروف النفسية
  • الضغوطات الخارجية
  • الضغوطات الداخلية

بشكل عام ، في حالة الراحة ، يكون انخفاض معدل ضربات القلب غير مواتٍ ، ولكن عندما يكون الجسم في حالة نشطة ، يكون معدل ضربات القلب المنخفض مناسبًا.

حتى التقلبات المنخفضة في معدل ضربات القلب يمكن أن تكون أيضًا بسبب الإجهاد حيث أن تقلب معدل ضربات القلب والضغط مرتبطان ببعضهما البعض. في كثير من الأحيان ، يقل تقلب معدل ضربات القلب في الإجهاد بغض النظر عن مصدره وكيف يكون.

ترتبط أيضًا الروابط المتشابهة بين HRV وقلق الإجهاد وتقلب معدل ضربات القلب. لقد وجدت الدراسات أن القلق يؤدي إلى انخفاض معدل ضربات القلب.

كيفية زيادة تقلب معدل ضربات القلب؟

هناك العديد من الطرق التي يمكنك من خلالها زيادة تقلب معدل ضربات القلب مثل

  • تمارين الأيروبيك
  • تمارين التنفس أو على سبيل المثال مجرد التنفس الثقيل
  • تأمل
  • العلاج بالحرارة الساخنة
  • العلاج بالحرارة الباردة
  • المكملات

تقلب معدل ضربات القلب مرتفع

يشير ارتفاع معدل ضربات القلب (أو الاختلافات المتفوقة بين دقات القلب) بشكل عام إلى أن الجسم لديه قدرة أقوى على التعامل مع الإجهاد أو أنه يتعافى بقوة من الإجهاد المتراكم سابقًا.

في حالة الراحة ، يكون معدل ضربات القلب المرتفع مناسبًا ، وعادة ما يكون ارتفاع معدل ضربات القلب في حالة نشطة غير موات.

أسباب ارتفاع معدل ضربات القلب

من المعروف أن ارتفاع معدل ضربات القلب هو علامة على صحة القلب. وجدت معظم الدراسات أن ارتفاع معدل ضربات القلب يرتبط بانخفاض معدلات المراضة والوفيات وتعزيز الرفاهية النفسية ونوعية الحياة الجيدة.

في كثير من الأحيان ، يرجع السبب الأكثر شيوعًا لتقلب معدل ضربات القلب المرتفع إلى الضغوطات المستمرة منخفضة الدرجة. تؤدي هذه الضغوطات على المدى القصير إلى ارتفاع معدل ضربات القلب حيث يبذل الجسم جهودًا مستمرة للتعافي من الموقف.

كيف تحافظ على النطاق الطبيعي لتقلب معدل ضربات القلب؟

على الرغم من أن العوامل الوراثية لها دور كبير في هذه المسألة ، يمكن للمرء الحفاظ على النطاق الطبيعي لتقلب معدل ضربات القلب من خلال الحفاظ على صحة جيدة ، والالتزام بنظام اللياقة البدنية ، وإدارة الإجهاد ، واتباع طرق التعافي مثل التأمل. كقاعدة إبهامية ، فإن الحفاظ على حياة خالية من الإجهاد هو القاعدة الأساسية لنطاق طبيعي من HRV.

على الرغم من أن نطاق التقلب الدقيق لمعدل ضربات القلب يعد أمرًا صعبًا للإجابة عليه مع العلم أنه أمر جيد حيث يمكنك أن تكون على دراية بحالتك الصحية من خلال تتبع HRV.

Sudheendra هو مدون عاطفي لمدة 8 سنوات ويحمل شهادة في الصحافة والاتصال الجماهيري. تركز كتاباته بشكل خاص على الصحة والطب والنظام الغذائي ونمط الحياة. بالنسبة له ، كل ما يربط ويتعلق بالصحة والعالم الطبي يغريه. تهدف كتاباته إلى تثقيف الناس ليس فقط من خلال تقديم الحقائق ولكن عن طريق غرس اللمسة الإنسانية.


الاستنتاجات

ألفا هو مفهوم مهم في تقييم التقييمات والاستبيانات. من الضروري أن يقوم المقيمون والباحثون بتقدير هذه الكمية لإضافة صحة ودقة لتفسير بياناتهم. ومع ذلك ، فقد تم الإبلاغ عن ألفا في كثير من الأحيان بطريقة غير نقدية وبدون فهم وتفسير كافيين. لقد حاولنا في هذه الافتتاحية شرح الافتراضات الكامنة وراء حساب ألفا ، والعوامل التي تؤثر على حجمها والطرق التي يمكن من خلالها تفسير قيمتها. نأمل أن يكون المحققون في المستقبل أكثر أهمية عند الإبلاغ عن قيم ألفا في دراساتهم.


9 إجابات 9

لا أستطيع التفكير في المعنى البديهي لمقياس F ، لأنه مجرد مقياس مشترك. ما هو أكثر بديهية من F-mesure ، بالطبع ، هو الدقة والتذكر.

لكن باستخدام قيمتين ، غالبًا لا يمكننا تحديد ما إذا كانت إحدى الخوارزميات متفوقة على أخرى. على سبيل المثال ، إذا كانت إحدى الخوارزميات تتمتع بدقة أعلى ولكن استدعاء أقل من الخوارزمية الأخرى ، فكيف يمكنك معرفة الخوارزمية الأفضل؟

إذا كان لديك هدف محدد في ذهنك مثل "الدقة هي الملك. لا أهتم كثيرًا بالاستدعاء ، فلا توجد مشكلة. الدقة العالية هي الأفضل. ولكن إذا لم يكن لديك مثل هذا الهدف القوي ، فستحتاج إلى مقياس مشترك. هذا مقياس F. باستخدامه ، ستقارن بعض الدقة وبعض الاسترجاع.

غالبًا ما يتم رسم منحنى ROC يوضح مقياس F. قد تجد هذه المقالة مثيرة للاهتمام لأنها تحتوي على شرح لعدة مقاييس بما في ذلك منحنيات ROC: http://binf.gmu.edu/mmasso/ROC101.pdf

تختلف أهمية درجة F1 بناءً على السيناريو. لنفترض أن المتغير المستهدف هو تسمية ثنائية.

  • فئة متوازنة: في هذه الحالة ، يمكن تجاهل درجة F1 بشكل فعال ، ومعدل التصنيف الخاطئ هو المفتاح.
  • فئة غير متوازنة ، ولكن كلا الصنفين مهمان: إذا كان توزيع الصنف منحرفًا بدرجة كبيرة (مثل 80:20 أو 90:10) ، فيمكن للمصنف الحصول على معدل تصنيف خاطئ منخفض ببساطة عن طريق اختيار فئة الأغلبية. في مثل هذه الحالة ، سأختار المصنف الذي يحصل على درجات عالية في F1 في كلا الفئتين ، بالإضافة إلى معدل تصنيف خاطئ منخفض. يجب التغاضي عن المصنف الذي يحصل على درجات منخفضة في F1.
  • فئة غير متوازنة ولكن فئة واحدة إذا كانت أهم من الأخرى. على سبيل المثال في اكتشاف الاحتيال ، من المهم تصنيف مثيل بشكل صحيح على أنه احتيالي ، بدلاً من تصنيف مثيل غير احتيالي. في هذه الحالة ، سأختار المصنف الذي حصل على درجة F1 جيدة فقط في الصف المهم. تذكر أن درجة F1 متاحة لكل فصل.

مقياس F له معنى بديهي. يخبرك بمدى دقة المصنف الخاص بك (عدد الحالات التي يصنفها بشكل صحيح) ، بالإضافة إلى مدى قوته (لا يفوتك عددًا كبيرًا من الحالات).

مع الدقة العالية والاسترجاع المنخفض ، يكون المصنف دقيقًا للغاية ، لكنه يفتقد عددًا كبيرًا من الحالات التي يصعب تصنيفها. هذا ليس مفيد جدا.

ألق نظرة على هذا الرسم البياني. تجاهل الغرض الأصلي منه.

نحو اليمين ، تحصل على دقة عالية ، لكن استدعاء منخفض. إذا قمت فقط بتحديد المثيلات ذات الدرجة أعلى من 0.9 ، فستكون مثيلاتي المصنفة دقيقة للغاية ، ومع ذلك سأفقد عددًا كبيرًا من الحالات. تشير التجارب إلى أن النقطة الجيدة هنا تقع حول 0.76 ، حيث يكون مقياس F هو 0.87.

مقياس F هو الوسيلة التوافقية للدقة والاستدعاء. في معظم الحالات ، لديك مفاضلة بين الدقة والاستدعاء. إذا قمت بتحسين المصنف الخاص بك لزيادة أحدهما وإزعاج الآخر ، فإن المتوسط ​​التوافقي ينخفض ​​بسرعة. ومع ذلك ، يكون الأمر أعظم عندما تتساوى الدقة والتذكر.

بالنظر إلى مقاييس F من 0.4 و 0.8 للمصنفات الخاصة بك ، يمكنك أن تتوقع أن تكون هذه حيث تم تحقيق القيم القصوى عند الموازنة بين الدقة مقابل الاسترجاع.

للإشارة المرئية ، ألق نظرة على هذا الشكل من ويكيبيديا:

مقياس F هو ح, أ و ب أذكر والدقة. يمكنك زيادة أحدهما ، ولكن بعد ذلك ينخفض ​​الآخر.

بدقة على المحور y والاستدعاء على المحور x ، يكون ميل منحنى المستوى $ F _ < beta> $ عند (1، 1) هو $ -1 / beta ^ 2 $.

بالنظر إلى $ P = frac$ و $ R = frac$ ، دع $ alpha $ هو نسبة تكلفة السلبيات الزائفة إلى الإيجابيات الزائفة. إذن التكلفة الإجمالية للخطأ تتناسب مع $ alpha frac <1-R> + فارك <1-P>

إذن منحدر منحنى المستوى عند (1، 1) هو $ - alpha $. لذلك ، بالنسبة إلى النماذج الجيدة ، فإن استخدام $ F _ < beta> $ يعني أنك تعتبر السلبيات الزائفة $ beta ^ 2 $ أكثر تكلفة من الإيجابيات الخاطئة.

صيغة قياس F (F1 ، مع بيتا = 1) هي نفس الصيغة التي تعطي المقاومة المكافئة المكونة من مقاومتين موضوعتين بالتوازي في الفيزياء (نسيان العامل 2).

قد يمنحك هذا تفسيراً محتملاً ، ويمكنك التفكير في كل من المقاومة الإلكترونية أو الحرارية. سيحدد هذا القياس قياس F على أنه المقاومة المكافئة التي تشكلها الحساسية والدقة الموضوعة بالتوازي.

بالنسبة إلى مقياس F ، يكون الحد الأقصى الممكن هو 1 ، وستفقد المقاومة بمجرد أن يفقد أحدهما المقاومة أيضًا (وهذا يعني أيضًا الحصول على قيمة أقل من 1). إذا كنت تريد أن تفهم بشكل أفضل هذه الكمية وديناميكيتها ، فكر في الظاهرة الفيزيائية. على سبيل المثال ، يبدو أن مقياس F & lt = max (حساسية ، دقة).

يُنظر إلى أقرب معنى بديهي لدرجة f1 على أنه وسيلة الاسترجاع والدقة. دعنا نوضحها لك:

في مهمة التصنيف ، قد تخطط لبناء مصنف بدقة عالية و اعد الاتصال. على سبيل المثال ، المصنف الذي يخبرك ما إذا كان الشخص صادقًا أم لا.

من أجل الدقة ، يمكنك عادةً تحديد عدد الأشخاص الشرفاء في مجموعة معينة بدقة. في هذه الحالة ، عندما تهتم بالدقة العالية ، فإنك تفترض أنه يمكنك إساءة تصنيف الشخص الكاذب على أنه صادق ولكن ليس كثيرًا. بعبارة أخرى ، هنا تحاول تمييز الكاذب من الصادق كمجموعة كاملة.

ومع ذلك ، للتذكير ، ستشعر بالقلق حقًا إذا كنت تعتقد أن الشخص الكاذب سيكون صادقًا. بالنسبة لك ، ستكون هذه خسارة كبيرة وخطأ كبير ولن ترغب في تكرارها مرة أخرى. أيضًا ، لا بأس إذا صنفت شخصًا صادقًا على أنه كاذب ، لكن يجب ألا يدعي نموذجك أبدًا (أو في الغالب ألا يدعي) أن الشخص الكاذب صادق. بعبارة أخرى ، أنت هنا تركز على فئة معينة وتحاول ألا تخطئ في ذلك.

الآن ، لنأخذ الحالة التي تريد أن يقوم النموذج الخاص بك (1) بتحديدها بدقة من الكاذب (الدقة) (2) تحديد كل شخص من كلا الفئتين (تذكر). مما يعني أنك ستختار النموذج الذي سيعمل بشكل جيد على كلا المقياسين.

ستحاول نموذج قرار الاختيار بعد ذلك تقييم كل نموذج بناءً على متوسط ​​المقياسين. F-Score هو أفضل ما يمكن أن يصف هذا. دعنا نلقي نظرة على الصيغة:

كما ترى ، كلما زاد الاسترجاع و الدقة ، كلما زادت درجة F.


صلاحية

الصلاحية مدى تمثل الدرجات على مقياس ما المتغير أو البناء المقصود منها. الصدق هو حكم يستند إلى الأدلة المتاحة. هي مدى تمثيل الدرجات من مقياس ما المتغير المقصود منها. لكن كيف يصدر الباحثون هذا الحكم؟ لقد نظرنا بالفعل في أحد العوامل التي أخذوها في الاعتبار - الموثوقية. عندما يكون للمقياس موثوقية اختبار-إعادة اختبار جيدة واتساق داخلي ، يجب أن يكون الباحثون أكثر ثقة في أن الدرجات تمثل ما يفترض بهم. ومع ذلك ، يجب أن يكون هناك المزيد ، لأن المقياس يمكن أن يكون موثوقًا للغاية ولكن ليس له أي صلاحية على الإطلاق. كمثال سخيف ، تخيل شخصًا يعتقد أن طول إصبع السبابة لدى الناس يعكس تقديرهم لذاتهم ، وبالتالي يحاول قياس احترام الذات من خلال إمساك المسطرة بأصابع السبابة. على الرغم من أن هذا الإجراء سيكون له موثوقية اختبار-إعادة اختبار جيدة للغاية ، إلا أنه لن يكون له أي صلاحية على الإطلاق. حقيقة أن إصبع السبابة لشخص ما أطول بمقدار سنتيمتر واحد من إصبع آخر لا يشير إلى أي شيء عن الشخص الذي يتمتع بتقدير أعلى لذاته.

عادةً ما تقسم العروض التقديمية للصلاحية في الكتب المدرسية إلى عدة "أنواع" متميزة. لكن الطريقة الجيدة لتفسير هذه الأنواع هي أنها أنواع أخرى من الأدلة - بالإضافة إلى الموثوقية - التي يجب أن تؤخذ في الاعتبار عند الحكم على صحة الإجراء. هنا نأخذ في الاعتبار أربعة أنواع أساسية: صلاحية الوجه ، وصحة المحتوى ، وصلاحية المعيار ، والصلاحية التمييزية.


ما هو تقلب معدل ضربات القلب؟

تقلب معدل ضربات القلب هو قياس الجهاز العصبي اللاإرادي (ANS) الذي يُعتقد إلى حد كبير أنه أحد أفضل المقاييس الموضوعية للقوة البدنية وتحديد مدى استعداد الجسم لأداء أي إجراء.

HRV هو حرفيا الفرق في الوقت بين دقات القلب. لذا ، إذا كان معدل ضربات القلب 60 نبضة في الدقيقة ، فهو في الواقع لا ينبض مرة واحدة في الثانية. خلال تلك الدقيقة يمكن أن يكون هناك 0.9 ثانية بين دقاتين ، على سبيل المثال ، و 1.15 ثانية بين دقاتين أخريين. وكلما زاد هذا الاختلاف ، زاد "استعداد" الجسم للتصرف على مستوى أعلى.

ما هو تقلب معدل ضربات القلب الطبيعي؟

يمكن أن يتراوح معدل ضربات القلب القياسي للبالغين في أي مكان من أقل من 20 إلى أكثر من 200 مللي ثانية. أفضل طريقة لمعرفة مستوى HRV الطبيعي لديك هي استخدام وحدة يمكن ارتداؤها تقيس HRV في إعداد مضبوط مثل النوم وإنشاء خط أساسي في غضون بضعة أسابيع.

يختلف معدل ضربات القلب لكل شخص ، لذا لا تقارن & # 8217t بالآخرين ، وبدلاً من ذلك ، قم بقياس HRV الخاص بك إلى متوسط ​​الأرقام الخاصة بك. من الطبيعي جدًا ملاحظة الاختلافات الموسمية في HRV يوميًا.

لاحظ أيضًا أن هناك عوامل مختلفة تؤثر على ANS لديك والتي تؤثر على HRV الخاص بك

تقلب معدل ضربات القلب منخفض

بشكل عام ، يشير انخفاض معدل ضربات القلب (أو اختلاف أقل في ضربات القلب) إلى أن جسمك يتعرض لضغط لسبب ما قد يكون بسبب التمارين أو الإجراءات النفسية أو أي ضغوط خارجية وداخلية أخرى.

أسباب انخفاض معدل ضربات القلب

ترجع أسباب تقلب معدل ضربات القلب المنخفض كما هو مذكور أعلاه إلى العديد من الأسباب وعادة ما تكون بسبب المواقف التالية

  • ممارسة
  • الظروف النفسية
  • الضغوطات الخارجية
  • الضغوطات الداخلية

بشكل عام ، في حالة الراحة ، يكون انخفاض معدل ضربات القلب غير مواتٍ ، ولكن عندما يكون الجسم في حالة نشطة ، يكون معدل ضربات القلب المنخفض مناسبًا.

حتى التقلبات المنخفضة في معدل ضربات القلب يمكن أن تكون أيضًا بسبب الإجهاد لأن تقلب معدل ضربات القلب والضغط مرتبطان ببعضهما البعض. في كثير من الأحيان ، يقل تقلب معدل ضربات القلب في الإجهاد بغض النظر عن مصدره وكيف يكون.

ترتبط أيضًا الروابط المتشابهة بين HRV وقلق الإجهاد وتقلب معدل ضربات القلب. لقد وجدت الدراسات أن القلق يؤدي إلى انخفاض معدل ضربات القلب.

كيفية زيادة تقلب معدل ضربات القلب؟

هناك العديد من الطرق التي يمكنك من خلالها زيادة تقلب معدل ضربات القلب مثل

  • تمارين الأيروبيك
  • تمارين التنفس أو على سبيل المثال مجرد التنفس الثقيل
  • تأمل
  • العلاج بالحرارة الساخنة
  • العلاج بالحرارة الباردة
  • المكملات

تقلب معدل ضربات القلب مرتفع

يشير ارتفاع معدل ضربات القلب (أو الاختلافات المتفوقة بين دقات القلب) بشكل عام إلى أن الجسم لديه قدرة أقوى على التعامل مع الإجهاد أو أنه يتعافى بقوة من الإجهاد المتراكم سابقًا.

في حالة الراحة ، يكون معدل ضربات القلب المرتفع مناسبًا ، وعادة ما يكون ارتفاع معدل ضربات القلب في حالة نشطة غير موات.

أسباب ارتفاع معدل ضربات القلب

من المعروف أن ارتفاع معدل ضربات القلب هو علامة على صحة القلب. وجدت معظم الدراسات أن ارتفاع معدل ضربات القلب يرتبط بانخفاض معدلات المراضة والوفيات وتعزيز الرفاهية النفسية ونوعية الحياة الجيدة.

في كثير من الأحيان ، يرجع السبب الأكثر شيوعًا لتقلب معدل ضربات القلب المرتفع إلى الضغوطات المستمرة منخفضة الدرجة. تؤدي هذه الضغوطات على المدى القصير إلى ارتفاع معدل ضربات القلب حيث يبذل الجسم جهدًا مستمرًا للتعافي من الموقف.

كيف تحافظ على النطاق الطبيعي لتقلب معدل ضربات القلب؟

على الرغم من أن العوامل الوراثية لها دور كبير في هذه المسألة ، يمكن للمرء الحفاظ على النطاق الطبيعي لتقلب معدل ضربات القلب من خلال الحفاظ على صحة جيدة ، والالتزام بنظام اللياقة البدنية ، وإدارة الإجهاد ، واتباع طرق التعافي مثل التأمل. كقاعدة إبهامية ، فإن الحفاظ على حياة خالية من الإجهاد هو القاعدة الأساسية لنطاق طبيعي من HRV.

على الرغم من أن نطاق التقلب الدقيق لمعدل ضربات القلب يعد أمرًا صعبًا للإجابة عليه مع العلم أنه أمر جيد حيث يمكنك أن تكون على دراية بحالتك الصحية من خلال تتبع HRV.

Sudheendra هو مدون عاطفي لمدة 8 سنوات ويحمل شهادة في الصحافة والاتصال الجماهيري. تركز كتاباته بشكل خاص على الصحة والطب والنظام الغذائي ونمط الحياة. بالنسبة له ، كل ما يربط ويتعلق بالصحة والعالم الطبي يغريه. تهدف كتاباته إلى تثقيف الناس ليس فقط من خلال تقديم الحقائق ولكن عن طريق غرس اللمسة الإنسانية.


الحلول الصحية من رعاتنا

فادي ، R. "تصفية الكرياتينين." ميدسكيب. 7 مايو 2013. & lth https: //emedicine.medscape.com/article/2117892-overview>

أعلى مقالات اختبار الدم الكرياتينين ذات الصلة

ارتفاع ضغط الدم (ارتفاع ضغط الدم)

ارتفاع ضغط الدم هو مرض يرتفع فيه الضغط داخل شرايين الجسم. يعاني حوالي 75 مليون شخص في الولايات المتحدة من ارتفاع ضغط الدم (1 من كل 3 بالغين) ، ونصفهم فقط قادر على إدارته. كثير من الناس لا يعرفون أنهم مصابون بارتفاع ضغط الدم لأنه غالبًا لا توجد به علامات أو أعراض تحذيرية.

الضغط الانقباضي والانبساطي هما القراءات التي يقاس فيها ضغط الدم. أصدرت الكلية الأمريكية لأمراض القلب إرشادات جديدة لارتفاع ضغط الدم في عام 2017. وتنص الإرشادات الآن على أن ضغط الدم الطبيعي هو 120/80 ملم زئبق. إذا كان أي من هذين الرقمين أعلى ، فأنت مصاب بارتفاع ضغط الدم.

تعرف الأكاديمية الأمريكية لأمراض القلب ارتفاع ضغط الدم بشكل مختلف قليلاً. يعتبر AAC 130/80 ملم زئبق. أو أكبر (أي رقم) المرحلة 1 من ارتفاع ضغط الدم. يعتبر ارتفاع ضغط الدم في المرحلة الثانية 140/90 ملم زئبق. أو أكبر.

إذا كنت تعاني من ارتفاع ضغط الدم ، فأنت معرض لخطر الإصابة بأمراض تهدد الحياة مثل السكتة الدماغية والنوبات القلبية.


الموثوقية [عدل | تحرير المصدر]

الموثوقية: 1) تجزئة نصف الموثوقية: تم إجراء اختبارات الموثوقية الداخلية لكل من الاستبيان والنماذج الموسعة على مقدمي الرعاية للأطفال دون سن 19. استمارة المسح قسمت نصف المعاملات للفئات العمرية الأقل من 3 سنوات تراوحت من .82 إلى .95 للفئة العمرية. المجالات و .96 إلى .98 لمركب السلوك التكيفي ، وتراوحت معاملات تقسيم النموذج الموسع من .90 إلى .97 للنطاقات و .98 إلى .99 للمركب. (2) موثوقية إعادة الاختبار - الاختبار (متوسط ​​17 يومًا بين الاختبارات): معاملات موثوقية نموذج الاستطلاع لمقدمي الرعاية للأطفال الذين تتراوح أعمارهم بين 6 أشهر وسنتين ، وتراوحت 11 شهرًا من .78 إلى .92 للمجالات و 90. لمركب السلوك التكيفي. لم تكن هناك اختبارات موثوقية للاختبار وإعادة الاختبار للنموذج الموسع. (3) Interrater reliability: The Survey Form interrater reliability coefficients, with a mean of 8 days between the interviews of caregivers of children ages 6 months to 18 years, 11 months, ranged from .62 to .78 for the Domains and was .74 for the Adaptive Behavior Composite. There were no interrater reliability tests for the Expanded Form.

Internal consistency: Survey Form: Split half means for Domains .83 to .90 for Adaptive Behavior Composite .94 Expanded Form: Split half means for Domains .91 to .95 for Adaptive Behavior Composite .97 Classroom Edition: Coefficient Alpha means for Domains .80 to .95 for Adaptive Behavior Composite .98

Test - Retest:Survey Form: Means for Domains .81 to .86 for Adaptive Behavior Composite .88 (N=484)

Interrater: urvey Form: Correlations between two different interviewers, for Domains .62 to .78 for Adaptive Behavior Composite .74 (N=160)

The manual provides extensive data regarding reliability


صلاحية

Validity The extent to which scores on a measure represent the variable or construct they are intended to. Validity is a judgment based on the available evidence. is the extent to which the scores from a measure represent the variable they are intended to. But how do researchers make this judgment? We have already considered one factor that they take into account—reliability. When a measure has good test-retest reliability and internal consistency, researchers should be more confident that the scores represent what they are supposed to. There has to be more to it, however, because a measure can be extremely reliable but have no validity whatsoever. As an absurd example, imagine someone who believes that people’s index finger length reflects their self-esteem and therefore tries to measure self-esteem by holding a ruler up to people’s index fingers. Although this measure would have extremely good test-retest reliability, it would have absolutely no validity. The fact that one person’s index finger is a centimeter longer than another’s would indicate nothing about which one had higher self-esteem.

Textbook presentations of validity usually divide it into several distinct “types.” But a good way to interpret these types is that they are other kinds of evidence—in addition to reliability—that should be taken into account when judging the validity of a measure. Here we consider four basic kinds: face validity, content validity, criterion validity, and discriminant validity.


9 Answers 9

I cannot think of an intuitive meaning of the F measure, because it's just a combined metric. What's more intuitive than F-mesure, of course, is precision and recall.

But using two values, we often cannot determine if one algorithm is superior to another. For example, if one algorithm has higher precision but lower recall than other, how can you tell which algorithm is better?

If you have a specific goal in your mind like 'Precision is the king. I don't care much about recall', then there's no problem. Higher precision is better. But if you don't have such a strong goal, you will want a combined metric. That's F-measure. By using it, you will compare some of precision and some of recall.

The ROC curve is often drawn stating the F-measure. You may find this article interesting as it contains explanation on several measures including ROC curves: http://binf.gmu.edu/mmasso/ROC101.pdf

The importance of the F1 score is different based on the scenario. Lets assume the target variable is a binary label.

  • Balanced class: In this situation, the F1 score can effectively be ignored, the mis-classification rate is key.
  • Unbalanced class, but both classes are important: If the class distribution is highly skewed (such as 80:20 or 90:10), then a classifier can get a low mis-classification rate simply by choosing the majority class. In such a situation, I would choose the classifier that gets high F1 scores on both classes, as well as low mis-classification rate. A classifier that gets low F1-scores should be overlooked.
  • Unbalanced class, but one class if more important that the other. For e.g. in Fraud detection, it is more important to correctly label an instance as fraudulent, as opposed to labeling the non-fraudulent one. In this case, I would pick the classifier that has a good F1 score only on the important class. Recall that the F1-score is available per class.

F-measure has an intuitive meaning. It tells you how precise your classifier is (how many instances it classifies correctly), as well as how robust it is (it does not miss a significant number of instances).

With high precision but low recall, you classifier is extremely accurate, but it misses a significant number of instances that are difficult to classify. This is not very useful.

Take a look at this histogram. Ignore its original purpose.

Towards the right, you get high precision, but low recall. If I only select instances with a score above 0.9, my classified instances will be extremely precise, however I will have missed a significant number of instances. Experiments indicate that the sweet spot here is around 0.76, where the F-measure is 0.87.

The F-measure is the harmonic mean of your precision and recall. In most situations, you have a trade-off between precision and recall. If you optimize your classifier to increase one and disfavor the other, the harmonic mean quickly decreases. It is greatest however, when both precision and recall are equal.

Given F-measures of 0.4 and 0.8 for your classifiers, you can expect that these where the maximum values achieved when weighing out precision against recall.

For visual reference take a look at this figure from Wikipedia:

The F-measure is ح, أ و ب are recall and precision. You can increase one, but then the other decreases.

With precision on the y-axis and recall on the x-axis, the slope of the level curve $F_<eta>$ at (1, 1) is $-1/eta^2$.

Given $P = frac$ and $R = frac$, let $alpha$ be the ratio of the cost of false negatives to false positives. Then total cost of error is proportional to $alpha frac<1-R> + frac<1-P>

.$ So the slope of the level curve at (1, 1) is $-alpha$. Therefore, for good models using the $F_<eta>$ implies you consider false negatives $eta^2$ times more costly than false positives.

The formula for F-measure (F1, with beta=1) is the same as the formula giving the equivalent resistance composed of two resistances placed in parallel in physics (forgetting about the factor 2).

This could give you a possible interpretation, and you can think about both electronic or thermal resistances. This analogy would define F-measure as the equivalent resistance formed by sensitivity and precision placed in parallel.

For F-measure, the maximum possible is 1, and you loose resistance as soon as one among he two looses resistance as well (that is too say, get a value below 1). If you want to understand better this quantity and its dynamic, think about the physic phenomenon. For example, it appears that the F-measure <= max(sensitivity, precision).

The closest intuitive meaning of the f1-score is being perceived as the mean of the recall and the precision. Let's clear it for you :

In a classification task, you may be planning to build a classifier with high precision و recall. For example, a classifier that tells if a person is honest or not.

For precision, you are able to usually tell accurately how many honest people out there in a given group. In this case, when caring about high precision, you assume that you can misclassify a liar person as honest but not often. In other words, here you are trying to identify liar from honest as a whole group.

However, for recall, you will be really concerned if you think a liar person to be honest. For you, this will be a great loss and a big mistake and you don't want to do it again. Also, it's okay if you classified someone honest as a liar but your model should never (or mostly not to) claim a liar person as honest. In other words, here you are focusing on a specific class and you are trying not to make a mistake about it.

Now, let take the case where you want your model to (1) precisely identify honest from a liar (precision) (2) identify each person from both classes (recall). Which means that you will select the model that will perform well on both metric.

You model selection decision will then try to evaluate each model based on the mean of the two metrics. F-Score is the best one that can describe this. Let's have a look on the formula:

As you see, the higher recall و precision, the higher the F-score.


الاستنتاجات

Alpha is an important concept in the evaluation of assessments and questionnaires. It is mandatory that assessors and researchers should estimate this quantity to add validity and accuracy to the interpretation of their data. Nevertheless alpha has frequently been reported in an uncritical way and without adequate understanding and interpretation. In this editorial we have attempted to explain the assumptions underlying the calculation of alpha, the factors influencing its magnitude and the ways in which its value can be interpreted. We hope that investigators in future will be more critical when reporting values of alpha in their studies.


مراجع

Cacioppo, J. T., & Petty, R. E. (1982). الحاجة للإدراك. Journal of Personality and Social Psychology, 42, 116–131.

Nosek, B. A., Greenwald, A. G., & Banaji, M. R. (2006). The Implicit Association Test at age 7: A methodological and conceptual review. In J. A. Bargh (Ed.), Social psychology and the unconscious: The automaticity of higher mental processes (pp. 265–292). London, England: Psychology Press.

Petty, R. E, Briñol, P., Loersch, C., & McCaslin, M. J. (2009). الحاجة للإدراك. In M. R. Leary & R. H. Hoyle (Eds.), Handbook of individual differences in social behavior (pp. 318–329). نيويورك ، نيويورك: مطبعة جيلفورد.


مصداقية

مصداقية refers to the consistency of a measure. Psychologists consider three types of consistency: over time (test-retest reliability), across items (internal consistency), and across different researchers (inter-rater reliability).

موثوقية الاختبار وإعادة الاختبار

When researchers measure a construct that they assume to be consistent across time, then the scores they obtain should also be consistent across time. Test-retest reliability is the extent to which this is actually the case. For example, intelligence is generally thought to be consistent across time. A person who is highly intelligent today will be highly intelligent next week. This means that any good measure of intelligence should produce roughly the same scores for this individual next week as it does today. Clearly, a measure that produces highly inconsistent scores over time cannot be a very good measure of a construct that is supposed to be consistent.

Assessing test-retest reliability requires using the measure on a group of people at one time, using it again on the نفس group of people at a later time, and then looking at test-retest correlation between the two sets of scores. This is typically done by graphing the data in a scatterplot and computing Pearson’s ص. Figure 5.2 shows the correlation between two sets of scores of several university students on the Rosenberg Self-Esteem Scale, administered two times, a week apart. Pearson’s r for these data is +.95. In general, a test-retest correlation of +.80 or greater is considered to indicate good reliability.

Figure 5.2 Test-Retest Correlation Between Two Sets of Scores of Several College Students on the Rosenberg Self-Esteem Scale, Given Two Times a Week Apart

Again, high test-retest correlations make sense when the construct being measured is assumed to be consistent over time, which is the case for intelligence, self-esteem, and the Big Five personality dimensions. But other constructs are not assumed to be stable over time. The very nature of mood, for example, is that it changes. So a measure of mood that produced a low test-retest correlation over a period of a month would not be a cause for concern.

الاتساق الداخلي

A second kind of reliability is internal consistency, which is the consistency of people’s responses across the items on a multiple-item measure. In general, all the items on such measures are supposed to reflect the same underlying construct, so people’s scores on those items should be correlated with each other. On the Rosenberg Self-Esteem Scale, people who agree that they are a person of worth should tend to agree that that they have a number of good qualities. If people’s responses to the different items are not correlated with each other, then it would no longer make sense to claim that they are all measuring the same underlying construct. This is as true for behavioural and physiological measures as for self-report measures. For example, people might make a series of bets in a simulated game of roulette as a measure of their level of risk seeking. This measure would be internally consistent to the extent that individual participants’ bets were consistently high or low across trials.

Like test-retest reliability, internal consistency can only be assessed by collecting and analyzing data. One approach is to look at a split-half correlation. This involves splitting the items into two sets, such as the first and second halves of the items or the even- and odd-numbered items. Then a score is computed for each set of items, and the relationship between the two sets of scores is examined. For example, Figure 5.3 shows the split-half correlation between several university students’ scores on the even-numbered items and their scores on the odd-numbered items of the Rosenberg Self-Esteem Scale. بيرسون ص for these data is +.88. A split-half correlation of +.80 or greater is generally considered good internal consistency.

Figure 5.3 Split-Half Correlation Between Several College Students’ Scores on the Even-Numbered Items and Their Scores on the Odd-Numbered Items of the Rosenberg Self-Esteem Scale

Perhaps the most common measure of internal consistency used by researchers in psychology is a statistic called Cronbach’s α (the Greek letter alpha). Conceptually, α is the mean of all possible split-half correlations for a set of items. For example, there are 252 ways to split a set of 10 items into two sets of five. Cronbach’s α would be the mean of the 252 split-half correlations. Note that this is not how α is actually computed, but it is a correct way of interpreting the meaning of this statistic. Again, a value of +.80 or greater is generally taken to indicate good internal consistency.

موثوقية Interrater

Many behavioural measures involve significant judgment on the part of an observer or a rater. Inter-rater reliability is the extent to which different observers are consistent in their judgments. For example, if you were interested in measuring university students’ social skills, you could make video recordings of them as they interacted with another student whom they are meeting for the first time. Then you could have two or more observers watch the videos and rate each student’s level of social skills. To the extent that each participant does in fact have some level of social skills that can be detected by an attentive observer, different observers’ ratings should be highly correlated with each other. Inter-rater reliability would also have been measured in Bandura’s Bobo doll study. In this case, the observers’ ratings of how many acts of aggression a particular child committed while playing with the Bobo doll should have been highly positively correlated. Interrater reliability is often assessed using Cronbach’s α when the judgments are quantitative or an analogous statistic called Cohen’s κ (the Greek letter kappa) when they are categorical.


What does a high and a low z-score mean?

A high #z# -score means a very low probability of data above this #z# -score and a low #z# -score means a very low probability of data below this #z# -score..

تفسير:

A high #z# -score means a very low probability of data above this #z# -score. For example, the figure below shows the probability of #z# -score above #2.6# .

Probability for this is #0.47%# , which is less than half-percent. Note that if #z# -score rises further, area under the curve fall and probability reduces further.

A low #z# -score means a very low probability of data below this #z# -score. The figure below shows the probability of #z# -score below #-2.5# .

Probability for this is #0.62%# and note that if #z# -score falls further, area under the curve falls and probability reduces further.


شاهد الفيديو: RAW2019: تارا هيوز كينيون-استراتيجية تناول ثقافة المخاطر ل.. (أغسطس 2022).