Теорія класичних тестів

Теорія класичних тестів / Експериментальна психологія

Тест a науковий інструмент в тій мірі, в якій він вимірює те, що він має намір, тобто він є дійсним, і він добре вимірює, тобто є точним або надійним. Якщо ми знайдемо інструмент, яким не можна довіряти заходи, які вони надають, оскільки вони час від часу змінюються, коли ми вимірюємо один і той же об'єкт, то скажемо, що він не є надійним. Інструмент, для вимірювання правильно щось, воно повинно бути точним, тому що в іншому випадку, виміряти, що ви вимірюєте, виміряти його неправильно. Отже, бути точним є необхідною, але не достатньою умовою. Крім того, він повинен бути дійсним, тобто, що він точно вимірює, буде те, що він має намір виміряти, і ніщо інше.

Вас також може зацікавити: Теорія відповіді на предмет - програми та тести

Надійність:

Абсолютна та відносна надійність: ми можемо вирішити проблему надійності тесту двома різними способами, хоча на тлі вони співпадають.

Надійність як неточність його вимірювань: Коли суб'єкт відповідає на тест, він отримує емпіричну оцінку, на яку впливає помилка. Якщо помилки не було, суб'єкт отримав би його справжню оцінку. Тест є неточним, тому що емпірична оцінка не відповідає справжньому істинному рахунку. Ця різниця між обома оцінками є помилкою вибірки, похибкою вимірювання. The типова помилка вимірювання буде стандартне відхилення похибок вимірювання. The типова помилка вимірювання вказує абсолютну точність тесту, оскільки дозволяє оцінювати різницю між отриманими вимірюваннями і тією, яка була б отримана, якщо не було помилки.

Надійність як стабільність вимірювань: тест буде більш надійним, чим більш постійними або стабільними будуть результати, які він забезпечує, коли він повторюється. Чим більш стійкими є результати у двох випадках, тим більше співвідношення між ними. Це співвідношення називається коефіцієнт надійності. Це виражає нас не кількість помилки, а узгодженість тесту з самим собою і постійність інформації, яку вона пропонує. The коефіцієнт надійності виражає відносну надійність тесту.

Коефіцієнт надійності та індекс надійності: - Коефіцієнт надійності тесту - співвідношення тесту з самим собою, отримане, наприклад, у двох паралельних формах: rxx. - Індекс точності є співвідношення емпіричних балів тесту та його істинних балів: rxv Показник точності завжди буде більшим, ніж коефіцієнт надійності.

  • Знайдіть кореляцію між тестом і його повторенням: Метод повторення або тест-повторного методу: Він складається з застосування одного і того ж тесту до однієї групи в двох випадках і обчислення кореляції між двома серіями балів. Це співвідношення є коефіцієнтом надійності. Цей метод зазвичай дає більш високий коефіцієнт надійності, ніж коефіцієнт, отриманий за допомогою інших процедур, і може бути забруднений порушуючими факторами.
  • Знайдіть кореляцію між двома паралельними формами тесту: Метод паралельних форм: Підготуйте дві паралельні форми одного і того ж тесту, тобто дві еквівалентні форми, які дають однакову інформацію, і застосовуються до однієї групи суб'єктів. Співвідношення між цими двома формами - коефіцієнт надійності. За допомогою цього методу, не повторюючи одного і того ж випробування, уникаються тривожні джерела надійності повторного тестування.
  • Знайдіть кореляцію між двома паралельними половинами тесту: Метод двох половин: Тест розділений на дві еквівалентні половини і знайдено кореляцію між ними. Це кращий метод, оскільки він простий і ігнорує обмеження попередніх процедур. Ви можете вибрати непарні елементи тесту, скласти одну половину, а парні елементи скласти іншу.

Коефіцієнт надійності та співвідношення паралельних випробувань

The коефіцієнт надійності тесту вказує на частку, яку істинну дисперсію має емпірична дисперсія: graphic33 Коефіцієнт надійності тесту варіює від 0 до 1. Наприклад: якщо кореляція між двома паралельними тестами є rxx´ = 0,80, означає, що 80% дисперсії тесту обумовлено реальною мірою, а решта, тобто 20% дисперсії тесту обумовлена ​​помилкою. The індекс надійності тесту - кореляція між його емпіричними оцінками та індексом надійності його істинних балів = Індекс надійності дорівнює квадратному кореню з коефіцієнта надійності

Після того, як дві паралельні форми тесту були розроблені, процедура дисперсійного аналізу застосовується для перевірки однорідності відхилень і різниці між показниками. Якщо дисперсії є однорідними, то різниця між засобами не є суттєвою і обидві форми будуються з однаковим числом елементів одного типу і психологічного змісту, можна сказати, що вони паралельні. Якщо ні, то вам доведеться їх реформувати, поки вони не з'являться. Відсутність надійності визначається значенням rxx´= 0 4. - Типова похибка вимірювання: Різниця між емпіричним і реальним рахунком - випадкова помилка, що називається похибкою вимірювання. Стандартне відхилення похибок вимірювання називається типовою похибкою вимірювання. The типова помилка вимірювання дозволяє оцінювати абсолютну достовірність тесту, тобто оцінювати, наскільки похибка вимірювання впливає на бал.

Надійність і довжина: Довжина тесту відноситься до кількості його елементів. Надійність залежить від цієї довжини. Якщо тест складається з трьох елементів, суб'єкт може одного разу отримати оцінку 1, а в іншому або паралельно -

З одного випадку до іншого, оцінка змінювалася на одну точку; точка вище трьох - це варіація 33%, висока варіація. Якщо суб'єкти отримують випадкові варіації цього типу, кореляція тесту з самим собою або з двома паралельними формами тесту буде значно зменшена і не може бути високою. Якщо тест набагато довший, якщо у вас, наприклад, 100 пунктів, то суб'єкт може отримати 70 балів за один раз і 67 на паралельній основі. З одного на інший змінилося 3 бали; це відносно невелика дисперсія по відношенню до загального тесту, зокрема 3%. Ці невеликі випадкові зміни такої величини, які відбуваються в оцінках суб'єктів, коли йдуть від однієї форми до паралелі, є відносно неважливими і не зменшуються стільки, скільки перед співвідношенням між ними.

Коефіцієнт надійності буде значно вищим, ніж у попередньому випадку. Рівняння Спірмена-Брауна виражає взаємозв'язок між надійністю і довжиною. Точність тесту дорівнює нулю, коли довжина дорівнює 0, і збільшується по мірі збільшення довжини. Хоча збільшення є відносно меншим, оскільки довжина частини є більшою. Це означає, що точність значно зростає на початку і порівняно менше. Коли довжина прагне до нескінченності, коефіцієнт надійності прагне до

Збільшуючи довжину тесту, його точність зростає, оскільки вона збільшує істинну дисперсію зі швидкістю, вищою за дисперсію помилки. Це означає, що точність тесту зростає, оскільки частка дисперсії внаслідок помилки зменшується. Формула Рулона, як і формула Фланагана і Гутмана, особливо застосовні при розрахунку коефіцієнта надійності методом двох половин. Це формули, які використовуються для розрахунку коефіцієнта надійності.

Надійність і послідовність: Коефіцієнт надійності можна знайти і іншим способом, це так званий коефіцієнт альфа o коефіцієнт узагальнюваності або репрезентативності (Cronbach). Цей альфа-коефіцієнт вказує на точність, з якою деякі елементи вимірюють аспект особистості або поведінки. Вона може бути інтерпретована як: оцінка середньої кореляції всіх можливих елементів у певному аспекті. Міра точності тесту відповідно до його когерентності або внутрішньої узгодженості (взаємозв'язок між її елементами, наскільки тестові елементи все-таки вимірюють) і її довжини. Вказуючи на репрезентативність тесту, тобто на суму, в якій вибірка предметів, що складають її, є репрезентативною для популяції можливих предметів одного типу і психологічного змісту. The коефіцієнт альфа відображає, головним чином, два основних поняття в точності тесту: 1. Взаємозв'язок між її елементами: ступінь, до якої всі вони вимірюють одне і те ж \ t.

Тривалість тесту: при збільшенні кількості випадків вибірки, і якщо систематичні помилки усуваються, вибірка представляє населення краще, ніж витягується, і більш малоймовірно, що випадкова помилка бере участь. Якщо елементи тесту дихотомічні, (так чи ні, 1 або 0, узгодження або незгода, тощо), рівняння альфа-коефіцієнта спрощується, що призводить до рівнянь Кудер-Річардсон (KR20 і KR21). Враховуючи певну кількість елементів, тест буде більш надійним, коли він буде більш однорідним. Альфа-коефіцієнт говорить нам про надійність, оскільки він представляє однорідність і послідовність або внутрішню послідовність елементів тесту.

Стандарти та критерії надійності

Згідно з моделлю простору вибірок предметів, метою тесту є оцінка міри, яка б була отримана, якщо б використовувалися всі елементи у пробному просторі. Ця міра була б істинною оцінкою, до якої реальні вимірювання наближаються більш-менш. Залежно від того, наскільки вибірка елементів корелює з істинними балами, тест більш-менш надійний. У цій моделі центральна матриця кореляцій між усіма елементами у пробному просторі, яка більш безпосередньо наполягає на внутрішній послідовності, а тому, наскільки вона досягається, опосередковано гарантує стабільність..

Лінійна модель паралельних випробувань більше наполягає на стабільності балів, і в тій мірі, в якій вона досягає стабільності, вона опосередковано сприяє внутрішній послідовності. Якщо застосувати тест для встановлення індивідуальних діагнозів і прогнозів, то коефіцієнт надійності повинен бути 0,90. У прогнозах і колективних класифікаціях, це не стільки вимога, хоча й незручно відійти від 0'90 до 0'80.

Іноді в деяких видах тестів, таких як особистісні тести, важко досягти коефіцієнтів більше 0,70. Якщо паралельні форми або паралельні половини застосовуються після більш-менш великого інтервалу, випадкові помилки можуть бути більш численними, ніж ті, що впливають на альфа-коефіцієнт. Це пояснюється тим, що те, що знижує кореляцію, є не тільки випадковими помилками, властивими випробуванню, але і єдиним випадком, які враховують альфа-коефіцієнт, але також впливають на всі помилки, які можуть виникнути в двох різних ситуаціях. , які можуть відрізнятися численними деталями. Отже, коефіцієнт альфа зазвичай більший за інші коефіцієнти.

За винятком коефіцієнта, знайденого шляхом повторення одного і того ж тесту, оскільки існує більша ймовірність, що випадкові помилки першого застосування повторюються у другому, і замість зменшення кореляції між двома, збільшують його. Необхідно забезпечити, щоб друге додаток було повністю незалежним від першого. Якщо ми досягнемо цього, це буде найпростіший і найдешевший метод і доцільно, коли намагатиметься оцінити стабільність балів, особливо протягом тривалих періодів часу і складних тестів. > Далі: дійсність тестів

Ця стаття є суто інформативною, в Інтернет-психології у нас немає факультету, щоб поставити діагноз або рекомендувати лікування. Ми запрошуємо вас звернутися до психолога, щоб звернутися до вашого випадку зокрема.

Якщо ви хочете прочитати більше статей, подібних до Теорія класичних тестів, Ми рекомендуємо Вам увійти до нашої категорії Експериментальна психологія.