XPT Site
Вниз XPT
Главная
Скачать
Читать
Планы
Ссылки
История
О Проекте
Об Авторе
Ваши отзывы

Главная/Материалы/Краткий терминологический словарь по теории педагогических тестов

Краткий терминологический словарь по теории педагогических тестов

Самара 2000

Евсигнеев Андрей Евгеньевич

Анализ задания (item analysis) – процедура для оценки его эффективности в тесте, включающая в себя анализ технологичности формы, соответствия содержанию и статистических характеристик задания (определение корреляции заданий с общим показателем по тесту, факторный анализ заданий, шкалирование заданий или другие виды их статистического оценивания).

Балл (score) (индивидуальный балл, тестовый балл) – количественный показатель выраженности измеряемого свойства у данного испытуемого, получаемый при помощи данного теста.

  • истинный (true score) – гипотетический балл, который получил бы испытуемый, если бы он выполнил все задания из банка заданий для данного теста;
  • необработанный ("сырой") (rawscore) – первичный (не подвергнутый обработке) индивидуальный балл, полученный испытуемым по данному тесту;
  • стандартизованный (standard score) – индивидуальный балл, отражающий степень выраженности измеряемого свойства у испытуемого относительно некоторой нормативной группы;
  • стенайны (stanines) – нормализованный стандартный балл на одномерной шкале ранжирования от -1 до 9.
  • стены (stens) – нормализованный стандартный балл на одномерной шкале ранжирования от 1 до 10.
  • T-показатель (T-score) — стандартизованный балл, имеющий распределение со средним 50 и стандартным отклонением 10.
  • Z-показатель (Z-score) — стандартизованный балл, имеющий распределение со средним» 0 и стандартным отклонением 1.
  • IQ — стандартизованный балл, имеющий распределение со средним 100 и стандартным отклонением 15.
  • шкалированный (scale score) – подвергнутый обработке первичный индивидуальный балл испытуемого после преобразования его в специальную шкалу для данного теста.

Валидность (validity) – комплексная характеристика качества теста, отражающая обоснованность, значимость его результатов, а также пригодность данного теста для целей, заявленных его разработчиками.

  • конструктная (construct validity) – тип валидности, отражающая степень репрезентации исследуемого "педагогического конструкта" - совокупности знаний, умений, навыков - в результатах теста; конструктная валидность теста тем выше, чем больше, результаты тестирования соответствуют теоретической гипотезе о свойствах измеряемой переменной;
  • критериальная (criterion validity) – характеристика теста, отражающая обоснованность, значимость его результатов по сравнению с некоторой внешней переменной и состоящая из конкурентной и прогностической валидности;
  • прогностическая (predictive validity) – характеристика теста, отражающая обоснованность, значимость его результатов по сравнению с некоторой внешней переменной в будущем; измеряется корреляцией результатов тестирования с результатами других тестов или других педагогических измерений, проведенных спустя определенное время и предназначенных для тех же целей;
  • содержательная (content validity) – один из основных видов валидности, отражающей степень репрезентативности содержания тестовых заданий по отношению к области содержания теста;
  • текущая (concurrent validity) – характеристика теста, отражающая обоснованность, значимость его результатов по сравнению с некоторой внешней переменной; измеряется корреляцией результатов тестирования с результатами других тестов или других педагогических измерений, предназначенных для тех же целей.

Выборка (sample) – множество, случайным образом формируемое из генеральной или выборочной совокупности; например, выборка испытуемых или выборка заданий.

Дискриминативность (discriminatory power или item discrimination) (дифференцирующая способность или различающая способность) – способность отдельных заданий теста и теста в целом дифференцировать испытуемых относительно "максимального" и "минимального" результата теста.

Дисперсионный анализ (variance analysis) – статистический метод изучения влияния отдельных переменных на изменчивость изучаемого признака.

Дисперсия (variance) — показатель изменчивости, разброса некоторого множества измерений вокруг арифметического среднего; среднее значение возведенных в квадрат отклонений от арифметического среднего, квадрат стандартного отклонения.

Дистракторы (distracters) – варианты ответов в тестовых заданиях закрытой формы близкие к правильному ответу, но таковыми не являющиеся.

Кривые зависимости "задание-ответ" (item-characteristic curves) – характеристические кривые заданий, отражающие вероятность ответов на задания, предназначенные для измерения некоторых гипотетических свойств или латентных черт испытуемых.

Критериально-ориентированний педагогический тест (criterion-referenced test) – тип тестов, предназначенных для определения уровня обученности испытуемых относительно данной области содержания и (или) данной цели тестирования.

Корреляционная матрица (correlation matrix) - набор значений коэффициента корреляции между переменными, представленный в виде матрицы.

Корреляция (correlation), корреляционный анализ — комплекс методов статистического исследования взаимозависимости между переменными, связанными корреляционными отношениями.

  • бисериальная (biserial correlation) – метод корреляционного анализа отношения переменных, одна из которых измерена в дихотомической шкале наименований, а другая - в интервальной шкале отношений или порядковой шкале (то есть является континуальной).

Коэффициент корреляции — показатель степени взаимозависимости, статистической связи двух переменных; изменяется в пределах от -1 до +1. Значение коэффициента корреляции 0 указывает на возможное отсутствие зависимости, значение +1 свидетельствует о согласованности переменных.

  • дихотомический — показатель связи признаков (переменных) измеряемых по дихотомическим шкалам наименований.
  • Пирсона (Pearson product-moment correlation) — коэффициент корреляции, используемый для континуальных переменных.
  • ранговой корреляции Спирмент (Spearmen's rank-order correlation) — коэффициент корреляции для переменных, измеренных в порядковых (ранговых) шкалах.
  • точечно-бисериальной корреляции (point-biserial correlation) - коэффициент корреляции, применяемый в случае анализа отношения переменных, одна из которых измерена в континуальной шкале, а другая — в строго дихотомической шкале наименований.
  • j  – коэффициент корреляции, используемый в случае, если обе переменные измерены в дихотомической шкале наименований.
  • тетрахормческнм (четырехпольный) (tetrachoric) — коэффициент корреляции, используемый в случае, если обе переменные измерены в континуальных шкалах.

Коэффициент надежности (reliability coefficient) — средняя величина корреляции одного теста или задания со всеми тестами или заданиями из генеральной совокупности.

  • Кронбаха (a-коэффициент) — оценка корреляции данного теста с тестом такой же длины из одной генеральной совокупности заданий.
  • Кудера-Ричардсона формула (Kuder-Richardson, KR-20) — частный случай коэффициента альфа для заданий дихотомического типа.

Надежность (reliability) — характеристика теста, отражающая точность педагогических измерений, степень постоянства результатов тестирования, а также устойчивость результатов теста к действию посторонних случайных факторов.

  • параллельных форм (parallel-form reliability) – вид надежности педагогического теста, оцениваемой с помощью взаимозаменяемых (параллельных) форм теста, предъявляемых одной и той же выборке испытуемых;
  • ретестовая (test-retest reliability) – вид надежности педагогического теста, оцениваемой при повторном тестировании с помощью одного и того же теста по прошествии времени;
  • расщепленных частей теста (split-half reliability) – вид надежности педагогического теста, оцениваемой путем анализа устойчивости результатов отдельных групп заданий в тесте, например устойчивость результатов по четным и нечетным заданиям теста.

Нормативно-ориентированный педагогический тест (norm-referenced test) – тип тестов, предназначенных для определения сравнительного уровня подготовки (обученности) испытуемых между собой.

Нормы (norms) – статистическое описание результатов теста на определенной выборке, называемой нормативной группой. В большинстве случаев нормы представляют из себя таблицы, определяющие процентильный эквивалент для каждого балла выбранной шкалы.

Параллельная форма теста (parallel form of test) – вариант теста, близкий его основной форме по критериям валидности, надежности и другим характеристикам и способный его заменить.

Процентильный эквивалент (percentile) – ранг, числено равный проценту в нормативной группе тех испытуемых, которые получили такой же или более низкий индивидуальный балл.

Распределение индивидуальных баллов (frequency distribution) – для каждого значения индивидуального балла число испытуемых, получивших этот балл по данному тесту.

Репрезентативность – свойство выборочной совокупности представлять характеристики генеральной совокупности; означает, что с определенной погрешностью можно считать, что представленное в выборочной совокупности распределение изучаемых признаков соответствует их реальному распределению

Совокупность выборочная, популяция (population) — репрезентативная часть генеральной совокупности, определенное множество: а) заданий для измерения данной черты, из которого формируются выборки заданий теста; или б) испытуемых, из которого формируются репрезентативные выборки испытуемых.

Совокупность генеральная (universe) — гипотетическое множество элементов, объединенных общей характеристикой: а) всех возможных заданий для выявления измеряемой черты или свойства; или б) всего контингента испытуемых (стат.).

Согласованность внутренняя (internal consistency) – характеристика теста, указывающая на степень однородности состава заданий с точки зрения измеряемого свойства испытуемых.

Стандартизация теста (test standardization) – процедура получения распределения индивидуальных баллов по тесту для нормативной группы (репрезентативной выборки) испытуемых, позволяющая сопоставлять результаты у разных групп тестируемых.

Стандартное отклонение (standard deviation) – характеристика изменчивости; определяется как квадратный корень из дисперсии (стат.).

Стандартная ошибка измерения (standard error of measurement) — статистическая величина, отражающая степень точности отдельных (педагогических) измерений; диапазон изменения показателей, в который попадает теоретический показатель (например, истинный балл), при данном выборочном показателе, с различной степенью вероятности.

Тест (test) – испытание, процедура измерения свойств субъектов или объектов.

  • педагогический (education test) – это система заданий специфической формы, позволяющая измерить уровень обученности студентов, совокупность их представлений, знаний, умений и навыков на той или иной области содержания.
  •  психологический (test) – стандартизированное, часто ограниченное во времени испытание, предназначенное для установления количественных (и качественных) индивидуально - психологических особенностей.
  • достижений (attainment test) – тест, направленный на оценку достигнутого уровня развития умений, навыков и знаний (часто синоним педагогического теста).
  • индивидуально-ориентированный (tailored test) – тест, специально создаваемый или модифицируемый для определенного испытуемого.
  • интеллекта (intelligence test) – совокупность методик, образованных в рамках объективного диагностического подхода, предназначенных для измерения уровня интеллектуального развития.
  • результативность (power test) – тест, не имеющий ограничений по времени. Задания подобраны так, что лишь небольшое количество испытуемых может выполнить все их правильно, как бы долго они над ними ни работали.
  • скорости (speed(ed) test) – тип тестов, в которых основным показателем продуктивности работы испытуемых является время выполнения (объем) заданий теста.
  • специальных способностей (test of ability) — группа тестов, предназначенных для измерения уровня развития отдельных аспектов интеллекта и психомоторных функций, преимущественно обеспечивающих эффективность в конкретных, достаточно узких областях деятельности.

Тестовое задание (test item) - элемент теста, сформулированный либо в форме утверждения, либо в форме вопроса, после ответа на которое оно превращается истинное или ложное высказывание, служащее для моделирования исследуемой деятельности, актуализации изучаемых педагогических и психологических качеств испытуемых (знаний,умений, навыков, представлений, психологических свойств и пр.)

  • альтернативные (true-false item) – форма задания, которая содержит некоторое утверждение, которое испытуемый должен оценить как истинное или ложное (дать ответ "верно" или "неверно", "да" или "нет").
  • дихотомические (dichotomous items) - задания, оцениваемые в тесте либо 1-баллом при правильном выполнении, либо 0-баллов при неправильном.
  • закрытой формы (с вариантами выбора ответа) (multiple-choice items) - форма тестового задания, при которой испытуемый должен выбрать правильный ответ из нескольких вариантов, причем один из них правильный, а остальные (называемые дистракторами) - нет;
  • открытой формы - форма тестового задания, при которой испытуемый должен дополнить основной текст таким элементом, чтобы получилось истинное высказывание;
  • на установление соответствия (matching items) - форма задания, в котором испытуемому предлагается установить соответствие между элементами двух списков (двух множеств);
  • с рейтинговыми шкалами (items with rating scales) — форма заданий, в которых испытуемым для оценки предъявляемых утверждений прилагаются рейтинговые шкалы (в педагогических тестах применяются редко; очень распространены в психологических тестах).
  • на установление правильной последовательности - форма задания, в котором испытуемому требуется установить правильную последовательность действий, операций и т.д.

Трудность заданий (difficulty) - характеристика заданий теста, отражающая статистический уровень их выполнения в данной выборке стандартизации.

Угадывание ответов (guessing) - проблема в конструировании педагогических тестов, состоящая в возможности случайного угадывания испытуемыми правильных ответов (в основном в заданиях с выбором вариантов ответа), искажающего их показатели по тесту.

Черта (trait) - измеряемая при помощи психодиагностической методики особенность испытуемого.

  • скрытаячерта (latent trait) - внутренняя, скрытая особенность исследуемого объекта или явления, выявляемая на основе ее внешних проявлений.

Шкала (scale) - упорядоченная числовая система для фиксации совокупности свойств изучаемого объекта или явления.

  • Гутмена (Guttman scale) — тип шкал для тестов достижений, интеллекта, в которых предполагается, что задания упорядочены по трудности, а их выполнение испытуемыми описывается кривыми зависимости "задание-ответ".
  • интервальная (interval scale) - шкала без фиксированной нулевой точки с равномерным разбиением делений.
  • наименований (номинативная) (nominal scale) - простейшая классификация, устанавливающая соответствие объекта или явления тому или иному классу
  • отношений (ratio scale) - континуальная шкала с равномерно нанесенными делениями и со значимой нулевой точкой.
  • порядковая (ранговая) (ordinal scale) - шкала с упорядоченными элементами, но без учета расстояний между ними.

Источник поступления: Евсигнеев А. Е., Самарский государственный технический университет, Факультет повышения квалификации преподавателей, Проектирование информационных технологий, Информационный бюллетень  №1, Самара 2000.

@
ICQ: 193184932
Последнее обновление 25.03.2004 0:53 . HWS©2000, Жуков Андрей.
Hosted by uCoz