|
Главная/Материалы/Краткий
терминологический словарь по теории педагогических тестов
Краткий терминологический словарь по теории педагогических тестов
Самара 2000
Евсигнеев Андрей Евгеньевич
Анализ задания (item analysis) – процедура для оценки
его эффективности в тесте, включающая в себя анализ технологичности
формы, соответствия содержанию и статистических характеристик задания
(определение корреляции заданий с общим показателем по тесту, факторный
анализ заданий, шкалирование заданий или другие виды их статистического
оценивания).
Балл (score) (индивидуальный балл, тестовый балл)
– количественный показатель выраженности измеряемого свойства у данного
испытуемого, получаемый при помощи данного теста.
- истинный (true score) – гипотетический балл,
который получил бы испытуемый, если бы он выполнил все задания из
банка заданий для данного теста;
- необработанный ("сырой") (rawscore)
– первичный (не подвергнутый обработке) индивидуальный балл, полученный
испытуемым по данному тесту;
- стандартизованный (standard score) – индивидуальный
балл, отражающий степень выраженности измеряемого свойства у испытуемого
относительно некоторой нормативной группы;
- стенайны (stanines) – нормализованный стандартный
балл на одномерной шкале ранжирования от -1 до 9.
- стены (stens) – нормализованный стандартный
балл на одномерной шкале ранжирования от 1 до 10.
- T-показатель (T-score) — стандартизованный
балл, имеющий распределение со средним 50 и стандартным отклонением
10.
- Z-показатель (Z-score) — стандартизованный
балл, имеющий распределение со средним» 0 и стандартным отклонением
1.
- IQ — стандартизованный балл, имеющий распределение
со средним 100 и стандартным отклонением 15.
- шкалированный (scale score) – подвергнутый
обработке первичный индивидуальный балл испытуемого после преобразования
его в специальную шкалу для данного теста.
Валидность (validity) – комплексная характеристика качества
теста, отражающая обоснованность, значимость его результатов, а также
пригодность данного теста для целей, заявленных его разработчиками.
- конструктная (construct validity) – тип валидности,
отражающая степень репрезентации исследуемого "педагогического
конструкта" - совокупности знаний, умений, навыков - в результатах
теста; конструктная валидность теста тем выше, чем больше, результаты
тестирования соответствуют теоретической гипотезе о свойствах измеряемой
переменной;
- критериальная (criterion validity) – характеристика
теста, отражающая обоснованность, значимость его результатов по сравнению
с некоторой внешней переменной и состоящая из конкурентной и прогностической
валидности;
- прогностическая (predictive validity) – характеристика
теста, отражающая обоснованность, значимость его результатов по сравнению
с некоторой внешней переменной в будущем; измеряется корреляцией результатов
тестирования с результатами других тестов или других педагогических
измерений, проведенных спустя определенное время и предназначенных
для тех же целей;
- содержательная (content validity) – один из
основных видов валидности, отражающей степень репрезентативности содержания
тестовых заданий по отношению к области содержания теста;
- текущая (concurrent validity) – характеристика
теста, отражающая обоснованность, значимость его результатов по сравнению
с некоторой внешней переменной; измеряется корреляцией результатов
тестирования с результатами других тестов или других педагогических
измерений, предназначенных для тех же целей.
Выборка (sample) – множество, случайным образом формируемое
из генеральной или выборочной совокупности; например, выборка испытуемых
или выборка заданий.
Дискриминативность (discriminatory power или item discrimination)
(дифференцирующая способность или различающая способность) – способность
отдельных заданий теста и теста в целом дифференцировать испытуемых
относительно "максимального" и "минимального" результата
теста.
Дисперсионный анализ (variance analysis) – статистический
метод изучения влияния отдельных переменных на изменчивость изучаемого
признака.
Дисперсия (variance) — показатель изменчивости, разброса
некоторого множества измерений вокруг арифметического среднего; среднее
значение возведенных в квадрат отклонений от арифметического среднего,
квадрат стандартного отклонения.
Дистракторы (distracters) – варианты ответов в тестовых
заданиях закрытой формы близкие к правильному ответу, но таковыми не
являющиеся.
Кривые зависимости "задание-ответ" (item-characteristic
curves) – характеристические кривые заданий, отражающие вероятность
ответов на задания, предназначенные для измерения некоторых гипотетических
свойств или латентных черт испытуемых.
Критериально-ориентированний педагогический тест (criterion-referenced
test) – тип тестов, предназначенных для определения уровня обученности
испытуемых относительно данной области содержания и (или) данной цели
тестирования.
Корреляционная матрица (correlation matrix) - набор значений
коэффициента корреляции между переменными, представленный в виде матрицы.
Корреляция (correlation), корреляционный анализ — комплекс
методов статистического исследования взаимозависимости между переменными,
связанными корреляционными отношениями.
- бисериальная (biserial correlation) – метод
корреляционного анализа отношения переменных, одна из которых измерена
в дихотомической шкале наименований, а другая - в интервальной шкале
отношений или порядковой шкале (то есть является континуальной).
Коэффициент корреляции — показатель степени взаимозависимости,
статистической связи двух переменных; изменяется в пределах от -1 до
+1. Значение коэффициента корреляции 0 указывает на возможное отсутствие
зависимости, значение +1 свидетельствует о согласованности переменных.
- дихотомический — показатель связи признаков (переменных)
измеряемых по дихотомическим шкалам наименований.
- Пирсона (Pearson product-moment correlation)
— коэффициент корреляции, используемый для континуальных переменных.
- ранговой корреляции Спирмент (Spearmen's rank-order
correlation) — коэффициент корреляции для переменных, измеренных
в порядковых (ранговых) шкалах.
- точечно-бисериальной корреляции (point-biserial
correlation) - коэффициент корреляции, применяемый в случае анализа
отношения переменных, одна из которых измерена в континуальной шкале,
а другая — в строго дихотомической шкале наименований.
- j – коэффициент корреляции, используемый в случае,
если обе переменные измерены в дихотомической шкале наименований.
- тетрахормческнм (четырехпольный) (tetrachoric)
— коэффициент корреляции, используемый в случае, если обе переменные
измерены в континуальных шкалах.
Коэффициент надежности (reliability coefficient)
— средняя величина корреляции одного теста или задания со всеми тестами
или заданиями из генеральной совокупности.
- Кронбаха (a-коэффициент) — оценка корреляции
данного теста с тестом такой же длины из одной генеральной совокупности
заданий.
- Кудера-Ричардсона формула (Kuder-Richardson, KR-20)
— частный случай коэффициента альфа для заданий дихотомического типа.
Надежность (reliability) — характеристика теста, отражающая
точность педагогических измерений, степень постоянства результатов тестирования,
а также устойчивость результатов теста к действию посторонних случайных
факторов.
- параллельных форм (parallel-form reliability) –
вид надежности педагогического теста, оцениваемой с помощью взаимозаменяемых
(параллельных) форм теста, предъявляемых одной и той же выборке испытуемых;
- ретестовая (test-retest reliability) – вид
надежности педагогического теста, оцениваемой при повторном тестировании
с помощью одного и того же теста по прошествии времени;
- расщепленных частей теста (split-half reliability)
– вид надежности педагогического теста, оцениваемой путем анализа
устойчивости результатов отдельных групп заданий в тесте, например
устойчивость результатов по четным и нечетным заданиям теста.
Нормативно-ориентированный педагогический тест (norm-referenced
test) – тип тестов, предназначенных для определения сравнительного
уровня подготовки (обученности) испытуемых между собой.
Нормы (norms) – статистическое описание результатов теста
на определенной выборке, называемой нормативной группой. В большинстве
случаев нормы представляют из себя таблицы, определяющие процентильный
эквивалент для каждого балла выбранной шкалы.
Параллельная форма теста (parallel form of test) – вариант
теста, близкий его основной форме по критериям валидности, надежности
и другим характеристикам и способный его заменить.
Процентильный эквивалент (percentile) – ранг, числено
равный проценту в нормативной группе тех испытуемых, которые получили
такой же или более низкий индивидуальный балл.
Распределение индивидуальных баллов (frequency distribution)
– для каждого значения индивидуального балла число испытуемых, получивших
этот балл по данному тесту.
Репрезентативность – свойство выборочной совокупности представлять
характеристики генеральной совокупности; означает, что с определенной
погрешностью можно считать, что представленное в выборочной совокупности
распределение изучаемых признаков соответствует их реальному распределению
Совокупность выборочная, популяция (population) — репрезентативная
часть генеральной совокупности, определенное множество: а) заданий для
измерения данной черты, из которого формируются выборки заданий теста;
или б) испытуемых, из которого формируются репрезентативные выборки
испытуемых.
Совокупность генеральная (universe) — гипотетическое
множество элементов, объединенных общей характеристикой: а) всех возможных
заданий для выявления измеряемой черты или свойства; или б) всего контингента
испытуемых (стат.).
Согласованность внутренняя (internal consistency) – характеристика
теста, указывающая на степень однородности состава заданий с точки зрения
измеряемого свойства испытуемых.
Стандартизация теста (test standardization) – процедура
получения распределения индивидуальных баллов по тесту для нормативной
группы (репрезентативной выборки) испытуемых, позволяющая сопоставлять
результаты у разных групп тестируемых.
Стандартное отклонение (standard deviation) – характеристика
изменчивости; определяется как квадратный корень из дисперсии (стат.).
Стандартная ошибка измерения (standard error of measurement)
— статистическая величина, отражающая степень точности отдельных (педагогических)
измерений; диапазон изменения показателей, в который попадает теоретический
показатель (например, истинный балл), при данном выборочном показателе,
с различной степенью вероятности.
Тест (test) – испытание, процедура измерения свойств
субъектов или объектов.
- педагогический (education test) – это система
заданий специфической формы, позволяющая измерить уровень обученности
студентов, совокупность их представлений, знаний, умений и навыков
на той или иной области содержания.
- психологический (test) – стандартизированное,
часто ограниченное во времени испытание, предназначенное для установления
количественных (и качественных) индивидуально - психологических особенностей.
- достижений (attainment test) – тест, направленный
на оценку достигнутого уровня развития умений, навыков и знаний (часто
синоним педагогического теста).
- индивидуально-ориентированный (tailored test) –
тест, специально создаваемый или модифицируемый для определенного
испытуемого.
- интеллекта (intelligence test) – совокупность
методик, образованных в рамках объективного диагностического подхода,
предназначенных для измерения уровня интеллектуального развития.
- результативность (power test) – тест, не имеющий
ограничений по времени. Задания подобраны так, что лишь небольшое
количество испытуемых может выполнить все их правильно, как бы долго
они над ними ни работали.
- скорости (speed(ed) test) – тип тестов, в которых
основным показателем продуктивности работы испытуемых является время
выполнения (объем) заданий теста.
- специальных способностей (test of ability)
— группа тестов, предназначенных для измерения уровня развития отдельных
аспектов интеллекта и психомоторных функций, преимущественно обеспечивающих
эффективность в конкретных, достаточно узких областях деятельности.
Тестовое задание (test item) - элемент теста, сформулированный
либо в форме утверждения, либо в форме вопроса, после ответа на которое
оно превращается истинное или ложное высказывание, служащее для моделирования
исследуемой деятельности, актуализации изучаемых педагогических и психологических
качеств испытуемых (знаний,умений, навыков, представлений, психологических
свойств и пр.)
- альтернативные (true-false item) – форма задания,
которая содержит некоторое утверждение, которое испытуемый должен
оценить как истинное или ложное (дать ответ "верно" или
"неверно", "да" или "нет").
- дихотомические (dichotomous items) - задания,
оцениваемые в тесте либо 1-баллом при правильном выполнении, либо
0-баллов при неправильном.
- закрытой формы (с вариантами выбора ответа) (multiple-choice
items) - форма тестового задания, при которой испытуемый должен
выбрать правильный ответ из нескольких вариантов, причем один из них
правильный, а остальные (называемые дистракторами) - нет;
- открытой формы - форма тестового задания, при
которой испытуемый должен дополнить основной текст таким элементом,
чтобы получилось истинное высказывание;
- на установление соответствия (matching items)
- форма задания, в котором испытуемому предлагается установить соответствие
между элементами двух списков (двух множеств);
- с рейтинговыми шкалами (items with rating scales)
— форма заданий, в которых испытуемым для оценки предъявляемых
утверждений прилагаются рейтинговые шкалы (в педагогических тестах
применяются редко; очень распространены в психологических тестах).
- на установление правильной последовательности -
форма задания, в котором испытуемому требуется установить правильную
последовательность действий, операций и т.д.
Трудность заданий (difficulty) - характеристика заданий
теста, отражающая статистический уровень их выполнения в данной выборке
стандартизации.
Угадывание ответов (guessing) - проблема в конструировании педагогических
тестов, состоящая в возможности случайного угадывания испытуемыми правильных
ответов (в основном в заданиях с выбором вариантов ответа), искажающего
их показатели по тесту.
Черта (trait) - измеряемая при помощи психодиагностической
методики особенность испытуемого.
- скрытаячерта (latent trait) - внутренняя, скрытая
особенность исследуемого объекта или явления, выявляемая на основе
ее внешних проявлений.
Шкала (scale) - упорядоченная числовая система для фиксации
совокупности свойств изучаемого объекта или явления.
- Гутмена (Guttman scale) — тип шкал для тестов достижений,
интеллекта, в которых предполагается, что задания упорядочены по трудности,
а их выполнение испытуемыми описывается кривыми зависимости "задание-ответ".
- интервальная (interval scale) - шкала без фиксированной
нулевой точки с равномерным разбиением делений.
- наименований (номинативная) (nominal scale) - простейшая
классификация, устанавливающая соответствие объекта или явления тому
или иному классу
- отношений (ratio scale) - континуальная шкала
с равномерно нанесенными делениями и со значимой нулевой точкой.
- порядковая (ранговая) (ordinal scale) - шкала
с упорядоченными элементами, но без учета расстояний между ними.
Источник
поступления: Евсигнеев
А. Е., Самарский государственный технический университет, Факультет
повышения квалификации преподавателей, Проектирование информационных
технологий, Информационный бюллетень №1, Самара 2000. |