Prob-Irka писал(а):kanonik
Выше приведенный вами ответ для Пробирки, это финт для непонимающих математику вообще.
Не создавайте впечатления у читателей, что Пробирка не знает основ, что вы делаете.
Повторю:
Вы прекрасно знаете, где вы визуально заменяете один низкие проценты высокими..
И прекрасно знаете, что линнйная корреляция может юыть высокой на малых отклонениях. Именно поэтому линейную корреляцию критикуют, ограничивают ее область применения. А вы эту область расширяете с целью создания, что вы правильно определяете ТИМ по мелким совпадениям.
Скажите, каноник, каков коэффициент линейной корреляции между этими двумя рядами:
А и Б ?
А и В ?
А) Первый ряд (ответы на вопросы тестируемого)
1-1-2-2-4-4-5-5
Б) Второй ряд (ТИМный эталоный профиль с большими отклонениями от среднего):
2.1 -2.1 -2.6 -2.6 -3.4 -3.4 -3.8 -3.8
Замечу, что превышение над средним уровнем в этом примере я сделала высоким, около ±30% процентов от средниего уровня 3 балла.
В) Третий ряд (ТИМный эталоный профиль с малыми отклонениями от среднего):
2.8 -2.8 -2.9 -2.9 -3.1 -3.1 -3.2 -3.2
А если сравнивать первый ряд с этим, то тут превышение над средним уровнем много меньше, около ±7% процентов от средниего уровня в 3 балла.
Но и в этом случае коэффициент корреляции будет тоже высоким.
Пробирка!
Если Атех теперь несет просто нарочную злобную чепуху, то Вы снова хоть и искренне, но глубоко и раздраженно заблуждаетесь.
И делаете в своих рассуждениях сразу две принципиальнейшие математические ошибки, которые и ввергают Вас в грех заблуждения.
ПЕРВАЯ ВАША МАТЕМАТИЧЕСКАЯ ОШИБКАНапомню для начала, чему равна корреляция. Это ковариация деленная на произведение стандартных отклонений двух сравниваемых рядов данных. Иначе говоря:
Корреляция между рядами данных Xi и Yi = Сумма от 1 до N (Xi-Xср)*(Yi-Yср)/(N*Sx*Sy)В ваших двух примерах, искусственно составленных из чисел со строго одинаковой пропорциональностью, но просто лишь в разном масштабе, корреляция в обоих случаях действительно будет получаться одинаковой. Но ведь это только в том случае, если ответы испытуемого с одинаковой пропорцией следуют и за первым рядом диагностических коэффициентов вопросов (имеющих высокую диагностическую силу), и в той же пропорции - за вторым рядом диагностических коэффициентов - в вопросах с малой диагностической силой. Вы в самом деле полагаете, что в обоих случаях ответы испытуемого будут следовать за диагностическими коэффициентами с одинаковой пропорциональностью??? В реальности если человек отвечает на вопросы с ускользающе низкими диагностическими коэффициентами (например, просто на бессмысленные вопросы), то его ответы никогда не будут пропорциональны этим коэффициентам. Его ответы БУДУТ СЛУЧАЙНЫ, они случайным образом будут отклоняться выше или ниже средней тройки без всякой связи с диагностическими коэффициентами вопросов. То есть в этом случае ковариация будет равна НУЛЮ - нулевой в итоге получится и корреляция.
ТЕПЕРЬ О ВТОРОЙ ВАШЕЙ ОШИБКЕ:Корреляции в ваших двух рассмотренных примерах, ДАЖЕ ПРИ ТОМ УСЛОВИИ, ЧТО ОТВЕТЫ ИСПЫТУЕМОГО В ОБОИХ ПРИМЕРАХ СТРОГО ПРОПОРЦИОНАЛЬНЫ ДИАГНОСТИЧЕСКИМ КОЭФФИЦИЕНТАМ (чисто надуманный Вами пример), получатся одинаковыми все равно только в том случае, если первый набор вопросов полностью состоит только из вопросов с большой (и притом одинаковой) диагностической силой, а второй набор - опять же ТОЛЬКО из вопросов с малой и притом тоже одинаково низкой диагностической силой. Потому что лишь в этом случае в ваших двух примерах будут одинаковые отношения Yi/Sy. Если же второй набор вопросов разбавить хотя бы парочкой вопросов с высокой диагностической силой, то его Sy сразу резко подскочит (без существенного изменения числителя), и итоговая корреляция во столько же раз уменьшится.
Короче, это ваши сугубо искусственнные примеры, в реальности опросников такого нет и быть не может. Во-первых, вопросы в опросниках смешанные, с разной диагностической силой (в довольно широком дипазаоне). Во-вторых, вопросы со слишком низкой диагностической силой в опросники В КАЧЕСТВЕ ДИАГНОСТИЧЕСКИХ просто не включаются - для этого есть строго математические критерии их отбора, подробно разобранные в работе:
http://sociotoday.narod.ru/nadejn1.docx (скачать)Вам бы эту работу прочесть, разобраться, а Вы с ходу пытаетесь "опровергать", не зная, с какого конца у лошади хвост растет...
Диагностическая сила вопроса определяется сигмой его типного профиля. Средняя сигма профилей всех вопросов любого опросника всегда примерно одинакова - она колеблется в диапазоне от 0,42 до 0,46. Если меньше, чем 0,42, то опросник при том же числе вопросов будет малонадежным.
Корреляция, еще раз напоминаю, вычисляется по формуле:
Корреляция между рядами данных Xi и Yi = Сумма от 1 до N (Xi-Xср)*(Yi-Yср)/(N*Sx*Sy)Здесь Sx и Sy зависят от всего набора вопросов, а не от его малого поднабора. Вопросы с малым дигностическим весом в итоговую величину корреляции, по причине низкого своего вклада в произведение (Xi-Xср)*(Yi-Yср), вносят крайне малый, пренебрежимый вклад. На корреляцию в итоге влияют в первую очередь лишь вопросы с наибольшим диагностическим весом, которые в любоми опроснике всегда есть. Вопросы, которые сильно уходят вниз по своему диагностическому весу, лишь снижают общую корреляцию. Привносят дополнительный случайный шум, и больше ничего. Здесь есть определенные критерии - когда дополнительно включаемый в анкету вопрос начинает не помогать, а мешать, лишь снижая общую надежность. Подробности - опять в статье по ссылке. Поэтому наилучшим образом составленный опросник - это тот, где все вопросы имеют примерно одинаковую диагностическую силу. И достаточно высокую.
ИТОГ РАЗБОРА ВАШИХ ОШИБОК:Вот почему Вы считаете, что другие, в частности Таланов (который, наверное, не хуже Вас разбирается в математике) - тем не менее глупее Вас во всех этих вопросах? Откуда у Вас эти агрессивные наскоки - притом ни в чем толком до того не разобравшись? И, кстати, где вообще Вы видели опросник, который был бы составлен из одних лишь вопросов с нарочно маленькой диагностической силой?
А если бы такой и был, то все корреляции с ответами респондентов в нем заведомо получались бы очень близкими к нулю - в силу выше разобранной причины номер один, то бишь вашей первой математической ошибки.
И ЕЩЕ РАЗ ПОВТОРЮ В ЗАКЛЮЧЕНИЕ:Именно корреляция является наиболее точной мерой взаимосвязи между двумя рядами данных. Квадрат корреляции - это доля общей дисперсии двух рассматриваемых явлений. Никакой более точной меры при диагностике чего угодно, ТИМов в том числе, нет и быть не может в принципе. Это - вещи, давно математически доказанные. Притом не Талановым. Были люди математически еще намного потолковее его, и притом намного раньше, еще в 19-м веке. Потому и говорю: прежде чем изобретать велосипед, разберитесь с вероятностями, тогда и корреляции станут понятнее, перестанут быть раздражающей "красной тряпкой".