TailWind писал(а):Мэйпл писал(а):И по этому почерку Таланов отловил все фейки
Прям супермен )))
На самом деле, это принципиальный момент: ведь других гарантий того, что в выборке не было дублей, Таланов не дал, а значит наличие повторных анкет (в случае если фейки на практике отловить нереально) может объяснять появление таких эксклюзивных признаков как сросшиеся брови гюго, широкий рот штирлица или курение робов, которые могут быть просто артефактами выборки.
Я уже дважды предлагала эвристическую задачу для поиска решения (всех возможных решений) для всех желающих и в первую очередь тех, кто знаком со статистикой (как Пробирка, например).
Вот эта задача. Дано:
1. В эксперименте по сбору статистики было установлено, что у штирлицев рот шире нормы.
2. Современное академическое сообщество считает физиогномику классическим примером лженауки.
Нужно предложить все возможные решения, объясняющие сосуществование двух этих фактов одновременно.
Моё решение такое. Убираю два во всех смыслах крайних варианта: некомпетентность академиков и недобросовестность автора. Допустим, автор говорит правду, когда утверждает, что ширина рта выше нормы была статистически зафиксирована для штирлицев по их анкетам в количестве 60.
Как это могло получиться?
Убираю арифметический вариант - банальная ошибка в цифрах на порядок, например. Почему? Потому что у нас в перспективе не только рот штирлица, у нас целый ряд таких псевдонаучных признаков.
Сморим дальше: что именно было зафиксировано в анкетах? Среднюю ширину рта в популяции мы не знаем, но мы знаем распределение - 70% норма, 15% ниже и 15% выше. Т.е. если мы получили для всех типов указания на широкий рот в 15% случаев, а для штирлицев в 20% случаев - то да, мы можем говорить, что их рот шире среднего.
Но давайте посмотрим, что такое 15% для 60ти анкет. Это 9 (девять) анкет. Ну, плюс-минус 2, всё это норма. А эксклюзивное превышение нормы пойдёт начиная с 12 анкет, те самые 20%. Звучит внушительно - на 5% больше. Немного, но автор и не подчёркивает абсолютные цифры- важна эксклюзивность, когда у всех типов картина схожая, а у штирлица чем-то выделяется.
Итак, эту разницу нам дают 3 (три) лишних анкеты. Откуда они взялись? Если нет способа контролировать повтор, то взяться они могли практически легитимно: некто с широким ртом указал свой тип как штирлиц, но остался недоволен итогами теста, решил перепройти. Ну, скажем, ему не понравилось, что в ряде ответов он был неуверен, а теперь ему выдают штирлица с нежелательным для него подтипом гюго, а он всегда выбирал между максом и штиром и хочет более точный результат.
Проходит раз, уточняя ответы. Проходит ещё раз. При этом ответ про рот, на который он не обращает внимания как на маловажный, так и болтается, усиливая статистику штирлицев по ртам.
Сделаем ещё один шаг. Представим, что у данного штирлица оказался не только широкий рот, но и привычка в детстве в шутку топить товарищей. И ещё пусть у него же будут брови домиком. Таким образом на повторе трёх анкет от одного респондента мы получаем три эксклюзивных признака штирлицев, фигурирующих в таблицах Таланова.
Таким же образом могла появиться у робов эксклюзивная привычка к табакокурению - вопреки статистике ВОЗ, где людям сайентистских профессий, напротив, курение свойственно меньше. Просто какой-то курящий роб с узкой переносицей и слабым либидо, например, мучил анкету со всей дотошностью, на которую только способны робы, чтобы убедиться в её надёжности. А там "счётчик голосов" работал - и теперь все робы должны поверить в свои проблемы с либидо.
Но, повторюсь, если у автора был способ отсеивать повторы, то моё объяснение не годится. Вот почему я принципиально заострила на этом внимание.