Урок 5: Трехсторонние таблицы: разные типы независимости

Рейтинг: 4.6 из 5
Автор
Вадим Соколов
Рейтинг автора
4.6

В этом уроке излагаются методы анализа трехсторонних таблиц, которые являются репрезентативным анализом любой К- позиционной таблицы. Начнем со структуры трехкомпонентной таблицы и соответствующих совместных, маргинальных и условных распределений. В частности, мы различаем предельное и условное отношение шансов . Затем мы рассматриваем, как расширить критерии согласия, которые мы видели на предыдущих уроках. Теперь будет множество моделей независимости и ассоциаций (см. Список ниже). Естественно подумать об использовании разработанных нами тестов для двухсторонних таблиц на трехсторонних таблицах. Многие модели, которые мы обсуждаем в этом уроке, соответствуют конкретному выбору того, как превратить трехсторонний стол в двухсторонний.

Концепция условной независимости очень важна и является основой для многих статистических моделей (например, моделей скрытых классов, факторного анализа, моделей ответов элементов, графических моделей и т. Д.). Что касается моделей условной независимости, мы подробнее рассмотрим статистику Кокрана-Мантеля-Хензеля (CMH) и опишем явление, известное как парадокс Симпсона. Мы также узнаем о модели однородных ассоциаций. На следующем уроке, посвященном лог-линейным моделям, мы научимся отвечать на те же вопросы, но с помощью моделей, а не критериев согласия.

Каждой из моделей, описанных в этом уроке, будет дана математическая формулировка, например, формула для ожидаемого подсчета, когда это возможно. Если это не ваша «чашка чая», вы можете пропустить эти абзацы и сосредоточиться на концептуальном понимании и на том, как мы проводим соответствующие тесты в SAS и / или R.

Ключевые идеи

  1. Маргинальные и неполные таблицы
  2. Предельные и условные отношения шансов
  3. Модели (типы объединений):
    1. Насыщенный
    2. Полная (взаимная) независимость
    3. Совместная независимость (например, две переменные, независимые от третьей)
    4. Условная независимость
    5. Однородные ассоциации
    1. Парадокс Симпсона
    2. CMH тесты на условную независимость
    3. Оценка общих соотношений шансов
    4. Статистика Бреслоу-Дея для проверки однородности

    Цели

    • Понять структуру трехсторонних таблиц
    • Понять концепции независимости и ассоциаций в трехкомпонентных таблицах

    Полезные ссылки

    • Источник SAS для стратифицированных таблиц: http://support.sas.com/documentation/cdl/en/procstat/66703/HTML/default…
    • R: Критерий хи-квадрат Кохрана-Мантеля-Хензеля для данных подсчета http://stat.ethz.ch/R-manual/R-patched/library/stats/html/mantelhaen.test.html
    • R: Тест Бреслоу-Дея: функция для класса, breslowday.test ()

    5.1 - Три примера

    Трехсторонняя таблица непредвиденных обстоятельств - это перекрестная классификация наблюдений по уровням трех категориальных переменных. В более общем смысле, k- образные таблицы сопряженности классифицируют наблюдения по уровням k категориальных переменных. Уровни могут быть порядковыми или номинальными.

    Возникает интересный вопрос: будут ли показатели принятия и отклонения различаются в шести отделах? Мы не можем ничего спросить о поле.

    Пример 5-1: Смертная казнь

    Стол 2 × 2 × 2. Рэдлет (1981) изучал влияние расовых характеристик на то, получали ли лица, осужденные за убийство, смертную казнь. 326 субъектов были фигурантами обвинений в убийствах в 20 округах Флориды в период 1976-1977 гг. (Данные Агрести (1990)).

    Раса обвиняемого Гонка жертвы Смертный приговор да Нет белый белый Чернить Чернить белый Чернить
    19 132
    0 9
    11 52
    6 97

    Есть ли связь между смертной казнью, расой обвиняемого и расой жертвы? Что за ассоциация? Аналогичный пример есть у Agresti (2007), Sec. 2.7.2. Мы можем отобразить эту таблицу по-другому:

    Раса обвиняемого Жертва гонки Смертный приговор \ (n_ \)
    белый белый да 19
    белый белый нет 132
    белый чернить да 0
    белый чернить нет 9
    чернить белый да 11
    чернить белый нет 52
    чернить чернить да 6
    чернить чернить нет 97
    326

    Обратите внимание, что при таком подходе к данным «забывается», что восемь категорий происходят от трех переменных с двумя уровнями в каждой.

    Пример 5-2: Бойскауты и преступность среди несовершеннолетних

    Стол 3 × 2 × 2. В приведенной ниже таблице классифицируется n = 800 мальчиков в соответствии с социально-экономическим статусом ( S ), статусом мальчика-скаута ( B ) и его статусом преступности среди несовершеннолетних ( D ):

    Независимо ли преступный статус мальчика от его социально-экономического статуса и / или статуса бойскаута?

    Пример 3 - Прием в аспирантуру

    Стол 6 × 2 × 2. В таблице ниже приведена информация о приеме в магистратуру шести крупнейших факультетов Калифорнийского университета в Беркли осенью 1973 года.

    Отдел Мужчины отвергнуты Принимаются мужчины Женщины отвергли Женщины приняли
    А 313 512 19 89
    B 207 353 8 17
    C 205 120 391 202
    D 278 139 244 131
    E 138 53 299 94
    F 351 22 317 24

    Пусть D = отделение, S = пол и A = статус приема (отклонено или принято). Есть ли гендерная предвзятость при поступлении? Отличается ли прием в разные отделения?

    Ниже приведены данные о приеме и отклонении для 6 отделов. Данные представлены в таблице 2 × 2, в которой учитывается принятие и отклонение для мужчин и женщин без учета отделов. В такой таблице мы могли бы только спросить, различаются ли отказы или допуски по полу, но ничего об отделах.

    Мужской Женский Всего Принято Отклоненный Всего
    1199 557 1756
    1492 1278 2770
    2691 1835 г. 4526

    Остановись и подумай!

    Совокупные данные и данные на уровне отделов рассказывают противоположные истории о гендерной предвзятости. В большинстве отделов есть небольшая предвзятость к женщинам, в то время как разница в общем количестве поступающих и поступающих приводит к тому, что совокупная предвзятость указывает в другом направлении. Какое толкование было правильным, стало предметом судебного процесса.

    Вот пример стола 2 × 6. Однако те же данные, что и выше, но на этот раз данные представлены с учетом количества принятых и отклоненных по отделам, без учета пола.

    отделение А B C D E F Всего Принято Отклоненный Всего
    601 370 322 270 147 46 1756
    332 215 596 522 437 668 2770
    933 585 918 792 584 714 4526

    Остановись и подумай!

    Возникает интересный вопрос: будут ли показатели принятия и отклонения различаются в шести отделах? Мы не можем ничего спросить о поле.

    5.2 - Обозначения и структура

    Таблица трехсторонних непредвиденных обстоятельств I × J × K

    Трехсторонняя таблица непредвиденных обстоятельств - это перекрестная классификация наблюдений по уровням трех категориальных переменных. Предположим, что у нас есть три категориальные переменные: A , B и C , где

    A принимает возможные значения 1, 2,. . . , Я ,

    B принимает возможные значения 1, 2,. . . , Дж ,

    C принимает возможные значения 1, 2,. . . , K .

    Если мы соберем триплет ( A , B , C ) для каждой единицы в выборке из n единиц, то данные можно будет обобщить в виде трехмерной таблицы. Пусть \ (n_ \) - количество единиц, имеющих \ (A = i, B = j \) и \ (C = k \). Тогда вектор подсчета ячеек \ ((n_ , n_ , \ dots, n_ ) \) Могут быть организованы в виде таблицы, размеры которого я × J × К . С геометрической точки зрения представьте себе куб; например, кубик Рубика представляет собой стол размером 3 × 3 × 3.

    В примере со смертной казнью с таблицей 2 × 2 × 2 пусть A = раса Защитника, B = раса жертвы и C = смертная казнь. В нашей выборке, например, мы наблюдали \ (n_ = 132 \) случаев, когда и обвиняемый, и потерпевший были белыми, и смертная казнь отсутствовала.

    Частичные таблицы

    Для отображения трехсторонних таблиц мы обычно используем набор двусторонних таблиц; то есть мы разрезаем куб. Иногда их называют плоскими столами . В k-образных таблицах мы будем смотреть на двусторонние таблицы для уровней всех других переменных. Для трехсторонних столов это можно сделать тремя способами:

    • рассмотрим K , A × B таблиц для каждого уровня C
    • Рассмотрим таблицы J , A × C для каждого уровня B
    • рассмотрим таблицы I , B × C для каждого уровня A

    Например, отображение A × B для каждого уровня C :

    Это представление подразумевает, что мыконтролируемиликорректируемслучайную величину C ; мы НЕигнорироватьC . Помните условное распределение? Каждый × В таблице находится на определенном значении C .

    В нашем примере таблица A × B × C может быть отображена, показывая две таблицы 2 × 2 расы потерпевшего и обвиняемого по статусу смертной казни:

    C = смертная казнь - да B = жертва белый Чернить A = защитник белый Чернить
    19 0
    11 6
    C = Смертная казнь нет B = жертва белый Чернить A = защитник белый Чернить
    132 9
    52 97

    Или, показывая частичные таблицы расы обвиняемого и статуса смертной казни, по расе жертвы, A × C для каждого уровня B :

    B = Жертва белая C = смерть да Нет A = защитник белый Чернить
    19 132
    11 52
    B = Жертва черная C = смерть да Нет A = защитник белый Чернить
    0 9
    6 97

    Маржинальные таблицы

    Как и раньше, мы будем использовать «+» для обозначения суммирования по нижнему индексу; например, в приведенном ниже выражении мы суммируем J ,

    Тогда вектор отсчетов \ ((n_ , n_ , \ dots, n_ \) можно составить в таблицу размеров I × K. Мы называем это маргинальная таблицей из A и C , потому что мы маргинальные над B . В следующем выражении \ (n _ = \ sum \ limits_ ^ Я \ сумма \ пределы_ ^ J n_ \) Мы просуммировать как I и J , и , таким образом , создать маргинальную таблицу случайной величины С . Это представление подразумевает, что мы игнорируемпеременную, по которой мы маргинализуем (суммируем).

    Для нашего примера, мы имеем таблицу 2 × 2 статуса гонки и смертную казнь подсудимого, игнорируяинформацию о расе жертвы, то есть в × C таблицу, игнорируя (суммируя) значения B . Если мы наблюдаем только эту таблицу, мы ничего не знаем B .

    C = смерть да Нет A = защитник белый Чернить
    19 141
    17 149

    Совместное распространение

    Если n единиц в выборке являются независимыми и одинаково распределенными ( IID ), то есть если они являютсяслучайной выборкой, то вектор количества клеток \ (x = , n_ , \ точки, n_ >\) имеет полиномиальное распределение с индексом \ (n = n _ \) и параметром

    где \ (π_ = P (A = i, B = j, C = k) \) = вероятность того, что случайно выбранная единица попадет в ячейку \ ((i, j, k) ^ \) таблицы непредвиденных обстоятельств. Распределение вероятностей \ (π_ \) Является совместным распределением по A, B, и C. Естественно, для k- позиционных таблиц у нас будет совместное распределение K случайных величин, например, для пятимерной таблицы \ (π_ = P (A = i, B = j, C = k, D = l, E = m) \).

    В неограниченной (насыщенной) полиномиальной модели нет ограничений наπ,кроме \ (\ sum \ limits_ ^ Я \ сумма \ пределы_ ^ J \ сумма \ пределы_ ^ К \ пи_ = \ pi_ = 1 \), а оценки максимального правдоподобия (ML) - это пропорции выборки, \ (\ hat _ = n_ / п \).

    Насыщенная модель всегда идеально соответствует данным, и предполагаемая ожидаемая частота ячейки ( i, j, k ), \ (\ mu_ = E (n_ ) = n \ hat _ = п \ cdot n_ / п \) - наблюдаемая частота \ (n_ \) клетки ( i, j, k ) для всех i, j, k .

    Например, \ (n_ = 19 \), оценочная вероятность, \ (\ hat _ = 19/326 \), а ожидаемое количество ячеек \ (E (n_ ) = 326 × \ dfrac = 19 \). Эта модель дает \ (X ^ 2 = G ^ 2 = 0 \) с нулевым df. Почему?

    Установка насыщенное модель не может выявить какой - либо специальной структуры , которые могут существовать в отношениях между A, B, и C . Чтобы исследовать эти отношения, мы предлагаем более простые модели и проводим тесты, чтобы увидеть, соответствуют ли эти более простые модели данным, сравнивая их с насыщенной моделью, то есть наблюдаемыми данными, как мы это делали на предыдущих уроках. Эти новые модели будут зависеть от маржинального и условного распределений.

    Маржинальные распределения

    Когда вы суммируете различные подмножества совместных вероятностей, вы получаете маржинальные распределения. Этим, естественно, соответствуют вероятности в маргинальных таблицах.

    Мы имеем предельные распределения для каждой из переменных, A, B, и C . Например, распределение вероятностей \ (\ pi_ \) - предельное распределение для A, где \ (P (A = 1) = \ pi_ \) и \ (P (A = 2) = \ pi_ \), где образец пропорции - это MLE. Для примера смертной казни обозначим оценочное значение \ (\ pi_ \) как \ (p_ \), затем \ (P (A = \ text ) = p_ = 160/326 \) и \ (P (A = \ text ) = p_ = 166/326 \).

    Остановись и подумай!

    Если мы суммируем только по одному индексу (одной переменной), мы получаем совместное (или маргинальное) распределение двух других переменных. Например, \ (\ pi_ \) - совместное распределение A и B , P (A = i, B = j) . Обратите внимание, что они соответствуют маргинальным таблицам A × B с наблюдаемыми подсчетами, которые мы рассмотрели ранее, поэтому мы также можем обозначить это как маргинальное распределение AB .

    Что такое совместное, то есть граничное, распределение А и В в примере со смертной казнью? Это таблица 2 × 2, и есть четыре вероятности, сумма которых равна 1, т. Е. \ ( >= (\ pi_ , \ pi_ , \ pi_ , \ pi_ \)) и примерные пропорции, то есть MLE для насыщенной модели: (\ ( p_ = 151/326 \), \ (p_ = 9/326 \), \ (p_ = 63/326 \), \ (p_ = 103 / 326 \)), что является наблюдаемым совместным распределением расы обвиняемого и расы жертвы. Например, в выборке было 151 = 19 + 132 человека, а обвиняемый и потерпевший были белыми, что приводит к соотношению выборки 151/326 = 0,46.

    Условные распределения

    Условное распределение - это подмножество переменных с учетом другого взаимоисключающего подмножества переменных.

    Например, условное распределение A и C для данного B равно \ ( >= \ pi_ / \ pi _ \), такое что \ (\ sum_ \Пи_ = 1 \). Наглядно, вы спрашиваете , как делает совместное распределение А и С изменением в категории B изменения?

    Мы также можем рассмотреть условное распределение одной переменной с учетом двух других. Например, \ ( >= \ pi_ / \Пи_ \), такое что \ (\ sum_j \ pi_ = 1 \); что условное распределение B дано А и С. Наглядно, вы спрашиваете , как это распределение B изменений при условии , что вы совместно изменить уровни А и С?

    Остановись и подумай!

    Из приведенной выше таблицы A × C для каждого уровня B мы имеем два наблюдаемых условных распределения.

    Обратите внимание, что 214 - это общая сумма для частичной таблицы A × C, когда жертва белая, и эти значения в сумме равны 1.

    Обратите внимание, что 112 - это сумма для частичной таблицы A × C, когда жертва черная, и эти значения в сумме равны 1.

    Как насчет распределения B при A и C ?

    Маргинальные ассоциации и условные ассоциации могут быть самыми разными!В следующем разделе мы определяем и изучаем предельные и условные отношения шансов, чтобы помочь нам понять потенциальную разницу в этих ассоциациях и их влияние на статистический вывод.

    Схемы отбора проб

    Какие есть способы создания трехсторонних (или k- ходовых) таблиц подсчетов? По сути, у нас есть те же схемы выборки, что и для двусторонних таблиц:

    • Неограниченная выборка Пуассона - ничего не фиксировано, каждая ячейка является случайной величиной Пуассона со скоростью \ (\ mu_ \)
    • Полиномиальная выборка с фиксированным общим размером выборки n

    С k-образными таблицами, поскольку нам нужно исправить больше «общих» размеров выборки, у нас есть дополнительные способы подумать о выборке, например:

    • Стратифицированная выборка, где у нас есть полиномиальная выборка по продукту с фиксированным размером выборки для каждой частичной таблицы, например \ (n _ \)
    • Продукт-полиномиальная выборка в каждой частичной таблице, например fix \ (n_ \), то есть исправить строки в каждой частичной таблице.

    Затем давайте определим предельные и условные отношения шансов.

    5.3 - Предельные и условные коэффициенты шансов

    Коэффициенты предельных шансов

    Предельные отношения шансов - это отношения шансов между двумя переменными в маргинальной таблице, которые могут использоваться для проверки предельной независимости между двумя переменными при игнорировании третьей. Например, для маржи AC , \ (μ_\), где \ (\ mu \) обозначает ожидаемое количество , «предельное отношение шансов» будет:

    или, выборочное (наблюдаемое) предельное отношение шансов для нашего примера бегущей смерти:

    Шансы на смертную казнь для белого обвиняемого в 1,18 раза выше, чем для черного обвиняемого. Но является ли эта величина статистически значимой?

    Условные отношения шансов

    Условные отношения шансов - это отношения шансов между двумя переменными для фиксированных уровней третьей переменной, которые могут проверять условную независимость двух переменных с учетом третьей. Например, для фиксированных уровней B оценочная условная ассоциация AC сучетомуровня \ (j ^ \) B равна

    Они вычисляются с использованием частичных таблиц и иногда называются «частичными ассоциациями». Например, примерные (наблюдаемые) условные (частичные) отношения шансов в нашем примере текущей смерти:

    Напомним, что когда у нас есть нули выборки (т. Е. Нулевые значения), специальный метод для получения оценки отношения шансов, отличных от нуля, заключается в добавлении 0,5 к каждому значению ячейки. В этом примере оценочное отношение шансов A и C для B = черный будет: (0,5 × 97,5) / (9,5 × 6,5) = 0,79.

    Как бы вы интерпретировали эти отношения шансов?

    Мы вычисляем отношения шансов для различных частичных таблиц большой таблицы и можем использовать их для проверки условной независимости A и C при заданном B. Если \ (θ_ ≠ 1 \) , по меньшей мере , одного уровня B ( по крайней мере , один J) , можно сказать , что переменные A и C являются условно связаны . Мы узнаем об этом больше, а пока давайте воспользуемся нашими знаниями о двусторонних таблицах, чтобы провести предварительный анализ.

    Примените свои знания о двусторонних таблицах. Сравните предельные и условные отношения шансов для нашего примера.

    • Они приводят к одинаковому или разному выводу?
    • Как насчет тестов на независимость для каждой таблицы 2 × 2?
    • Как насчет различных мер ассоциаций для этих подтаблиц?
    • Что они говорят нам о взаимосвязях между этими переменными?

    Вы можете использовать код / ​​выходы SAS или R.

    Давайте посмотрим на использование файла программы SAS death.sas (вывод: death.lst).

    Вы должны запустить ссылку INSPECT, чтобы увидеть разные значения параметров в приведенном выше коде SAS и в выходных данных SAS. Например,

    таблицы ответчика * штраф / чиск все нокол нопкт;

    создаст маргинальную таблицу ответчиков и штрафов и вычислит все соответствующие статистические данные для этой таблицы 2x2 (см. ниже). Чтобы получить частичные таблицы подсудимых и штрафов для каждого уровня жертвы и получить весь анализ для этих подтаблиц 2x2, вы можете запустить следующую строку:

    таблицы потерпевший * ответчик * штраф / чиск смч нокол нопкт;

    Мы обсудим вариант CMH позже. В PROC FREQ частичные таблицы будут созданы с учетом уровней первой переменной, которую вы укажете при создании трехсторонней таблицы. Вы также можете запустить эту программу в SAS, чтобы получить результат или посмотреть файл death.lst.

    Статистические выводы

    Предельная независимость. Давайте сначала посмотрим на маргинальную таблицу расы обвиняемого и смертной казни, игнорируя расу жертвы (см. Ниже). Балльная оценка отношения шансов составляет 1,18, а его 95% ДИ (0,5902, 2,3634) на основе случай-контроль (отношение шансов).ряд ниже. Шансы на смертную казнь для белых подсудимых в 1,18 раза выше, чем для черных подсудимых. Напомним, что нулевая гипотеза о том, что отношение шансов = 1, означает, что переменные независимы. Основываясь на этих данных, мы не можем отвергнуть нулевую гипотезу о том, что раса обвиняемого не зависит от смертной казни. Более того, мы можем быть уверены на 95% в том, что раса обвиняемого и смертная казнь независимы, поскольку истинное отношение шансов составляет от 0,6 до 2,4, а интервал содержит 1,00. Однако имейте в виду, что здесь мы проигнорировали гонку Жертвы. Более точное утверждение было бы сказать, что раса подсудимого и смертная казнь кажутсянезначительно независимыми.

    Условная независимость. Теперь рассмотрим точечные оценки отношений шансов, когда мы учитываем расу жертвы, т. Е. Условные отношения шансов (см. Раздел 5.2. Или части выходных данных SAS и попытайтесь определить частичные таблицы и соответствующую статистику). является белым, вероятность смертной казни для белых подсудимых в 0,69 раза выше, чем для черных, но его 95% ДИ (0,32, 1,50)) указывает на отсутствие значительной разницы; см. строку « Случай-контроль (отношение шансов)» . Статистический тест хи-квадрат на независимость от расы обвиняемого и смертная казнь для случаев, когда жертвы белые, подтверждают тот же вывод, например, с \ (X ^ 2 = 0,88, df = 1, \ text = 0,35 \) мы не можем отвергнуть нулевую гипотезу.

    Учитывая, что жертва черная, отношение шансов составляет 0,79 после того, как мы скорректируем ноль выборки, добавив 0,5 к каждому счету, а затем вычислим его как OR = (0,5 × 97,5) / (9,5 × 6,5) = 0,79. Если мы рассмотрим доверительные интервалы для этих отношений шансов или для каждой из этих подтаблиц 2 × 2 выполнить тест независимости, нулевая гипотеза независимости не может быть отвергнута. В частности, мы говорим, что раса обвиняемого и смертная казньусловно не зависят от расы жертвы.

    Однако, судя по точечным оценкам, маргинальные и условные ассоциации, кажется, показывают противоположные (эффекты) направления; например, 1,18 против 0,69 и 0,79, хотя результаты незначительны. Это пример явления, известного какпарадокс Симпсона,обсуждаемого ниже.

    Пользователи R должны открыть файл death.R и соответствующий ему выходной файл death.out.

    Есть много способов сделать это. Например, после того, как мы ввели данные в трехмерный массив (см. Death.R), R отобразит частичные таблицы по уровням последней переменной в массиве (например, см. Deathp в коде или выводе).

    Мы также можем использовать функцию ftable (), например,

    для создания плоских таблиц, в данном случае случайных величин AB на C, поэтому мы смотрим на табличное представление 4 × 2 исходной таблицы 2 × 2 × 2.

    Чтобы создать маргинальную таблицу, вы можете использовать функцию margin.table (), например,

    DeathPen

    Ответчик да нет

    белой 19 141

    черных 17 149

    Эта функция создает маргинальную таблицу второй и первой переменных из исходного массива, в данном случае Ответчик × Смертная казнь. Для получения более подробной информации запустите код и изучите другие способы манипулирования данными, а также разместите любые вопросы, которые могут у вас возникнуть, на доске обсуждений.

    Статистические выводы

    Предельная независимость. Давайте сначала посмотрим на маргинальную таблицу расы обвиняемого и смертной казни, игнорируя расу жертвы (см. Ниже). Точечная оценка отношения шансов составляет 1,181, а его 95% -ный доверительный интервал (0,595, 2,343) с использованием страницы VCD. Шансы на смертную казнь для белых подсудимых в 1,18 раза выше, чем для черных подсудимых. Напомним, что нулевая гипотеза о том, что отношение шансов = 1, означает, что переменные независимы. Основываясь на этих данных, мы не можем отвергнуть нулевую гипотезу о том, что раса обвиняемого не зависит от смертной казни. Более того, мы можем быть уверены на 95% в том, что раса обвиняемого и смертная казнь независимы, поскольку истинное отношение шансов составляет от 0,6 до 2,3, а интервал содержит 1,00. Однако имейте в виду, что здесь мы проигнорировали гонку Жертвы.Более точное утверждение было бы сказать, что раса подсудимого и смертная казнь кажутсянезначительно независимый.

    Условная независимость. Теперь рассмотрим точечные оценки отношений шансов, когда мы учитываем расу жертвы, т. Е. Условные отношения шансов (см. Раздел 5.2. Или части выходных данных R и попытайтесь идентифицировать частичные таблицы и соответствующую статистику). является белым, вероятность смертной казни для белых подсудимых в 0,69 раза выше, чем для черных, но его 95% ДИ (0,31, 1,50)) указывает на отсутствие значительной разницы; см. вывод ниже и обратите внимание, что есть много разных способов сделать это в R - некоторые из них предусмотрены в смерти. Код R Тест статистики хи-квадрат для независимости от расы обвиняемого и смертная казнь для случаев, когда жертвы белые, подтверждают то же самое поиск, например, с \ (X ^ 2 = 0.88, df = 1, \ text = 0,35 \) мы не можем отвергнуть нулевую гипотезу. Обратите внимание, что если мы возведем в квадрат z-значение из сводки (lor) ниже, \ ((- 0,948) ^ 2 \ приблизительно 0,88 \) с двусторонним значением p \ (1-pchisq (0,88,1) = 0,35 \) .

    >### через отношения шансов

    >отношение шансов (deathp, 3, log = FALSE)

    белый черный

    0,6804408 0,7894737

    >## log отношения шансов для таблицы 2x2 с учетом уровней третьей переменной

    >lor = oddsratio (deathp, 3)

    >exp (confint (lor)) ## CI

    lwr upr

    белый 0,30704729 1,50791

    черный 0,04121472 15,12248>итоговый (lor)

    Лог Отношение шансов Станд. Ошибка z значение Pr (>| z |)

    белый -0,38501 0,40600 -0,9483 0,1715

    черный -0,23639 1,50644 -0,1569 0,4377

    Учитывая, что жертва черная, отношение шансов составляет 0,79 после того, как мы скорректируем ноль выборки, добавив 0,5 к каждому счету, а затем вычислим его как OR = (0,5 × 97,5) / (9,5 × 6,5) = 0,79. Если мы рассмотрим доверительные интервалы для этих отношений шансов или для каждой из этих подтаблиц 2 × 2 выполнить тест независимости, нулевая гипотеза независимости не может быть отвергнута. В частности, мы говорим, что раса обвиняемого и смертная казньусловно не зависят от расы жертвы.

Новости спорта

Изначально сайт создавался для пользователей со всех стран мира. Международный домен ориентирован на самых разных пользователей. Страницы сайта переведены на 46 языков, среди которых есть и азербайджанский. Это выгодно выделяет платформу на фоне конкурентов, так как многие из них либо не работают на территории данной страны, либо не имеют местной локализации.

Больше новостей