НОУ ІНТУЇТ | лекція | Перевірка простої гіпотези щодо простий альтернативи
Анотація: Байєсова рішення як перевірка по відношенню правдоподібності. Значимість і потужність критерію. Функція байєсівського ризику.
Байєсова рішення як перевірка по відношенню правдоподібності
Розглянемо статистичну гру (17.17) при m = n = 2. Прикладом операції такого роду є обговорювалася в "Вибір рішень при невідомих станах природи (гри з природою)" задача діагностики туберкульозу. Будемо використовувати цю задачу для ілюстрації основних положень, що вводяться нижче.
Приймемо, що функція втрат включає лише витрати, викликані помилками при постановці діагнозу. При цьому втрати L (1,2), пов'язані з помилковим напрямком на лікування здорової людини, приймемо за одиницю втрат. тоді
де w> 0 є (виражені в зазначених вище одиницях) втрати від постановки помилкового діагнозу особі, ураженому захворюванням. Зауважимо, що при зроблених припущеннях функція повністю визначається завданням однини w> 0.
Відповідно до зауваженням про простих гіпотезах (див. "Вибір рішень при невідомих станах природи (гри з природою)" ), Будь-яка статистична гра з функцією втрат виду (18.1) може інтерпретуватися як вибір однієї з двох простих гіпотез. При цьому залишається альтернатива також відповідає простий гіпотезі.
Відзначимо, що два типи помилок статистика, можливих в обговорювалася задачі діагностики туберкульозу, взагалі кажучи, не є однаковими за супровідним втрат. Випадок, коли обстеження не виявило факт захворювання, наслідком чого буде пізній початок лікування задавненої форми хвороби, повинен розглядатися як більш серйозна помилка, ніж напрямок здорової людини для проходження курсу лікування1.
У завданнях вибору рішень, для яких характерне зазначене розходження наслідків, що викликаються помилками, більш серйозну помилку, що веде до великих втрат, прийнято називати помилкою першого роду. Друга можлива помилка називається помилкою другого роду.
Зазначене відмінність в класифікації помилок веде до відповідного розрізнення двох розглянутих гіпотез. Якщо відкидання гіпотези, що є істинною, веде до помилки першого роду, то її називають випробуваної гіпотезою або нуль-гіпотезою. У розглянутому прикладі діагностики туберкульозу такою гіпотезою є наявність захворювання (тобто факт породження результату випробування випадковою величиною з розподілом p2 (z)).
Матриця втрат, відповідна функції (18,1), і введені найменування для станів природи, дій статистика і помилок представлені в табл. 4.3 .
введемо позначення для апріорної ймовірності першого стану природи, тобто приймемо, що
і визначимо умови, при виконанні яких рішення a = 1, відповідне відкидання нуль-гіпотези, буде Байєсова. Згідно (17.21), ці умови полягають у виконанні нерівності яке, враховуючи (18.1) і (18.2), може бути представлено у вигляді або
Умова (18,3) виділяє точки , Яким зіставляється рішення az = 1, яке визначається байєсівської вирішальною функцією . При цьому az = 2, якщо для відповідного значення z умова (18,3) не виконується. Отже, байєсівську стратегія може бути задана розбиттям безлічі випадків Z з (17.7) на підмножини Q1 і Q2 з (17.3), де
і з (18.3).
Визначення 4.1 (критичної області критерію). Для іменування стратегій (або вирішальних функцій) статистика використовується також і більш старий термін статистичний критерій (або просто критерій). При цьому безліч Q1 результатів , Спостереження яких веде до відкидання нуль-гіпотези відповідно до деякого критерію , Називається критичною областю цього критерію
Зауважимо, що в силу прийнятого умови n = 2, розбиття множини результатів Z на підмножини з (17.13) містить лише два елементи Q1 і Q2, тобто
Отже, критична область повністю визначає відповідний критерій .
Надалі для виділення критичних областей, відповідних Байєсова критеріям , , Будемо позначати визначають їх критичні області з (18.3) символом , де з (18.2).
Зауваження 4.3. (про перевірки по відношенню правдоподібності).
Ставлення ймовірностей p2 (z) і p1 (z) з лівої частини правила (18.3) називають ставленням правдоподібності, оскільки самі ці ймовірності, що характеризують частоти випадків випробувань, спочатку іменувалися функціями правдоподібності. Тому правила вибору рішень, засновані на умовах типу (18.3), отримали назву перевірок по відношенню правдоподібності.
Ідея використання відносин правдоподібності для вибору простої гіпотези (при простій альтернативі) шляхом порівняння цього відносини з деякою позитивною константою c виникла незалежно від концепції байесовских рішень, які мінімізують очікувані втрати. В її основі лежить просте міркування, згідно з яким при p2 (z) / p1 (z) <1 більш правдоподібно, що результат відповідає випадковій величині з розподілом p1 (z). При цьому, з огляду на різний характер наслідків, пов'язаних з різними помилковими рішеннями, а також (зазвичай наявне) відмінність частот появи станів і , Значення константи порівняння c могло бути вибрано відмінним від 1.
Таким чином, байесовский критерій , Що задається критичною областю з (18.4), відноситься до класу перевірок по відношенню правдоподібності. При цьому розглянутий байесовский підхід дозволяє дати змістовну інтерпретацію значень константи .
Оскільки при будь-якої функції втрат виду (18.1) значення величини з (18.3) пробігає весь діапазон при зміні ймовірності від нульового до одиничного значень, то клас всіх перевірок по відношенню правдоподібності збігається з класом всіх байесовских критеріїв , .