Суть одним предложением
Функция правдоподобия — это функция, которая измеряет, насколько “правдоподобны” различные значения параметров статистической модели при условии, что мы уже наблюдали конкретные данные.
Ключевая идея: меняется взгляд на вероятность
Чтобы понять функцию правдоподобия, нужно перевернуть с ног на голову обычное понимание вероятности.
-
Обычный взгляд (Вероятность): У нас есть модель с известными параметрами (например, монета с
p(орёл) = 0.5). Мы вычисляем вероятность получить какие-то данные (например, 2 орла из 3 бросков).- Вопрос: Какова вероятность данных при заданных параметрах?
- Обозначение:
P(Данные | Параметры)
-
Взгляд правдоподобия: У нас есть уже собранные данные (например, мы бросили монету 3 раза и получили 2 орла). Мы вычисляем, насколько правдоподобны различные параметры модели (разные значения
p) для объяснения этих данных.- Вопрос: Насколько правдоподобны параметры при заданных данных?
- Обозначение:
L(Параметры | Данные)
Важнейший момент: Функция правдоподобия — это не вероятность. Она не суммируется до 1. Ее абсолютное значение не имеет прямого вероятностного смысла. Важны относительные значения для разных параметров.
Математическое определение
Для набора независимых данных X = (x₁, x₂, ..., xₙ) и параметров модели θ функция правдоподобия L(θ | X) определяется как совместная вероятность (или плотность вероятности) получения этих данных при заданных параметрах:
Для дискретных данных:
L(θ | X) = P(x₁ | θ) * P(x₂ | θ) * ... * P(xₙ | θ)
Для непрерывных данных:
L(θ | X) = f(x₁ | θ) * f(x₂ | θ) * ... * f(xₙ | θ)
где f — функция плотности вероятности.
Так как это произведение многих чисел, с ним часто неудобно работать. Поэтому почти всегда используют логарифмическую функцию правдоподобия (Log-Likelihood):
ℓ(θ | X) = log(L(θ | X)) = Σ [log(f(xᵢ | θ))]
Произведение превращается в сумму, что гораздо удобнее для анализа и поиска максимума.
Наглядный пример с монетой
Данные: Мы подбросили монету 10 раз и получили 7 орлов и 3 решки.
Модель: Биномиальное распределение. Параметр, который мы оцениваем — p (вероятность орла).
Функция правдоподобия показывает, насколько правдоподобно каждое возможное значение p (от 0 до 1) для объяснения наших данных (7 орлов из 10).
L(p | данные) = P(7 орлов из 10 | p) = C(10,7) * p⁷ * (1-p)³
где C(10,7) — биномиальный коэффициент (константа).
Давайте посчитаем правдоподобие для нескольких значений p:
-
Если
p = 0.5(честная монета):L(0.5 | данные) ~ 0.117Это означает, что получить 7 орлов из 10 бросков честной монеты довольно маловероятно (~11.7%). -
Если
p = 0.7:L(0.7 | данные) ~ 0.267Правдоподобие значительно выше! Значениеp=0.7гораздо лучше объясняет наши данные. -
Если
p = 0.9:L(0.9 | данные) ~ 0.057Правдоподобие снова низкое, потому что при такой вероятности орла мы скорее получили бы 9 или 10 орлов, а не 7.
График функции правдоподобия L(p) для этого примера выглядел бы как колокол, пик которого приходится на p = 0.7.
Для чего нужна функция правдоподобия?
-
Метод максимального правдоподобия: Найти параметры
θ, которые максимизируютL(θ | X). Эти параметры делают наблюдаемые данные наиболее вероятными. -
Сравнение моделей: Сравнивать, какая из нескольких моделей лучше описывает данные. Модель с более высоким значением правдоподобия на тех же данных считается лучше.
-
Построение доверительных интервалов: Область параметров, для которых значение функции правдоподобия не слишком сильно отличается от максимального, задает правдоподобный диапазон значений параметров (например, с помощью отношения правдоподобий).
Итог
Функция правдоподобия L(θ | X) — это:
- Функция от параметров
θ(данныеXфиксированы). - Мера согласия между параметрами модели и наблюдаемыми данными.
- Основа для метода максимального правдоподобия.
- Инструмент для сравнения моделей и оценки неопределенности.
Проще всего запомнить: Правдоподобие — это вероятность данных при заданных параметрах, но интерпретируемая как мера правдоподобия самих параметров.