Байесовские сети (сети доверия)¶
Байесовские сети (также известные как сети Байеса или сети доверия) — это вероятностные графические модели, которые представляют совокупность случайных величин и их условных зависимостей с помощью направленного ациклического графа (DAG). В этих графах каждый узел соответствует случайной величине, а каждое ребро представляет прямую вероятностную зависимость.
Эти сети предоставляют компактный и интуитивно понятный способ кодирования совместных распределений вероятностей. Вместо явного моделирования полного совместного распределения, что становится невозможным с ростом числа переменных, байесовские сети разбивают его, используя цепное правило вероятности и условные независимости, закодированные в графе. Это делает их особенно подходящими для рассуждений в условиях неопределенности, выполнения логического вывода и принятия решений на основе неполных или зашумленных данных.
В основе байесовской сети лежат два компонента:
- Структура – сам граф, который определяет зависимости между переменными.
- Параметры – условные распределения вероятностей (УРВ), связанные с каждым узлом, при заданных его родителях.
В то время как структура говорит нам, какие переменные влияют друг на друга, параметры количественно определяют, насколько сильны эти влияния. Вместе они полностью определяют совместное распределение по переменным.
Обучение в байесовских сетях¶
При построении байесовских сетей по данным существуют две основные задачи:
-
Обучение структуре: Обнаружение оптимальной структуры графа, которая отражает зависимости между переменными. Это часто является комбинаторно сложной задачей, особенно для больших наборов данных, так как включает в себя поиск по пространству всех возможных DAG.
-
Обучение параметрам: Оценка УРВ для каждого узла при заданной структуре. Если структура известна и данные полны, этот шаг относительно прост и может быть выполнен с использованием оценки максимального правдоподобия или байесовской оценки.
Обучение как структуры, так и параметров по данным позволяет применять байесовские сети в реальных областях, где структуры, разработанные экспертами, недоступны. Это делает их особенно ценными в таких областях, как биоинформатика, медицинская диагностика и автоматизированные системы принятия решений.
Note
По умолчанию bamt
(и applybn
) будет использовать K2 в качестве оценщика структуры и максимальное правдоподобие в качестве оценщика параметров.