Байесовские сети (сети доверия)¶

Байесовские сети (также известные как сети Байеса или сети доверия) — это вероятностные графические модели, которые представляют совокупность случайных величин и их условных зависимостей с помощью направленного ациклического графа (DAG). В этих графах каждый узел соответствует случайной величине, а каждое ребро представляет прямую вероятностную зависимость.

Эти сети предоставляют компактный и интуитивно понятный способ кодирования совместных распределений вероятностей. Вместо явного моделирования полного совместного распределения, что становится невозможным с ростом числа переменных, байесовские сети разбивают его, используя цепное правило вероятности и условные независимости, закодированные в графе. Это делает их особенно подходящими для рассуждений в условиях неопределенности, выполнения логического вывода и принятия решений на основе неполных или зашумленных данных.

В основе байесовской сети лежат два компонента:

Структура – сам граф, который определяет зависимости между переменными.
Параметры – условные распределения вероятностей (УРВ), связанные с каждым узлом, при заданных его родителях.

В то время как структура говорит нам, какие переменные влияют друг на друга, параметры количественно определяют, насколько сильны эти влияния. Вместе они полностью определяют совместное распределение по переменным.

Обучение в байесовских сетях¶

При построении байесовских сетей по данным существуют две основные задачи:

Обучение структуре: Обнаружение оптимальной структуры графа, которая отражает зависимости между переменными. Это часто является комбинаторно сложной задачей, особенно для больших наборов данных, так как включает в себя поиск по пространству всех возможных DAG.
Обучение параметрам: Оценка УРВ для каждого узла при заданной структуре. Если структура известна и данные полны, этот шаг относительно прост и может быть выполнен с использованием оценки максимального правдоподобия или байесовской оценки.

Обучение как структуры, так и параметров по данным позволяет применять байесовские сети в реальных областях, где структуры, разработанные экспертами, недоступны. Это делает их особенно ценными в таких областях, как биоинформатика, медицинская диагностика и автоматизированные системы принятия решений.

Note

По умолчанию bamt (и applybn) будет использовать K2 в качестве оценщика структуры и максимальное правдоподобие в качестве оценщика параметров.