universal schemas

25
Universal Schema Универсальная схема для извлечения информации Невмержицкий Сергей

Upload: -

Post on 13-Jul-2015

167 views

Category:

Education


1 download

TRANSCRIPT

Page 1: Universal Schemas

Universal SchemaУниверсальная схема

для извлечения информации

Невмержицкий Сергей

Page 2: Universal Schemas

Использованные материалыProbabilistic Databases of Universal SchemaLimin Yao, Sebastian Riedel, Andrew McCallum, University of Massachusetts

Relation Extraction with Matrix Factorization and Universal SchemasSebastian Riedel, University College LondonLimin Yao, Andrew McCallum, Benjamin M. Marlin, University of Massachusetts

Page 3: Universal Schemas

Идея работыСейчас используютФормат источника данных Схема базы данныхМинусы:● Потеря корректности и полноты естественного языка

Предлагается● Универсальная схема● Вероятностная база данных

Page 4: Universal Schemas

Рисунок 1. Заполнение базы данных универсальной схемы. Темные кручи - наблюдаемые факты, серые - предполагаемые. Извлечение отношений (RE) отображает поверхностные

паттерны в структурные отношения.

Page 5: Universal Schemas

ОбозначенияR - множество отношений между словами (“the X–historian-at–Y”).T - множество именованных сущностей (<FERGUSON,HARVARD>)

Факт - это такой кортеж <r,t>, где и

На вход модели подается множество наблюдаемых фактов O и наблюдаемые факты для конкретного кортежа обозначаются как:

Page 6: Universal Schemas

Кортежи и триплетыЭто почти как множества только со следующими отличиями:● могут иметь повторяющиеся элементы● порядок элементов имеет значение● кортеж всегда имеет ограниченное количество элементов

Например в RDF используются трехместные кортежи, так называемые триплеты или триады:● <Вася, любит, Машу>● <машина, цвет, красный>

В данной работе используются двухместные кортежи: <Москва, Россия>.

Page 7: Universal Schemas

Цель исследованияПроверить, что данная модель может предсказать для конкретной пары отношения (r) и кортежа (t) вероятность p(yr,t=1), где yr,t- это некоторое бинарное число, равное единице, если t находится в связи с r.

Для этого мы вводим набор экспоненциальных моделей, которые оценивают вероятность, используя натуральный параметр и логистическую функцию:

является функцией от r, t и набора весов и/или скрытыми векторами.

Page 8: Universal Schemas

Модели натурального параметраLatent Feature ModelВ данной модели мы измеряем совместимость r и t как скалярное произведение двух скрытых переменных, отражающих размер K:

Этот подход соответствует обобщенному методу главных компонент (PCA).

Page 9: Universal Schemas

Рисунок 2. gPCA изменяет оценку представления двух отношений и кортежа при появлении наблюдения r1(e). Это позволяет оценивать вероятность ненаблюдаемого факта r2(e).

Page 10: Universal Schemas

Модели натурального параметраNeighborhood ModelВ основе данной модели лежит гипотеза: Мы можем интерполировать значение интересующих нас отношение+кортеж, основываясь на известных нам значениях истинности схожих отношений того же самого кортежа.

Page 11: Universal Schemas

Модели натурального параметраEntity ModelВ отличие от хорошо структурированных баз данных типа Freebase и DBPedia, в реальности не всегда имеется возможность различить отношения. Поэтому, вместо использования заранее определенного набора типов сущностей, в данной модели мы обучаемся по скрытым в данных сущностям (latent entity representation from data).

Page 12: Universal Schemas

Модели натурального параметраCombined ModelНа практике все вышеуказанные модели могут отразить важные аспекты данных, поэтому мы также используем совмещенную модель:

Page 13: Universal Schemas

Parameter EstimationДанные модели используют веса и скрытые вектора. Мы можем оценить эти данные максимизируя log-likelihood.

Вычисление негативных утверждений с помощью неявной обратной связи.

Для получения максимальной вычислительной мощности производится оптимизация множества фактов стохастическим градиентным спуском (SGD)

Page 14: Universal Schemas

Отличия от других подходовOpen IEНовый подход основан на единой унифицированной модели, не требует никаких типов сущностей. Выведение факта составляет всего несколько скалярных произведений.

Never-Ending Learning and BootstrappingНовая модель лишь усиливает корреляции между обрабатываемыми кореференциями. Это дает преимущество в том, что неправильные предсказания имеют меньшую вероятность быть усиленными, что снижает риск семантической дрейфа.

Page 15: Universal Schemas

Данные для эксперимента

● Named-entities recognition● Выравнивание новостного корпуса и структурированных данных● Фильтрации отношений реже 10 наблюдений

Источник Обучение Тест

NYTimes после 2000 года 1990-1999 года

Freebase факты 8k 8k

Freebase сущности 200k 200k

Page 16: Universal Schemas

Выполнение экспериментаДва раздельных эксперимента для структурированных данных и поверхностных шаблонов.

Каждое отношение рассматривается как запрос и получение первых 1000 пары сущностей из каждой системы. Затем берутся первые 100 ответов от каждой системы и вручную оцениваем их истинность. Это дает нам набор релевантных результатов, которые мы используем для вычисления полноты и точности:● средняя точность● mean average precision (MAP)● weighted mean average precision

Page 17: Universal Schemas

Результаты для FreebaseТаблица 1 содержит результаты для отношений Freebase, исключая те, для которых система не смогла найти релевантные факты.● MI09 - Distant supervision for relation extraction without labeled data [Mike

Mintz et al., 2009].● YA11 - Версия MI09 с добавлением “preprocessed cluster features”

[Limin Yao et al., 2011]● SU12 - the state-of-the-art Multi-Instance Multi-Label system [Mihai

Surdeanu et al., 2012].Для всех новых моделей использованы одинаковые значения K = 100, 1000 epochs, 0.01 в качестве регулязатора для весов компонентов и 0.1 для весов соседей.

Page 18: Universal Schemas

Столбец # содержит количество позитивных фактов в базе. Жирным указаны победители, курсивом - ничья.

Таблица 1. Средние и (взвешенные) MAP значения для отношений Freebase, основанные на объединенных данных.

Page 19: Universal Schemas

График 1. Средняя 11-значная кривая точность-полнота для отношений Freebase

Page 20: Universal Schemas

График 2. Точность и полнота для works_written(X,Y)

Page 21: Universal Schemas

Результаты для Surface PatternsТаблица 2 содержит сравнение наших моделей на 10 поверхностных паттернах.

Эти результаты были выбраны как наиболее интересные, по мнению автора, вопросы, не содержащиеся в Freebase. Мы вновь видим, что добавление скрытых моделей (F, E) существенно улучшает результаты по сравнению с N-моделью.

Page 22: Universal Schemas

Таблица 2. Средние и (взвешенные) MAP значения для отношений поверхностных паттернов

Page 23: Universal Schemas

График 3. Средняя 11-значная кривая точность-полнота для отношений поверхностных паттернов

Page 24: Universal Schemas

ЗаключениеБыла представлена модель извлечения отношений в универсальные схемы. Подобные схемы содержат петтерны поверхности, а также отношения из структурированных, полученные из данных.

Поверхностные паттерны + Структурированные отношения = Улучшение качества!

Новая модель расходует меньше времени на обучение при равных объёмах информации.

Новый подход можно использовать для различных интеграционных задач.