СЕКЦИЯ 1 - raai · web viewСекция 1. Моделирование...

СЕКЦИЯ 1

МОДЕЛИРОВАНИЕ РАССУЖДЕНИЙ И НЕКЛАССИЧЕСКИЕ ЛОГИКИ

УДК 512.563.6

ОЦЕНКИ УБЕЖДЕННОСТИ ОБ УРОВНЕ ИНФОРМИРОВАННОСТИ ИНТЕЛЛЕКТУАЛЬНОГО

АГЕНТА В ЗАДАЧЕ НЕЧЕТКОГО ВЫБОРА

Г.П. Виноградов ([email protected])

Н.В. Кирсанова

Р.С. ФедотовТверской государственный технический университет, Тверь

Ключевые слова: интеллектуальный агент, нечеткий выбор, модель, принятие решений, субъективные представления, немонотонная логика.

Рассматривается задача оценки уровня убежденности агента относительно ситуации целеустремленного выбора в условиях неполноты и неопределенности информации. В этом случае агент вынужден относительно ряда аспектов (свойств) ситуации целеустремленного выбора делать правдоподобные предположения и строить на этой основе субъективное, гипотетическое представление. Введенная мера степени уверенности агента в адекватности субъективных представлений позволяет оценивать ценность дополнительной информации.

Введение При решении прикладных задач выбора наилучших решений лицо,

принимающее решения (агент по терминологии теории многоагентных систем), использует модель предметной области, отражающую его представления о ней. В ситуации неполной информации, знания или дефицита времени агент строит модель ситуации целеустремленного [Виноградов, 2009] выбора, временно исходя из правдоподобных

21

предположений, относительно которых у него нет достаточных доказательств. Под предположениями будем понимать значения, принимаемые агентом по умолчанию на основе теоретических знаний и опыта в конкретной области деятельности. Комплекс таких предпосылок, идей, взглядов направлены на объяснение явлений, процессов и связей между ними в конкретной предметной области и они образуют гипотетическую концепцию агента, которая понимается как предположительное, субъективное знание.

Предпосылка выступает в форме убеждения, которое в свою очередь является мерой степени уверенности в не полностью определенном предположении.

Выводы (заключения), которые делаются на основе гипотетической концепции (субъективной теории), определяют у агента состояние убежденности, которое является мерой истинности предпосылок, гипотез, правила построения вывода (то есть гипотетической концепции).

Если результат, полученный от реализации решения, сформированного на основе субъективных представлений агента, не соответствует его ожиданиям, то он реализует немонотонный процесс пересмотра убеждений, который предполагает изъятие ошибочной предпосылки и/или введения новой предпосылки. Новые убеждения, таким образом, являются следствием новой информации, полученной как от системы вывода, так и от системы мониторинга решений.

Для повышения степени убежденности в истинности предпосылок и уверенности в предполагаемых результатах агент использует различные процедуры повышения своей информированности. В этой связи представляет интерес разработка математических моделей, учитывающих такое поведение агента, основой которых является теория нечетких систем и теория отношений [Zadeh, 1965].

1. Модель нечеткого выбораПусть имеется шкала X, которая может быть конечной или

бесконечной. Предполагается, что на множестве X задано бинарное отношение , обладающее свойствами асимметричности, транзитивности и слабой связности. Такое отношение называется отношением строгого предпочтения на множестве значений критерия. Известно, что слабая связность отношения означает, что для любых двух элементов x1 и x2 X, x1 x2 выполняется либо соотношение x1 x2, либо соотношение x2 x1.

Пусть А – произвольное непустое множество на множестве X и А X. Нечетким множеством А на множестве Х называется совокупность пар

22

где - отображение множества Х в единичный отрезок [0, 1], называемое функцией принадлежности нечеткого множества А [Рутковская и др., 2006].

Определение 1. Нечеткой функцией выбора называется отображение C, заданное на множестве всех непустых подмножеств }, которое ставит в соответствие каждому A X определенное нечеткое множество (А) с функцией принадлежности , обладающей свойствами:

.Будем считать, что возможна ситуация, когда для некоторых

. Это означает, что выбор из множества А является пустым, то есть (А) = . Другими словами, при предъявлении некоторых А имеет место отказ от выбора [Ногин, 2003].

Согласно этому определению исход или выигрыш от выбора определяется нечетким подмножеством на множестве исходов О. Это позволяет использовать представления о ситуации выбора человека, на основе которых он устанавливает соответствия между альтернативами и исходом, используя нечеткие действительные числа.

Под нечетким числом понимается нечеткое подмножество универсального множества действительных чисел, имеющих нормальную и выпуклую функцию принадлежности такую, что: 1) существует значение носителя, в котором функция принадлежности равна единице. 2) при отступлении от единицы вправо или влево функция принадлежности не возрастает.

При сравнении исходов, представленных в виде нечетких действительных чисел, в соответствии с принципом обобщения Заде необходимо определить меры для выявления предпочтений при сравнении нечетких действительных чисел.

2. Оценки предпочтений на множестве нечетких действительных чисел

Формирование нечеткого предпочтения на базе использования операций отношения между нечеткими действительными числами состоит в выявлении следующих ситуаций предпочтения:

1) строгое предпочтение;2) безразличие; 3) большая предпочтительность; 4) не сравнимость.Графически эти ситуации можно представить как показано на рис. 1.

23

(x) 1a)

(a) (b)

a b x Строгое предпочтение: ЦА уверен, что b предпочтительнее a

(x) 1б)

(a) (b)

a = b x Безразличие (равноценность)

(x)

в) 1 (a) (b)

a b x Большая предпочтительность: ЦА уверен, что a не предпочтительнее b

(x) г)

(a) (b)

х

Несравнимость: нельзя сказать ничего определенного о предпочтительности a перед b.

Рис. 1. Ситуации предпочтительности

Из теории нечетких множеств известно, что подмножество элементов множества Х, для которых (x) > 0, называется носителем (суппортом) нечеткого множества и обозначается supp A. Соответствующая формальная запись имеет вид

24

.

Тогда для случая а) supp A supp B = , то есть носители обоих нечетких множеств не имеют общих элементов.

Для случая б) нечеткое множество B содержится в нечетком

множестве A (A B) или , или supp B supp A.

Случай б) предполагает две ситуации: 1) нечеткое множество A равно нечеткому множеству B; 2) нечеткое множество A почти равно нечеткому множеству B.

В первом случае , а во втором – можно ввести понятие степени равенства нечетких множеств A и B, например, в виде

,

где .Случай в) можно оценивать и с других позиций. Известно, что -

уровнем нечеткого множества A X, обозначаемым, как , называется четкое подмножество:

.Это подмножество можно также определить характеристической

функцией следующего вида:

Следовательно, справедлива следующая импликация:.

Определение 2. Пусть нечеткие множества A X и B X, где X – четкое множество. Пусть для каждого нечеткого множества определены множества -уровня следующим образом

,

где и - функции принадлежности, значения которых

выражают степень уверенности агента в принадлежности элемента x множествам A и B соответственно.

25

Альтернатива a будет предпочтительнее альтернативы b тогда и только тогда, когда , то есть A больше B на уровне .

Обозначим через минимальное значение , при котором выполняется неравенство:

.Тогда 1- будет степенью уверенности в предпочтительности a

относительно b и безразличия при выборе a или b. Формально это можно записать как A B: (1-).

По аналогии, если содержится в , то есть , то говорят, что A содержится в B на уровне .

Так же, как и в предыдущем случае, можно ввести оценку степени уверенности 1-, где – это минимальное значение , при котором будет справедливым , то можно говорить, что со степенью уверенности равной 1-.

Величину 1- можно считать мерой уверенности ЦА в предпочтительности одной альтернативы над другой. Если величина =1- возрастает (или уменьшается) утверждение A больше B (или A содержится в B) становится более ясным. При =0 любой элемент, принадлежащий нечеткому множеству, будет для ЦА достоверно принадлежать только этому множеству.

3. Уверенность и информацияПонятие степени уверенности при выборе альтернативы можно

использовать в различных моделях выбора: классической и поведенческой.

Легко видеть, что величина =1- зависит от вида функций

принадлежности и . Чем меньше размах supp A и supp B

(интервал от минимального до максимального значения), тем более четко выражены представления ЦА о ситуации выбора.

Введение меры степени уверенности при сравнении альтернатив позволяет:

Определить степень достаточности информации для принятия решения. При значении степени уверенности ниже некоторого порога принятие решения откладывается для сбора дополнительной информации.

Определить ценность для ЦА собранной дополнительной информации. Она может быть равной нулю, если степень уверенности не изменится после ее получения. Если величина =1- выросла, то информация способствовала росту степени представления ЦА о ситуации

26

выбора. Если , то либо имеет место дезинформация, либо полученные данные разрушают представление ЦА о ситуации выбора и требуются новые данные.

Значение пороговой величины степени уверенности зависит от индивидуальных характеристик ЦА: более осторожный человек потребует, чтобы степень уверенности была бы высокой; решительный, привыкший рисковать – менее высокой. Это позволяет сформулировать меру для количественной оценки типа ЦА.

Величина позволяет определить направление

поиска информации. Пусть имеются два высказывания: X есть G и q X есть F, где F и G – предикаты, представленные в виде нечетких множеств. Тогда, если G F, p q (p влечет q). Это означает, что первое высказывание более информативно, чем второе.

Таким образом, степень уверенности при сравнении объектов для ЦА описывает оценку степени разделения множеств, характеризующих каждый объект. Степень уверенности при поступлении более ценной информации не должна уменьшиться по сравнению со степенью уверенности, сформированной на основе данных прошлого опыта. Обозначим через D – дискриминационный эффект текущих

представлений, тогда , то есть дискриминационный эффект более

ценной и достоверной информации для ЦА не отрицателен.Таким образом, более информативное высказывание – это

высказывание с меньшей нечеткостью, мешающей разделению объектов. Следовательно, изменение информированности ЦА приводит к

изменению его представлений и как следствие к изменению и

supp A, и они могут быть использованы в качестве мер информированности ЦА.

Значит, в теории принятия решений для более четкого различения альтернатив между собой, нужно уменьшить нечеткость в оценке каждого исхода и выигрыша при применении альтернативы путем уменьшения нечеткости функции исхода и функции выигрыша (модели объекта и оценок результатов).

Достижение эффекта G F требует увеличение числа учитываемых при описании свойств. При этом каждый добавляемый признак должен увеличивать степень уверенности в различении объектов.

Увеличение числа признаков может привести к двум ситуациям:

27

1. Новая информация увеличивает степень уверенности в G F, то есть утверждение с новым признаком является более информативным, чем такое же утверждение, но без него.

2. Если сравниваются два объекта с одним и тем же количеством оцениваемых свойств, к которым добавляется еще одно свойство, но его значение у обоих объектов имеет трудно различимую величину, то добавочная информация не повышает степень уверенности в различимости объектов, но и не уменьшает ее.

Третий момент связан с использованием либо редуцированной информации, либо косвенной информации при принятии решения. В этом случае уменьшение информации не оказывает положительного влияния на степень уверенности в правильном разделении объектов.

ЗаключениеВведенная мера уверенности агента для оценки степени своей

информированности о ситуации целеустремленного выбора позволяет на основе принципов немонотонной логики организовать целенаправленный отбор информации для формирования предположений с целью построения модифицируемых логических рассуждений.

Список литературы[Виноградов, 2009] Виноградов Г.П. Модели поведения интеллектуального

агента. Сборник научных трудов V-й Международной научно-практической конференции “Интегрированные модели и мягкие вычисления в искусственном интеллекте (28-30 мая 2009 г.)”. Т.1. – М.: Физматлит, 2009.

[Ногин, 2003] Ногин В.Д. Принцип Эджворта-Парето и относительная важность критериев в случае нечеткого отношения предпочтения // журнал вычислительной математики и математической физики, 2003, т. 43, №11.

[Рутковская и др., 2006] Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. – М.: Горячая линия – Телеком, 2006.

[Zadeh, 1965] Zadeh L. Fuzzy sets. Information and Control. 1965, №8.

28

УДК 512.563.6

ИССЛЕДОВАНИЕ И ОПТИМИЗАЦИЯ УСЛОВНЫХ СИСТЕМ ПЕРЕПИСЫВАНИЯ НА ОСНОВЕ

ПРОДУКЦИОННО-ЛОГИЧЕСКОЙ МОДЕЛИ

Д.В. Баранов ([email protected])

С.Д. Махортов ([email protected]) Воронежский государственный университет, Воронеж

Теория систем переписывания представляет эффективный аппарат для решения ряда важных задач искусственного интеллекта и компьютерной алгебры. В статье вводится алгебраическая система c семантикой совокупности правил условной эквациональной теории или условной системы переписывания термов. Для данной модели рассматриваются такие вопросы как замкнутость, эквивалентные преобразования, структура замыкания, логическая редукция.

Введение Системы переписывания термов (СПТ) применяются при решении

таких известных задач как автоматическое доказательство теорем [Hsiang, 1985], символьное упрощение алгебраических выражений [Buchberger et al., 1982], верификация компьютерных программ [Воробьев, 1987] и других. Важными вопросами СПТ являются эквивалентные преобразования и упрощение их множеств правил. Для обычных СПТ подобные задачи решались в ряде работ (например, [Toyama, 1986]), для условных СПТ они еще остаются открытыми. Данное обстоятельство объясняется более сложной структурой правил условных СПТ. Для обычных систем задача минимизации множества правил сводится к транзитивной редукции бинарного отношения. Для условных систем можно говорить о более сложной задаче нахождения логической редукции.

При определении системы переписывания отправной точкой является эквациональная теория, множество правил которой состоит из равенств термов. Правила СПТ получаются путем «ориентации» равенств и, возможно, пополнения для достижения свойства конфлюэнтности [Klop, 1992]. Аналогичный подход используется и для условных СПТ

29

[Dershowitz et al., 1988]. Поскольку обычно именно эквациональная теория дает критерий эквивалентности систем переписывания, исследование в этом плане условных СПТ может быть начато с рассмотрения эквивалентности самих условных эквациональных теорий.

В работе [Махортов, 2009] представлена методология исследования условных СПТ на основе «решеточных» продукционно-логических структур (LP-структур). Полученные результаты, в частности, впервые решают задачу построения логической редукции условной эквациональной теории. Однако рассмотренная там алгебраическая модель оперирует равенствами как атомами, не учитывая некоторые их транзитивные свойства. Данное обстоятельство приводит в общем случае к незавершенной минимизации множества условных правил при построении его логической редукции. В настоящей работе вводится и исследуется более сложная LP-структура, в результате чего отмеченный недостаток устраняется. Некоторые из полученных здесь результатов были анонсированы в сообщении [Махортов и др., 2010].

Исходная эквациональная теория состоит из условных соотношений вида («если имеют место равенства термов

, то выполнены и все »). Будем называть такие соотношения (условными) эквациональными правилами, или просто правилами там, где это не будет вызывать недоразумений. Равенства между термами интерпретируются обычным для эквациональных теорий способом: , если данное равенство можно получить из имеющегося набора равенств с помощью рассматриваемой эквациональной дедукции. Соответствующие ей аксиомы и правила вывода определяются в п.1. Они естественным образом расширяют набор аксиом и правил вывода, описанный в [Klop, 1992] для условных равенств вида .

В предлагаемой алгебраической модели условные эквациональные правила реализуются бинарным отношением на решетке, порожденной множествами равенств . Отношение связывает наборы равенств между термами: каждому правилу

соответствует пара , где и . Модель содержит логику

продукционного вывода.Кроме разработки самой модели, основные результаты статьи

(сформулированы в п.2) состоят в следующем. Представлено утверждение о существовании логического замыкания (теорема 2.1) бинарного отношения, что в приложении приводит к понятию эквивалентных эквациональных теорий. Обоснована возможность локально-

30

эквивалентных преобразований исходного отношения (теорема 2.2), соответственно и преобразования множества правил. Исследована структура логического замыкания (теорема 2.3), что позволяет при его построении использовать эффективные алгоритмы. Изучены вопросы существования и построения логической редукции бинарного отношения (теорема 2.4). Это исследование дает теоретическую основу для минимизации условной эквациональной теории. Под минимизацией подразумевается получение такой эквивалентной системы, из которой невозможно удалить ни одного правила без нарушения эквивалентности.

В п.3 подводятся итоги и указываются некоторые перспективы. Ввиду ограничения на объем статьи доказательства сформулированных теорем планируются к опубликованию в отдельной работе.

1. Основные понятия и обозначенияРешеткой называется частично упорядоченное множество , в

котором наряду с отношением («не больше», «содержится») введены две операции («пересечение») и («объединение»), вычисляющие соответственно точную нижнюю и верхнюю грани для любых .

Как известно, множество всех конечных подмножеств универсума образует решетку. В настоящей статье рассматривается именно такой вид решеток. Чтобы подчеркнуть данное обстоятельство, вместо символов , , и будем использовать знаки теоретико-множественных операций , , и . Однако термин «решетка» сохраняется, поскольку в дальнейшем результаты могут быть распространены и на другие виды решеток.

Приведем некоторые базовые определения, связанные с термами [Klop, 1992]. Пусть – алфавит, образованный объединением непересекающихся множеств: – множество переменных; , – множества -арных функций (функциональных символов); -арные функции называются также константами. Множество термов определяется рекурсивно:

; ;

если и , то .Отображение называется подстановкой. Это понятие

распространяется на все следующим образом: если , то ; если , то ;

31

если , и , то .

Эквациональной теорией называется пара , где – алфавит, состоящий из счетного множества переменных и

непустого множества функциональных символов (сигнатура); – множество равенств вида . Определяется понятие выводимости равенства из (

) на основе следующих правил:1) если , то ;2) если , то для

любого ;3) если , то для всех подстановок ;4) ;5) если , то ;6) если , то .Для множества равенств введем решетку конечных подмножеств

. На основании правила 6) будем в этой решетке отождествлять пары элементов вида и . В заданы отношения , , а также «решеточные» операции и – теоретико-множественные пересечение и объединение. Кроме них потребуются еще три группы операций, связанных соответственно с функциями, подстановками и транзитивностью равенств термов:

1) если и , то ;

2) если , то для подстановки ;

3) если , то .Определение 2.1. Пусть задана теория . Эквациональной

решеткой будем называть решетку, полученную пополнением относительно определенных выше дополнительных операций 1)–3).

Как уже подчеркивалось во Введении, рассматривается условная эквациональная теория, содержащая условные правила вида

. Таким образом, предпосылка и заключение правила являются элементами .

32

Используя в качестве основы аксиомы и правила, определенные в [Klop, 1992], сформулируем их аналоги для условной эквациональной дедукции. Аксиомы порождаются перечисленными выше правилами вывода равенств. Правило 2) означает наличие условного правила (аксиомы) для любых и ; из 3) следует аксиома для любых и подстановки . Правило 5) порождает аксиому для каждого подходящего . Еще одной очевидной аксиомой является правило при .

Заметим, что правило 6) было учтено при определении множества . Что касается правила 4), то в соответствии с ним можно было бы

ввести множество аксиом вида . Однако роль таких «вырожденных» аксиом для рассматриваемых в настоящей работе задач несущественна, поскольку трудно оправдать наличие равенства в предпосылке или заключении условной продукции.

Правила вывода в условной эквациональной дедукции таковы:1) для любой подстановки (см.

аналогичное правило в [5] с исходными обозначениями);2) (возможность вывода по частям);3) (транзитивность).

2. LP-структура для условной эквациональной теорииСогласно [Махортов, 2009], LP-структурой (Lattice Production

Structure) называется решетка с дополнительно заданным на ней бинарным отношением, которое обладает рядом продукционно-логических свойств. В этом разделе рассматриваются отношения на эквациональной решетке. Вводится понятие логического отношения, которое соответствует множеству правил условной эквациональной теории. Свойства такого отношения должны отражать сформулированные в п.1 аксиомы и правила условной эквациональной дедукции.

Во-первых, логическое отношение должно содержать все аксиомы. Введем для них общее обозначение: , если , ,

или . Таким образом, для логического отношения справедливо . Другие свойства логического отношения вытекают из правил дедукции.

Определение 2.1. Отношение назовем применимым, если для любой подстановки из следует .

Определение 2.2. Отношение назовем -дистрибутивным, если для любых выполнено .

33

Следующее определение суммирует рассмотренные свойства.Определение 2.3. Бинарное отношение на эквациональной решетке

называется логическим, если оно содержит аксиомы, а также является применимым, -дистрибутивным и транзитивным. Логическим замыканием произвольного отношения называется наименьшее логическое отношение, содержащее .

Два отношения и , определенные на общей эквациональной решетке, называются эквивалентными ( ), если их логические замыкания совпадают. Логической редукцией данного отношения называется минимальное эквивалентное ему отношение . Из определения не следует существования логического замыкания или редукции для произвольного бинарного отношения. Эти вопросы рассматриваются ниже.

Определение 2.4. Пусть задано некоторое отношение на эквациональной решетке . Будем говорить, что упорядоченная пара

логически связана отношением (обозначим этот факт ), если выполнено одно из следующих условий:

;1) :

1.1) или 1.2) или 1.3) или 1.4) ;2) существуют такие и подстановка , что

, причем ;3) существуют такие , что , причем

;4) существует элемент такой, что и .

Теорема 2.1. Для произвольного отношения на эквациональной решетке логическое замыкание существует и совпадает с множеством

всех упорядоченных пар, логически связанных отношением .Следствие 2.1. Пусть – бинарное отношение на эквациональной

решетке и ( конечно). Тогда отношение эквивалентно .

Пусть дано произвольное бинарное отношение на эквациональной решетке. Его эквивалентным преобразованием называется такая замена всего множества пар или его части, что полученное в результате новое отношение логически эквивалентно , то есть .

34

Теорема 2.2. Пусть – отношения на общей эквациональной решетке. Если при этом и , то

.Следствие 2.2. Пусть – отношения на общей эквациональной

решетке. Если при этом , то .Следствия 2.1 и 2.2 обосновывают принцип локальности

эквивалентных преобразований отношений: если часть данного отношения заменить эквивалентной частью, то и в целом новое отношение будет эквивалентным исходному. Эти результаты открывают возможности автоматических преобразований условных эквациональных теорий.

Далее выясним вопрос о возможности в процессе построения логического замыкания выделить этап, соответствующий транзитивному замыканию. Положительный ответ позволит свести изучение некоторых важных вопросов, касающихся логических отношений, к соответствующим проблемам транзитивных отношений. В частности, построение логического замыкания или редукции можно будет осуществлять с помощью быстрых алгоритмов (типа Уоршолла [Aho et al., 1972]).

Для произвольного отношения на эквациональной решетке рассмотрим отношение , построенное последовательным выполнением следующих шагов:

1) добавить к все пары , для которых , либо , и обозначить новое отношение ;

2) добавить к всевозможные пары вида , для которых , и обозначить новое отношение ;

3) добавить к всевозможные пары вида , где , и обозначить

новое отношение ;4) объединить с отношением . Заметим, что шаги 1) и 4) относятся ко всем теоретически возможным

элементам эквациональной решетки и соответственно не зависят от данного . В силу бесконечности множества описанный процесс построения отношения носит теоретический характер. В приложениях вместо можно взять конечное подмножество эквациональной решетки, построенное при ограничении уровня вложенности термов.

35

Теорема 2.3. Логическое замыкание отношения совпадает с транзитивным замыканием соответствующего отношения .

Выясним вопрос о существовании и построении логической редукции бинарных отношений. Для отношения на эквациональной решетке рассмотрим отношение , построенное по данному последовательным выполнением шагов, обратных построению , а именно:

1) исключить из все пары , для которых , и обозначить новое отношение .

2) исключить из все пары вида , где , причем

не совпадает ни с одной парой , и обозначить новое отношение ;

3) исключить из всевозможные пары вида , для которых , причем не совпадает с парой

, и обозначить новое отношение ;4) исключить из все пары , для которых , ,

либо .Вновь подчеркнем, что выполнение шагов 1), 4) связано с

«универсальными» тавтологиями, и поэтому алгоритмы их выполнения существенно не зависят от исходного отношения . Следующая теорема указывает достаточное условие существования и способ построения логической редукции бинарного отношения.

Теорема 2.4. Пусть для отношения на эквациональной решетке построено соответствующее отношение . Тогда, если для существует транзитивная редукция , то соответствующее ей отношение представляет собой логическую редукцию исходного отношения .

ЗаключениеВ настоящей работе предложена основанная на решетках

алгебраическая модель условной эквациональной теории и представлены результаты теоретического исследования этой модели. Они обосновывают локально-эквивалентные преобразования множества условных правил, а также его оптимизацию путем получения эквивалентной системы с минимальным набором правил. Указанные результаты могут найти

36

применение при решении ряда важных задач искусственного интеллекта и компьютерной алгебры.

В дальнейшем можно рассмотреть более общую модель LP-структуры, если в качестве ее основы вместо использовать решетку Линденбаума-Тарского [Расёва и др., 1972]. Тогда моделируемые условные правила смогут в качестве предпосылок и заключений содержать формулы пропозиционального исчисления. При этом общая методология исследования останется прежней.

Интересным представляется переход от равенств термов к модели ориентированных правил и выяснение вопроса о том, как логически эквивалентные преобразования множества правил влияют на основные свойства исходной условной СПТ (нетеровость и конфлюэнтность [Dershowitz et al., 1988], [Klop, 1992]). Можно предположить, что в силу эквивалентности преобразований основные свойства СПТ сохраняются, однако этот вопрос нуждается в формальных исследованиях.

Список литературы[Воробьев, 1987] Воробьев С. Г. Условные системы подстановок термов и их

применение в проблемно-ориентированной верификации программ: автореф. дис. к. ф.-м. н. – Новосибирск: ВЦ СО АН СССР, 1987.

[Махортов, 2009] Махортов С. Д. Основанный на решетках подход к исследованию и оптимизации множества правил условной системы переписывания термов // Интеллектуальные системы. – 2009. – Т. 13, вып. 1–4.

[Махортов и др., 2010] Махортов С. Д., Баранов Д. В. LP-структуры в условных системах переписывания // Современные проблемы информатизации в моделировании и социальных технологиях: сб. трудов / под ред. О. Я. Кравца. – Воронеж: Научная книга, 2010. – Вып. 15.

[Расёва и др., 1972] Расёва Е., Сикорский Р. Математика метаматематики. – М.: Наука, 1972.

[Aho et al., 1972] Aho A. V. The transitive reduction of a directed graph. SIAM J. Computing 1 : 2 / A. V. Aho, M. R. Garey, J. D. Ulman, 1972.

[Buchberger et al., 1982] Buchberger B., Loos R.. Algebraic Simplification // Computer Algebra – Symbolic and Algebraic Computation / eds. B. Buchberger, G. E. Collins, R. Loos. – Vienna – New York : Springer-Verlag, 1982.

[Dershowitz et al., 1988] Dershowitz N., Okada M., Sivakumar G. Canonical Conditional Rewrite Systems // Proceedings of the 9th international Conference on Automated Deduction (May 23–26, 1988) / eds E. L. Lusk, R. A. Overbeek // Lecture Notes In Computer Science. – London : Springer-Verlag. – 1988.

[Hsiang, 1985] Hsiang J. Refutational theorem proving using term-rewriting systems // Artif. Intell. – 1985.

[Klop, 1992] Klop J. W. Term rewriting systems // Handbook of Logic in Computer Science (Vol. 2): Background: Computational Structures / eds S. Abramsky, D. M. Gabbay and S. E. Maibaum // Osborne Handbooks of Logic In Computer Science. – New York : Oxford University Press. – 1992.

37

[Toyama, 1986] Toyama Y. On Equivalence Transformations for Term Rewriting Systems// Proceedings of the 1983 and 1984 RIMS Symposia on Software Science and Engineering II / eds E. Goto, K. Araki and T. Yuasa // Lecture Notes In Computer Science. – London : Springer-Verlag. – 1986.

УДК 007:519.816

РЕАЛИЗАЦИЯ ЛОГИКИ ВЕТВЯЩЕГОСЯ ВРЕМЕНИ

И.Е. Куриленко ([email protected]) Московский Энергетический Институт (Технический

Университет), Москва

Рассматривается современный подход к моделированию темпоральных (временных) рассуждений в интеллектуальных системах. Предлагаются алгоритмы вывода для ветвящейся временной логики, построенной на основе качественной точечной модели времени. Разработанные алгоритмы построены с учетом специфики применения в составе интеллектуальных систем поддержки принятия решений реального времени (ИСППР РВ).

ВведениеСовременные исследования и разработки по созданию перспективных

интеллектуальных (экспертных) систем поддержки принятия решений (ИСППР), в частности, ИСППР реального времени (РВ) [Вагин и др., 2001] опираются на разработку и применение интегрированных моделей и неклассических логик. Так как многие базовые понятия, такие как «изменение», «причина», «следствие» и отношения между ними описываются в терминах времени, ведутся активные исследования по построению интегрированных моделей рассуждений учитывающих временной фактор при описании проблемной ситуации и в процессе поиска решения [Поспелов и др., 1986]. ИС типа ИСППР РВ в процессе своего функционирования вынуждены оперировать с большим количеством информации, изменяющейся со временем (это могут быть показания датчиков, значения управляющих параметров, выполняемые операторами действия и т.д.) [Башлыков и др., 1994]. При этом поиск решения таких задач ИСППР как диагностика, мониторинг, планирование, прогнозирование и др. должен обеспечиваться в условиях достаточно жестких временных ограничений (определяемых реальным управляемым процессом) и различного вида неопределенностей в исходных данных и знаниях [Еремеев и др., 2003]. Таким образом,

38

временные логики и временной вывод могут применяться во многих блоках ИСППР РВ (анализаторе, блоках поиска решения, объяснения, моделирования и прогнозирования) и позволяют повысить скорость отклика системы, что увеличивает эффективность принятия решений ЛПР в различных проблемных (аномальных) ситуациях.

Для ИСППР РВ требуются модели (логики) ветвящегося времени, которые полезны при прогнозировании последствий принимаемых решений или развития некоторой ситуации в условиях дефицита времени. К сожалению, алгоритмы вывода для известных темпоральных логик [Torsun, 1998] ветвящегося времени обладают большой сложностью. В данной работе основное внимание уделяется вопросу создания темпоральной логики ветвящегося времени, применимой в составе современных ИС.

1. Основные определения и алгоритмыНа данный момент известно большое количество разнообразных

временных логик [Pnuelli, 1977; Смирнов, 1979; Allen, 1983; Gereviny et al., 1993]. Однако на практике препятствием к их широкому внедрению является высокая сложность алгоритмов вывода. В этом плане выделяются логики, построенные на основе представления информации о времени как ограничений (зависимостей) между временными примитивами. В качестве таких примитивов могут использоваться временные моменты, интервалы или их комбинация. Зависимости между временными примитивами трактуются как ограничения на их расположение во времени. Благодаря существованию полиномиальных алгоритмов вывода, а также тому, что в них представимы сложные типы временных зависимостей, они являются предметом активных исследований. Среди них наиболее простой и приемлемой по вычислительной сложности для применения в составе современных ИС является точечная временная логика [Еремеев и др., 2009]. Реализация алгоритмов вывода в точечной временной логике основывается на переходе к задаче согласования временных ограничений (ЗСВО). ЗСВО является конкретизацией более общей задачи согласования ограничений (ЗСО), что позволяет использовать для решения ЗСВО методы, применяемые для ЗСО [Еремеев и др., 2003]. ЗСВО задается как Z = (V,D,BTR,C) [Еремеев и др., 2005]:

1. V={V1,V2,…,Vm} – конечное множество временных переменных (интерпретируемых как моменты времени);

2. D – область значения переменных (множество целых чисел);3. BTR={r1,r2,…rn} – конечное множество взаимоисключающих

бинарных базовых временных ограничений, полное объединение

39

которых является универсальным ограничением U (не накладывающим каких-либо ограничений);

4. C={Cij|Cij={r1,…rk};k>0;r1,…rkBTR;i,j≤m}, конечное множество ограничений, где Cij – ограничение над временными переменными Vi и Vj, интерпретируемое как (Vi,r1,Vj) … (Vi,rk,Vj). Если Cij

состоит только из одного дизъюнкта, то оно называется точным.Для решения задачи выполнимости SAT необходимо найти множество

не противоречащих друг другу ограничений C*={Cij*|Cij

*={rl},rlCij}. Если такого множества построить нельзя, то ЗСВО является несогласованной. Если ЗСВО имеет по крайне мере одно решение, то она называется согласованной.

Основными операциями над временными ограничениями являются:1) отрицание (): Lij=U\Lij;2) инвертирование (~): ~(r1,…,rk)=(~r1,…,~rk);3) пересечение: S∩T={r|rS,rT};4) композиция: TS={t1,…tk}{s1,…sq}={t1s1,t1s2,…tksq}.Известно [Gereviny et al., 1993], что множество всех возможных типов

временных ограничений для двух временных примитивов, состоит из 2|BTR|

типов ограничений, замкнуто относительно операций , ~, ∩, и образует алгебру временных ограничений.

ЗСВО называют единичной ЗСВО (ЕЗСВО) тогда и только тогда, когда в множество C входят только точные ограничения. При этом сама ЗСВО сводится к проверке непротиворечивости (согласованности) ограничений из множества C. Задачу определения ограничения r, справедливого для переменных Vi и Vj, для которых задано ограничение Cij={r1,…rk}, при k>1, называют задачей вычисления неточного ограничения Cij.

Ограничение Cij выполнимо для переменных Vi и Vj тогда и только тогда, когда существует хотя бы одно решение ЗСВО, в котором Сij

является ограничением для этих переменных. Минимальным ограничением Сij

min называется множество, состоящее только из выполнимых ограничений для Vi и Vj. ЗСВО называют минимальной, если все ее ограничения минимальны. Задачу вычисления минимальной ЗСВО называют задачей поиска минимального представления MIN. Известно, что для любой ЗСВО всегда можно найти эквивалентную минимальную или показать несогласованность ограничений.

Построим на базе точечной временной логики логику ветвящегося времени, применимую в составе современных интеллектуальных систем [Куриленко, 2004; Куриленко, 2009]. Сначала определим на базе ЕЗСВО сценарий как Si=(Vi,Ci,Sj), где S0=(V0,D,BTR,C0) – ЕЗСВО, интерпретируемая как начальный сценарий; Si – наследуемый сценарий, который расширяет множество переменных Vj и множество единичных

40

ограничений Cj сценария Sj, j<i, множествами Vi и Ci соответственно; D – область определения переменных (множество целых чисел), BTR- множество базовых временных ограничений. Таким образом, сценарий является композитной ЕЗСВО, которую можно построить по иерархии наследования, задаваемой в определением сценария. Для каждого сценария, исходя из определения ЕЗСВО, можно поставить задачи поиска минимального представления и проверки согласованности, то есть можно говорить о согласованном или несогласованном сценарии и сценарии в минимальном представлении. Будем называть текущими сценариями такие сценарии, для которых не существует наследуемых сценариев.

Определим ветвящуюся ЗСВО как множество альтернативных сценариев, унаследованных от одного начального сценария S0 VZ = {S : S – сценарий}. Определим для ветвящейся ЗСВО следующие подзадачи:

Проверка согласованности – проверка существования как минимум одного текущего согласованного сценария Si VZ.

Проверка истинности каких-либо утверждений для конкретного текущего сценария.

Преобразование всех ЕЗСВО, соответствующих согласованным сценариям, к минимальному виду.

Проверка истинности каких-либо утверждений для всех текущих сценариев или хотя бы для одного текущего сценария.

Рассмотрим пример (рис. 1). Данная задача содержит 16 сценариев, из которых 5 являются несогласованными. Следует отметить, что, исходя из практических соображений, следует допускать наследование только согласованных сценариев. Поэтому сценарии S26 и S27 не участвовали в порождении сценариев-наследников.

Рис. 1. Ветвящаяся ЗСВО

41

Таким образом, каждый сценарий соответствует возможному варианту развития событий (задаваемому соответствующим множеством ограничений над моментами времени).

Существуют разнообразные стратегии формирования сценариев в ветвящейся ЗСВО. В качестве источника ветвления на каждом шаге являются дизъюнктивные утверждения. Не дизъюнктивные утверждения добавляются к каждому текущему сценарию и не приводят к ветвлению. В случае же если вносятся дизъюнктивные утверждения, то к каждому сценарию добавляется ряд наследников. Например, при добавлении в ветвящуюся ЗСВО ограничения типа Cij v Сxy для каждого текущего сценария должны быть добавлены три сценария – сценарий, в котором обязательно наличие ограничения Cij, сценарий, в котором обязательно наличие Сxy и сценарий в котором обязательно наличие как Cij так и Сxy. Естественно, что при такой постановке ветвление является существенной проблемой, так как ведет к сильному росту числа возможных сценариев (особенно при большом числе дизъюнктов). Однако существует ряд приемов, которые могут быть использованы для ограничения ветвления. Мы рассмотрим их немного позже. На практике может быть предусмотрен вариант внесения ограничений, связанных исключающим или, то есть в рассмотренном примере нет необходимости порождения сценария, в котором обязательно наличие комбинации Cij и Сxy. Другой возможной стратегией является независимая достройка сценариев (когда каждый сценарий достраивается и разветвляется так, как это необходимо исходя из практической задачи). В этом случае внесение дизъюнктивного ограничения приводит к разветвлению конкретного сценария и может не затронуть все оставшиеся сценарии.

Алгоритмы решения задач ветвящейся ЗСВО могут быть построены на базе алгоритмов решения ЕЗСВО [Gereviny et al., 1993; Еремеев и др., 2005; Куриленко, 2007; Куриленко, 2008]. В частности каждую ЕЗСВО в процессе решения ветвящейся ЗСВО можно решать с помощью перехода к задаче на графе времени TL-графе (Подробно подход к решению ЕЗСВО на основе перехода к задаче на графе рассмотрен в работах [Gereviny et al., 1993; Еремеев и др., 2005]). Однако подобный подход не является оптимальным, так как на практике придется хранить в памяти TL-граф и Time-граф для каждого сценария. С учетом возможного роста числа сценариев хотелось бы построить такое внутреннее представление задачи, которое позволяло бы экономить ресурсы за счет учета наследования сценариев, заложенного в само определение ветвящейся ЗСВО. Также при построении алгоритмов следует учесть, что создание новых сценариев на каждом шаге должно выполняться как можно быстрее, так как в некоторых приложениях, типа ИСППР РВ, глубина анализа (то есть рассмотрение как можно большего числа сценариев) способствует

42

получению более качественного решения. В работах [Куриленко 2008, 2009] предлагаются алгоритмы позволяющие экономить вычислительные ресурсы при последовательном дополнении ЕЗСВО ограничениями, за счет анализа производимых изменений. В случае ветвящейся ЗСВО такие алгоритмы отлично подходят для решения ЕЗСВО для каждого сценария-наследника Si=(Vi,Ci,Sj), так как они определяются как расширение множества ограничений в сценарии-предке. Коротко рассмотрим этот подход. Для представления ЕЗСВО используется TL граф, определяемый как G=(W,E,L), где W – непустое множество вершин (соответствующее моментам времени), E – множество направленных связей вида (wi, l, wj), где wi,wjW, lL, L={<,≤} [Куриленко, 2008]. Путем πxy=<x0,x1,..xk>из вершины x в вершину y в графе G называется последовательность вершин, в которой x0=x, xk=y и (xi,xi+1)E для всех 0≤i<k. В качестве веса пути примем w(πxy)= , где - пометка ребра (xi,xi+1). В случае если при вычислении веса wxy в графе G существует направленная связь (y, l, x), то в качестве wxy принимается ~l. Будем считать путь πxy существенным, если w(πxy)≠U и w(πxy)≠ Ø.

Определим множество P всех направленных путей между всеми вершинами в графе G. Определим: P' – множество существенных путей в графе G, P'P; множество входящих в вершину x путей Lp(x)={πlx|l≠x, πlxP'} и множество выходящих из вершины x путей Rp(x)={πxm|m≠x, πxmP'}. Алгоритмы создания и удаления связей строятся таким образом, что их выполнение производится над множеством существенных путей, и что связи, которые могут привести к несогласованности, отсекаются на этапе внесения и не участвуют в порождении путей. Ниже приводится алгоритм, применяемый для создания связей (алг. 1), сложность которого составляет O(|Rp(y)||Lp(x)|). Требуемый для работы объем памяти – O(e2). Существенным отличием алг. 1 является то, что согласованность проверяется на этапе создания связей, и несогласованность определяется сразу при внесении приводящих к ней связей.Алгоритм 1. Алгоритм создания связейВходные данные: (x,r,y) – связь для создания, r{<,>,≤,≥}; P' – множество всех существенных путей.01: r'← Алгоритм 1(x,y,P')02: if (r' ∩ r = Ø) return inconsistent03: if (r' r) return // Существующее ограничение сильнее вносимого04: foreach (πlxLp(x)) { 05: if (πly существенный) P = Pπly 06: foreach (πymRp(y)) 07: if (πlm - существенный) P = Pπlm 08: } // foreach πlx Lp(x)

43

09: foreach (πymRp(y))10: if (πxm – существенный) P = Pπxm

Алгоритм создания связей в результате своей работы вносит в множество существенных путей пути, которые образуются в TL-графе в результате создания связи (w,l,v). Алгоритмы вычисления выполнимого ограничения и удаления ограничения приведены в работе [Куриленко, 2008]. Эти алгоритмы построены так, что они позволяют поддерживать в актуальном состоянии множество всех существенных путей на TL-графе G, соответствующему ЕЗСВО, после каждого изменения. Основным преимуществом этого подхода является то, что после каждого изменения не требуется вызов дополнительных алгоритмов проверки согласованности и вычисления неявных ограничений.

Таким образом, для каждого текущего сценария можно держать множество существенных путей и для достройки сценария использовать приведенные выше алгоритмы. Следует отметить, что применяемая внутренняя структура данных (множество существенных путей) может быть с легкостью адаптирована для ветвящейся ЗСВО за счет хранения для каждого сценария-наследника Si=(Vi,Ci,Sj) только тех существенных путей, которые появились при дополнении ЕЗСВО сценария-предка Sj

входящими в Ci ограничениями. Такой подход очень просто реализуется, позволяет значительно уменьшить объем памяти, требуемый для решения задачи.

Рассмотрим некоторые методы, позволяющие уменьшить ветвление. В примере, приведенном на (рис. 2) показана ситуация, когда в ветвлении нет необходимости. Следует отметить, что все три сценария Sj+1, Sj+2 и Sj+3

будут идентичны Sj, так как ограничения (V2, <, V5) и (V1, <, V4) следуют из ЕЗСО, соответствующей сценарию Sj. Более сложной версией проиллюстрированного правила выводимости является случай, когда в дизъюнктивном ограничении не все элементарные ограничения следуют из Sj. Но и в этом случае можно уменьшить ветвление. Рассмотрим пример на рис.3. Сценарии Sj+2 и Sj+3 будут аналогичными, так как из ЕЗСВО, соответствующей Sj, следует ограничение (V2, <, V5). Сценарий Sj+1 идентичен Sj, но сохранен в качестве текущего сценария, чтобы не потерять вариант, когда выполнение ограничения (V5,<,V4) не требуется. В этом заключается сложность логики ветвящегося времени.

Приведенные алгоритмы позволяют организовать решение ветвящейся ЗСВО и ее подзадач. В частности, так как при любых изменениях поддерживается множество текущих сценариев и для каждого сценария за счет применения приведенных ранее алгоритмов для получения множества существенных путей поддерживается актуальное решение соответствующей ЕЗСВО, автоматически решается подзадача проверки

44

согласованности. В любой момент для любого из текущих сценариев можно проверить истинность какого-либо утверждения.

Рис. 2. Пример случая ограничения ветвления

Рис. 3. Пример случая ограничения ветвления

ЗаключениеПостроенная ветвящаяся логика на базе точечной временной логики

является менее выразительной, чем известные аналоги, но практически реализуемой. Рассмотренные алгоритмы реализованы в СВР PointTime, интегрирующей различные модели представления временных зависимостей (для метрического, интервального, смешанного представления времени, для линейной и ветвящейся структур времени, количественных и качественных временных зависимостей и т.д.). Данная СВР разрабатывается в МЭИ (ТУ) для применения в составе прототипа ИСППР РВ для мониторинга и управления сложными техническими объектами [Еремеев и др., 2005].

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 08-01-00437-a).

45

Список литературы[Башлыков и др., 1994] Башлыков А.А., Еремеев А.П. Экспертные системы

поддержки принятия решений в энергетике. – М.: Изд-во МЭИ, 1994. [Вагин и др., 2001] Вагин В.Н., Еремеев А.П. Некоторые базовые принципы

построения интеллектуальных систем поддержки принятия решений реального времени // Изв. РАН. Теория и системы управления, 2001, №6.

[Еремеев и др., 2003] Еремеев А.П., Троицкий В.В. Модели представления временных зависимостей в интеллектуальных системах поддержки принятия решений // Изв. РАН. Теория и системы управления, 2003, №5.

[Еремеев и др., 2005] Еремеев А.П., Куриленко И.Е. Реализация временных рассуждений для интеллектуальных систем поддержки принятия решений реального времени // Программные продукты и системы, 2005, №2.

[Еремеев и др., 2009] Еремеев А.П., Куриленко И.Е. Применение темпоральных моделей в интеллектуальных системах / Интеллектуальные системы. Колл. монография. Выпуск третий. / Под. Ред. В.М. Курейчика. – М.: Физматлит, 2009.

[Куриленко И.Е., 2004] Куриленко И.Е. Некоторые принципы построения систем временных рассуждений для СППР РВ // Сб. тр. научной сессии МИФИ–2004 в 15 т. – Т.3. – М.:МИФИ, 2004.

[Куриленко, 2007] Куриленко И.Е. О методах улучшения алгоритмов вывода для системы временных рассуждений // Сб. тр. IV–й междунар. научно–практической конф. Интегрированные модели и мягкие вычисления в искусственном интеллекте в 2 т. – Т.1. – М.:ФизМатЛит, 2007.

[Куриленко, 2008] Куриленко И.Е. «Пошаговые алгоритмы временных рассуждений для точечной модели времени» // Сб. тр. научной сессии МИФИ–2008 в 15 т. – Т.10. – М.:МИФИ, 2008.

[Куриленко, 2009] Курилено И.Е. Система временного вывода для интеллектуальных систем поддержки принятия решений реального времени // Сб. док. междунар. научно-практ. конф. Интегрированные модели и мягкие вычисления в искусственном интеллекте в 2 т. – Т.1. – М.:ФизМатЛит, 2009.

[Поспелов и др., 1986] Поспелов Д.А., Литвинцева Л.В Представление знаний о времени и пространстве в интеллектуальных системах / Под ред. Д.А. Поспелова. – М.: Наука, 1986.

[Смирнов, 1979] Смирнов В.А. Логические системы с модальными временными операторами // Материалы II Советско-финского коллоквиума по логике «Модальные и временные логики». – М.: Институт философии АН СССР, 1979.

[Allen, 1983] Allen J.F. Maintaining Knowledge about Temporal Intervals. // Communications of the ACM. 1983. Vol. 26, №11.

[Gereviny et al., 1993] Gereviny A. and Schubert L. Efficient Algorithms for Qualitative Reasoning about Time. Technical report 496, Department of Computer Science, University of Rochester, Rochester, NY, 1993.

[Pnuelli, 1977] Pnuelli A. The temporal logic of programs. Proc. 18th Ann. Symp. Found. Computational Science, 1977.

46

[Torsun, 1998] Torsun I.S. Foundations of Intelligent Knowledge-Based Systems // ACADEMIC PRESS, London, 1998.

УДК 007:519.816

ПРИНЦИПЫ ОРГАНИЗАЦИИ ПРАВДОПОДОБНЫХ РАССУЖДЕНИЙ

В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ

К.А. Найденова ([email protected]) Военно-медицинская академия, Санкт-Петербург

В работе описываются возможные механизмы организации и управления знаниями и данными в интеллектуальных компьютерных системах. Рассматриваются также трудности и тенденции в реализации правдоподобных рассуждений в интеллектуальных системах.

ВведениеМы будем рассматривать интеллектуальную компьютерную систему

(ИКС) как систему способную совершать правдоподобные рассуждения. База данных (БД) системы интеллектуальна, если она общается с пользователем скорее посредством рассуждений на уровне концептуальных знаний, а не с помощью специального формального языка запросов. Наша цель сформулировать главные принципы, которые могли бы быть положены в основу конструирования, прежде всего, интеллектуальных БД. Основные трудности реализации правдоподобных рассуждений в компьютерах связаны с решением следующих проблем:

Взаимодействие между данными и знаниями; Представление и структурная организация данных и знаний; Интеграция концептуальной кластеризации и управляемого

концептуального машинного обучения, при котором для интерпретации классов объектов возможно обращение к знаниям самой ИКС, а не только к эксперту, управляющему обучением;

Процедурный анализ и синтез объектов из элементарных компонентов. Эта задача концептуального машинного обучения возникает всегда при извлечении знаний из достаточно сложно организованных данных – изображения, тексты, речь и т. п.

Интеграция данных и знаний есть главная составляющая интеграции всех типов рассуждений в ИКС. Рассмотрим некоторые идеи

47

взаимодействия между данными и знаниями и сформулируем главные направления исследований для решения перечисленных выше проблем.

1. Интеграция данных и знаний

1.1. Данные как источник концептуальных знанийИнженерия знаний возникла из парадигмы, в которой знания

рассматриваются как что-то отделяемое от данных и функционирующее автономно для решения прикладных проблем. Но функционирование естественного интеллекта имеет результатом когнитивные структуры через организацию последовательных и постоянных действий, выполняемых над данными. Это влечет невозможность рассмотрения знаний вне данных и данных вне знаний. Мы полагаем, что:

1. Данные и знания должны представляться в рамках единой концептуальной, возможно, объектно-ориентированной модели.

2. Одни и те же алгоритмы машинного обучения (то есть правдоподобных рассуждений) обеспечивают:

Преобразование данных в знания; Обновление данных и знаний; Коммуникацию между пользователем и знаниями ИКС; Коммуникацию между данными и знаниями в ИКС.Три первых процесса влекут или подразумевают четвертый процесс. Изучение реального мышления показывает, что отделение данных от

знаний невозможно в принципе. Любой акт восприятия внешнего мира человеком подразумевает трансформацию воспринимаемого в определенную организационную структуру. В этом смысле реляционная БД есть по существу база знаний, так как схема БД строго определяет, какие данные могут быть введены в базу, и в какой форме они будут существовать в компьютере. Получение новых знаний из БД требует освобождения первоначальных записей от схем. Именно это выполняется в технологиях OLAP и OLAM с помощью кубов данных (Data Cubes).

Как показывают данные психофизиологии, существует определенная начальная когнитивная организация, которая контролирует восприятие. Когнитивные структуры ориентированы на конструирование объектов, свойств и взаимозависимостей между ними. В них потенциально заложена возможность преобразования объектов, и их развития. Свойства когнитивных процессов можно просуммировать следующим образом:

а) входная информация конвертируется при перцепции в структуры знаний;

б) структуры знаний управляют перцепцией.Введение данных в реляционные БД могло бы сопровождаться

конструированием некоторой системы знаний над ними. Например, каждую

48

единицу данных можно ассоциировать с ключевыми словами, отображающими связи этой единицы с элементами концептуальных знаний – объектами, действиями, свойствами и т. п. Идея аннотации БД восходит к предложению Tim Berners-Lee (1998) использовать онтологию для создания семантической аннотации структурированной базы документов. Проект воплотился в систему CGKAT [Martin, 1997]. Этот подход эволюционировал к так называемому “Corporate Semantic Web” подходу [Dieng-Kuntz et al., 2005]. В [Huchard et al., 2007] дан пример расширения классического (объект×атрибут) представления данных новой размерностью, которая строится вне объектных связей в БД. Суммируя вышесказанное, мы приходим к выводу, что конструирование БД должно начинаться с моделирования знаний и выяснения потенциальных направлений развития этих знаний. Мы полагаем, что

БАЗА ДАННЫХ ПРОСТОЙ СКЛАД ФАКТОВ Многие исследовательские группы выполняют работы по определению

стандартов и технологий для целей организации и связывания данных в Web так, чтобы обеспечить их более эффективное выявление, интеграцию и многократное использование в различных приложениях. Conceptual Graphs for Semantic Web Application – это одна из этих технологий. Этот формализм использовался в нескольких приложениях [Dieng et al., 1998], [Dieng-Kuntz et al., 2004].

1.2. Знания как средство организации и управления даннымиНеотделимость данных от знаний проявляется в том, что знания (пусть

они существуют с самого начала конструирования БД) управляют процессом ввода данных в БД. Должен существовать механизм распознавания факта, что некоторые данные уже известны. Механизм контроля со стороны знания непосредственно связан с выявлением противоречий с уже известными фактами. Например, если было известно, что птицы имеют крылья и летают, но появилась информация, что X есть птица, имеет крылья, но не летает, то “знающая система” должна спросить “почему Х не летает?”. Формирование знаний не может проходить без этой возможности спрашивать “что это?”, “для какой цели?”, “почему?”. В процессе анализа новых данных возникает необходимость изменения контекста рассуждений, то есть выбора соответствующих знаний и данных, ассоциативно связанных с этими новыми данными. Мы полагаем, что ввод данных должен управляться знанием, а данные должны помогать в развитии знаний.

1.3. Дедуктивные и индуктивные ответы на запросыВопросы к ИКС могут быть следующих типов: Вопросы о фактах, ответы на которые могут быть получены

непосредственно из данных;

49

Концептуальные вопросы, когда ответы могут быть получены через знания.

Следовательно, ИКС должна быть способна распознавать тип вопроса.Концептуальные вопросы должны интерпретироваться через знания.

Более того, ответы на эти вопросы требуют использования данных и знаний посредством правдоподобных рассуждений. Этот процесс выполняется шаг за шагом через диалог с пользователем. ИКС работает подобно думающему субъекту следующим образом:

ФАЗА ПЕРЦЕПЦИИ или ВВЕДЕНИЯ ВОПРОСА; ФАЗА ПОНИМАНИЯ ВОПРОСА (фаза распознавания образов); ВЫПОЛНЕНИЕ ОТВЕТА НА ВОПРОС (фаза правдоподобного

рассуждения); ОБРАЩЕНИЕ К ПОЛЬЗОВАТЕЛЮ, если это необходимо, и

ВОЗВРАТ к фазе ПЕРЦЕПЦИИ.Ввод данных/знаний может иметь следующие цели: “ЭТО НЕОБХОДИМО ЗНАТЬ” – простое сообщение

пользователя; ВВОД НОВЫХ ДАННЫХ С ИХ АССИМИЛЯЦИЕЙ

ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМОЙ”; это влечет диалог и процесс обучения (автоматический или под управлением пользователя); результат процесса есть обновленное знание.

Процесс обучения есть интерактивная пошаговая процедура, в реализации которой программа индуктивного вывода выполняет уточнение вопроса, выделяя необходимый контекст и выводя новое знание. Контекст в системе ответов на запросы рассматривается, например, в рамках логики умолчания Рейтера. Примером служит статья [Linke et al., 1998], в которой решается проблема, имеет ли логика Рейтера расширение, содержащее заданный вопрос. Интеграция индуктивного и дедуктивного вывода при обработке запросов к БД предлагается в [Aragao et al., 2004]. Эта статья имеет целью дать унифицированную семантику, как для задач дедукции, так и для задач индукции (классификация, кластеризация, ассоциация, и т. д.).

2. Структурная организация данных и знаний

2.1. Концептуальная модель данных и знанийКонцептуальная структура знаний отображается, например, в терминах

проблемных областей. В работе [Найденова, 2003] дан пример выявления структуры знаний специалистов на основе анализа геологических терминов о рельефах по отношению к геологическим процессам, формирующим эти рельефы. Термины, обозначающие элементы рельефа, являются словообразующими для конструирования терминов обозначающих формы

50

рельефа. Такую же образующую роль по отношению к формам рельефа играют термины, обозначающие процессы. Например: если ранее происходил процесс таяния ледниковых вод, то рельеф «водно-ледниковый», если в рельефе преобладают гряды и холмы, то рельеф «холмисто-грядовый». Здесь мы имеем сложные термины, образованные из двух и более компонентов и, между компонентами реализуются различные по содержанию отношения: «часть-целое» (рельеф, состоящий из холмов и гряд), «быть результатом процесса» (рельеф, образованный ледником).

Сложные термины подразумевают, что специалист неявно использует правила рассуждения вида «если – то». Например, знание, что некоторый процесс порождает определенный результат, дает возможность сделать непосредственный вывод, например, «если оледенение относится к четвертичному периоду, то оно является континентально - покровным».

В терминах отображается временная привязка объектов или процессов, которая осуществляется двумя способами: а) непосредственно, с помощью геологических шкал, б) опосредованно, путём соотнесения с каким-либо процессом или местом или объектом, для которого временная привязка известна. Эти способы временной привязки часто употребляются одновременно, например, “доледниковый четвертичный”. Здесь привязка по времени осуществляется с помощью геологической шкалы времени и с помощью соотнесения с процессом оледенения.

Чаще всего для выражения различных по смыслу отношений употребляется одна и та же форма выражения естественного языка, а именно атрибутивная или определительная форма. Атрибуты могут быть образованы от различных терминов, означающих процессы, периоды времени, элементы рельефа, осадки, местоположение в пространстве, качество. Объект может иметь несколько атрибутов. Например, «длительное денудационное выравнивание», «избирательная денудация», «значительные новейшие поднятия». Главный вывод из анализа терминов тот, что схемы знаний специалистов не только объектно-ориентированны, но они также и ориентированы на логический вывод.

Один из подходов к концептуальному моделированию знаний и данных основан на унификации двух понятий: схема БД и модель объекта. Это может быть сделано путем объединения реляционной и объектно-ориентированной моделей БД с получением Реляционной Объектно-Ориентированной Модели Баз Данных (РООМБД). Отношения в РООМБД просто соответствуют моделям объектов.

Существует множество подходов к моделированию знаний при помощи использования формализма концептуальных схем данных (КСД). Представление знаний для целей решения некоторой проблемы тесно связано с природой этой проблемы и стратегией вывода, применяемой для её решения. В этом состоит причина расхождения между онтологией и

51

КСД. Jarrar (2005) считает, что в противоположность концептуальной схеме или классической базе знаний, которая охватывает семантику заданной области применения, главное преимущество онтологии заключается в том, что она описывает знания прикладной области независимо от любых приложений. Hovy (2005) отмечает, что еще не существует систематической и теоретически обоснованной методологии конструирования онтологии. Наиболее проблематично 1) как интегрировать моделирование онтологии и концептуального знания; 2) как интегрировать уже существующие реляционные модели данных и концептуальные модели знаний. Одно из решений второй проблемы предложено в [Sitompul et al., 2006]. Это так называемая трансформационно-ориентированная методология для конструирования концептуальных данных в БД большого объема.

2.2. Концептуальная решетка как структура данных и знанийРоль концептуальной алгебраической решетки очень существенна, так

как эта структура не только поддерживает функционирование систем данных и знаний на основе операций правдоподобных рассуждений, но также реализует объединение данных и знаний в целостное образование.

Главная проблема в реализации структуры решеток при манипуляции с концептуальным знанием состоит в объединении физического уровня экземпляров объектов и концептуального уровня объектов как таковых. Эта проблема решена в Концептуально-ориентированной Модели (CoM), предложенной в [Savinov, 2009]. Физическая структура может быть реляционной иерархической БД, в которой каждый элемент имеет одну постоянную позицию и один постоянный физический контекст. Логическая структура имеет многоразмерную иерархическую форму, в которой каждый элемент имеет свой логический контекст, который может меняться с течением времени. Операции внутри физической структуры означают создание или удаление элементов, в то время как операции с элементами внутри логической структуры связаны только с изменением их свойств. Изменения в логической структуре должны выполняться через механизмы правдоподобного рассуждения (механизмы конструирования знаний). В этом смысле CoM идеально совместима с моделью правдоподобных рассуждений, предложенной в [Найденова, 2009].

3. Трудности машинного обученияМы понимаем под естественным человеческим рассуждением

рассуждение, с помощью которого строятся концептуальные знания и элементами которого служат объекты, атрибуты, классы объектов и связи между ними. Как показывает наше исследование [Naidenova, 2009], правдоподобное рассуждение эквивалентно машинному обучению, с

52

помощью которого выполняется постепенное создание, аккумуляция, применение и модификация знаний. Это рассуждение применимо к данным любой природы, любого уровня генерализации или специализации.

Процесс извлечения знаний из данных можно представить как многостадийный процесс, на каждом шагу которого концепты низкого уровня с их выявленными свойствами преобразуются в концепты верхнего уровня. В технических системах имеется принципиально два пути конструирования концептов верхнего уровня: 1) использование программных модулей, основанных на известных математических методах и знаниях специалистов об инвариантных свойствах концептов, и 2) использование индуктивного вывода концептов по примерам. Методы обучения, реализуемые как рассуждение, применимы, когда концепты низкого уровня описаны с помощью атрибутов. Но индуктивный вывод концептов по примерам требует громадных усилий учителя-эксперта. Активность учителя включает: 1) формирование примеров концептов, 2) задание классификаций примеров, 3) анализ результатов обучения, 4) ввод новых атрибутов или классификаций, 5) обобщение результатов, 6) кластеризация объектов и т.п. Учитель может дать примеры или контр-примеры концептов и таким образом ускорить процесс обучения.

Наименование объектов есть одна из очень важных операций обучения. Если группа объектов может быть названа, это значит, что эта группа имеет смысл как концепт. Поиск смысла или интерпретации классов объектов существует также в задаче концептуальной кластеризации: кластеры традиционно характеризуются только с точки зрения степени сходства объектов внутри них и одновременно с точки зрения различия между ними. Поиск описания кластеров в терминах некоторых полезных признаков есть задача управляемого машинного обучения. Однако желательно интерпретировать кластеры на базе знаний самой ИКС. Если мы ожидаем новых и неожиданных открытий от интеллектуальных систем, то мы должны научить их самостоятельному поиску смысла классификаций.

4. Ключевые проблемы машинного обучения как метода реализации правдоподобных рассуждений

Включение механизмов правдоподобного рассуждения в процессы взаимодействия данных и знаний является насущной задачей в конструировании ИКС. Пока не существует методологии, поддерживающей решение этой проблемы. Коснемся кратко некоторых направлений, ждущих своего решения. Будем исходить из предположения, что коммуникация данные–знания на всех уровнях и стадиях функционирования ИКС осуществляется с помощью правдоподобных рассуждений:

1. Ввод и удаление данных:

53

a) ввод данных: пользователем непосредственно или через запрос со стороны системы (знаний);

б) удаление данных: пользователем или самой системой.Ввод данных влечет решение задач распознавания, являются ли данные

новыми или они уже есть в системе или могут быть выведены. Если данные новые, то необходимо вывести следствия из этих данных. С этой точки зрения знания активны [Поспелов, 1992]. Удаление данных влечет (возможно) удаление знаний, выводимых из этих данных.

2. Дедуктивные и индуктивные ответы на запросы требуют правдоподобного рассуждения в форме диалога пользователь– интеллектуальная система или/и интеллектуальная система–онтология. Это рассуждение включает:

a) распознавания смысла вопроса или того, что требуется в ответе (факт, пример, множество примеров, концепт, зависимость, или классификация?);

б) формирование контекста вопроса (области рассуждений);в) распознавание концептуального уровня запроса.

Мы рассматриваем следующие уровни:1. Фактический уровень;2. Концептуальный уровень с некоторой степенью генерализации.

Результаты рассуждений могут быть следующими: Ответ находится в контексте рассуждений; Ответ выводится из контекста рассуждений; Ответ требует введения или вывода новых знаний.

Последний вариант требует расширения контекста рассуждений и вовлечения индуктивного вывода (машинного обучения) нового знания.

3. Оптимизация знаний есть работа интеллектуальной системы, следовательно, это требует самообучения системы на основе концептуальной кластеризации и интерпретации её результатов через системное или онтологическое знание.

4. Автоматизированное развитие интеллектуальных систем со встроенными механизмами правдоподобных рассуждений в текущий момент не поддерживается каким-либо языком программирования или программной технологией. Эта технология должна включать:

а) возможность специфицировать концепты (объекты) с их свойствами и связями;

б) возможность выводить некоторые составляющие элементы знаний интеллектуальных систем из данных при помощи обучающих механизмов;

в) возможность встроить механизмы правдоподобных рассуждений в развивающиеся системы.

Механизмы правдоподобных рассуждений должны быть интегральной частью языка программирования. Создание интеллектуальных систем

54

требует создания нового поколения концептуально-ориентированных языков запросов и интеллектуальных интерфейсов.

Список литературы[Найденова, 2003] Найденова К.А. Опыт анализа терминов проблемной области

при построении экспертных систем // Труды международной конференции «Диалог», Протвино. 2003.

[Поспелов, 1992] Поспелов, Д.А. Знания в интеллектуальных системах // Программные продукты и системы, 1992, № 3.

[Aragаo et al., 2004] Aragаo, M.A.T., Fernandes, A.A.A. Logic-Based Integration of Query Answering and Knowledge Discovery // Proc. 6th International Conference on Flexible Query Answering Systems, USA. 2004.

[Berners-Lee, 1998] Berners-Lee, T. Semantic Web Road Map – http://www.w3.org/DesignIssues/Semantic.html.

[Dieng et al., 1998] Dieng, R. Hug, S. Comparison of “Personal Ontologies” Represented through Conceptual Graphs // Proceedings of 13th European Conference on Artificial Intelligence. – Chichester, UK: John Wiley & Sons, 1998.

[Dieng-Kuntz et al., 2004] Dieng-Kuntz, R. Minier, D., Corby, F. Ruzicka, M., Corby, O., Alamarguy, L. Luong, P.-H. Medical Ontology and Virtual Staff for Health Network // Proceedings of 14th International Conference, USA. 2004.

[Dieng-Kuntz et al., 2005] Dieng-Kuntz, R., Corby, O. Conceptual Graph for Semantic Web Applications // F. Dau, M.-L. Mugnier, G. Stumme (Eds), Conceptual Structures: Common Semantics for Sharing Knowledge. – Springer, 2005

[Hovy, 2005] Hovy, E. Methodologies for the Reliable Construction of Ontological Knowledge // F. Dau, M.-L. Mugnier, G. Stumme (Eds), Conceptual Structures: Common Semantics for Sharing Knowledge. – USA: Springer, 2005.

[Huchard et al., 2007] Huchard, M., Rouane Hacene, M., Roume, C., Valtchev, P. Relational Concept Discovery in Structured Datasets // Annals of Mathematics and Artificial Intelligence archive, 2007, 49(1-4).

[Jarrar, 2005] Jarrar, M. Towards Methodological Principles for Ontology Engineering. Unpublished doctoral dissertation, 2005. – Free University of Brussels.

[Linke et al., 1998] Linke, T., Schaub, T. An Approach to Query-Answering in Reter’s Default Logic and Underlying Existence of Extensions Problem // Proceedings of the Sixth European Conference on Logics in Artificial Intelligence, USA. 1998.

[Martin, 1997] Martin, P. CGKAT: A Knowledge Acquisition and Retrieval Tool Using Structured Documents and Ontologies. Proceeding of the 5th International Conference on Conceptual Structures (ICCS’97), Germany. 1997.

[Naidenova, 2009] Xenia Naidenova. Machine Learning Methods for Commonsense Reasoning Processes: Interactive Models, 2009. – New York, USA: IDI Global.

[Savinov, 2009] Savinov, A. Concept-oriented Model // Viviana E. Ferraggine, Jorge H. Doorn, & Laura C. Rivero (Eds), Handbook of Research on Innovations in Database Technologies and Applications: Current & Future Trends, vol. 1. – New York, USA: ISR, 2009.

55

[Sitompul et al., 2006] Sitompul, O.S., Noah, S. A. A Transformation-oriented Methodology to Knowledge-based Conceptual Data Warehouse Design // Journal of Computer Science, 2006, 2 (5).

УДК 681.3:517.11

МНОГОМЕРНАЯ ИСЧИСЛЯЮЩАЯ КЛАССИФИКАЦИЯ УСЛОВНЫХ КОНСТРУКЦИЙ В

НЕПРОЦЕДУРНЫХ ЯЗЫКАХ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ

А.С. Васильевский ([email protected])К.В. Лапшин ([email protected])

ОАО «Концерн «Гранит-Электрон», Санкт-Петербург

В работе проводится анализ предложенной исчисляющей классификации условных конструкций с универсально-типологической позиции на основе единой теоретической базы.

ВведениеИнтерес к проблеме условных конструкций (УК) в интеллектуальных

системах объясняется, прежде всего, отсутствием исследований, в которых на основе единой теоретической базы давалось бы их подробное непротиворечивое описание в разноструктурных непроцедурных языках интеллектуальных систем. При повышенном внимании к условным конструкциям они менее всего изучены с универсально-типологических позиций.

***Определим параметры УК, которые должны имплицитно учитываться в

рамках определённой классификации:1. формальная выделимость/невыделимость частей УК;2. наличие/отсутствие формального показателя связи между частями

УК;3. статус показателя связи в случае его наличия

(подчинительная/сочинительная);4. статус глагольных форм, употребляемых в УК

(финитность/нефинитность);5. возможность употребления неглагольных предикатных слов.

56

Все условные предложения (соотносящиеся с концептом «условное значение») семантически тождественны, но формально-синтаксически неоднородны. Формально-синтаксический статус УК играет важную роль при решении вопроса, какие УК в конкретном языке являются прототипическими (исходными), а какие — периферийными (производными), способными по определенным правилам трансформироваться в исходные. Покажем, что в различных языковых семействах сложноподчиненные предложения и осложненные предложения выступают в роли прототипических УК. Соответственно естественной фреквенталией, а скорее всего, и универсалией следует считать, что простые предложения, сложносочиненные и сверхфазовые единства не являются прототипическими УК. Это связано с семантическим устройством УК. Если требуется поставить в соответствие условному концепту все УК (прототипические и непрототипические), то необходимо ориентироваться только на семантическое определение концепта, при условии, что он не является семантическим примитивом. Под определение, которое включало бы как семантические, так и формально-синтаксические признаки можно подвести лишь прототипические УК одного конкретного языка.

При любой формальной репрезентации УК представляет собой бипредикативную семантическую конструкцию. Из множества пар соотносительных терминов, призванных отразить семантическую специфику обеих частей УК будем использовать только пару: условие (p)-следствие (q). Зависимость между условием и следствием в УК реализуется двумя способами. В одном случае зависимость реализуется в виде связи между смыслами условия и следствия. В другом — в виде связи между смыслом условия и формой повеления, соответствующей следствию. Это обстоятельство позволяет разграничить «стандартные» утверждающие УК и «нестандартные» неутверждающие УК. Существенным пробелом является отсутствие на сегодняшний день анализа «нестандартных» УК. Покажем, что используемых сегодня для описания коммуникативных свойств УК ассертивных статусов (утверждение и пресуппозиция) недостаточно. Предлагается еще один ассертивный статус-суппозиция, которая определяется как такое нефактивное суждение, которое говорящий просит слушающего считать фактивным. Именно этот статус можно приписать зависимой части (ЗЧ) УК, выражающей условие. Если принять во внимание принцип кооперации, то получается, что слушающий соглашается с просьбой говорящего и с этого момента суппозиция превращается в пресуппозицию. К числу неутверждающих УК относится часто встречающаяся УК, главной части (ГЧ) которой соответствует акт оценки. В соответствии с существующей традицией, когда характеризуют смысл УК, имеют в виду, что в ЗЧ УК обозначается такое положение дел (p), которому в случае его осуществления сопутствует другое положение

57

дел (q), обозначаемое в ГЧ УК. Это справедливо для стандартных УК. В любой такой УК и положение дел (p), и положение дел (q) рассматриваются по отношению к миру не как действительные, т.е. фактивные, а как возможные или невозможные, то есть нефактивные. Иначе должны характеризоваться неутверждающие УК. Рассмотрим два толкования УК:

1. Для стандартных утверждающих УК — указывается не то, что положению дел (p) в случае его осуществления сопутствует положение дел (q).

2. Для неутверждающих УК — указывается на то, что положение дел (p) в случае его осуществления обосновывает сопутствующий речевой акт, содержащий положение дел (q).

Необходимо отметить, что в реальной УК всегда имеется в виду альтернатива, то есть положение дел, составляющее условие и выражаемое в ЗЧ, может либо осуществиться, либо не осуществиться. Альтернатива может быть эксплицирована в тексте, где в этом случае одновременно бывают представлены обе возможности, из которых делается выбор. Анализ возможности дать полноценное определение условного концепта, выражаемого в УК, показал неудовлетворительность всех имеющихся подходов. Неудачи здесь связаны с тем, что в определениях используются такие концепты как гипотетический, вывод, возможные миры, которые являются более сложными по сравнению с условным концептом и сами нуждаются в независимом определении. Предпочтительной представляется трактовка условного концепта как неопределяемого универсального примитива, который обнаруживается в так называемых канонических предложениях, где он выступает в определенной темпоральной упаковке: для реальных УК эта упаковка является футуральной, а для нереальных — претеритной. Однако темпоральная упаковка, то есть определенное временное значение, не является компонентом условного концепта, т.к. последний может выступать в различной темпоральной упаковке: футуральной, презентной, претеритной. Все семантические варианты УК: реальные (выполнимые) и нереальные (невыполнимые), как и все темпоральные упаковки этих вариантов УК могут быть получены путем добавления к условному концепту семантических выражений, которые состоят из неопределяемых понятий и в силу этого сами являются семантическими примитивами. Итоговый вывод — неопределяемый условный концепт в совокупности с рассмотренными семантическими выражениями, состоящими из семантических примитивов, дает толкование всем реальным и нереальным УК в различной темпоральной упаковке. В УК пропорция-условие и пропозиция-следствие связаны между собой. Наличие связи является непременным компонентом семантической характеристики УК. Тем не менее, в логике понятие связи не фигурирует при анализе импликации, которая по распространенному мнению

58

отображается в языке с помощью УК. Следует обратить внимание на то, что таблица материальной импликации упускает идею связи, которая присутствует в случае if-then. Мотивация связи между пропозициями в УК в общем случае принадлежит говорящему, и тем самым является субъективной. Лишь в одном частном случае связь между пропозициями может объективно характеризоваться как казуальная, или причинно-следственная. Однако такая интерпретация является компонентом условного значения. Таким образом, связь между пропозицией-условием и пропозицией-следствием в УК следует характеризовать как условную. Понятие «условная связь» является фундаментальным, т.е. не сводится к каким-либо другим понятиям и представляет собой концептуальный примитив.

Выше было отмечено, что в теории интеллектуальных систем представлено заимствованное из логики утверждение, что в естественном языке именно УК является коррелятом сложного высказывания, состоящего из двух простых высказываний, связанных логической операцией импликации типа АВ или АВ, а условный союз типа если, if, then и т.п. является соответственно коррелятом операции импликации. С нашей точки зрения, не является продуктивной мысль о том, что какая-либо языковая конструкция специально предназначена для отображения определенных высказываний из языка логико-математических рассуждений. У языковых конструкций нет стопроцентных логических прототипов. В лучшем случае речь может идти о частичной корреляции. В частности, все нереальные УК и все неутверждающие реальные УК в принципе не коррелируют с логическими высказываниями и не случайно они остаются за пределами логического анализа. Лишь стандартные утверждающие УК, в которых пропозиция-условие и пропозиция-следствие связаны естественной связью, могут рассматриваться как кандидаты в корреляты логических высказываний, связанных операцией импликации.

В логико-математических рассуждениях иррелевантна оппозиция фактивности/нефактивности. А об употреблении УК можно говорить лишь при действии этой оппозиции. Таким образом, УК в общем случае нельзя трактовать как коррелят рассматриваемого в логике сложного высказывания, состоящего из двух простых высказываний, связанных операцией импликации.

Являясь сложным объектом, обладающим различными специфическими содержательными и формальными признаками, УК доступны субкатегоризации по целому ряду независимых параметров. Одни из них релевантны как для УК, так и для других конструкций, а некоторые только для УК. Соответственно каждый из независимых параметров может служить основанием для классификации УК, и, следовательно, может быть столько классификацией, сколько выделяется классификационных

59

параметров. В существующих описаниях представлен целый ряд подобных одномерных классификаций. Возникает много вопросов по поводу таких одномерных классификаций. Это — вопрос об объяснительной силе подобных классификаций, вопрос о значимости каждой классификации и о ранжировании классификаций в соответствии с их значимостями, вопрос о корреляции этих классификаций с целями конкретных исследований. И, наконец, встает вопрос о необходимости перехода от ряда одномерных классификаций к одной многомерной исчисляющей классификации, которая одновременно была бы и более экономной и более содержательной, чем любая совокупность одномерных классификаций. При типологическом описании УК только универсальная многомерная исчисляющая классификация может предложить исчерпывающий набор моделей, которым должны соответствовать УК всех языков. Существует только одно общее требование, которое следует предъявлять к типологически ориентированным исчисляющим классификациям. Все параметры таких классификаций должны быть семантическими. Лишь после построения универсальных семантических моделей УК, можно переходить к решению вопроса о том, с помощью каких формальных средств эти модели воплощаются в различных конкретных языках и как можно классифицировать языки в зависимости от того, какие формальные средства используются в них для выражения тех или иных универсальных семантических моделей УК. Необходимо отметить, что предлагаемая классификация не является полной, так как она не учитывает неутверждающие УК. В основу исчисляющей классификации утверждающих УК положены следующие параметры: в УК условие (p), выражаемое в ЗЧ, и следствие (q), выражаемое в ГЧ, рассматриваются по отношению к миру не как действительные, а как возможные или невозможные. Указанная смысловая особенность составляет универсальный отличительный признак УК, который и отбирается в качестве первого классификационного параметра. Этот параметр принимает соответственно два значения:

1. в УК выражается реальная, т.е. выполнимая возможность;2. в УК выражается нереальная, т.е. невыполнимая возможность.Второй классификационный параметр представляет собой таксисную

зависимость между условием (p) и следствием (q). Он указывает на соотносительное расположение на временной оси положений дел, обозначаемых в условии и следствии. Данный параметр релевантен для всех бипредикативных конструкций и принимает три значения:

1. (p) раньше (q);2. (p) позже (q);3. (p) одновременно с (q).

60

Тем самым условие и следствие отнесены к единому временному интервалу, в рамках которого теоретически возможны различные хронологические отношения между условием и следствием. Что касается величины временного интервала, то она в общем случае неопределенна, а в каждом конкретном случае определяется значением пропозиций, выражаемых (p) и (q). Третий параметр представляет собой временную отнесенность условия и следствия, т.е. их абсолютную локализацию на временной оси. Этот параметр, который релевантен для всех бипредикативных конструкций, принимает девять значений:

1. (p) в будущем, (q) в будущем;2. (p) в будущем, (q) в настоящем;3. (p) в будущем, (q) в прошлом;4. (p) в настоящем, (q) в будущем;5. (p) в настоящем, (q) в настоящем;6. (p) в настоящем, (q) в прошлом;7. (p) в прошлом, (q) в будущем;8. (p) в прошлом, (q) в настоящем;9. (p) в прошлом; (q) в прошлом.Предлагаемая исчисляющая классификация включает 54 модели

(результат перемножения параметров 2х3х9). Ниже покажем, что из логически допустимых 54 моделей, реально функционируют 16. Это число не должно вызывать затруднений при практической работе по описанию УК в конкретных языках. Причина, в силу которой существуют запреты на реализацию 38 моделей из 54, входящих в исчисление, — несочетаемость друг с другом отдельных значений второго и третьего классификационных параметров, то есть таксисная зависимость между условием и следствием и временной отнесенности условия и следствия.

Необходимо отметить, что в отличие от второго и третьего параметров первый, который выражает реальную или нереальную возможность и который является специфичным для УК, никак не влияет на реализацию моделей, входящих в исчисление.

Если с системной точки зрения все реализуемые модели логически равноправны, то и по своим семантическим особенностям, и по своим прагматическим предпочтениям и ограничениям, и по своей представленности в текстах эти модели заметно отличаются друг от друга, что, в конечном счете, зависит от тех конкретных комбинаций значений классификационных параметров, которые определяют индивидуальность каждой модели. Наиболее существенным является разграничение реальных УК (нечетные модели) и нереальных УК (четные модели). Вместе с тем для реализации значения как реального, так и нереального условия важную роль играет та или иная временная локализация условия и (в меньшей мере) следствия. Соответственно, все реализуемые модели целесообразно разбить

61

на три группы: в первую входят те модели, в которых условие локализовано в будущем; во вторую группу входят те модели, в которых условие локализовано в прошлом; в третью группу входят модели, в которых условие локализовано в настоящем. На представленность моделей в тексте оказывает также влияние характер таксисной зависимости между условием и следствием. Соответственно реализуемые модели можно разбить на две группы: в первую группу входят модели, в которых условие предшествует следствию; во вторую группу входят модели, в которых условие одновременно следствию. Учитывая сказанное, можно дать семантико-прагматическую характеристику реальных УК. Локализация и условия, и следствия в будущем в ситуации, когда условие предшествует следствию, в наибольшей степени благоприятствует осуществлению реальной, то есть выполнимой возможности. Этот факт объясняется, прежде всего, тем, что будущее по своей природе является наиболее потенциальным временным планом и, тем самым, наилучшим образом приспособлено для выражения значения реального условия. По этой причине при локализации реального условия в будущем отсутствуют какие-либо прагматические ограничения на употребление УК. По этой же причине УК, в которых и условие, и следствие локализованы в будущем, относятся к самым частотным моделям среди реальных УК, допускающих временную локализацию условия и следствия. В наименьшей степени способствует осуществлению реальной возможности локализация условия в прошлом. Причина здесь заключается в том, что прошлое время по своей природе является наиболее фактивным временным планом и поэтому мало подходит для выражения значения реального условия. По этой причине при локализации реального условия в прошлом существует целый ряд прагматических ограничений на функционирование УК. УК, в которых условие локализовано в настоящем, занимают промежуточное положение, но примыкают к УК, в которых условие локализовано в прошлом, составляя вместе с ними периферию реальных УК. Анализируя нереальные УК, отметим, что в наибольшей степени способствует выражению невыполнимой возможности, локализация условия в прошлом. Причем модели, в которых условие и следствие локализованы в разных временных планах, менее преферентны, чем модели, в которых и условие, и следствие локализованы в прошлом. При локализации нереального условия в прошлом отсутствуют какие-либо прагматические ограничения на функционирование УК. Определенная близость нереальных УК, в которых условие локализуется в настоящем, к нереальным УК, в которых условие локализуется в прошлом, вытекает из того, что настоящее фактивно приблизительно в той же степени, что и прошлое.

Все реализуемые модели рассматриваются как исходные объекты, из которых с помощью введения значений определенных семантических

62

признаков могут быть построены производные модели. В частности, в исходные модели могут вводиться значения гипотетичности или, напротив, подчеркнутой истинности. Показателями этих значений преимущественно служат модальные слова. Кроме того, в исходные модели могут вводиться значения случайности или, напротив, неслучайности. Проведенные исследования позволяют сделать следующие предварительные выводы. Во-первых, грамматические показатели деривационного процесса используются только в модели реальных УК, в которой условие и следствие локализованы в будущем (модель 1) и в модели нереальных УК, в которой условие и следствие локализованы в прошлом (модель 50). Во-вторых, грамматически маркируются лишь деривационные значения, которые либо указывают на отсутствие контроля над выполнимостью данного положения дел, то есть значения типа возможно, вероятно, либо указывают на отсутствие предположений относительно возможности осуществления данного положения дел, то есть значения типа вдруг, случайно.

ЗаключениеЗавершая анализ предложенной многомерной исчисляющей

классификации УК, еще раз подчеркнем, что все ее параметры являются семантическими, а не формальными. Речь идет о семантических признаках и их значениях, а не о формальных средствах выражения этих значений. Предложенная классификация не является полной — за ее пределами остаются все неутверждающие УК, итеративные УК, генерализованные УК. Однако вряд ли можно в принципе построить полную исчисляющую классификацию, так как итеративные и генерализованные УК семантически отличаются от остальных УК наличием элемента фактивности в их смысловом содержании, то есть они по смыслу являются не вполне условными.

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект №06-01-00224).

Список литературы[Васильевский и др., 2006] Васильевский А.С. Методология исследования

проблемы условных конструкций в системах представления и использования знаний // Десятая национальная конференция по искусственному интеллекту КИИ-2006. — М: Физматлит, 2006.

[Касевич, 1995] Касевич В.Б. Семантика условности и условность семантики // Тезисы международной конференции. — Т.I.М., 1995.

[Stump, 2001] Stump G.T. The Semantic Variability of Absolute Constructions — Reidel: Dordrecht, 2001.

63

УДК 004.832.38

АЛГОРИТМ РЕЗОЛЮЦИИ В ЛОГИКЕ ВЫСКАЗЫВАНИЙ ПРИ 0-1-НОМ ПРЕДСТАВЛЕНИИ

ДИЗЪЮНКТОВ

И.С. Грунский ([email protected])Институт прикладной математики и механики НАН

Украины, Донецк, Украина

М.В. Волченко ([email protected]) Государственный университет информатики и искусственного интеллекта, Донецк, Украина

В работе рассматривается проблема автоматизации алгоритма резолюции в логике высказываний. Предложено 0,1-ное представление дизъюнктов и матричная структура представления связей дизъюнктов, для которых разработан алгоритм резолюции с эвристической функцией выбора связи для резольвирования. Показана эффективность предложенного алгоритма на серии экспериментальных данных.

ВведениеВ настоящее время алгоритмы дедуктивного вывода находят широкое

применение в системах принятия решений, дедуктивных базах данных, информационно-поисковых системах. В числе других областей использования дедуктивного вывода можно также назвать верификацию спецификаций компьютерного оборудования (процедуры дедуктивного вывода использовались, например, при верификации процессоров компании AMD), проверку корректности систем безопасности, анализ корректности протоколов передачи данных [Вагин и др., 2004].

Одной из основных проблем, встающих перед разработчиками процедур дедуктивного вывода, является экспоненциальный рост пространства поиска. В условиях постоянно растущих объемов обрабатываемых данных особое значение приобретает проблема создания

64

процедур дедуктивного вывода, способных эффективно работать с большими множествами дизъюнктов [Вагин и др., 2004], [Gomez et al., 2008].

Для эффективной обработки множеств дизъюнктов большой мощности процедура вывода должна отвечать следующим требованиям:

- на сколько возможно, сужать пространство поиска контрарной пары на каждом шаге резольвирования;

- исключать из дальнейшего рассмотрения дизъюнкты, которые не могут быть использованы в процессе доказательства;

- в процедуре вывода должен быть реализован эффективный алгоритм выбора контрарных пар для резольвирования [Вагин и др., 2004], [Gomez et al., 2008].

Резольвирование на графовых структурах в качестве основы для построения процедур дедуктивного вывода является одним из способов повышения эффективности процесса вывода. Был создан ряд алгоритмов дедуктивного вывода на графовых структурах. Однако при решении задач практической сложности, которые характеризуются экспоненциальным ростом числа дизъюнктов, данные алгоритмы не всегда показывали удовлетворительные результаты, что привело к дальнейшим исследованиям в области повышения эффективности процедур вывода [Аверин, 2004].

В настоящей работе рассматривается проблема автоматизации алгоритма резолюции в логике высказываний на основе построения матрицы связей в 0-1-ном представлении дизъюнктов.

1. Постановка задачиРассматривается классическая задача проверки выполнимости

логических высказываний. Исходными данными является множество дизъюнктов S={С1, С2, …, Сk}. Необходимо проверить выводим ли из множества дизъюнктов S заданного высказывания пустой дизъюнкт . Если это так, то S невыполнимо, иначе – выполнимо [Вагин и др., 2004].

Данная задача является NP-полной за счет экспоненциального роста пространства поиска.

Одним из основных методов повышения эффективности процесса вывода является резольвирование на графе связей [Вагин и др., 2004]. При построении графа связей для последовательности дизъюнктов S=С1, С2, …, Сk, состоящих из конъюнктов K1, K2, …, Km, каждому дизъюнкту ставится в соответствие вершина графа G. Две вершины соединяются ребром, называемым связью, если они образуют контрарную пару, т.е. по этим дизъюнктам может быть проведено резольвирование. Результат резольвирования узлов добавляется в граф G.

65

Последовательный алгоритм вывода на графе связей имеет следующий вид [Вагин и др., 2004]:

1. Выбор связи из множества связей. 2. Резольвирование связи и получение резольвенты. Удаление связи,

по которой производилось резольвирование. 3. Если получена пустая резольвента, то успешное завершение, иначе

помещение резольвенты в граф, добавление ее связей, удаление дизъюнктов-тавтологий и чистых дизъюнктов, выполнение операции поглощения дизъюнктов.

4. Если граф не содержит ни одного дизъюнкта, то неуспешное завершение алгоритма, иначе переход к шагу 1.

Графовое представление позволяет существенно сокращать пространство поиска, но в ряде случаев не позволяет получить оптимальное решение. В настоящей работе предложен матричный способ представления дизъюнктов для алгоритма резолюции логики высказываний.

2. Матричное представление дизъюнктов

2.1. Представление дизъюнктовПусть задано множество S дизъюнктов. Пусть -

алфавит всех букв из всех дизъюнктов. Считаем, что А линейно упорядочен.

На начальном этапе каждый дизъюнкт будем представлять 0,1-ным набором по правилу [Волченко, 2009]:

В результате такого представления будет получено множество 0,1-ных векторов (наборов), соответствующее исходному множеству S.

2.2. Формирование списков дизъюнктов Полученные наборы сортируются по убыванию числа ‘_’ в

наборах. В группах векторов с одинаковым числом ‘_’ проводится дополнительная сортировка по возрастанию числа единиц. Полученное

66

упорядоченное множество дизъюнктов будем называть списком дизъюнктов.

2.3. Построение треугольной матрицы связей Каждой паре наборов и из списка дизъюнктов, ставится в

соответствие связь R(l,j) по правилу:

3. Описание алгоритма резолюции на матрице связейНеопределяемые понятия общеприняты и их можно найти в [Вагин и

др., 2004]. Предлагаемый алгоритм состоит из следующих процедур:

предобработка матрицы, выбор связи для резольвирования, резольвирование дизъюнктов, добавление полученного вектора-резольвенты в матрицу связей.

3.1. Процедура предобработки матрицыВыполняется удаление дизъюнктов-тавтологий, поглощенных и чистых

дизъюнктов для всех связей матрицы. В матрице связей если для наборов и количество нулей в связи R(l,j) больше одного, то в результате

резольвирования соответствующей пары дизъюнктов будет получен дизъюнкт-тавтология, и такую связь необходимо удалить.

Если , то

дизъюнкт поглощает дизъюнкт , удаляем j-е строку и столбец.Если достигнут конец первой строки, значит, получен чистый дизъюнкт,

удаляем первую строку.

3.2. Выбор связи для резольвирования Наиболее важным этапом реализации алгоритма является выбор связи

для резольвирования, так как при неправильном выборе связи возможно увеличение количества дизъюнктов до , где n – первоначальное количество дизъюнктов. В [Волченко, 2009] были предложены эвристики позволяющие в частных случаях повысить эффективность предложенного алгоритма:

- Последовательное резольвирование связей треугольной матрицы связей от столбца с минимальным номером до столбца с максимальным номером.

67

- Резольвирование связей с максимальным количеством единиц.- Резольвирование связей с минимальным количеством единиц.- Выбирается та связь, количество ‘_’ которой минимально

отличается от количества ‘_’ второго дизъюнкта.В результате проведения экспериментов с предложенными эвристиками

на ряде частных случаев было получено, что резольвирование связей с максимальным числом единиц позволяет получить результат за минимальное число итераций, но при этом наблюдается кратковременный рост количества обрабатываемых дизъюнктов. Выбор связи по числу ‘_’ позволяет уменьшить такой рост, но при этом для получения результата требуется большее число итераций. На основе полученных данных был предложен комплексный подход к выбору связи для резольвирования:

1. Выбирается та связь, количество ‘_’ которой минимально отличается от количества ‘_’ второго дизъюнкта.

2. Если таких дизъюнктов несколько, то происходит резольвирование связей с максимальным количеством единиц.

3.3. Операция резольвирования дизъюнктовОперация резольвирования осуществляется по построенной матрице

связей. Наличие в 0,1-ном наборе связи одного нуля показывает, что дизъюнкты образуют контрарную пару, то есть возможно их резольвирование.

Операция резольвирования заключается в получении из векторов и нового вектора – резольвенты , который определяется по правилу:

Полученные резольвенты будем добавлять в начало отсортированного списка дизъюнктов, что позволит уменьшить количество сравнений при поиске новой связи для резольвирования, а также увеличить вероятность поглощения новым дизъюнктом последующих.

3.4. Алгоритм резолюции для матричного представления дизъюнктов

1. Построение треугольной матрицы связей.2. Предобработка матрицы связей:

68

Если , то дизъюнкт Xi поглощает дизъюнкт Xj, удаляем j-ю строку и столбец, j=j+1.

Если для наборов Xl и Xj количество нулей в связи R(l,j) больше одного, то такую связь необходимо удалить, j=j+1.

3. Последовательный выбор связи для резольвирования. Выбирается связь, количество ‘_’ которой минимально отличается второго дизъюнкта и имеет максимальное число единиц. Если таких дизъюнктов несколько, то происходит резольвирование связей с максимальным количеством единиц.

Если для наборов Xl и Xj количество нулей в связи R(l,j) равно одному, то проводим резольвирование, иначе j=j+1.

Если j больше количества дизъюнктов, удалить первую строку (чистый дизъюнкт).

4. Если , то удачное завершение, иначе добавление резольвенты в начало отсортированного списка, переход к шагу 2.

4. Экспериментальные исследованияДля оценки эффективности предложенного в работе алгоритма были

выполнены серия экспериментов. Критериями эффективности метода были выбраны число итераций (резольвирований) и максимальное число дизъюнктов за время работы алгоритма.

Анализ эффективности предложенного алгоритма проводился на множествах дизъюнктов различной мощностью и различной длиной алфавита (табл. 1). Результаты оценки являются средними по результатам 30 экспериментов.

Табл. 1.

Критерии оценки Резолюция на графе связей

Резолюция на 0,1-ном представлении

Длина алфавита

Число дизъюнктов

Число вершин

Число итераций

Число наборов

Число итераций

510 11 7 6 420 23 10 13 450 50 10 36 3

1010 12 13 11 1020 24 25 21 1950 56 50 46 43

20 20 22 29 22 2350 55 69 52 53

69

100 107 131 103 89

Анализ экспериментальных исследований предложенного алгоритма на ряде частных случаев показал существенное уменьшение числа выполняемых итераций при незначительном росте пространства поиска.

4. ВыводыВ настоящей работе предложено представление дизъюнктов в виде

0,1-ных наборов, также предложено матричное представление графа связей, на основе чего разработан алгоритм метода резолюций для такого представления. Для описанного алгоритма предложены эвристические методы выбора связи для резольвирования.

Экспериментальными данными показано, что алгоритм для матричного представления дизъюнктов позволяет уменьшить пространство поиска, количество сравнений дизъюнктов, а также уменьшено количество резольвирований.

Список литературы [Аверин, 2004] Аверин А.И. Исследование и разработка алгоритмов

параллельного вывода на графовых структурах. Автореферат. – М.: МЭИ, 2004.

[Вагин и др., 2004] Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В. Достоверный и правдоподобный вывод в интеллектуальных системах / Под ред. В.Н. Вагина, Д.А. Поспелова. – М.: ФИЗМАТЛИТ, 2004.

[Волченко, 2009] Волченко М.В. Представление термов для алгоритма резолюции логики высказываний. Информатики и компьютерные технологии / Материалы V международной конференции. – Донецк: Изд-во ДГТУ, 2009.

[Gomez et al., 2008] Gomez C.P., Kautz H., A. Sabharawal and B.Selman. Satisfability Solvers// Handbook of Knowledge Representaton, 2008.

70

УДК 004.832.32

МЕТОД ВЫЧИСЛЕНИЙ В ПАРАЛЛЕЛЬНОМ ЛОГИЧЕСКОМ ВЫВОДЕ

Д.А. Страбыкин ([email protected])

М.М. Шихов ([email protected]) Вятский государственный университет, Киров

В работе предлагается метод вычислений для параллельного логического вывода на знаниях, представленных формулами исчисления предикатов первого порядка. Описывается модификация формальной системы. Предлагается организация вычислений на подстановках с учетом параллельности логического вывода. Приводится пример вычислений, и дается оценка недостатков и преимуществ подхода.

ВведениеВведение вычислений в логический вывод, прежде всего, продиктовано

необходимостью избежать излишней сложности представления привычных символов и задания отношений над ними. В категорию вычислений можно вынести преобразования символов, наиболее значимые для решения прикладных задач, знания о реализации которых, в контексте решаемой задачи представляются неважными. Также необходимо увеличить скорость этих преобразований, которая будет ограничена скоростью обработки символов. Так как обычно системы логического вывода приходится реализовать программно на традиционных вычислительных машинах, то обработка символов происходит медленнее вычислений, если же определять вычисления средствами символьной обработки в программах логического вывода, то снижение скорости решения задач будет наблюдаться на порядки.

Введение вычислений здесь следует рассматривать как перенос части знаний о преобразованиях символов в более быстродействующую специализированную подсистему символьной обработки (подсистему вычислений). Сама система логического вывода теряет в этом случае декларативность: знания о вычислениях отсутствуют в базе знаний, так как не заданы в виде данных непосредственно. Но лишь потому, что в этом

71

отсутствует необходимость (в случае если таковая возникнет, то её всегда можно реализовать).

1. Модификация формальной системы IP с целью введения вычислений

За основу был взят обобщенный метод параллельного дедуктивного вывода, представленный в работе [Страбыкин, 1998], в котором отсутствует возможность вычислений. Метод использует вводимую в той же работе формальную систему IP, которая подвергается незначительной модификации. Значениями будем называть специально вводимые символы, например, числа, строки, матрицы и т.д.

Изменяется определение терма. Всякая предметная переменная (xi

N), значение или функциональный символ (aj

N) есть терм (будем обозначать либо просто t, либо tN, когда необходимо. Множество значений функциональных символов также будем называть множеством предметных констант).

Если tN, t1,…,tN – термы, то tN(t1,…,tN) – также терм. Если t – терм, то e(t) – терм. Здесь e – специальный символ,

обозначающий вычислитель. Других правил образования термов нет.Вводятся дополнительные аксиомы. При этом мы полагаем, что в

обозначении A[…,t,…] атом A имеет вхождения терма t в своем составе. Аксиома вычисления предметной константы: A[…,e(ai),…]→

A[…,ai,…]. Аксиома вычисления функции с константными аргументами:

A[…,e(a0N(a1,…,aN)),…]→A[…,aM,…], где aM есть результат отображения

a0N:(a1,…,aN) → aM. При этом все аргументы функции a0

N в левой части формулы являются предметными константами.

Обобщенная аксиома вычисления функции: A[…,e(t0N(t1,…,tN)),

…]→A[…,e(e(t0N)( e(t1),…, e(tN))),…].

При этом формальная постановка задачи дедуктивного вывода остается прежней с дополнительным условием: формулы доказанного заключения, а также все формулы, входящие в схему вывода, не должны содержать вхождений вычислителя e.

2. Реализация вычислений на подстановкахОсобенностью взятого за основу метода является то, что в результате

параллельного выполнения процедур вывода, в процессе доказательства одна и та же переменная может принимать различные значения. Затем эти значения необходимо согласовать. Этот факт исключает последовательный подход в реализации вычислений. Одной из основных информационных структур в избранном методе является подстановка,

72

содержащая значения переменных, полученных в одной из параллельно отработавших процедур вывода. А одной из основных процедур является процедура согласованного объединения решений (множества подстановок), полученных процедурами вывода.

Исходя из указанных особенностей метода, предлагается ввести двуместную операцию согласованного объединения подстановок, в процессе выполнения которой и реализовать вычисления. На основе этой операции построить процедуру согласованного объединения решений, таким образом, сохранив все ресурсы параллелизма исходного метода.

Подстановку λ удобно определить как объединение двух непересекающихся множеств: λ= λv λe. Множество λe составляют замены вида e(t)/x, где t – терм, x – переменная исчисления, e(t) – вычислитель. Оставшиеся элементы t/x составляют множество λv. В заменах t/x λv не может быть вхождений вычислителя e(t'). Это достигается за счет того, что t[…,e(t'),…]/x преобразуется в t[…,y,…]/x, а к множеству λe добавляется замена e(t')/y. Здесь y – фиктивная новая переменная предметной области. Причины такого подхода – минимизация объемов вычислений и упрощение описания алгоритмов. Также введем ряд дополнительных обозначений. Подстановку, не содержащую ни одной замены, будем обозначать . Подстановку, в которой присутствуют замены, конфликтующие по одной и той же переменной, причем термы-значения этих переменных не могут никакими заменами переменных в их составе сведены к одному значению, будем называть несогласованной и обозначать .

Результат работы вычислителя зависит от ограничений, накладываемых на область определения функций в составе его аргумента, и влияет на ход алгоритма согласованного объединения подстановок. Внутри системы вычислитель удобно рассматривать в виде процедуры, определенной следующим образом: e=<t, v, s>, где t – исходный терм; v – результат вычисления; s – признак окончания вычислений. Признак окончания s может принимать следующие значения: 0 – вычисления прошли без ошибок и v – константа предметной области; 1 – вычисления прошли без ошибок, но v – не является константой; 2 – в ходе вычислений возникли ошибки, делающие дальнейшее согласование подстановок невозможным. Алгоритм процедуры задается следующим образом.

1. Если терм принадлежит множеству констант предметной области, то v=t, s=0. Переход к пункту 10.

2. Если терм принадлежит множеству переменных, то v=e(t), s=1. Переход к пункту 10.

3. Если t=e(t'), то выполняется e<t',v,s>. Переход к пункту 10.4. Иначе терм t есть функция t0(t1, …, tn). Для каждого ti (0 i n)

рекурсивно выполняется e<ti, vi, si>. 5. Если max(s1,…,sn)=2, то v=e(t), s=2. Переход к пункту 10.

73

6. Иначе, если max(s1,…,sn)=1, то v = e(v'0(v'1, …, v'n)), s=1. Где v'i = t'i, если v'i=e(t'i), и v'i=vi иначе. Переход к пункту 10.

7. Осуществляется проверка принадлежности кортежа (v1,…,vn) области определения функции v0.

8. Если значения (v1,…,vn) не принадлежат области определения, то v=e(v0(v1,…,vn)), s=2. переход к пункту 9.

9. Иначе, если значения (v1,…,vn) принадлежат области определения, то выполняется отображение v0:(v1,…,vn) v. Фиксируется s=0.

10. Конец процедуры e.В процессе логического вывода в логике предикатов значение имеет

унификация, позволяющая свести два или более термов к одному, применяя к ним одну и ту же подстановку, которая собственно и будет результатом унификации.

Определение наименьшего общего унификатора ([Вагин и др., 2004]).Задачи унификации термов и согласованного объединения подстановок

тесно связаны между собой. Чтобы иметь возможность рассматривать согласованное объединение подстановок как операцию, вводится отношение строгого порядка на множестве переменных.

Рассмотрим все варианты возможных унификаций термов. Результатом унификации t0(t1,…,tn) и t'0(t'1,…,t'm) будет согласованное объединение подстановок {t0/y0,t1/y1,…,tn/yn} и {t'0/y0,t'1/y1,…,t'm/ym}. Особенностью специальных вспомогательных переменных yi (1 i max(m, n)) является то, что сравнение x<yi всегда истина для любой x из предметной области. Из результата согласованного объединения подстановок все элементы вида t/yi могут быть исключены. Результатом унификации t0(t1,…,tn) и предметной константы a всегда будет . Результатом унификации t0(t1,…,tn) и переменной x будет либо , если t0(t1,…,tn) содержит вхождения x, либо подстановка {t0(t1,…,tn)/x}. Результатом унификации t0(t1,…,tn) и вычислителя e(t) всегда будет . Результатом унификации констант a и a' будет либо (если a≠a'), либо (если a=a'). Результатом унификации константы a и переменной x всегда будет подстановка {a/x}. Результатом унификации константы a и вычислителя e(t) будет подстановка {a/y, e(t)/y}, где y – фиктивная переменная (x<y всегда истина для любой x из предметной области). В дальнейшем если e(t) будет вычислен и окажется равным a, замены с фиктивной переменной можно удалить из результата. Результатом унификации двух переменных x и x' будет либо (если x=x'), либо {x/x'} (если x<x'), либо {x'/x} (если x'<x). Результатом унификации переменной x и вычислителя e(t) всегда будет подстановка {e(t)/x}. Результатом унификации двух вычислителей e(t) и e(t') будет либо (если t=t'), либо {e(t)/y, e(t')/y} (если t≠t'). Здесь y – фиктивная переменная (x<y

74

всегда истина, и в случае вычисления e(t)=e(t'), замены с y можно исключить).

Алгоритм двуместной операции согласованного объединения подстановок ' " следующий.

1. Если ' = , то ="; переход к пункту 17.2. Иначе, если " = , то ='; переход к пункту 17.3. Иначе, если '= или "=, то =; переход к пункту 17.4. Иначе выполняется ='".5. Множество разделяется на константную и вычислимую части

=ve; ve=.6. Выполняются замены переменных в составе термов t; t/x,

соответствующими значениями из множества v.7. Для всех e(ti); e(ti)/xie множества выполняются процедуры e<ti,

vi, si>.8. Если хоть один si=2 то фиксируется =. Переход к пункту 17.9. Иначе все e(ti)/xie в составе преобразуются в vi/xi и, если

имеются si=0, то переход к пункту 5.10. Фиксируется одно из множеств всех значений некоторой

переменной x: {t1,…,tn}; ti/xv, (1 i n). Причем n 2.11. Если ни для какой переменной такое множество сформировать не

удается, то выполняется переход к пункту 17.12. Иначе устанавливается t'=t1, j=2. Из множества исключается

замена t1/x.13. В соответствии с изложенными выше правилами унификации

находится t как результат унификации терма t' и терма tj.14. Если t=, то фиксируется = и выполняется переход к пункту

17.15. Иначе из множества исключается замена ti/x, выполняется j=j+1,

t'=tt', =t.16. Если j>n, то выполняется ={t'/x} и переход к пункту 5, иначе

переход к пункту 13.17. В качестве результата операции фиксируется .В данном алгоритме следует отдельно прокомментировать пункт 13.

Унификация термов, как следует из описания, реализуется в ряде случаев через согласованное объединение подстановок. Алгоритм рекурсивен, и так как сводится к базовому случаю унификации терма с переменной или терма с константой, имеет неизбежный рекурсивный возврат.

3. Пример вычисленийВыполнить согласованное объединение подстановок: '={1/X, f(Y)/M,

e(sin(Y))/Z} и "={f(0)/M, e(add(Z,X))/K}, которое предполагает вычисление элементарной функции sin(Y) и выполнение суммирования add(Z,X).

75

Процесс выполнения алгоритма с указанием шагов следующий.1: 2: 3: 4: ='" ={1/X, f(Y)/M, e(sin(Y))/Z, f(0)/M, e(add(Z, X))/K}.5: =ve={1/X, f(Y)/M, f(0)/M}{e(sin(Y))/Z, e(add(Z, X))/K}.6: =ve= {1/X, f(Y)/M, f(0)/M}{e(sin(Y))/Z, e(add(Z, 1))/K}.7: =ve= {1/X, f(Y)/M, f(0)/M}{e(sin(Y))/Z, e(add(Z, 1))/K}.8: 9: 10: {f(Y), f(0)} для переменной M.11: 12: t'= f(Y); ={1/X, f(0)/M}{e(sin(Y))/Z, e(add(Z, 1))/K}; j=2.13: результатом унификации t' и t2, т.е. f(Y) и f(0) являетя t={0/Y}.14: 15: ={1/X}{e(sin(Y))/Z, e(add(Z, 1))/K}; j=3; t'=f(0); ={1/X}

{e(sin(Y))/Z, e(add(Z, 1))/K}{0/Y}.16: ={t'/x}={1/X}{e(sin(Y))/Z, e(add(Z, 1))/K}{0/Y}{f(0)/M}.5: =ve={1/X, 0/Y, f(0)/M}{e(sin(Y))/Z, e(add(Z, 1))/K}. 6: ={1/X, 0/Y, f(0)/M}{e(sin(0))/Z, e(add(Z, 1))/K.} 7: 8: 9: ={1/X, 0/Y, f(0)/M, 0/Z, e(add(Z, 1))/K} есть si=0 для

получившейся 0/Z.5: =ve={1/X, 0/Y, f(0)/M, 0/Z}{e(add(Z, 1))/K}.6: ={1/X, 0/Y, f(0)/M, 0/Z}{e(add(0, 1))/K}.7: 8: 9: ={1/X, 0/Y, f(0)/M, 0/Z, 1/K} есть si=0 для получившейся 1/K.5: =ve={1/X, 0/Y, f(0)/M, 0/Z, 1/K}.6: 7: 8: 9: 10: 11: 17: результат: {1/X, 0/Y, f(0)/M, 0/Z, 1/K}.Таким образом, в процессе согласованного объединения подстановок

выполнены вычисления: sin(Y)=0 (в замене sin(Y))/Z при Y=0) и add(Z,X)=1 (в замене add(Z,X))/K) при Z=0, X=1).

4. Свойства операции согласованного объединения подстановок

Согласование с пустой подстановкой не влияет на исходный операнд: ==. Согласование с несогласованной подстановкой в результате дает несогласованную подстановку: ==. Операция коммутативна: '='. И ассоциативна: '"=(')"=('").

Последние два свойства следуют из правил унификации терма и константы, а также терма и переменной, к которым в конечном итоге рекурсивно сводится операция согласованного объединения подстановок.

5. Достоинства и недостатки подходаОсновным достоинством подхода является то, что он позволяет

сохранить декларативность описания предметной области, что является существенным моментом, например для самообучающихся систем. Вычисления фактически становятся отложенными до того момента, пока полностью не определятся аргументы вычислителя. Также остались все возможности по распараллеливанию логического вывода, какие имелись в

76

исходном методе. Вычисления остаются «прозрачными» для системы логического вывода.

Введение вычислений на уровне термов дает большую гибкость и полностью покрывает возможности введения вычислений на уровне атомов, например, правила: ADD(A, B, e(add(A, B))), ADD(A, e(sub(C, A)), C), ADD(e(sub(C, B)), B, C) позволяют организовать «вычислимый» предикат, позволяющий находить числа, состоящие в отношении A+B=C.

Вычисления сосредоточены в рамках одной операции.Существенным недостатком подхода является расход памяти на

фиктивные переменные, позволяющие реализовать отложенные вычисления.

Также необходимо отметить, что приведенные алгоритмы имеют высокий ресурс распараллеливания как на уровне узла, выполняющего согласованное объединение подстановок, так и на более высоком уровне согласования решений [Страбыкин, 1998].

Предложенный метод вычислений в сочетании с методом обобщения функциональных символов [Страбыкин, 2008] позволяет в одной логической программе не только конструировать формулы, но и рассчитывать их значения.

Список литературы[Вагин и др., 2004] Вагин, В.Н. Достоверный и правдоподобный вывод в

интеллектуальных системах [Текст] / В. Н. Вагин, Е. Ю. Головина, А. А. Загорянская, М. В. Фомина; под ред. В. Н. Вагина, Д. А. Поспелова. – М.: Физматлит, 2004.

[Страбыкин, 1998] Страбыкин, Д.А. Логический вывод в системах обработки знаний [Текст] / Д. А. Страбыкин; под ред. Д. В. Пузанкова. – СПб.: СПбГЭТУ, 1998.

[Страбыкин, 2008] Логический вывод с обобщением функциональных символов в формулах посылок и заключений [текст] / Д.А. Страбыкин, М.М. Шихов, Р.С. Петров // КИИ-2008 Одиннадцатая национальная конференция по искусственному интеллекту с международным участием (28 сентября – 3 октября 2008 г., Дубна, Россия). – М.: Физматлит, 2008, в 3-х т. – Т.1.

77

УДК 004.832.34

АЛГОРИТМ АБДУКТИВНОГО ВЫВОДА С ИСПОЛЬЗОВАНИЕМ СИСТЕМ ПОДДЕРЖКИ

ИСТИННОСТИ НА ОСНОВЕ ПРЕДПОЛОЖЕНИЙ

В.Н. Вагин ([email protected])

К.Ю. Хотимчук ([email protected])Московский Энергетический Институт

(Технический Университет), Москва

В последнее время в интеллектуальных системах очень важную роль стал играть абдуктивный вывод, цель которого заключается в выводе причины для наблюдаемого события. Разработан алгоритм абдуктивного вывода AAA (Assumption-based Truth Maintenance System-based Abduction Algorithm). Результаты экспериментов, проведенных на примере задачи составления расписаний для энергохранилищ, подтвердили эффективность алгоритма AAA.

ВведениеВ настоящее время разработка формальных моделей различных форм

рассуждения играет ключевую роль в создании интеллектуальных систем различного назначения. Логический вывод, на котором основаны рассуждения, в стандартном смысле понимается как достоверный вывод, при организации которого из истинных посылок мы всегда получаем истинные заключения. В широком смысле к достоверному выводу относится хорошо изученный дедуктивный вывод. Дедукция – строгая и ограниченная форма рассуждения, и дедуктивного вывода недостаточно для моделирования таких важных аспектов человеческого мышления, как противоречивость информации, неопределенность, формирование гипотез и др. Поэтому в интеллектуальных системах наряду с дедукцией необходимо привлекать правдоподобные формы рассуждения, такие, как индукция и абдукция.

Индуктивный вывод – это вывод от частного к общему. Абдуктивный вывод заключается в выводе причины из наблюдаемого события и является выводом от частного к частному. Схематично абдуктивный вывод можно представить следующим образом. Пусть имеется правило и известно, что имеет место событие . Тогда, по абдукции, делаем

78

заключение о том, что, быть может, имеет место и . Точнее, при заданной теории и наблюдении, предложенном для объяснения, абдуктивный вывод должен определить одно или более наилучших объяснений наблюдения на основе заданной теории. Термин “абдукция” впервые ввел американский философ Пирс [Peirce, 1955]. На сегодняшний день вывод по абдукции успешно применяется для решения задач диагностики[Cox et al., 1987], понимания естественного языка[Hobbs et al., 1993], распознавания, накопления знаний, составления расписаний и, несомненно, является очень важной частью интеллектуальных систем.

В настоящей работе мы рассматриваем понятие минимального абдуктивного объяснения, после чего приведём алгоритм абдуктивного вывода с использованием систем поддержки истинности, основанных на предположениях (Assumption-based Truth Maintenance Systems, ATMS). Показано применение алгоритма AAA для решения задачи составления расписаний для энергохранилищ.

1. АбдукцияАбдукция заключается в выводе объяснений наблюдаемого факта. К

настоящему времени рассмотрены различные формы абдукции, из которых можно выделить функциональную абдукцию, абдукцию, основанную на логике, вероятностную абдукцию. Мы будем рассматривать только абдукцию, основанную на логике. В этом случае имеющиеся знания представлены как логическая теория. Абдуктивный вывод, основанный на логике, определяется через теорию, основанную на предположениях. Под предположениями будем понимать гипотезы, которые в процессе вывода будут подтверждаться или опровергаться.

Определение 1 [Marquis, 2000]. Пусть Ф – конъюнкция формул логики предикатов первого порядка (ЛП1П). H – конечное множество фактов, называемых предположениями (гипотезами). Упорядоченная пара T = <Ф, Н> – теория, построенная на предположениях.

Определение 2 (абдуктивного вывода). Пусть T = <Ф, Н> – теория, построенная на предположениях. Абдуктивный вывод заключается в выводе объяснения для наблюдаемого события δ как подмножества γ H, такое, что Ф & γ ╞ δ.

Заметим, что на γ в определении 2 накладывается синтаксическое ограничение – γ представляет собой конъюнкцию фактов.

Определение 3 [Marquis, 2000]. Пусть Т = <Ф, Н> – теория, основанная на предположениях, и δ – формула логики предикатов первого порядка. Конъюнктивно интерпретируемое подмножество γH назовем абдуктивным объяснением δ относительно Т, если:

Ф γ ╞ δ; Ф γ выполнимо.

79

Пример 1. Пусть Т = <Ф, Н>, где Ф = x (Студент(x) Юн(x)), δ = Юн(Петров). Пусть H = {Студент(x1), Рабочий(x2)}. Тогда Студент(Петров), Студент(Петров) & Рабочий (Иванов) являются абдуктивными объяснениями δ относительно T.

Заметим, что абдуктивное объяснение должно быть непротиворечиво. В примере 1 Студент(Петров) & Юн(Петров) не является абдуктивным объяснением δ относительно T в силу противоречивости.

Определение 4 [Marquis, 2000]. Пусть Т = <Ф, Н> – теория, основанная на предположениях, δ – формула логики предикатов первого порядка. Конъюнктивно интерпретируемое подмножество γH назовем минимальным абдуктивным объяснением δ относительно Т, если:

γ – абдуктивное объяснение для δ относительно Т; для любого абдуктивного объяснения γ' для δ относительно Т

выполняется (γγ') ( γ'γ).Пример 2. Пусть Т = <Ф, Н>, где Ф = x (Студент(x) Юн(x)), δ =

Юн(Петров). Пусть H = {Студент(x1), Рабочий(x2)}. Тогда Студент(Петров) является минимальным абдуктивным объяснением δ относительно T. Студент(Петров) & Рабочий (Иванов) не является минимальным абдуктивным объяснением δ относительно T.

Задачу абдукции будем рассматривать как задачу нахождения множества минимальных абдуктивных объяснений наблюдаемого события.

2. Алгоритм абдуктивного вывода, использующий ATMSСуществуют различные методы решения задачи абдукции. Мы

рассматриваем метод решения задачи абдукции с помощью ATMS. Назовем алгоритм абдуктивного вывода, использующий ATMS, как AAA (ATMS-based Abduction Algorithm) [Hwee Tou Ng et al., 1991]. Достоинством алгоритма AAA является тот факт, что вся выводимая информация сохраняется в дереве вывода, и для вывода новых вершин не нужно тратить время на конструирование дизъюнктов. На вход алгоритма поступает исходное множество дизъюнктов и наблюдаемое событие, которое необходимо объяснить. На выходе получается множество абдуктивных объяснений этого события. Сначала создается вершина GOAL (операция создания вершины ATMS), а наблюдаемое событие добавляется в ATMS как обоснование GOAL (операция добавления обоснования в ATMS). Процедура Assume добавляет для вершины, помеченной некоторой литерой, вершину-предположение, содержащую эту же литеру (операция добавления предположения в ATMS). Таким образом, реализуется допущение об истинности литеры для вершины. Далее, начиная с GOAL, в ход вступают процедуры ProcessNode и ProcessJustification, рекурсивно вызывающие друг друга. В процедуре ProcessNode для каждого обоснования текущего узла запускается механизм ProcessJustification. В

80

процедуре ProcessJustification происходит собственно добавление новых вершин в ATMS: для каждой вершины n текущего обоснования,

помеченной литерой N, ищется дизъюнкт 1 2 ... kX X X N , и к

вершине n добавляется обоснование 1 2 ,, ..., kx x x n , где 1 2,, ..., kx x x – это

вершины, помеченные литерами 1 2, , ..., kX X X соответственно (операция добавления обоснования в ATMS). Если в процессе унификации аргументы текущего обоснования изменяются, то обоснование копируется, и унификация и добавление новых узлов происходят с копией обоснования. Это необходимо для того, чтобы не потерять текущее обоснование как часть решения. После того, как дерево построено, вычисляется метка на узле GOAL, которая представляет собой множество минимальных абдуктивных объяснений.

В алгоритме AAA используется понятие фактора дизъюнкта. Если две или более одинаковые литеры одного и того же знака дизъюнкта C имеют НОУ , то дизъюнкт C называется фактором дизъюнкта C [Вагин и др., 2008].

Алгоритм AAA.Исходные данные:clauses – исходное множество дизъюнктов,observed – наблюдаемый конъюнкт.Выходные данные:result – множество абдуктивных объяснений для observed

(результирующее множество конъюнктов).

Начало.Шаг 1. Если все дизъюнкты из clauses – хорновские дизъюнкты,

то переход к шагу 2. Иначе ОШИБКА, Сообщение “Все дизъюнкты должны быть хорновскими!”, Конец.

Шаг 2. Вычислить множество , где

– множество всевозможных факторов дизъюнктов из clauses.

Шаг 3. Пусть O1,O2... – это литеры observed. Создать вершину GOAL (операция добавления вершины в ATMS) и добавить к ней обоснование . nO1, nO2… – добавленные таким образом новые вершины (операция добавления обоснования в ATMS).

Шаг 4. Выполнить процедуру Assume с параметрами nOi, Oi для i=1,2.. (операция добавления предположения в ATMS)

81

Шаг 5. Выполнить процедуру ProcessNode с параметрами GOAL, extendedClauses, GOAL, .

Шаг 6. Вычислить метку на вершине GOAL. Найденная метка содержит результирующее множество конъюнктов. Запишем его в result.

Конец.

Процедура Assume.Исходные данные:node – вершина,litera – литера, по которой делается предположение.Требуется:создать предположение для текущей вершины.Начало.Шаг 1. Создать вершину-предположение nLitera с литерой litera

и добавить обоснование (операция добавления предположения в ATMS).

Конец.

Процедура ProcessNode.Исходные данные:node – текущая вершина,clauses – множество дизъюнктов,mainNode – целевая вершина,unassumed – список литер, к вершинам которых запрещено добавлять

обоснование-предположение.Требуется:добавить новые вершины через механизм обратной дедукции.Начало.Шаг 1. Обозначим – номер обоснования; justificationCount

– число обоснований.Шаг 2. Если , то Конец. Иначе рассмотрим

justification – i-е обоснование вершины node. Вызвать процедуру ProcessJustification с параметрами justification, clauses, mainNode, unassumed.

Шаг 3. Присваиваем и переход к шагу 2.Конец.

Процедура ProcessJustification.Исходные данные:justification – текущее обоснование,

82

clauses – множество дизъюнктов,mainNode – целевая вершина,unassumed – список литер, к вершинам которых запрещено добавлять

обоснование-предположение.Требуется:добавить новые вершины через механизм обратной дедукции.Начало.

Шаг 1. Пусть nodeCount – число вершин в justification; – номер вершины в justification.

Шаг 2. Если , то Конец. Иначе рассмотрим node – i-я вершина в justification.

Шаг 3. Найти список пар дизъюнкт-подстановка вида <clause, subst>, в которых литера из clause унифицируется с литерой на вершине node. Обозначим этот список пар как substitutions, количество элементов в substitutions – как substitutionCount;

– номер текущего элемента в substitutions.Шаг 4. Если , то и переход

к шагу 2. Иначе рассмотрим пару дизъюнкт-подстановку substitution – substNumber-й элемент в substitutions. Пусть substitution представляет пару clause – дизъюнкт и subst – подстановка.

Шаг 5. Определить, меняет ли литера хотя бы на одном узле ветви от mainNode до justification свои аргументы при подстановке subst. Если есть такой узел, то переход к шагу 6. Иначе переход к шагу 7.

Шаг 6. “Устранение многозначности”. Пусть lastStableNode – это последний узел текущей ветви C, начиная от вершины mainNode, литера на котором не меняет свои аргументы при подстановке subst. Пусть notStableJustification – обоснование вершины lastStableNode, причем одна или несколько литер вершин notStableJustification меняют свои аргументы при подстановке subst. Тогда stableJustification – скопированное обоснование notStableJustification, к которому применена подстановка subst и которое добавлено в дерево вывода как обоснование lastStableNode (операции создания вершины и добавления обоснования в ATMS). Определим newUnassumed – последовательность литер, которыми помечены вершины начиная от lastStableNode и заканчивая node; причём ко всем литерам этой последовательности применена подстановка subst. Вызвать процедуру ProcessJustification с параметрами stableJustification, clauses, mainNode, newUnassumed. Переход к шагу 8.

83

Шаг 7. Резолюция по node с дизъюнктом clause с добавлением нового обоснования newJustification к node. … – узлы обоснования newJustification, … – литеры, соответствующие этим узлам (операции создания вершины и добавления обоснования в ATMS). Пусть firstUnassumedLitera – первая литера в unassumed. Среди литер … найти firstUnassumedLitera. Пусть это . Если литера не найдена, то unassumedNumber = -1. Выполнить процедуру Assume с параметрами , , (операция добавления предположения в ATMS). Если unassumedNumber -1, то удалить из unassumed первую литеру. Выполнить процедуру ProcessNode с параметрами node, clauses, mainNode, unassumed.

Шаг 8. Присвоить и переход к шагу 4.

Конец.

3. Пример работы алгоритма AAAПусть исходное множество дизъюнктов имеет вид

Наблюдается конъюнкт . Требуется найти множество его абдуктивных объяснений.

84

Рис. 3.1. Пример дерева вывода для алгоритма AAA

Алгоритм AAA строит дерево, изображённое на Рис. 3.1. В построенном дереве после удаления включаемых окружений и после замены переменной y1 на y получаем

Label(GOAL) =

85

Ответ:

4. Результаты экспериментовНами был разработан программный комплекс, реализующий алгоритм

AAA. Для тестирования разработанного программного комплекса используется усеченная версия задачи о составлении расписаний для энергохранилищ [Denecker et al., 2002]. Число энергохранилищ изменялось от 1 до 50. В зависимости от этого количество правил изменялось от 7 до 1145. Требовалось найти все минимальные абдуктивные объяснения вводимых запросов, а означенные переменные в полученных минимальных абдуктивных объяснениях являлись искомыми параметрами задачи составления расписаний энергохранилищ. Так, например, для 50 энергохранилищ было получено 11350 минимальных абдуктивных объяснений, содержащих 7528 вариантов планирования. Алгоритм AAA эффективно решил поставленную задачу, что подтвердило его применимость в решении задачи абдукции, и в частности, в решении задачи планирования работы сложных технических объектов.

86

ЗаключениеВ настоящее время абдуктивный вывод широко применяется в

интеллектуальных системах различного назначения. Предложен алгоритм AAA, использующий ATMS. Достоинством алгоритма AAA является тот факт, что вся выводимая информация сохраняется в дереве вывода, и для вывода новых вершин не нужно тратить время на конструирование дизъюнктов. На примере задачи составления расписаний для энергохранилищ была продемонстрирована применимость алгоритма AAA в решении задач планирования сложных технических объектов.

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 08-07-00212).

Список литературы[Вагин и др., 2008] Вагин В.Н., Головина Е.Ю., Загорянская А.А. и др.

Достоверный и правдоподобный вывод в интеллектуальных системах. – 2е изд., испр. и доп. / Под ред. Вагина В.Н. и Поспелова Д.А. – М.: ФИЗМАТЛИТ, 2008.

[Cox et al., 1987] Cox P.T. and Pietrzykowski T. General diagnosis by abductive inference // Proc. IEEE Sympos. Logic Programming. San Francisco. 1987.

[Denecker et al., 2002] Denecker M., Kakas A. Abduction in Logic Programming // Computational Logic: Logic Programming and Beyond, Essays in Honour of Kowalski R.A., P. I, London, UK: Springer-Verlag. 2002. V. 2407.

[Hobbs et al., 1993] Hobbs J., Stickel M.E., Appelt D. et al. Interpretation as abductior // Artificial Intelligence. 1993. 63(1 – 2).

[Hwee Tou Ng et al., 1991] Hwee Tou Ng, Mooney R.J. An Efficient First-Order Horn-Clause Abduction System Based on the ATMS // Proc. AAAI-91. Anaheim, CA. 1991.

[Marquis, 2000] Marquis P. Consequence finding algorithms // Handbook for Defeasible Reasoning and Uncertain Management Systems, eds. D.M. Gabbay and P. Smets. 2000. V. 5.

[Pierce, 1955] Peirce C.S., Philosophical writings. N.Y.: Dover Publications, Inc, 1955.

87

УДК 510.6

ЛОГИКА УМОЛЧАНИЙ КАК АЛЬТЕРНАТИВА МОДИФИКАЦИОННЫХ ИСЧИСЛЕНИЙ

Д.В. Виноградов ([email protected]) Всероссийский Институт Научной и Технической

Информации, Москва

Статья посвящена изложению формализации правдоподобных рассуждений типа ДСМ средствами логики умолчаний.

ВведениеПервоначальное изложение ДСМ-метода автоматического порождения

гипотез [Финн, 1991] использовало средства многозначных логик. Очень важной оказалась идея Д.А. Бочвара [Бочвар, 1972] о разделении внутренних (фактических) и внешних (логических) истинностных значений. Связь между истинностными значениями обеспечивается (характеристическими) J-операторами Россера-Тьюкетта. При этом подходе каждая замкнутая формула получала единственное истинностное значение. В своей книге [Anshakov, 2010] О.М. Аншаков и Т. Гергей разработали альтернативный подход — модификационные исчисления. В этом подходе вывод состоит из внешних (J-атомарных и состоящих из них) формул, однако внутренняя (не имеющая J-связки) атомарная формула может встречаться под разными J-символами. Это означает, что в процессе вывода внутреннее истинностное значение этой формулы может изменяться. Для обеспечения непротиворечивости был предложен механизм модификации вывода.

В настоящей статье мы опишем возможность замены модификационного исчисления логикой умолчаний [Reiter, 1980]. Используя связь логики умолчаний с логическими программами [Gelfond, 1990], мы обсудим формализацию правдоподобных рассуждений типа ДСМ средствами стратифицированных логических программ [Виноградов, 1999, 2001].

88

1. Основные понятия логики умолчаний

1.1. Определение теорий с умолчаниями и их расширенийУмолчание – это правило вывода вида

),,(),,(,),,,(:),,(

1

1111

n

nknn

xxCxxBxxBxxA

, где A(x1,…,x n) – посылка

умолчания, B1(x1,…,x n),…, B k(x1,…,x n) образуют подтверждение умолчания и С(x1,…,x n) – заключение умолчания. Будем его записывать в одну строчку: A(x1,…,x n) : B1(x1,…,x n),…,B k(x1,…,x n) / С(x1,…,x n). Неформально оно означает: «Для всех индивидуумов a1,…,a n если мы допускаем A(a1,…,a n) и каждое из высказываний B1(a1,…,a n),…, B k(a1,…,a n) не противоречит допускаемому, то мы будем допускать и С(a1,…,a n)».

Теория с умолчаниями – это пара W, D, где W – множество формул логики предикатов первого порядка, а D – множество умолчаний.

Для теории T = W, D в языке L определим оператор Г, отображающий множество формул S L в наименьшее множество формул Г(S) L, такое, что:

1) Г(S) = Th(Г(S));2) W Г(S);3) если [A : B1,…,B k / С]D, A Г(S) и B1S, …, B k S, то

C Г(S).Множество формул E назовем расширением теории T = W, D, если и

только если E = Г(E).Нормальное умолчание – это умолчание вида A:C/С. Теория T = W, D

называется нормальной, если все ее умолчания нормальны.

1.2. Примеры теорий с умолчаниямиТеория {Bird(Tweety)}, {Bird(Tweety): Flies(Tweety)/ Flies(Tweety)}

имеет единственное расширение Th({Bird(Tweety) & Flies(Tweety)}).Теория {Bird(Tweety) Bird(Joe)}, {: Bird(Tweety) /

Bird(Tweety); : Bird(Joe) / Bird(Joe)} имеет два расширения Th({Bird(Tweety) & Bird(Joe)}) и Th({Bird(Tweety) & Bird(Joe)})

Теория , { : Bird(Tweety) / Bird(Tweety)} не имеет расширений.

1.3. Свойства теорий с умолчаниямиТеория T = W, D имеет противоречивое расширение, если и только

если противоречиво W.Если E и F – расширения теории T = W, D и E F, то E=F.Если у теории T = W, D есть противоречивое расширение, то оно

единственное.

89

Если W непротиворечиво, то нормальная теория T = W, D имеет непротиворечивое расширение.

Если нормальная теория T = W, D имеет различные расширения E и F, то EF противоречиво.

1.4. Связь с логическими программамиВ работе [Gelfond, 1990] М.Г. Гельфонд и В.А. Лифшиц связали с

каждой логической программой такую теорию с умолчаниями, чтобы стабильные модели программы совпадали с расширениями теории с умолчаниями.

Перевод очень прост: каждое правило C(x1,…,x n) A1(x1,…,x n),…,A m(x1,…,x n), B1(x1,…,x n),…,B k(x1,…,x n) заменяется на A1(x1,…,x n)& …&A m(x1,…,x n) : B1(x1,…,x n),…,B k(x1,…,x n) / С(x1,…,x n).

В работе [Виноградов, 1999] было показано, что для формализации правдоподобных рассуждений типа ДСМ достаточно ограничиться классом стратифицированных логических программ [Chandra, 1985].

Для таких программ существует единственная наименьшая модель — итерированная неподвижная точка, которая совпадает с единственной стабильной моделью. При переводе Гельфонда-Лифшица соответствующая теория с умолчаниями будет иметь единственное расширение.

2. Модификационные исчисленияДля теорий с умолчаниями имеется две теоремы, характеризующие

расширения. Первая описывает расширение как предел расширяющегося множества теорем из фрагментов E j:

Множество формул E – расширение теории T = W, D, если и только если E = j E j, где E0 = W, E j+1 = Th(E j) {C: [A : B1,…,B k / С] D, E j|-A и B1 E, …, B k E}.

Вторая характеризует расширение как множество теорем из объединения начальной теории W и множества заключений, порождающих его умолчаний.

Для расширения E теории T = W, D множество порождающих умолчаний – это GD(E,T) = {[A : B1,…,B k / С] D : A E, B1 E, …, B k E}.

Если множество формул E – расширение теории T = W, D, то E = Th(W {C: [A : B1,…,B k / С] GD(E,T)}).

Основываясь на этих теоремах, можно разработать теорию доказательств для скептического (формула истинна во всех расширениях) и доверчивого (формула истинна в каком-нибудь расширении) отношений следования.

В своей книге [Anshakov, 2010] О.М. Аншаков и Т. Гергей разработали альтернативный подход — модификационные исчисления.

90

В применении к формализации ДСМ-рассуждений модификации соответствуют переходу от внутреннего истинностного значения (фактическое незнание) к внутреннему истинностному значению +1 (фактическая истина).

Например, (+)-правило 1-го рода записывается как импликация: J(V2 {p})&Ma

+(V,{p}) & Ma- (V,{p}) J+1(V2{p}). Однако, правила:

J0(V2{p}) Ma+(V,{p}), Ma

-(V,{p}), J+1(V2{p}), J-1(V2{p}) и J+1(V2{p}) Ma

+(V,{p}), J0(V2{p}), J-1(V2{p}) переписываются как умолчания и соответствующий вывод может быть рассмотрен как модификационный.

Как показано в [Виноградов, 2001] итерированная неподвижная точка совпадает для конечных доменов с единственной моделью ДСМ-метода.

Когда к теории ДСМ-рассуждений добавляются аксиомы, возможны несколько моделей, и требуется полная мощь логики умолчаний.

Благодарности. Работа выполнена при поддержке программы фундаментальных исследований Президиума РАН «Математическое моделирование и интеллектуальные системы» на 2010 год.

Список литературы [Бочвар, 1972] Бочвар Д.А., Финн В.К. О многозначных логиках, допускающих

формализацию анализа антиномий I. // Многозначные логики и их применения. Т. 1. – М.: Издательство «ЛКИ», 2008.

[Виноградов, 1999] Виноградов Д.В. Логические программы для квазиаксиоматических теорий // ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания. – М.: ЛИБРОКОМ, 2009.

[Виноградов, 2001] Виноградов Д.В. Корректные логические программы для правдоподобных рассуждений // ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания. – М.: ЛИБРОКОМ, 2009.

[Финн, 1991] Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ // ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания. – М.: ЛИБРОКОМ, 2009.

[Anshakov, 2010] Anshakov O., Gergely T. Cognitive reasoning: a formal approach. - Berlin: Springer-Verlag, 2010.

[Chandra, 1985] Chandra A., Harel D. Horn clause queries and generalizations // Journal of Logic Programming, Vol. 2, 1985.

[Gelfond, 1990] Gelfond M., Lifschitz V. Logic program with classical negation // Proceedings of the 7th Int. Conf. on Logic Programming, MIT, 1990.

[Reiter, 1980] Reiter R. A Logic for Default Reasoning. // Artificial Intelligence, Vol. 13, 1980.

91

УДК 004.896

ПРОЦЕДУРЫ ВЫЯВЛЕНИЯ ЗНАНИЙ ОБ ОТНОШЕНИЯХ ОБУСЛОВЛЕННОСТИ

А.В. Жожикашвили ([email protected])

Л.В. Савинич ([email protected])

В.Л. Стефанюк ([email protected])Институт проблем передачи информации РАН, Москва

Исследуются способы формализации текстов естественного языка с целью представления их в виде совокупности правил для экспертных систем. С учётом типологических особенностей текстов, соотносятся синтаксическая и коммуникативная структуры предложений. Разработанные алгоритмы реализованы в виде демонстрационного программного комплекса.

ВведениеБольшая часть знаний, накопленных людьми, сегодня хранится в форме

текстов на естественном языке. Особенно это характерно для гуманитарных дисциплин или для общедоступных популярных изложений научно-технических дисциплин. В последнем случае изложения часто ориентированы на богатую интуицию человека, который в состоянии все более глубоко проникать в смысл текста по мере того, как в этом возникает необходимость, иногда исправляя или уточняя сказанное.

Современные применения компьютеров в прикладных задачах связаны с необходимостью введения отдельного специалиста – инженера по знаниям, который должен уметь извлекать необходимые продукционные правила из текстов и других источников, опираясь на свои собственные знания и интуицию. В наших работах [Савинич и др., 2007, 2008, 2009] сделана попытка автоматизировать процесс порождения продукционных правил естественно-языкового текста, которые позволят, не прибегая к услугам инженера по знаниям, своевременно вносить уточняющие изменения в продукционные правила в соответствии с новыми публикациями в данной предметной области.

Данная статья является продолжением наших исследований, имеющих своей целью: во-первых, обозначить возможные способы выявления конструкций со значением обусловленности в текстах естественного языка;

92

во-вторых, придать найденным конструкциям формат, используемый в экспертных системах. И, наконец, в-третьих, ожидается, что трансформация любого (или только заданного типа) текста в совокупность конструкций со значением обусловленности позволит осуществить поиск требуемых конструкций при помощи компьютера. Иными словами, задача состоит в том, чтобы чисто формальными методами преобразовывать тексты естественного языка в совокупность строгих логических продукций, типичных для интеллектуальных систем [Стефанюк и др., 2007].

В основе логических правил вывода для интеллектуальной системы обычно лежит математическое понятие импликации (‘если …, то’). Но так как в лингвистике импликация имеет другое значение, а именно ‘нечто подразумеваемое’, мы используем иной термин – отношение обусловленности. Обусловленность, или каузальность, то есть причинность в широком смысле слова, объединяет в себе существенно более богатый спектр значений, таких, как основание, обоснование, доказательство и др. Весь этот круг отношений предполагает такую связь ситуаций, при которой одна служит основанием для реализации другой. Таким образом, в нашу задачу требуемого трансформирования текстов в продукции входит также задача формального разграничения логически связанных между собой ситуаций.

Отражая тем или иным образом логическую структуру высказывания, синтаксические отношения образуют в языке формальные признаки слов, обозначающих предмет высказывания, и противопоставленные им признаки слов, типично обозначающих предикацию. С целью представления для интеллектуальных систем формальных признаков слов, с одной стороны, и выявления понятийного аппарата текста, с другой стороны, нами был предпринят анализ лексического состава текста, в результате чего выделены характерные для выбранного типа текста классы лексических единиц и форманты, маркирующие их.

На первом этапе работы нами были выявлены элементы, маркирующие отношение обусловленности в естественном языке, – общеизвестные условные союзы если, в случае, в случае когда, а также их субституты.

На основе данных формальных показателей был составлен алгоритм, автоматически преобразующий текст в набор продукций для использования в интеллектуальной системе [Отчет по теме РФФИ, 2008].

Однако, выявленные формальные компоненты предложения, маркирующие отношение обусловленности, не исчерпывают всех случаев смыслового выражения обусловленности, как, например, в следующем предложении:

Граждане (физические лица) и юридические лица приобретают и осуществляют свои гражданские права своей волей и в своем интересе.

93

Поэтому для обнаружения иных маркеров отношения обусловленности был предпринят анализ синтаксической структуры предложений в его соотношении со смысловым содержанием.

Мы исходили из того, что тип текста в значительной степени предопределяет его синтаксическую структуру, поэтому обратились к описанию структуры деловых текстов для выявления их типологических особенностей.

1. Основные черты делового текста регулирующего характераВыбранный для анализа текст представляет собой свод положений,

предписываемых к исполнению и регулирующих взаимоотношения участников в различных официально-деловых ситуациях. Такая регулирующая функция выражается в тексте рядом характерных грамматических особенностей.

Основной стилевой чертой данного типа текстов является точность формулировок, не допускающая инотолкования в описании ситуации и её участников [Кожина, 1983]. Эта черта реализуется путём использования специальных терминов и фразеологических сочетаний, характерных для данной сферы деятельности, в однозначности и безóбразности нетерминологической лексики:

физические лица, предпринимательская деятельность, гражданские права и др.

Это исключает использование синонимов, которые могут выражать иные смысловые оттенки. Поэтому особенностью деловой речи является неоднократное повторение одних и тех же слов, в основном терминов.

Помимо этого, выражению точности способствует употребление различных уточнений и оговорок, что проявляется в использовании многочисленных уточняющих синтаксических конструкций, причастных и деепричастных оборотов, цепочек однородных членов. А для точности и логичности высказывания характерно преобладание союзной связи. Причём, в большинстве своём используются составные отымённые союзы и предлоги:

в случае; в случае, когда; в соответствии с; вследствие; в результате.Другой стилевой чертой является безличное, неличное выражение

предписываемого регламента. Данная черта проявляется в отсутствии форм глагола 1 и 2 лица, с другой стороны – в преимущественном употреблении форм 3 лица и инфинитива. Форма 3 лица настоящего времени имплицитно выражает долженствование:

Товары, услуги и финансовые средства свободно перемещаются (то есть должны свободно перемещаться) на всей территории Российской Федерации.

94

Как правило, характер долженствования в деловой речи проявляется в частом использовании кратких прилагательных модального значения долженствования (должен, обязан, обязателен) или инфинитивов глагола (Приказываю: 1) Командировать…; 2) Повысить производительность…; 3) Установить… и т.п.). Например:

Способы самозащиты должны быть соразмерны нарушению и не выходить за пределы действий, необходимых для его пресечения.

Однако в анализируемых нами текстах регламентирующего характера черта долженствования значительно смягчена и выражается также другими сочетаниями: глаголом может + инфинитив глагола; модальным словом вправе + инфинитив, имеющими предписывающий характер:

При осуществлении процедуры признания банкротом индивидуального предпринимателя его кредиторы по обязательствам, не связанным с осуществлением им предпринимательской деятельности, также вправе предъявить свои требования.

Далее следует выделить типичную для деловой речи стандартизированность (шаблон, форма), употребление устойчивых для деловой сферы общения оборотов:

на основании и во исполнение настоящего закона; защита гражданских прав; компенсация морального вреда; возмещение причинённых убытков и т.д.

Типичным признаком деловой речи является её именной характер (т.е. широкое использование имён существительных и имён прилагательных). Употребление в ней существительных значительно превышает использование единиц других лексических категорий. Для существительных характерно употребление не только в свойственной им номинативной функции (называния), но и, очень часто, в атрибутивной (функции определения), образуя ряды номинативных конструкций:

права авторов произведений науки; порядок осуществления права собственности; ограничение дееспособности гражданина и др.

Таким образом, была представлена характеристика делового типа текста с его синтаксическими и грамматическими особенностями.

2. Синтаксическая структура делового типа текста регулирующего характера

Ещё раз отметим, что выявленные формальные маркеры отношений обусловленности (союзы если; в случае; в случае, когда) не исчерпывали всех случаев выражения импликации для интеллектуальной системы. Поэтому нами был использован иной подход для определения обусловленности, выраженной имплицитно.

С учётом прагматической значимости порядка слов в предложении были определены статистические данные для выделения исходной позиции

95

предиката. С этой целью был предпринят анализ коммуникативной структуры предложений.

3. Анализ коммуникативной структуры предложенийИсходя из прагматически релевантного актуального членения, было

проанализировано деление предложений на тему и рему высказывания. Тема – "компонент актуального членения предложения, исходный пункт сообщения, – то, относительно чего нечто утверждается в данном предложении". Как показал анализ, тема в анализируемом тексте преимущественно занимает начальную позицию в предложении. Рема – "компонент актуального членения предложения, то, что утверждается или спрашивается об исходном пункте сообщения – теме – и создаёт предикативность, законченное выражение мысли". Как свидетельствует анализ, рема занимает конечную позицию.

│Граждане ││ могут иметь имущество на праве собственности… │ тема рема

Анализ коммуникативной структуры позволяет нам сделать очевидный вывод: тема высказывания в подобных текстах регулирующего характера преимущественно занимает начальную позицию в предложении и заканчивается перед первым глагольным или именным сказуемым, которое маркируется свойственными им окончаниями. Причём, их число ограничивается только формами инфинитива и глаголами 3 лица настоящего времени, что, как указывалось в разделе 2, свойственно текстам делового типа и поэтому существенно упрощает поиск таких компонентов в предложении.

4. Локализация рематической части предложений в интеллектуальной системе

Способ формального выделения интеллектуальной системой глагола по морфологическим показателям – так называемый вербоцентрический подход – не является новым. Однако в деловых текстах глагол выступает не только формальным разграничителем связанных между собой ситуаций, но также несёт основную смысловую нагрузку в регулировании их отношений.

Поэтому далее был предпринят рекурсивный анализ предложения для выявления компонентов, находящихся в препозиции к глаголу и влияющих на его семантику. Например:

Однако такой гражданин │ самостоятельно несёт имущественную ответственность по совершённым им сделкам и за причинённый им вред.

(Вертикальная черта показывает, что место членения предложения на тему и рему высказывания сдвинута от глагола влево – перед обстоятельством.)

96

5. Синтаксический модуль: бессоюзное сложное предложениеТакие предложения характерны для официально-деловой речи. Они

используются при перечислении реалий деловой сферы общения, условий взаимодействия сторон и т.д. Обязательным оператором (знаком пунктуации) перед перечисляемыми элементами является двоеточие. Основная синтаксическая функция двоеточия заключается в разграничении связанных ситуаций, из которых одна служит основанием для реализации другой. Таким образом, двоеточие представляет собой формальный маркер для интеллектуальной системы при выделении отношений обусловленности. Помимо этого, при перечислении после двоеточия часто используется цифровая нумерация перечисляемых компонентов и пунктуационный знак – точка с запятой – после каждого компонента, которые также могут служить дополнительными маркерами. Например:

Государственной регистрации подлежат следующие акты гражданского состояния:

рождение;заключение брака;расторжение брака;усыновление (удочерение);установление отцовства;перемена имени;смерть гражданина. В данном примере одна ситуация реализуется на основании

обусловливающих её перечисленных ситуаций. Это пример обратной последовательности в отношениях обусловленности. Однако если двоеточию предшествуют слова с модальным значением долженствования – должен, обязан, вправе, имеет право – то отношение обусловленности выстраивается в прямом порядке. Например:

Участники хозяйственного товарищества или общества вправе:участвовать в управлении делами товарищества или общества…;получать информацию о деятельности товарищества или общества;принимать участие в распределении прибыли…

6. Программная реализация описанных методовЗначительная часть описанных выше методов, позволяющих разбить

предложение на части, содержащие условия, и часть, содержащую заключение, были реализованы программно.

В задачу авторов не входило строить специализированную систему, относящуюся к области компьютерной лингвистики. Вместо этого ими был использован традиционный для данного коллектива аппарат

97

продукционных систем. Точнее, была использована так называемая продукционная сеть, состоящая из рекурсивных продукций. Такая продукция, прежде чем отработать, запускает другие продукции системы, и считается успешно выполненной, если работа этих продукций закончилась успехом. Продукционная сеть оказалась удобной для разбора лингвистических конструкций. Такая конструкция может состоять из фрагментов, каждый их которых, в свою очередь, представляет собой сложную структуру, требующую самостоятельного разбора.

В систему, служащую для поиска конструкций обусловленности, был включен механизм исключений. Он был основан на тех же идеях, что и сама продукционная система – на понятии образца и операции сопоставления. В продукционных системах, созданных авторами ранее, продукция считалась применимой к ситуации, если эта ситуация была сопоставима с определенным образцом. В использованной здесь системе продукция считается применимой к ситуации, если эта ситуация сопоставима с определенным образцом и при этом не сопоставима с другими образцами, играющими роль исключений.

Желая упростить программную часть системы, авторы рассматривали в качестве ситуации отдельную фразу, понимая ее как последовательность слов и знаков препинания. В процессе работы, однако, потребовался разбор отдельных слов с целью установить форму слова. В результате продукционная система была сделана двухуровневой. Верхний уровень служит для разбора фраз как последовательностей слов. Нижний уровень применяется для разбора отдельного слова. Поскольку набор слов и набор форм слова, используемый в разбираемых текстах, крайне ограничен, разбор слова позволил в некоторых случаях отказаться от словарей. Так, окончание –ет позволило отнести слово к глаголам 3 лица настоящего времени, причём единственным исключением на весь анализируемый текст оказалось слово лет.

Для участия лингвистов в разработке алгоритмов поиска конструкций со значением обусловленности, был создан вариант, который, используя COM-интерфейс, анализировал непосредственно текст в формате Microsoft Word, и в этом же формате хранились правила продукционной системы, служащие для поиска конструкций со значением обусловленности. Эта программа позволяла работать, не выходя из редактора Word, модифицируя при необходимости правила и повторно запуская продукционную систему. В исходном тексте программа выделяла цветом фразы, в которых ей удалось найти конструкции со значением обусловленности, отдельно выделяя цветом маркеры, служащие для распознавания этих конструкций. Исследователь мог перемещаться по тем выделенным фразам, при этом в отдельном окне показывалось, как эта фраза была разбита в соответствии с выявленным отношением обусловленности.

98

ЗаключениеВпервые такая задача автоматизации извлечения экспертных знаний из

текста возникла в наших работах по созданию динамических экспертных систем в 1990-х годах [Стефанюк, 1994], когда знания специалистов по сейсмологии стали недоступны, в связи с некоторыми особенностями проходившей в стране "перестройки". При этом, однако, имелась достаточно богатая литература по вопросу сейсмопрогноза. В то время казалось естественным использование инженеров по знаниям, которые, исходя из текстового материала, строили продукционные правила, предназначенные для динамической экспертной системы.

Примерно тогда и возник вопрос об автоматическом извлечении знаний в форме продукций. Однако опыт показал, что эта задача оказалась намного сложнее, чем можно было ожидать, что и потребовало интенсивных исследований.


Список литературы[Кожина, 1983] Кожина М.Н. Стилистика русского языка. – М.: Просвещение,

1983.[Отчет по теме РФФИ, 2008] Отчет по теме РФФИ, грант № 07-07-00391-а, М.:

2008 (рукопись).[Савинич и др., 2007] Савинич Л.В., Стефанюк В.Л. Представление конструкций

со значением обусловленности // Труды 2-й международной конференции "Системный анализ и информационные технологии (САИТ-2007)". – М.: Издательство ЛКИ/URSS, 2007. Т. 1.

[Савинич и др., 2008] Савинич Л.В., Стефанюк В.Л. Выражение обусловленности в естественном языке // Информационные технологии и вычислительные системы. – М., 2008. №1.

[Савинич и др., 2009] Савинич Л.В., Стефанюк В.Л. К извлечению знаний об отношениях обусловленности // Труды конгресса AIS-IT’09. – М.: Физматлит, 2009. T.1.

[Стефанюк, 1994] Стефанюк В.Л. Поведение квазистатической оболочки в изменяющейся нечёткой среде // Труды IV национальной конференции с международным участием «Искусственный интеллект94». – Рыбинск, 1994. Т. 1.

[Стефанюк и др., 2007] Стефанюк В.Л., Жожикашвили А.В. Сотрудничающий компьютер: проблемы, теории, приложения. – М.: Наука, 2007.

99

УДК 519.816

НЕЧЕТКАЯ АРИСТОТЕЛЕВА ЛОГИКА

Г.С. Плесневич ([email protected]) Московский Энергетический Институт, Москва

В работе рассматривается нечеткая Аристотелева логика и определяется понятие нечеткого силлогизма как некоторого состоятельного правила вывода для баз фактов в этой логике. Построены нечеткие силлогизмы для пропозициональной Аристотелевой логики с треугольной нормой Заде, то есть с нормой Т(х,у) = min{x,y}.

1. Основные определенияВ последние годы были предложены и в настоящее время

разрабатываются новые подходы к Аристотелевой логике, позволяющие расширить ее выразительные и дедуктивные возможности. Помимо традиционных приложений к философии и лингвистике, эта логика применяется в системах искусственного интеллекта и, вообще, в информационных системах. Отметим, например, применение Аристотелевой логики в амбициозном проекте Semantic Web (Семантический Веб), выдвинутом Т. Бернерс-Ли, изобретателем WWW, [Berners-Lee et al., 2001]. Язык Аристотелевой логики используется как формализм для спецификации онтологий, с помощью которых записываются семантические аннотации к ресурсам Веба.

Как известно, основанные на двузначной логике методы недостаточны для обработки плохо структурированной, неопределенной или нечеткой информации. Но именно такого рода информацию часто нужно представлять в онтологиях для Семантического Веба. В связи с этим перспективным является применение методов нечеткой логики к решению задач Семантического Веба, [Sanchez, 2006].

Существуют различные подходы к построению нечетких онтологий [Bobillo et al., 2009], [Tho, 2006]. Мы будем использовать нечеткую Аристотелеву логику с нечеткими силлогизмами в качестве правил вывода.

Классическая логика Аристотеля состоит из предложений видаP а Q, P i Q, P е Q, P о Q,

100

где P и Q – переменные, значениями которых служат множества (классы объектов), а а, i, е и о – Аристотелевы связки, обозначающие отношения между множествами. Этими отношениями служат включение, непустое пересечение, пустое пересечение и отрицание включения множеств P I и Q I, которые являются значениями переменных P и Q в интерпретации I. Таким образом, если U I – универсум интерпретации I, то P I U I, Q I U I

и(P а Q) I = 1 (истина) P I Q I, (P i Q) I = 1 P I Q I , (P e Q) I = 1 P I Q I = , (P o Q) I = 1 P I – Q I .Силлогизмы Аристотеля – это правила вывода для логики Аристотеля.

Эти правила традиционно классифицируют по четырем формам (так называемым фигурам):

(I) Y α Z, X β Y |– X γ Z, (II) Z α Y, X β Y |– X γ Z,(III) Y α Z, Y β X |– X γ Z, (IV) Z α Y, Y β X |– X γ Z,где α, β, γ {a, i, e, o}.Известно, что существует 15 силлогизмов как состоятельных правил

вывода. Например, силлогизм Barbara относится к фигуре (I) и имеет паттерн ааа, а силлогизм Baroco относится к фигуре (II) и имеет паттерн аоо. Паттерн – это слово αβγ с конкретными значениями α, β, γ для данного правила. В традиционном названии силлогизма гласные определяют его паттерн. Вот список всех 15 силлогизмов (с указанием фигур):

(I) Barbara, Darii, Celarent, Ferio (II) Camestres, Baroco, Cesare, Festino(III) Datisi, Ferison, Disamis, Bocardo(IV) Camenes, Fresison, Dimaris.Обозначим через α* обратное к α отношение (т.е. будем

интерпретировать предложение P α*Q так же, как и предложение Q α P). Тогда все 15 силлогизмов можно свести к одной форме, например к форме X α Y, Y β Z |– X γ Z. При этом получается только 8 правил вывода. Эти правила даны в табл.1, где указаны их паттерны.

Табл. 1 aaa Barbara iai Darii, Datisi, Disamis aee Celarent, Cesare, Camesres, Camenes

ieo Ferio, Festimo, Ferison, Fresison oa*o Baroco

a*oo Bocardo

101

Рассмотрим, например, силлогизм Festino: Z e Y, X i Y |– X o Z . Переставляя посылки и учитывая, что Z e Y и Y e Z эквивалентны (т.е. (Z e Y)I = (Y e Z)I для всех интерпретаций I), получаем правило X i Y, Y e Z |– X o Z с паттерном ieo.

Нечеткая Аристотелева логика имеет тот же синтаксис, т.е. ее предложения имеют вид P α Q, где α {a, i, e, o, a*, o*}. Интерпретация I назначает каждому имени Р нечеткое подмножество PI универсума UI, т.е. функцию P I : U I → [0,1] = {x | 0 x 1}. Значениями предложений в интерпретации I служат по определению:(P a Q) I = sup{P I(u) Q I(u) | u U I}

= sup{ (PI(u) QI(u)) | u U I}, (P i Q)I = inf{P I(u) Q I(u) | u U I}, (1.1)(P е Q)I = sup{ (P I(u) Q I(u)) | u U I},(P о Q)I = inf{P I(u) Q I(u) | u U I}. Здесь и – нечеткие логические связки, которые обычно определяется следующим образом: x = 1–y и x y = T(x,y), где Т – треугольная норма. В этом случае соотношения (1.1) переходят в соотношения:(P a Q)I = sup{1–Т(P I(u), 1– Q I(u)) | u U I}, (P i Q)I = inf{Т(Р I(u), Q I(u)) | u U I}, (P е Q)I = sup{1–Т(P I(u), Q I(u)) | u U I}, (P о Q)I = inf{Т(P I(u), 1– Q I(u) | u U I}.

Выражения вида s P α Q t будем называть (нечеткими) фактами. Здесь α {a, i, е, о, а*, о*}, а s и t – числа из интервала [0,1], причем s t. Значением факта s P α Q t в интерпретация I служит 1 (истина) или 0 (ложь) и (s P α Q t) I = 1 df s (P α Q) I t.

Конечное множество нечетких фактов назовем базой фактов. Пусть Fb – произвольная база фактов и φ – какой-либо факт. Логическое следствие Fb |= φ определяется стандартным образом, т.е. как отсутствие интерпретации, при которой все факты из Fb истинны, но факт φ ложен. База фактов называется невыполнимой, если не существует ни одной интерпретации, при которой все факты из Fb.

Рассмотрим правила вывода для фактов, имеющие видR(g,h): a P α Q с, b P β Q d |– g P γ Q h.

Здесь a, b, c, d рассматриваются как параметры (переменные), принимающие значения в интервале [0,1], а g и h – некоторые функции от этих параметров. Правило R(g,h) состоятельно, если имеет место логическое следствие a P α Q с, b P β Q d |= g P γ Q h.

102

Ясно, что это логическое следствие тривиально имеет место, если посылки правила R(g,h) составляют невыполнимое множество. Естественно исключить из рассмотрения такие правила вывода. Существует условие, накладываемое на числа a, b, c и d, когда пара посылок правила R(g,h) невыполнима. Это условие назовем условием невыполнимости

Ясно, что для любых связок α, β, γ {a, i, е, о, а*, о*} и любых чисел a, b, c, d [0,1] таких, что a с и b d, найдутся числа g и h такие, что правило R(g,h) состоятельно (например, можно взять g = 0 и h =1). Ясно также, если правило R(g,h) состоятельно, то состоятельно также и правило R(g’,h’), где g’ g и h' h. Следовательно, существуют оптимальные границы для g и h, при которых состоятельно правило вывода R(g,h). Положим

gαβγ(a,b,c,d)=sup{g| правило R(g,1) состоятельно},hαβγ(a,b,c,d) = inf{h | правило R(0,h) состоятельно}.

Правило выводаa P α Q с, b Q β R d |– gαβγ(a,b,c,d) P γ R hαβγ(a,b,c,d)

мы называем нечетким силлогизмом с паттерном αβγ. Построить нечеткий силлогизм – значит, найти выражения для функций gαβγ(a,b,c,d) и hαβγ(a,b,c,d), а также указать условие невыполнимости для его правой части.

Ясно, что имеется ровно 216 = 6 6 6 различных нечетких силлогизмов. Однако, можно взять 6 силлогизмов, которые являются базовыми в том смысле, что любой другой силлогизм, можно свести к некоторому базовому силлогизму (см. далее раздел 2).

В настоящей работе мы рассматриваем в основном случай нечеткой пропозициональной Аристотелевой логики, когда допускаются только интерпретации с одноэлементными универсумами. Точнее, пусть U I ={ω} для всех допустимых интерпретаций. Тогда соотношения (1.1) превращаются в соотношения:

(P a Q) I = 1 – Т(P I(ω), 1– Q I(ω)), (P i Q) I = Т(Р I(ω), Q I(ω)),(P е Q) I = 1–Т(P I(ω), Q I(ω)), (P о Q) I = Т(P I(ω), 1– Q I(ω)).

Мы можем трактовать значение P I(ω) как значение нечеткой пропозициональной переменной, которую обозначим р. Таким образом, мы приходим к нечеткой пропозициональной Аристотелевской логике (НПАЛ) с предложениями вида p a q, p i q, p е q, p о q, для которых имеем:

(p a q) I = 1 – Т(p I, 1– q I), (p i q) I = Т(p I, q I),(p е q)I = 1–Т(pI, qI), (p о q)I = Т(pI, 1– qI).

В нечеткой пропозициональной Аристотелевой логике силлогизмы принимают вид

a p α q с, b q β r d |– gαβγ(a,b,c,d) p γ r hαβγ(a,b,c,d).

103

Одним из мотивов для введения НПАЛ является то, что проблема невыполнимости в логике Аристотеля сводится к проблеме выполнимости в пропозициональной логике Аристотеля (см. раздел 3).

В разделе 4 мы рассмотрим метод аналитических таблиц для вывода фактов НПАЛ с нормой Заде, т.е. с нормой Т(х,у) = min{x,y}. Используя этот метод, мы строим нечеткие силлогизмы для этой логики (см. раздел 5).

2. Базовые нечеткие силлогизмы В качестве базовых силлогизмов возьмем нечеткие силлогизмы со

следующими паттернами: aai, ааа*, iaа, iii, iai, а*аi.Рассмотрим, например, как нечеткий силлогизм с паттерном o*ie можно

свести к базовому силлогизму iii. При интерпретации I предложений этого силлогизма имеем импликацию

а sup{1–Т(Q I(u),1–P I(u)) | u U I} c, b inf{Т(Q I(u),R I(u)) | u U I}d

=> go*ie(a,b,c,d) sup{1–Т(P I(u),R I(u)) | u UI} go*ie(a,b,c,d).Отсюда1–c inf{Т(Q I(u),1–P I(u)) | u U I} 1–a, b inf{Т(Q I(u),RI(u))|u U I} d =>1–ho*ie(a,b,c,d) inf{Т(P I(u),R I(u)) | u U I} 1 –go*ie(a,b,c,d).Переименовав P на R, Q на P и R на Q и сделав перестановку посылок

импликации, получимb inf{Т(P I(u),Q I(u)) | u U I} d1–c inf{Т(Q I(u),1– R I(u)) | u U I} 1–a =>1–ho*ie(a,b,c,d) inf{Т(P I(u),R I(u)) | u U I} 1–go*ie(a,b,c,d).В силу произвольности интерпретации I имеем состоятельный

силлогизмb P i Q d, 1–c Q i R 1–a |– 1–ho*ie(a,b,c,d) P i R 1–go*ie(a,b,c,d).

Отсюда giii(b,1–c,d,1–a) = 1–ho*ie(a,b,c,d), hiii(b,1–c,d,1–a) = 1–go*ie(a,b,c,d) и, значит, go*ie(a,b,c,d) = 1–hiii(b,1–c,d,1–a), ho*ie(a,b,c,d) = 1–giii(b,1–c,d,1–a).

Итак, нечеткий силлогизм с паттерном o*ie сводится к нечеткому силлогизму с паттерном iii в том, что границы первого силлогизма вычисляются из границ второго.

Теорема 1. Каждый нечеткий силлогизмa ≤ p α q ≤ c, b ≤ q β r ≤ d |– gαβγ(a,b,c,d) ≤ p γ r ≤ hαβγ(a,b,c,d)сводится к некоторому базовому силлогизму a’≤p λ q≤ c’, b’≤ q μ r ≤ d ’ |– gλμν(a’,b’,c’,d ’) ≤ p r ≤ hλμν(a’,b’,c’,d ’),где λμν {aai, ааа*, iaа, iai, iii, а*аi} и a’, b’, c’, d ’ {a, b, c, d,1–a, 1–

b,1–c,1–d}.

104

3. Проблема невыполнимости в логике АристотеляТеорема 2. Пусть S – конечное множество предложений логики

Аристотеля. Тогда по S можно построить такое множество предложений S1 пропозициональной логики Аристотеля, что выполняется эквивалентность

S выполнимо S1 (пропозиционально) выполнимо.Если множество S содержит m предложений со связками i или о, то |S1|

= m(|S| - m). Другими словами, проблема невыполнимости в логике Аристотеля полиномиально сводится к проблеме невыполнимости в пропозициональной логике Аристотеля.

Как построить базу знаний S1 можно понять из следующего примера. Пусть S = {A i B, A o C, A a D, B e C, B e D}. Предложения из S запишем в языке логики предикатов:

x(A(x) B(x)), x(A(x) C(x)), (3.1)x( (A(x) D(x)), x( (B(x) C(x))), x( (B(x)

D(x))). (3.2) Заменим формулы (3.1) на формулы

А(s1) B(s1), A(s2) C(с2), (3.3)где s1 и s2 – сколемовские константы. Эта замена сохраняет свойство выполнимости и поэтому множество S выполнимо тогда и только тогда, когда множество E формул (3.2) и (3.3) выполнимо. По теореме Эрбрана множество E будет выполнимым тогда и только тогда, когда оно выполнимо в универсуме Эрбрана, который в данном случае состоит из двух элементов – констант s1 и s2. Следовательно, множество E будет выполнимым тогда и только тогда, когда выполнимо множество, состоящее из формул (3.3) и формул, получаемых из формул (3.2) подстановкой констант s1 и s2 вместо переменной х:

А(s1) B(s1), A(s2) C(s2), (A(s1) D(s1)), (B(s1) C(s1)),(B(s1) D(s1)), (A(s2) ~D(s2)), (B(s2) C(s2)), (B(s2)

D(s2).Формулы А(s1), A(с2), B(с1), B(с2), С(с1), С(с2), D(с1), D(с2) можно

рассматривать в качестве пропозициональных переменных и обозначить соответственно р1, р2, р3, р4, р5, р6, р7, р8. Возвращаясь к обозначениям с аристотелевскими связками, мы получим множество

Е1= {р1 i р3, р1 o р6, р1 a р7, р3 e р5, р3 e р7, р2 a р8, р4 e р6, р4 e р8}.Таким образом, множество Е выполнимо тогда и только тогда, когда

выполнимо множество Е1.

4. Метод аналитических таблиц для пропозициональной Аристотелевой логики с нормой Заде

105

Очевидно, что справедливы следующие соотношения:min{x,y} ≤ c x ≤ c или у ≤ c, min{x,y} ≥ c x ≤ c и у ≤ c,max{x,y} ≤ c x ≤ c и у ≤ c, max{x,y} ≥ c x ≤ c или у ≤ c.

Такие же соотношения имеют место, если нестрогие неравенства заменить на строгие. Эти соотношения доказывают состоятельность приведенных в табл.1 правил вывода, действующих на фактах с односторонними неравенствами. (Такие факты для краткости будем называть 1-фактами.) Аналогичные правила имеются для 1-фактов со строгими неравенствами. Обозначим R множество этих правил вывода, т.е. R состоит из всех указанных в табл.3 правил, а также правил, получаемых из них заменой знаков и на знаки < и >.

Табл. 1. р а q ≥ c р а q ≤ с---------------- ----------- р ≤ 1– c | q c p ≥ 1– c q ≤ с

p i q ≥ c p i q ≤ c ----------- ------------- р ≥ c p ≤ c | q ≤ c q ≥ c

p e q c p e q c---------------------- -----------р ≤ 1– c | q ≤ 1– c p ≥ 1– c q ≥ 1– c

p o q ≥ c p o q c ----------- ------------------- р ≥ c p ≤ c | q ≥ 1– c q ≤ 1– с

Легко видеть, что распознавание логического следствия Fb |= φ может быть сведено к распознаванию невыполнимости множеств 1-фактов. В самом деле, пусть Fb’– множество 1-фактов, получаемое из Fb заменой каждого входящего в Fb факта t ≤ p α q s на два факта p α q t и p α q s. Для произвольного факта φ: t ≤ p α q s обозначим через φ– факт p α q t, а через φ+ – факт p α q s. ТогдаFb |= φ множества Fb’ { φ– } и Fb’ { φ+ } невыполнимы.Правила из R составляют полную систему вывода для 1- фактов.Теорема 1. Для произвольного множества 1-фактов S имеют место следующие утверждения:

Если множество S невыполнимо, то при применении (в любом порядке) правил вывода из R, начиная с «ветви», составленной из 1-фактов множества S, мы, в конце концов, получим замкнутое дерево;

Если при применении правил вывода (в каком-либо порядке) мы получили замкнутое дерево, то множество S невыполнимо.

5. Силлогизмы для нечеткой пропозициональной Аристотелевой логики с нормой Заде

106

Правила вывода системы R могут быть использованы для построения нечетких силлогизмов для НПАЛ с нормой Заде. Например, покажем, как построить базовый нечеткий силлогизм с паттерном аai.

Пусть Fb = {a p a q c, b q a r d} – факты, составляющие посылки силлогизма с паттерном aai. На рис.1 показано дерево вывода для множества 1-фактов Fb’= {p a q c, p a q a, q a r d, q a r d}. Это дерево изображено в части между точечными линиями А и Б. Дерево будет замкнутым тогда и только тогда, когда будут невыполнимым пара 1-фактов {q c, q 1–d}. Ясно, что эта пара предложений невыполнима тогда и только тогда, когда c<1–d, то есть, когда c+d<1. Таким образом, неравенство c+d<1 служит условием невыполнимости для посылок нечеткого силлогизма. p > h . . . .. . . . . . . . . . . . . . . . . . . . . . . r > h. . . . . . . . . . . . . . . . . . . . . . . . . . . . A p a q a [3] p a q c [1] q a r b [4] q a r d [2] p 1– c q c q 1– d ___________ r d_________________ | | _____ p 1– a____ ______ q a_______ | | | | _ q 1– b_ ___ r b__ __ q 1– b_ ___r b__ | . . . . . . . . | . . . . . . . | . . . . . . . .| . . . . . . |. . . . . . . . . | . . . . . . . |. . . . . . . . |. .Бp<g r<g p<g r<g p<g r<g p<g r<g(1) (2) (3) (4) (5) (6) (7) (8)

Рис.1 Дерево вывода для множества 1-фактов Fb’

Для получения нижней границы gaai(a,b,c,d) для нечеткого силлогизма с паттерном aai строим дерево вывода для множества Fb’ {p i r < g}. Это дерево изображено в части ниже линии А. В дереве нужно найти пары 1-фактов, которые могут противоречить друг другу. В табл.4 выписаны эти пары вместе с условиями их несовместности, а также с номерами ветвей дерева, которые блокируют (замыкают) эти ветви. Пару 1-фактов, для которой имеется условие, выполнение которого блокирует хотя бы одну ветвь таблицы, назовем блокирующей.

107

Заметим, что условием невыполнимости пары {p 1–c, p 1–a}, лежащей на ветвях (1), (2), (3), (4), служит неравенство a>c. Но это неравенство не может быть выполнено, так как всегда a c. Поэтому эта пара не является блокирующей.

Табл. 2 p 1– c, p < g g 1– c (1), (3), (5), (7) r b, r < g g b (4), (8) r d, r < g g d (2), (4), (6), (8)

Из табл.1 видно, что условие g 1–c g d блокирует все ветви таблицы. Очевидно, что g 1–c g d g min{1–c, d}. Значит, наибольшим g, при котором дерево будет замкнутым, является min{1–c, d}. Следовательно, gaai(a,b,c,d) = min{1– c, d}.

Для нахождения верхней оценки рассмотрим часть дерева (рис.1) выше линии Б. Мы обнаруживаем, что здесь нет блокирующих пар для ветвей (5), (6), (7) и (6), если только h < 1; если же h = 1, то все ветви будут блокированы. Следовательно, haai(a,b,c,d) = 1.

Найдем еще нижнюю границу для нечеткого силлогизма с паттерном iаа. Для этого построим соответствующее дерево Т (рис.2). p > 1– g . . . .. . . . . . . . . . . . . . . . . . . . . . . r < g. . . . . . . . . . . . . . . . . . . . . . . . . . . . A p a q a [3] p i q c [1] q a r b [4] q a r d [2] p a q a q 1– d ___________ r d________________ | | _____ p с______ _____ q c______ | | | | q 1– b r b q 1– b r b (1) (2) (3) (4) Рис.2. Дерево Т.

Дерево в части между линиями А и Б не имеет блокирующих пар, так как его ветвь (2) всегда открыта. Следовательно, силлогизм с паттерном iaa не имеет условия невыполнимости. Чтобы найти нижнюю границу для этого силлогизма, найдем блокирующие пары для дерева Т.

В табл.3 представлены все блокирующие пары для ветвей дерева Т.

108

Табл. 3 q a, q 1– b а+b > 1 (1), (3) r < g, r b g b (2), (4) p > 1– g, p с g 1– c (1), (2) q 1– d , q c C+ d < 1 (3), (4)

Очевидно, что дерево Т замкнуто тогда и только тогда, когда либо a+b>1 & g b, либо c+d<1 & g 1–c, то есть когда выполняется условие (a+b>1 & g b) (c+d <1 & g 1– c). Отсюда получаем: (i) если a+b >1 и c+d <1, то g b g 1– c; (ii) если a+b >1 и c+d 1, то g b; (iii) если a+b 1 и c+d <1, то g 1– c; (iv) если a+b 1 и c+d 1, то 0.Поскольку a c и b d, то c+d > 1, когда a+b > 1. Поэтому (i) можно исключить, а (ii) свести к a+b > 1. Следовательно, мы получаем: • если a+b > 1, то giaa(a,b,c,d) = b;• если a+b 1 и c+d < 1, то giaa(a,b,c,d)= 1– c; • если a+b 1 и c+d 1, то giaa(a,b,c,d) = 0.

Проводя дальнейшие аналогичные рассуждения, найдем границы для всех базовых нечетких пропозициональных силлогизмов. Эти оценки даны в табл.4.

Табл. 4Паттерн Условие

невып. Нижняя граница Верхняя граница

аai с+d< 1 min{1–c,d} 1 aaa* с+d< 1 1– d 1 Aa b, если a+b > 1

1–c, если a+b1, c+d < 1 0, если a+b1, c+d 1

1–a, если a+b > 1max{d,1–a}, если a+b 1

Iai min{a,b},если a+b >1 0, если a+b 1

max{c,d}, if c+d < 1 d, if c+d 1

iii min{a,b} max{c,d}, если b >c, a > d c, если b c, a > d d, если b > c, a d 0, если b c, a d

а*ai 0 c, если cd d, если d c

109

Благодарности. Автор благодарит РФФИ за финансовую поддержку настоящей работы (проекты 08-01-00465 и 09-01-00587).

Список литературы[Ионин и др., 2009] Ионин В.К., Плесневич Г.С. Нечеткая пропозициональная

силлогистика // V-ая Международная научно-практическая конференция «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (Коломна 2009). Сб. научных трудов. – М.: Физматлит, 2009.

[Новак и др., 2006] Новак В., Перфильева И., Мачкорж И. Математические принципы нечеткой логики. – М.: Физматлит, 2006.

[Berners-Lee et al, 2001] Berners-Lee T., Hendler J. and Lassila O. The Semantic Web // Scientific American. Vol. 284, № 5, 2001.

[Sanchez, 2006] Sanchez E. Fuzzy Logic and the Semantic Web. – Elsevier, 2006.[Stanford, 2007] Stanford Encyclopedia of Philosophy. Aristotle’s Logic. –

http//plato.stanford.edu/Aristotle-logic.

УДК 510.644

PN-ЛОГИКИ И МОДИФИКАЦИОННЫЕ ИСЧИСЛЕНИЯ

О.М. Аншаков ([email protected]) Российский государственный гуманитарный университет,

Москва

В качестве альтернативы многозначным логикам с J-операторами предлагаются многозначные логики с введенными автором PN-операторами. Логики с PN-операторами (также как и логики с J-операторами) могут служить логическим базисом для систем интеллектуального анализа данных, основанных на когнитивных рассуждениях, использующих немонотонные модификационные исчисления.

1. J-операторы в многозначных логикахJ-операторы были введены в работе Россера и Тьюркета [Rosser et al,

1951] как характеристические функции одноэлементных подмножеств множеств истинностных значений конечнозначных логик. В случае бесконечнозначной логики J-оператор более удобно определить как

110

характеристическую функцию произвольного подмножества множества истинностных значений этой логики. В обоих случаях мы предполагаем, что множество истинностных значений многозначной логики (обозначим его через V) содержит два элемента (обозначим их через 0 и 1), которые интерпретируются как ложь и истина, соответственно. Пусть

Тогда J-операторы и определяются следующим образом:

где В работе [Anshakov et al., 1989] рассматривается широкий класс

многозначных логик с двумя сортами истинностных значений: внешним и внутренним. Множество внешних истинностных значений обозначим через

множество внутренних истинностных значений – через

Мы предполагаем, что и на множестве определены обычные классические логические операции: конъюнкция, дизъюнкция, импликация, отрицание и эквиваленция. На множестве могут быть определены какие-то свои (внутренние) логические операции. Кроме того,

и связаны между собой с помощью J-операторов.В работе [Anshakov et al., 1989] J-операторы определяются как

произвольные отображения множества в множество Такие отображения, очевидно, можно рассматривать как характеристические функции подмножеств множества .

Интуитивный смысл внешних и внутренних истинностных значений следующий:

внешними истинностными значениями оцениваются утверждения, которые обоснованы теоретически, считаются достоверными и/или общепринятыми;

внутренними истинностными значениями оцениваются данные наблюдений и экспериментов и результаты правдоподобных рассуждений, т.е. утверждения, обоснованные эмпирически.

Другими словами, внешними истинностными значениями оцениваются (достоверные и/или конвенциональные) знания, в то время как внутренние истинностные значения применяются для оценки фактов и гипотез, полученных с помощью недостоверных рассуждений. Среди этих гипотез могут встретиться описания закономерностей, установленных опытным путем. Эти описания также следует рассматривать как знания, но не являющиеся достоверными.

111

Логики с двумя сортами истинностных значений и с J-операторами позволяют избежать противоречий при использовании формализованных правдоподобных рассуждений. Одна из таких логик была использована для дедуктивной имитации ДСМ-метода автоматического порождения гипотез – методологии и технологии интеллектуального анализа данных, предложенной В.К. Финном в 1980-х годах (см., например, [Финн, 1983], наиболее современное изложение ДСМ-метода можно найти в [Финн, 2010]).

Анализ описания правил ДСМ-метода на языке логики с двумя сортами истинностных значений показывает, что для формулировки таких правил нет необходимости использовать какие-либо операции, определенные на множестве , отличные от J-операторов. Это означает, что для формализации правдоподобных рассуждений можно использовать многозначные логики, устроенные более просто, чем логики из работы [Anshakov et al, 1989]. В книге [Anshakov et al, 2010] такие логики названы чистыми J-логиками (PJ-логиками).

Чистые J-логики имеют два сорта (а значит и два множества) истинностных значений. На множестве внешних истинностных значений определены обычные классические логические операции; на множестве внутренних истинностных значений определены только J-операторы (отображения множества внутренних истинностных значений во множество внешних истинностных значений).

Чистые J-логики были использованы в [Anshakov et al., 2010] для формализации так называемых когнитивных рассуждений – рассуждений, направленных на уменьшение неопределенности. Ясно, что уменьшение неопределенности влечет увеличение количества информации, что включает два аспекта: расширение области определенности и увеличение степени определенности. Однако чистые J-логики позволяют достаточно хорошо формализовать только один аспект – расширение области определенности. Для представления другого аспекта роста количества информации, сопровождающего процесс познания, можно использовать логики с PN-операторами, рассматриваемые ниже.

В книге [Anshakov et al., 2010] описывается так называемый познающий агент – система произвольной природы, основной целью деятельности которой является познание, наглядно представляемое как движение от незнания к знанию. При работе познающего агента чередуются две фазы: фаза восприятия и фаза рассуждений. В обсуждаемой книге детально рассматривается именно фаза рассуждений. Фактически в этой книге рассуждение понимается как манипулирование суждениями (по аналогии с манипулированием данными). Манипулирование суждениями включает операции добавления, удаления и модификации суждений. Ясно, что понимаемое таким образом рассуждение может быть немонотонным.

112

В рассматриваемой книге для формализации рассуждений познающего агента вводится специальная логическая техника – модификационные исчисления и модификационные теории. Модификационные исчисления являются немонотонными. При выводе в модификационном исчислении может возникнуть эффект временной противоречивости. Достаточно простые примеры, демонстрирующие эти особенности модификационных исчислений, рассмотрены в [Anshakov et al., 2010].

2. PN-логикиPN-операторы как альтернатива J-операторам были введены в работе

[Аншаков, 2008]. Мотивацией для замены J-операторов на PN-операторы являлась необходимость независимого рассмотрения аргументов «за» и «против» некоторой гипотезы в итеративном процессе порождения гипотез. Использование J-операторов в классической стратегии как ДСМ-метода, так и познающего агента делало невозможным пересмотр гипотез, если какие-то аргументы были признаны доминирующими. Т.е., если некоторое утверждение было признано «эмпирически истинным» (аргументы «за» оказались более убедительными), то на последующих шагах рассуждения это утверждение нельзя было признать «эмпирически ложным» или «противоречивым». Понятно, что такое ограничение делает стратегию рассуждений недостаточно гибкой, а их немонотонность – формальной. Немонотонность фактически сводится к возможности изменить оценку гипотезы «неопределено» на одну из характеристик определенности.

Автор в [Аншаков, 2008] предложил учитывать аргументы «за» и «против» (положительные и отрицательные аргументы) независимо друг от друга и определил для этого некоторые логические средства. В частности, в обсуждаемой работе приводится пример логики, которая примерно соответствует бесконечнозначной логике с четырьмя типами истинностных значений, применяемой для дедуктивной имитации ДСМ-метода. Ниже мы ограничимся рассмотрением только конечнозначных логик и определим класс логик, соответствующих конечным чистым J-логикам из [Anshakov et al., 2010].

2.1. Истинностные значенияБудем рассматривать два сорта истинностных значений: внешние и

внутренние. Множество внешних истинностных значений обозначим через и положим где 0 и 1 интерпретируются как

классические ложь и истина, соответственно. Пусть

,

113

– конечное множество. Положим Элементы множества будем называть внутренними истинностными значениями. Каждое

внутреннее истинностное значение есть упорядоченная пара , где

Число понимается как вес положительных аргументов, число – как вес отрицательных аргументов, касающихся некоторой гипотезы.

2.2. Логические операцииБудем предполагать, что на множестве определены обычные

логические операции: конъюнкция дизъюнкция импликация отрицание и эквиваленция На множестве определим

P- и N-операторы следующим образом: для любого положим

где Для простоты вместо и будем

писать и соответственно. Очевидно, что на можно определить структуру бирешетки [Ginsberg, 1988], положив

если и

если и

Связь бирешеток с аргументацией рассматривалась в работе [Виноградов, 2006].

Мы не будем в явном виде вводить на структуру бирешетки и определять соответствующие операции, однако оставим за собой право использовать эту бирешеточность неявно при формулировке правил рассуждений.

Итак, никаких других операций, кроме классических логических операций на , P- и N-операторов на в алгебре определяемой логики нет.

Логику с определенными в 2.1 истинностными значениями и описанными в 2.2 логическими операциями будем называть конечной PN-логикой.

114

2.3. АксиоматизацияИсчисление для конечной PN-логики можно построить по аналогии с

исчислением для конечной чистой J-логики. Будем предполагать, что сигнатура содержит внешние и внутренние предикатные символы с помощью которых можно определить внешние и внутренние атомарные формулы данной сигнатуры. Внешними атомарными формулами также считаются формулы вида где и – термы одного сорта.

PN-формулами называются выражения вида или где – внутренняя атомарная формула, Выражение называется базовой формулой, если оно является внешней атомарной формулой или PN-формулой.

Внешние формулы определяются по индукции следующим образом: каждая базовая формула является внешней формулой; если и являются внешними формулами, то выражения

и также являются внешними формулами;

если – внешняя формула, – предметная переменная, то выражения и – также являются внешними формулами.

Аксиомы для исчисления первого порядка, соответствующего PN-логике, делятся на следующие группы:

1. Пропозициональные аксиомы: сюда относятся все результаты подстановки внешних формул вместо пропозициональных переменных в классические тавтологии.

2. PN-аксиомы: формулы вида

где – внутренняя атомарная

формула, 3. Кванторные аксиомы: формулы вида и

где – внешняя формула, – предметная

переменная, – терм, и имеют один сорт, в формуле ни одно свободное вхождение переменной не находится в области действия квантора по переменным, входящим в ,

есть результат замены в формуле переменной на терм во всех свободных вхождениях.

4. Аксиомы равенства: формулы вида ,

где – предметные переменные, – внешняя

115

формула, в которой ни одно свободное вхождение переменной не находится в области действия квантора по переменным и

и получены в результате замены в формуле переменной на переменные и соответственно, во всех свободных вхождениях.

Правила вывода:

(modus ponens)

(-введение)

(-введение)

Здесь и – внешние формулы, – предметная переменная не имеющая вхождений в

Теоремы о корректности и о полноте для описанного выше исчисления доказываются аналогично соответствующим теоремам для конечных чистых J-логик (см. [Anshakov el al., 2010]).

3. Модификационные исчисленияМодификационные исчисления для конечных PN-логик можно

определить аналогично тому, как в [Anshakov el al, 2010] определялись модификационные исчисления на базе конечных чистых J-логик. В данном разделе опишем только общий вид модификационных правил для PN-логик. Эти правила будут выглядеть следующим образом:

(P-правило)

(N-правило)

Здесь – внутренняя атомарная формула, – некоторая внешняя формула, представляющая положительное условие для внутренней атомарной формулы и весов и положительных аргументов, аналогично представляет отрицательное условие для внутренней атомарной формулы .

116

Условие выражает такое сочетание обстоятельств, которое позволяет увеличить суммарный вес аргументов за гипотезу с до Другими словами, констатирует наличие достаточно весомых положительных аргументов, которое позволяет повысить степень доверия к истинности с до

Аналогично может быть объяснено условие .Рассмотрим простой конкретный пример. Пусть Тогда

множество содержит четыре внутренних истинностных значения: – неопределенность, – эмпирическая истина, –

эмпирическая ложь, – эмпирическое противоречие. Рассмотрим правило, аналогичное одному из правил второго рода ДСМ-метода.

(P-правило)

Здесь – объект, – фрагмент объекта, – свойство объекта, – предикат «обладать свойством», – предикат «являться причиной свойства». Приведенное выше правило можно неформально объяснить следующим образом:

Пусть отсутствуют аргументы за то, что объект обладает свойством

Пусть существует фрагмент такой, что является частью и есть аргументы за то, что является причиной

Тогда есть аргументы (мы их только что нашли) за то, что обладает свойством

Аналогично может быть определено N-правило.

Список литературы[Аншаков, 2008] Аншаков О.М. PN vs. J // XI национальная конференция по

искусственному интеллекту с международным участием (КИИ 2008) Труды конференции. В 3-т. М.: Физматлит, 2008.

[Виноградов, 2006] Виноградов Д.В. Бирешетки и логика аргументации // X национальная конференция по искусственному интеллекту с международным участием (КИИ 2006) Труды конференции. В 3-т. М.: Физматлит, 2006.

[Финн, 1983] Финн В.К. О машинно-ориентированной формализации правдоподобных рассуждений в стиле Ф.Бэкона – Д.С.Милля // Семиотика и информатика.– 1983.– Вып. 20.

[Финн, 2010] Финн В.К. Индуктивные методы Д.С. Милля в системах искусственного интеллекта // Искусственный интеллект и принятие решений, № 2, 2010 (в печати).

117

[Anshakov el al., 1989] Anshakov O.M., Finn V.K., Skvortsov D.P. On axiomatization of many-valued logics associated with formalization of plausible reasoning // Studia Logica. 1989. Vol. 48, № 4.

[Anshakov el al., 2010] Anshakov O., Gergely T. Cognitive Reasoning: A Formal Approach. Berlin–Heidelberg: Springer. 2010.

[Ginsberg, 1988] Ginsberg M.L. Multivalued logics: A uniform approach to inference in artificial intelligence // Computational Intelligence, 1988. Vol. 4, № 3.

[Rosser et al., 1951] Rosser J.B., Turquette A.R. Many-valued Logics. Amsterdam: North-Holland. 1951.

УДК 519.816

СПОСОБ ПРЕДСТАВЛЕНИЯ ТЕРМОВ В ЛОГИКЕ ПРЕДИКАТОВ ПЕРВОГО ПОРЯДКА. АЛГОРИТМ

УНИФИКАЦИИ

А.П. Раговский ([email protected])Московский Государственный Университет Приборостроения и Информатики, Москва

Предложен способ представления термов в логике предикатов первого порядка и алгоритм унификации, использующий данное представление. Приведен результат работы алгоритма унификации.

Создание высокопроизводительных процедур доказательства теорем, способных эффективно решать задачи практической степени сложности в условиях экспоненциального роста пространства поиска, требует решения ряда задач. Первая задача относится к структурам представления термов и алгоритмам их обработки. Это связано с тем, что термы являются основной структурой обработки в процедурах вывода и их неэффективное представление может значительно ухудшить общую производительность процедур вывода. Вторая задача относится к разработке более производительного и эффективного алгоритма унификации, чем алгоритм, предложенный Дж. Робинсоном [Вагин и др., 2004].

В настоящее время в алгоритмах доказательства теорем, как правило, используются достаточно простые и экономные структуры представления

118

термов, которые очень хорошо сочетаются и с процедурой дедуктивного вывода, и с процедурой унификации. Такими структурами часто являются ориентированные ациклические графы и плоские термы [Касьянов и др., 2003] [Christian, 1993]. Достоинством ациклических орграфов является реализация всевозможных операций просмотра термов в разных направлениях и манипулирования их частями. Главным их недостатком является усложнение работы с памятью, из-за того, что размер каждого узла в первую очередь зависит от количества потомков. Однако этого нельзя сказать о плоском представлении термов. Достоинством плоских термов является предоставление удобного способа прямого разбора терма и значительное упрощение работы с памятью, из-за фиксированной структуры.

При разработке эффективного и простого в использовании представления термов необходимо объединение достоинств вышеописанных структур. Для этого необходимо решить две основные задачи: определение основной структуры представления термов и расширение такой структуры для удобного хранения в памяти. В качестве основной структуры представления термов предлагается использование размеченных ациклических орграфов , формальное определение

которых описывается с помощью составного объекта , при условии , где – множество меток, – множество натуральных чисел, – множество вершин, – начальная вершина,

– функция разметок вершин, – множество упорядоченных связей, таких, что , [Касьянов и др., 2003] [Капитонова и др., 2004] [Андерсон, 2003] [Дистель, 2002].

Для удобного описания термов рассматриваются только инициальные составные объекты, т.е. объекты для любой вершины которых,

, где – транзитивное замыкание отношения непосредственной достижимости. Каждая вершина составного объекта S порождает составной объект, начальной вершиной которого является она сама. Причем i-м аргументом составного объекта , порожденного вершиной v, при условии существования такой, что

, является составной объект , порожденный вершиной .Задача представления терма размеченным ациклическим орграфом

составного объекта S дополняется префиксным способом прохождения вершин с расстановкой на ребрах порядковых номеров потомков заданного родителя. Для этого выполняются следующие действия:

119

1. исследуется корневая вершина терма ;2. рассматривается самый левый аргумент вершины , который еще

ни разу не рассматривался ;

3. помечается ребро функцией разметок ребер , при условии что , где – множество меток.

Пример 1. На рисунке 1 терм представлен размеченным

ациклическим орграфом составного объекта S.

Рис. 1. Представление терма в виде размеченного ациклического орграфа составного объекта S

Таким образом, вершины орграфа хранят вспомогательную информацию: о функциональных символах, о позициях подтермов, о номере аргумента и помеченных ребрах, при прямом обходе. Причем, все висячие вершины, описывающие переменные или константные символы, располагаются на одном уровне. Они имеют путь на орграфе, который состоит из вершин орграфа вместе с пометками ребер, которые расположены вдоль этого пути. При этом любой путь рассматривается с корневой вершины , которая помечена символом самого терма. Благодаря такому отождествлению, данное представление терма можно задать в виде массива вершин с дополнительной информацией.

Рассмотрим терм, имеющий вид: **,...,*,..., 21 nffft ,

где if есть функциональный символ, а в качестве любой переменной или константы терма берется символ *. Тогда символ * имеет путь на орграфе, который можно сформулировать в виде строки:

kk nfnf ...11 ,

1 23 5

4 6

1 1 2 12 3

khg

f

x2x1 x3

120

где in есть пометка на ребре исходящая из заданного if функционального символа. Этот путь имеет обозначение ПУТЬi(*), где i есть порядковый номер пути.

Пример 2. На рисунке 1 к переменной x1 имеется несколько путей: ПУТЬ1(x1) := f1; ПУТЬ2(x1) := f2g1; ПУТЬ3(x1) := f4h1;ПУТЬ4(x1) := f6k1.Для расширенного представления термов также используются две

дополнительные операции: ТИП(*) – тип висячей вершины орграфа (переменная, обозначаемая символом v и константа, обозначаемая символом c), КВАНТОР(*) – в области действия какого квантора находится переменная.

Задавая пути, при прямом порядке обхода вершин орграфа, к символам переменных или констант в строковом виде, и обходя вершины слева направо и сверху вниз, можно получить некоторую последовательность, которая обязательно будет начинаться с корневой вершины. Такое множество строк удобнее всего записывать в виде некоторого массива.

Пример 3. На рисунке 2 приведено расширенное задание терма в виде массива, взятого из примера 1.

Рис. 2. Представление терма в виде массива

Для создания эффективных процедур дедуктивного вывода, решающих задачи практической степени сложности, необходимо решение задачи построения эффективного алгоритма унификации. При построении алгоритма унификации возникают такие проблемы, как проблема вычисления унификатора и предварительная проверка, являются ли термы унифицированными. Предложенная структура представления термов позволяет отойти от алгоритма унификации, предложенного Дж. Робинсоном [Вагин и др., 2004], и разбить этот алгоритм на две основные части. В первой части алгоритма, именуемой ТЕСТ (u, v: терм), проводится предварительная проверка, являются ли термы унифицированными, и, в

К

Т

v

v

v

f

x1

x2

x3

1

*

2

g1

3

*

4

h1

h2

5

*

6

k1

k2

k3

121

случае положительного ответа на проверку унифицируемости конкретной позиции, создаются связи множества рассогласований подтермов.

Пример 4. На рисунке 3 представлен результат работы процедуры ТЕСТ (P(y, g(z), f(x)), P(a, x, f(g(y)))):

1) тип связи множества рассогласований {переменная/константа};

2) тип связи – {переменная/функциональный символ}; 3) тип связи – {переменная/функциональный символ}.

Рис. 3. Представление задачи унификации пары термов с использованием предложенного способа представления термов

Во второй части алгоритма, именуемой УНИФИКАЦИЯ (u, v: терм), строится наиболее общий унификатор пары термов , которые успешно прошли предварительную проверку унифицируемости подтермов, используя информацию о множестве рассогласований, записанной в виде связей.

Пример 5. На рисунке 4 приведен результат работы алгоритма унификации, запрограммированного на Delphi в системе Borland Developer Studio 2006. Данный результат получен при запуске процедуры УНИФИКАЦИЯ (u, v: терм) на множестве пар термов

мощностью равной 20.

T P 1 2

v y *

v z g1

v x

3

f1

T P 1 2

c a *

v x *

v y

3

f1g1

122

Рис. 4. Результат работы последовательного алгоритма унификации

На оси абсцисс графика изображено общее количество операторов алгоритма унификации. При этом процедура ТЕСТ (u, v: терм) описывается 45 операторами. На оси ординат графика изображено среднее время, в миллисекундах, потраченное компьютером на обсчет одной пары термов.

Заключение

Рассматривается новый способ представления термов в логике предикатов первого порядка, включающий в себя основные достоинства ациклических орграфов и плоских термов. Данное представление явилось основой для создания удобного и высокоэффективного алгоритма унификации, что подтверждается приведенным графиком, показывающим результат работы алгоритма унификации.

Список литературы

[Андерсон, 2003] Андерсон Д.А. Дискретная математика и комбинаторика. – М.: Вильямс, 2003.

[Вагин и др., 2004] Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В Достоверный и правдоподобный вывод в интеллектуальных системах – М.: ФИЗМАТЛИТ, 2004.

[Дистель, 2002] Дистель Р. Теория графов. – Новосибирск, Изд-во Ин-та математики, 2002.

123

[Капитонова и др., 2004] Капитонова Ю.В., Кривой С.Л., Летичевский А.А., Луцкий Г.М. Лекции по дискретной математике – СПб.: БХВ-Петербург, 2004.

[Касьянов и др., 2003] Касьянов В.Н., Евстигнеев В.А. Графы в программировании: обработка, визуализация и применение. – СПб.: БХВ-Петербург, 2003.

[Christian, 1993] Christian J. Flatterms, discrimination nets and fast term rewriting // Journal of Automated Reasoning. 1993. № 10 (1).

124

СЕКЦИЯ 2

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ

УДК 004.891.3

ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА ТИПА ДСМ ДЛЯ АНАЛИЗА КЛИНИЧЕСКИХ ДАННЫХ В ОНКОЛОГИИ

Д.А. Добрынин (dobr@ viniti.ru) Всероссийский Институт Научной и Технической

Информации РАН, Москва

И.Н. Михайлова ([email protected]) Всероссийский Онкологический Центр им. Н.Н. Блохина

РАМН, Москва

Е.С. Панкратова (pankr@ viniti.ru)

В.К. Финн (finn@ viniti.ru)Всероссийский Институт Научной и Технической

Информации РАН, Москва

В работе описываются применение ДСМ-системы для новой задачи – прогнозирования продолжительности жизни и оценки маркера S-100 для больных меланомой.

ВведениеВ секторе интеллектуальных систем ВИНИТИ создана

интеллектуальная система типа ДСМ1 (ИнтС ДСМ) [Арский, 2008], основанная на ДСМ-методе автоматического порождения гипотез.

Существующая Инт ДСМ включает в себя:Инт ДСМ = Решатель задач + Информационная среда (база данных и

база знаний) + Интеллектуальный интерфейс (диалог + представление результатов + обучение работе с системой).

Решатель ИнтДСМ основан на ДСМ-методе автоматического порождения гипотез ([Арский, 2008], [Финн, 2004]), реализующий 1 Название в честь английского мыслителя Джона Стюарта Милля.

125

автоматизированные правдоподобные рассуждения. Разрабатываемые правдоподобные рассуждения образуют формализованную эвристику извлечения зависимостей причинно-следственного типа из баз структурированных фактов. Извлечение знаний типа «причина-следствие» основано на принципе: «сходство фактов порождает сходство эффектов и их повторяемость» (этот принцип отличен от вероятностного подхода к анализу данных: «повторяемость эффектов определяет сходство фактов»). Гипотезы о (±)-причинах, извлекаемых из БФ, порождаются посредством специально созданной процедуры индукции, порождающей сходство объектов – источник или причину наличия (отсутствия) изучаемого эффекта. Предсказание этого эффекта осуществляется посредством аналогии, использующей гипотезы о (±)-причинах, содержащихся в базе знаний и порожденных индукцией. И, наконец, ДСМ-рассуждение завершается абдуктивной процедурой – объяснением начального состояния БФ, которое или является достаточным основанием для принятия гипотез, или является средством расширения БФ для итерации ДСМ-рассуждения, если существуют необъясненные факты из БФ.

Условия применимостиПеречислим условия применимости ДСМ-метода:1. возможность структурирования данных и формального

определения сходства фактов (из базы фактов (БФ));2. наличие положительных и отрицательных примеров (±)-примеров

в БФ;3. наличие в БФ неявно заданных зависимостей причинно-

следственного типа ((±)-причины изучаемых эффектов).

Особенности ДСМ-методаГлавной особенностью метода является то, что ДСМ-метод, будучи

нестатистическим методом анализа данных, в состоянии учитывать индивидуальные особенности изучаемых объектов исследования, если их структура представлена информативно так, что используемые параметры достаточны для выявления сходства – генератора эффекта (то есть причины изучаемого явления).

Второй важной особенностью ДСМ-метода является его способность порождать полезные гипотезы на малых массивах данных благодаря выявленному сходству объектов, характеризуемых существенными параметрами.

Третья особенность ДСМ-метода анализа данных состоит в том, что он работает с открытыми массивами данных (а не с замкнутыми таблицами!), указывая на необходимость расширения базы фактов, если таковая

126

возникает (это осуществляется посредством абдуктивного объяснения базы фактов).

Области применения ИнтС ДСМИнтС ДСМ применяется для прогнозирования свойств

структурированных объектов в БФ с неполной информацией для задач фармакологии, социологии, прогнозирования химической канцерогенности, токсичности, прогнозирования путей метаболизма ([Финн и др., 2006a], [Финн и др., 2006b]). ДСМ-метод может быть распространен и на другие задачи, которые удовлетворяют условиям его применимости.

Применение в медицинеПредлагаемая интеллектуальная система типа ДСМ является

инструментом поддержки медицинских исследований со сложно структурированными данными и множеством фактов, необозримых без использования компьютерных технологий. Следует отметить, что анализ данных средствами ДСМ – рассуждений является новым средством формализованного качественного анализа данных в интеллектуальных системах.

Ранее ИнтС ДСМ применялись для решения следующих задач [Финн и др., 2006c]:

1) прогнозирования высокопатогенных типов вируса папилломы человека (ВПЧ) по цитологическим результатам исследования мазков (Кафедра клинической и лабораторной диагностики Российской Медицинской Академии последипломного образования). Защищена кандидатская диссертация Цидаевой И.Г.

2) диагностики двух заболеваний глаз: дегенеративного ретиношизиса и наследственных витреоретинальных дистрофий (Лаборатория клинической физиологии зрения МНИИ глазных болезней им. Гельмгольца).

3) диагностики системной красной волчанки (Отделение нефрологии Городской клинической больницы им. Боткина). Защищена кандидатская диссертация Захаровой Е.В.

Новая область примененияСотрудниками Российского Онкологического Центра им. Н.Н. Блохина

РАМН была поставлена следующая задача: для больных с диагнозом «меланома» прогнозировать общую продолжительность жизни на основании анализа клинических и лабораторных данных.

В настоящее время разработана архитектура и создан прототип ИнтС типа ДСМ для решения новой задачи в области медицины, а также

127

экспериментальная версия интеллектуальной ДСМ системы (ИнтС ДСМ) для анализа клинических данных больных меланомой.

Постановка задачи Задачей системы является прогнозирование продолжительности жизни

больных меланомой в зависимости от экспрессии протеина S100 (широко изучаемого биохимического маркера прогрессирования меланомы кожи).

Прогноз у больных локализованными формами меланомы кожи сильно зависит от исходной стадии заболевания (TNM) и многих других факторов, значение которых остается малоизученным. Задачей системы является необходимость оценить прогностическое значение уровня S100.

Нам был поставлен вопрос: «Существует ли зависимость между продолжительностью жизни и значением S100?» Возможно переформулировать этот вопрос: «Существуют ли причины прогнозирования продолжительности жизни, отличные от причин прогнозирования значения S100?»

Создание БДПервым этапом совместной работы была разработка подсистемы

представления знаний и создание БД – одной из составных частей ИнтДСМ для больных с диагнозом «меланома». В настоящее время создана оболочка БД. Атрибутами этой БД являются сведения о больных, представленные в медицинских картах. Эти атрибуты объединены в следующие группы: антропометрические и расчетные показатели; предрасполагающие факторы среды обитания; наследственные, врожденные и приобретенные предрасполагающие факторы; история настоящего заболевания; описание настоящего состояния и текущих проявлений заболевания; лабораторные и гистологические показатели на момент осмотра; проведенное лечение; сопутствующие заболевания; клинический диагноз; проведенное ранее лечение (химиотерапия иммунотерапия, химиоиммунотерапия, лучевая терапия на область опухоли; общее количество циклов химиотерапии, которое проведено на настоящий момент, наибольшая длительность положительного объективного ответа (стабилизации, частичного или полного ответа на фоне лечения или без него (всего 80 атрибутов).

В настоящее время в БД занесены данные о 38 больных2. Для каждого больного определено значение протеина S100 и общая продолжительность жизни.

Настройка на предметную область

2 БД заполнена сотрудником РОНЦ Самойленко И.

128

Для возможности применения ИНТ ДСМ к новой задаче необходима настройка [Финн и др. 2006c], включающая в себя следующее:

1. разработку языка представления данных;2. определение понятия «объект» и «свойство» в терминологии ДСМ-

метода;3. определение аксиом предметной области;4. задание операции сходства;5. задание отношения вложения.

(1) Разработка языка представления данных Для описания результатов обследований больного был разработан язык

представления имеющихся медицинских данных. Были составлены признаки описания больного, по которым необходимо составить прогноз заболевания.

Анализируя эти многочисленные медицинские факты, можно выделить несколько различных типов данных.

1) В кортеже длины «n» (где n – количество элементов списка признаков) указываются присутствующие качественные признаки, вместо отсутствующих признаков ставится L (пустой элемент):

El(1) =<At1,…,Ati,…Atn>

2)Указывается один из возможных качественных признаков3)Указывается норма признака или интервал отклонения признака от

нормы с указанием направления отклонения

El(4) = <At,dir,k>,

где dir{¯,N,} , N – норма признака, ¯ – отклонение от нормы в сторону уменьшения, – отклонение от нормы в сторону уменьшения, а k{1,2,3,4,5}

4)Указываются конкретные признаки иерархической структуры Таким образом, был создан язык представления онкологических

данных, разработаны программы ввода медицинской информации. Полученная система является автоматизированной историей болезни пациентов онкологического профиля. Форма ввода медицинских данных очень удобна для врача. Можно просматривать БЗ, добавлять информацию о заболевании «меланома» по мере ее получения, включать результаты различных клинических, электроретинографических и психофизических исследований. При необходимости возможно наполнение БД новыми терминами и понятиями.

(2) Определение понятия «объект» и «свойство» в терминологии ДСМ-метода

129

Объект, соответствующий истории болезни конкретного больного, представляет собой кортеж из 80 элемента:

Оi = <El1,…., El80>Каждый элемент этого кортежа соответствует конкретному признаку. В

соответствие с языком представления данных каждый элемент объекта принадлежит одному из 4-х типов или же является комбинацией каких-либо типов.

Так как задачей системы в данной работе является прогнозирование исходов заболевания «меланома», то в терминологии ДСМ-метода эти исходы являются свойствами.

(3) Аксиомы предметной областиВ данной задаче, т.к. изучается влияние S100, то этот признак

помещается в группу необходимых признаков.

(4,5) Операция сходства и отношение вложения определяются поэлементно и зависят от типа данных.

Настройка на экспериментНастройка системы на эксперимент включает в себя следующее.1. Выбор стратегии: простой метод сходства, метод сходства с запретом

на контрпримеры (невложение полученных методом сходства гипотез в исходные примеры противоположного знака) отдельно для (+) и (-) примеров.

2. Подбор нужного количества родителей (наименьшее количество примеров, образующих гипотезу).

3. Настройка фильтра конъюнктивных признаков33. В данной задаче это присутствие S100.

4. Настройка фильтра дизъюнктивных признаков44.Возможный критерий оценки подбора параметров и стратегии

эксперимента – применение процедуры «доопределение по одному»: последовательно каждому объекту выборки присваивается значение «», производится доопределение этого объекта средствами ДСМ-системы с выбранными параметрами и сравнивается доопределенное значение с существующим. Подсчитывается общее количество правильных и неправильных доопределений.

Выбираются параметры пп.1-4, при которых при применении процедуры «доопределение по одному» будет наилучший результат, то есть

3 Список атрибутов, которые должны присутствовать в порожденной гипотезе. Гипотезы, где нет всех атрибутов из списка, отбрасываются.4 Список атрибутов, из которого хотя бы один должен присутствовать в порожденной гипотезе. Гипотезы, где нет ни одного атрибута из списка, отбрасываются.

130

наибольшее количество правильных доопределений и наименьшее количество неправильных.

Эти параметры логично использовать для доопределений вновь занесенных в базу фактов пациентов, у которых необходимо поставить диагноз.

РезультатыС использованием системы было проведено несколько компьютерных

экспериментов. Опишем один из них. «Объектом» в терминологии ДСМ-метода является описание больного, занесенное в БД. В данном конкретном эксперименте «свойством» является продолжительность жизни больного: больше пяти лет (положительный пример в терминологии ДСМ-метода) и меньше пяти лет (отрицательный пример). Имеем 12 положительных примеров и 26 отрицательных. Для проверки работы системы применялась стратегия «доопределение по-одному»: последовательно каждый пример из БД считался неизвестным и доопределялся средствами ДСМ-системы. Результат работы системы: общее количество правильных доопределений – 21, и неправильных – 2 доопределения.

В результате проведенных экспериментов были получены результаты для прогностической оценки значения уровня S100. Выявлено следующее: все порожденные положительные гипотезы-причины (продолжительность жизни больше 5 лет), помимо прочих атрибутов, включают значение S100 меньше 0,120 нг/мл (лабораторная норма РОНЦ им. Н.Н.Блохина), а все отрицательные (продолжительность жизни меньше 5 лет) – значение S100 больше 0,120 нг/мл. [Михайлова и др., 2010].

Для решения вопроса «Существуют ли причины прогнозирования продолжительности жизни, отличные от причин прогнозирования значения S100?» была создана процедура, реализующая усеченный метод остатков Д.С.Милля.

1.Проведен компьютерный эксперимент по прогнозированию продолжительности жизни более 5 лет (свойство в терминологии ДСМ-метода) с конъюнктивным фильтром S100 менее 0,12нг/мл. Порождено некоторое множество A гипотез-причин продолжительности жизни более 5лет, причем каждая гипотеза содержала значение S100.

2.Проведен компьютерный эксперимент по прогнозированию продолжительности жизни более 5 лет. Конъюнктивный фильтр не включался. Порождено некоторое множество гипотез причин B продолжительности жизни более 5лет.

3.Проведен компьютерный эксперимент, где свойством в терминологии ДСМ-метода является значение S100 менее 0,120 нг/мл. Порождено некоторое множество гипотез-причин C значения S100 менее 0,120нг/мл.

131

4.Из множества A вычиталось множество B (то есть из каждой гипотезы множества A вычитались последовательно гипотезы множества B).Таким образом, было получено множество B’)5. Эксперимент показал, что B B’ = L, что подтверждает существование некоторой зависимости между S100 и продолжительностью жизни.

ИС ДСМ относятся к evidence based medicineПредлагаемая интеллектуальная система является инструментом

поддержки медицинских исследований со сложно структурированными данными и множеством фактов, необозримых без использования компьютерных технологий. Результаты применения ДСМ-метода, как средства анализа онкологических данных, демонстрируют полезность этого метода, являющегося новым инструментом доказательной медицины.

Распространенный сейчас термин evidence based medicine, к сожалению, переведен как «доказательная медицина», а не как «медицина, основанная на очевидных фактах». Методы, относящиеся к evidence based medicine, основаны на установленных фактах и используют эти факты как аргументы при принятии решений в медицине, в частности, для диагностики.

Но смысл этого термина состоит в том, что решения, принимаемые врачами, должны быть аргументированными (но не доказанными – ведь авторы говорят о вероятных прогнозах, то есть о гипотезах!), что означает, что принимаемые решения используют аргументы, извлеченные из клинических данных.

В самом деле, ()-гипотезы о причинах эффектов, обнаруженные в базе фактов посредством выявления сходства, являются аргументами или контраргументами в пользу порождаемой интеллектуальной системой гипотезы о наличии или отсутствии изучаемого эффекта.

Сказанное является аргументом в пользу утверждения о том, что ДСМ-метод является полезным аппаратом доказательной медицины [Финн и др., 2006b].

Таким образом, подтверждается возможность использования ДСМ-метода автоматического порождения гипотез в области медицинской диагностики, где недостаток формальных знаний может быть “скомпенсирован” богатым фактическим материалом. В некоторых областях медицины, находящихся на стадии феноменологического описания и накопления данных, развитые логико-математические методы восстанавливают причинно-следственные зависимости, служат для пополнения знаний на основе имеющихся фактических данных и являются

5 Программа вычитания гипотез была создана студенткой 5-го курса отделения интеллектуальных систем Анной Волковой.

132

средством поддержки интеллектуальных возможностей экспертов-медиков.

Благодарности. Работа выполнена при поддержке программы фундаментальных исследований Президиума РАН «Математическое моделирование и интеллектуальные системы» на 2010 год.

Список литературы[Арский, 2008] Арский Ю.М., Финн В.К. Принципы конструирования

интеллектуальных систем. // Информационные технологии и вычислительные системы. 2008. №4.

[Михайлова и др., 2010] Михайлова И.Н., Панкратова Е.С., Добрынин Д.А., Самойленко И.В., Решетникова В.В., Шелепова В.М., Демидов Л.В., Барышников А.Ю., Финн В.К. О применении интеллектуальной компьютерной системы для анализа клинических данных больных меланомой. // Российский Биотерапевтический Журнал. 2010. №2.

[Финн, 2004] Финн В.К. Об интеллектуальном анализе данных // Новости искусственного интеллекта. 2004. №3.

[Финн и др., 2006a] Финн В.К., Блинова, В.Г, Панкратова Е.С., Фабрикантова Е.Ф. Интеллектуальные системы для анализа медицинских данных. Часть 1. // Врач и информационные технологии. 2006. №5.

[Финн и др., 2006b] Финн В.К., Блинова В.Г., Панкратова Е.С., Фабрикантова Е.Ф. Интеллектуальные системы для анализа медицинских данных. Часть 2. //Врач и информационные технологии. 2006. №6.

[Финн и др., 2006c] Финн В.К., Блинова В.Г., Панкратова Е.С., Фабрикантова Е.Ф. Интеллектуальные системы для анализа медицинских данных. Часть 3. //Врач и информационные технологии. 2007. №1.

УДК 519.17:004.9

ГРАФ-МОДЕЛИ ДЛЯ АНАЛИЗА СХОДСТВА СТРУКТУР СИСТЕМ НА ОСНОВЕ ОБОБЩЕННОГО

ПОДСТРУКТУРНОГО ПОДХОДА

В.А. Кохов ([email protected]) Государственный Университет-Высшая школа экономики,

Москва

133

В.В. Кохов ([email protected]) Московский Энергетический Институт (ТУ), Москва

Предложены граф-модели структур систем, позволяющие определять сходство систем с учётом расположения фрагментов. Рассмотрена система стратификации граф-моделей, которая позволяет формировать и исследовать широкий спектр новых отношений структурного сходства систем. Эти модели позволили обобщить подструктурный подход к анализу сходства орграфов и выделить новые характеристики структурного сходства систем.

ВведениеПонятие «структурное сходство» систем является ключевым в

интеллектуальном анализе данных, реализации правдоподобных рассуждений, обработке высказываний на естественных языках и других областях искусственного интеллекта. Сходство является ключевой операцией при поисках в базах структурных данных (семантический web-поиск электронных документов в Интернете) и знаний, представленных семантическими сетями. Это определяет актуальность и значимость разработки моделей, методов и программных средств для определения сходства структурированных нечисловых объектов (графов, орграфов, мультиграфов, семантических сетей и пр.) [Финн, 1991; Кузнецов, 1996].

Ниже предлагается новый подход, использующий граф-модели (трансграфы), которые позволяют: (1) создать обобщенный подструктурный подход (ОПП) к анализу сходства орграфов, использующий точное расположение цепных фрагментов; (2) отобразить (визуализировать) каждый цепной фрагмент орграфа вершиной трансграфа; (3) определить новые характеристики сходства орграфов и исследовать тенденции изменения сходства при все более и более точной их характеризации через трансграфы; (4) выделить новые виды отношений структурного сходства орграфов; (5) исследовать группу автоморфного расположения цепных фрагментов орграфа как группу автоморфизмов вершин трансграфа; (6) внедрить новые информационные технологии обучения студентов университетов при изучении орграфов и их групп.

Новый подход, названный обобщенным ПП, позволяет получать на начальном этапе результаты ПП, приводит к иерархической системе уточнения результатов ПП и расширяет диапазон входного численного пространства для решения задач кластеризации анализируемых орграфов, выраженный в большем разнообразии весов ребер в графе расстояний (сходства) всех пар анализируемых орграфов.

134

1. Подструктурный подход к анализу сходства орграфов и его недостатки

Пусть задан орграф G=(V,E) с числом вершин p=V и дуг q=E. Порожденный подграф орграфа получается при удалении вершин и инцидентных к ним дуг. Если из орграфа удалять дуги, то в результате получаем фрагмент орграфа. Два орграфа G1=(V1,E1) и G2=(V2,E2) изоморфны (G1»G2), если

:(V1V2)(vi,vjV1 [(vi,vj)E1 ((vi),(vj))E2]),где (vi),(vj)V2.

Множество всех изоморфизмов орграфа на себя образует группу Aut(G). Орграф G1=(V1,E1) изоморфно вкладывается в орграф G2=(V2,E2) как порожденный подграф G1SG2 (фрагмент, G1G2), если в орграфе G2 есть порожденный подграф (фрагмент) G*=(V*,E*), для которого справедливо отношение G*»G1. Под максимальным общим фрагментом (MCF) (порожденным подграфом, MCS) орграфов G1,G2 понимаем орграф G*, для которого справедливы условия: (1) G*G1 и G*G2 (G*SG1 и G*SG2); (2) не существует большего G* по числу дуг (вершин) фрагмента (подграфа) в орграфе G1, для которого выполняется условие (1).

В орграфе следует различать три вида порожденных подграфов: слабо связный; односторонне связный; сильно связный. Ниже будем рассматривать в качестве порожденных подграфов (фрагментов) орграфов слабо связные порожденные подграфы. Все не определенные ниже понятия можно найти в книге [Нечепуренко, 1990].

В основе ПП лежит использование максимального общего фрагмента (MCF) двух орграфов [Bunke et al., 1998]. Величина сходства зависит от размера (числа вершин и/или дуг) MCF относительно размеров сравниваемых орграфов. Обычно меры расстояния (D) и коэффициенты сходства (MSI) между орграфами G1 и G2, используемые в качестве результатов, вычисляются по формулам [Bunke et al., 1998]:

D(G1,G2)=F(G1) + F(G2) 2 (MCF(G1,G2));MSI(G1,G2)=F(MCF(G1,G2)2/(F(G1)F(G2)),

где F характеризует размер орграфа. Две основные постановки задачи следуют из использования

порождённого подграфа (MCS и D1, MCI1) или фрагмента (MCF и D2, MSI2) орграфа. В первом случае F(G) = p(G) (число вершин), во втором – F(G) = p(G)+q(G). Под результатом решения задачи определения попарного различения (сходства) набора их K орграфов будем понимать полный граф с K вершинами, каждое ребро которого {vi,vj} взвешено значением расстояния D(Gi,Gj ) (индекса сходства MSI (Gi,Gj)). Чем шире разнообразие значений расстояний D(Gi,Gj ) (MSI(Gi,Gj)), тем больше возможностей для решения задачи кластеризации анализируемых орграфов. Ниже в качестве

135

одного из главных критериев развития ПП выберем возможность расширения границ кластеризации (сходства).

Определение 1. Чувствительностью решения задачи различения пар орграфов в множестве из N орграфов по инварианту IN относительно MCF при построении графа попарного различения орграфов называется отношение вида (IN(D), MCF)=KL(IN(D))/(N(N1)/2), где KL(IN(D)) обозначает число классов IN-эквивалентности пар орграфов по значениям расстояния D.

Определение 2. Чувствительностью решения задачи определения сходства пар орграфов в множестве из N орграфов по инварианту IN относительно MCF при построении графа попарного сходства орграфов называется отношение вида (IN(MSI), MCF)=KL(IN(MSI))/(N(N1)/2), где KL(IN(MSI)) обозначает число классов IN-эквивалентности пар орграфов по значениям индекса сходства MSI.

Аналогично вводятся определения относительно MCS. IN-эквивалентность определяется совпадением значений расстояний (индексов сходства), полученных при исследовании орграфов. Характеристики чувствительности позволяют проводить исследование роли новых моделей (трансграфов) орграфа и оценивать широту разнообразия получаемого пространства для дальнейшей кластеризации анализируемых на сходство орграфов.

На основе анализа ПП и результатов объемных вычислительных экспериментов (проанализировано сходство более 21 000 000 орграфов) выделим его недостатки: (1) NP-полнота задачи определения MCF (MCS) двух орграфов [Гэри, 1982]; (2) жесткая детерминированность – полученное значение метрики или коэффициента сходства нельзя далее уточнять; (3) малая «чувствительность» (значение (IN(D), MCS)) при определении кластеров орграфов с одинаковым числом вершин; (4) подход не учитывает в явном виде расположение фрагментов в структуре орграфа.

Несмотря на выделенные недостатки, ПП нашел широкое применение в химической и биологической информатике [Raymond, 2002]. Ниже приводится метод построения трансграфа путей для орграфа G (Сgp(G)), позволивший устранить перечисленные выше (2-4) недостатки ПП. Можно устранить и основной недостаток ПП, если при некоторой потере точности результатов, использовать базовые модели для характеризации орграфов и трансграфов [Кохов, 2002]. Трансграфы путей являются наиболее актуальными для исследования сходства орграфами, что обосновано следующими причинами: (1) любые орграфы включают пути; (2) пути отражают как локальные (пути малой длины), так и глобальные (пути большой длины) свойства орграфов; (3) пути наиболее легко конструктивно перечислимые фрагменты в сравнении с другими фрагментами орграфа; (4) пути относятся к классу монотонно

136

наращиваемых по сложности структурных базисов для характеризации орграфов; (5) в базисе путей естественным образом задается строгий порядок по длине пути.

2. Трансграфы путей как модели для визуализации и учета расположения путей в орграфах

Алгоритм построения цветных трансграфов путей (Сgp(G)) для G=(V,E) включает 7 шагов: (1) исходный орграф G является Сgp(G) для путей длины 0; (2) для G cтроим 1-гомеоморфное расширение и получим Сgp(G) для путей длины 1. Новые вершины viVP1 отображают пути длины 1 в G. Ориентация дуг определена в направлении дуги исходного орграфа; (3) каждую пару новых вершин vi,vj соединим дугой (vi,vj), если ГviГvj ; (4) объединение путей, соответствующих новым вершинам, порождает путь на единицу большей длины, чем длины объединяемых путей; (5) строим 1-гомеоморфное расширение новых дуг, порождая новые вершины, как пути длины 2 исходного орграфа G; (6) повторяем выполнение п.3 и п.4 до тех пор, пока порождаются новые дуги, соответствующие путям исходного орграфа G; (7) вершинам построенного орграфа приписываем цвет, номер которого равен длине пути. В результате, построена Сgp-модель первого или второго вида.

Если в Сgp-модели сохранить дуги исходного G=(V,E), то получим Сgp+-модель. Аналогично строятся цветные трансграфы путей-подграфов (Сgps-модели и Сgps+-модели). Если цвета вершин в Сgp(G) (Сgp+(G)) не учитывать, то такой орграф будем называть трансграфом цепей (трансграфом цепей плюс) и обозначать через gp(G) (gp+(G)).

Обозначим через gp+(G/pj) (gp+(G/p0j)) трансграф путей, построенный для всех путей длины j (от 0 до длины j включительно) в орграфе G. На рис. 1 приведены примеры трансграфов путей для G1,G2,G3.

Рис. 1. Примеры трансграфов путей для G1,G2,G3

137

Из анализа алгоритма построения трансграфов путей для орграфов, результатов вычислительных экспериментов и не сложных комбинаторных рассуждений следует справедливость утверждений:

Утверждение 1. Группа автоморфизмов вершин Сgp+(G) для орграфа G изоморфна группе автоморфизмов вершин орграфа G.

Утверждение 2. Группа автоморфизмов вершин gp+(G) для орграфа G изоморфна группе автоморфизмов вершин орграфа G.

Утверждение 3. Группа автоморфизмов вершин цветного трансграфа путей cgp(G) для орграфа G не изоморфна группе автоморфизмов вершин орграфа G.

Утверждение 4. Количество путей N(Tp) в ордереве Tp на p вершинах равно числу вершин трансграфа путей gp+(Tp) и не превышает величины p(p+1)/2.

3. Обобщенный подструктурный подход к анализу сходства орграфов

Использование, расширяемой по длинам путей системы страт gp+(G): <gp(G/p0), gp+(G/p01), gp+(G/p02),…, gp+(G/p0j),…, gp+(G/p0(p-1))>

приводит к новым аспектам исследования сходства по ПП с учетом расположения путей тех длин, которые интересуют исследователя. Так как анализируемые орграфы являются gp+-моделями для цепей длины 0, то ПП является частным случаем обобщенного подструктурного подхода. Использование системы страт gp+(G) при построении gp+-моделей орграфов позволяет уточнять результаты анализа их сходства. На рис. 2 (рис. 3) приведены графики изменения значений расстояний D1 (индексов сходства MSI1) для пар орграфов G1G3 при последовательном построении gp+-моделей для длин путей от 0 до 4.

Таким образом, ОПП впервые позволяет анализировать тенденции изменения значений расстояний (индексов сходства) при наращивании

138

Рис.2. Графики изменения значений расстояний D1

Рис. 3. Графики изменения индексов сходства MSI1

длин путей и выявлять границу по длине пути для установления максимального значения чувствительности (IN(D1)) ((IN(MSI1))).

Использование предложенных трансграфов путей позволяет вводить новые характеристики для исследования сходства орграфов относительно используемых систем страт трансграфов:

где dср среднее значение D, ср индекс среднего значения MSI для пар орграфов.

4. Трансграфы цепей как модели для визуализации и учета расположения цепей в графах и их свойства

Алгоритм построения по графу G=(V,E) его трансграфа цепей (Сgс(G)) включает 7 шагов и аналогичен алгоритму построения трансграфов путей. Отличие заключено в отсутствии учета ориентации, так как вместо дуг анализируются цепи графа G. На рис. 4 приведены три графа, а на рис. 5 их цветные трансграфы цепей Cgc(G/p0-4). На рис. 5 вершины Cgc(G), расположенные на одном и том же уровне, имеют одинаковый цвет.

Рис. 4. Графы G1 , G2 , G3

В табл. 1 приведены результаты определения значений D1 и MSI1 для G1G3 по ПП (значения выше главной диагонали) и по ОПП (значения ниже главной диагонали). Сравнивая эти результаты, видим, что при длине цепей равной 3 имеем Максимальное значение чувствительности различения α(IN(D1), MCS) получено при использовании gc(G/p0-3).

Рис. 5. Цветные трансграфы цепей Cgc(G/p0-4)

139

Табл. 1.D1 G1 G2 G3 MSI1 G1 G2 G3

gp(G1)0 2 4 gp(G1

)1 0.694 0,44

4

gp(G2)8 0 2 gp(G2

)0,65

51 0,69

4

gp(G3)11 7 0 gp(G3

)0,53

60,688 1

Из анализа алгоритма построения трансграфов цепей для графов и не сложных комбинаторных рассуждений вытекает справедливость следующих утверждений.

Утверждение 5. Группа автоморфизмов вершин цветного трансграфа цепей Сgc(G) для графа G изоморфна группе автоморфизмов вершин графа G, то есть Aut(G)»Aut(Сgc+(G)).

Утверждение 6. Группа автоморфизмов вершин трансграфа цепей gc(G) для графа G изоморфна группе автоморфизмов вершин графа G, то есть Aut(G)»Aut(gc+(G)). Единственное исключение составляет граф P3.

Заметим, что деревья представляют наибольший интерес при построении Сgc-моделей, так как число цепей в них растет полиномиально и вычислительная сложность алгоритма построения Сgc-моделей имеет полиномиальный рост от числа вершин.

5. Пример анализа сходства графов по ПП и ОППВ табл. 2 (выше главной диагонали) приведены результаты определения

D1 по ПП и (dср×10) (ниже главной диагонали) по ОПП для всех деревьев на 7 вершинах. При значении чувствительности (IN(D1), MCS) различения значений по D1 для ПП, равной 0,054 (3 класса пар деревьев), мы получили значение 0,545 (30 классов пар деревьев) для ОПП. Заметим, что результаты ПП не позволили провести кластеризацию анализируемых деревьев, ввиду низкой чувствительности по (IN(D1), MCS). На основе ОПП кластеризацию провести удалось.

Табл. 2.G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 G11

G1 0 2 4 6 4 6 4 4 6 6 6G2 96 0 2 4 2 4 4 2 4 4 6G3 160 92 0 2 2 2 4 2 2 2 4G4 208 152 88 0 4 2 4 4 2 4 2G5 132 96 92 152 0 2 2 2 4 4 4G6 180 124 80 88 88 0 2 2 2 2 4G7 176 140 152 148 104 88 0 2 2 2 2

140

G8 156 88 88 140 72 92 92 0 2 2 4G9 216 148 84 76 148 68 88 84 0 2 2G10 212 156 112 136 128 68 64 84 80 0 2G11 248 188 124 104 164 112 116 132 64 60 0На рис. 6 приведены результаты кластеризации анализируемых деревьев

на основе ОПП с использованием графа расстояний, веса ребер которого имели значения dср×10.

Рис. 6. Результаты кластеризации деревьев на основе ОПП

При кластеризации последовательно удалялись ребра, значения веса (расстояния) которых, превышали соответственно следующие границы 96; 84; 80; 72; 64; 60.

Следует выделить, что с целью существенного повышения эффективности применения обобщенного подструктурного подхода к анализу сходства, но с некоторой потерей точности, необходимо заменить экспоненциальный по вычислительной сложности алгоритм определения максимального общего подграфа для cgp-моделей на эффективный (полиномиальный по вычислительной сложности) алгоритм определения максимального изоморфного пересечения b(gs)-моделей [Кохов, 2002].

ЗаключениеПредложенные модели, сохраняющие симметрию расположения путей

анализируемых орграфов, существенно расширили возможности классического подструктурного подхода при анализе сходства орграфов.

141

Они позволили уточнить результаты ПП, исследовать тенденции изменения сходства и ввести новые характеристики при анализе сходства графовых моделей систем.

Обобщенный подструктурный подход к анализу сходства графовых моделей систем программно реализован в АСНИ «GMW» (www.graphmodel.com) и используется в учебном процессе МЭИ (ТУ), ГУ-ВШЭ, научных исследованиях ВИНИТИ и ИВМиМГ СО РАН (г. Новосибирск).

Список литературы[Гэри, 1982] Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые

задачи. М., Мир, 1982.[Кохов, 2002] Кохов В.А. Концептуальные и математические модели сложности

графов. – М: Изд-во МЭИ, 2002.[Кохов, 2008] Кохов В.А. Граф-модели для анализа сходства структур систем на основе их сложности // Труды 11-ой национальная конференция по

искусственному интеллекту с международным участием. КИИ-2008. В 3-х т. Том 3. – М.: Физматлит, 2008.

[Кузнецов и др., 1996] Кузнецов С.О.,Финн В.К. О модели обучения и классификации, основанной на операции сходства. //Обозрение Прикладной и Промышленной Математики 3, №1, 1996.

[Нечепуренко, 1990] Нечепуренко М.И., Попков В.К., Кохов В.А. и др. Алгоритмы и программы решения задач на графах и сетях. – Новосибирск: Наука, 1990.

[Финн, 1991] Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ. // Итоги науки и техники, сер. «Информатика», Т.15. 1991.

[Bunke and oth, 1998] Bunke H. and Shearer K. A graph distance metric based on maximal common subgraph, Pattern Recognition Letters, Vol. 19, №. 3-4, 1998.

[Raymond, 2002] Raymond J. W., Gardiner E. J., Willett P. RASCAL: Calculation of graph similarity using maximum common edge subgraphs. //Computer Journal, vol. 45, №6, 2002.

УДК 004.832.3:001.8

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХВ КОГНИТИВНОЙ СОЦИОЛОГИИ

М.А. Михеенкова ([email protected])

В.К. Финн ([email protected]) Всероссийский институт научной и технической

информации РАН, Москва

142

В работе рассматриваются проблемы формализации познавательного цикла «анализ данных – предсказание – объяснение» для решения задач когнитивной социологии, в частности, получения нового знания на основе анализа эмпирических социологических данных с последующей формулировкой новых проблем. Этой цели служит реализация методов интеллектуального анализа данных в Интеллектуальных системах логическими средствами.

ВведениеВ соответствии с общими представлениями, задачей когнитивной

социологии является изучение социально обусловленных особенностей мышления индивидов и групп, процессов восприятия информации, социальных аспектов принятия решений, исследование мыслительных процессов, которые активизируются при восприятии вопроса и ответе на него в социологических опросах [Zerubavel, 1997; Рогозин, 2002; Садмен и др., 2003]. Более широкое понимание когнитивного подхода – как включения проблем познания, понимания и объяснения в структуру научных методологий – приводит некоторых исследователей к заключению, что любое социологическое исследование с необходимостью учитывает когнитивные факторы и, следовательно, может быть отнесено к когнитивным [Плотинский, 2001]. При таком подходе познавательная деятельность применительно к изучению социальных явлений, и сама по себе представляющая вид когнитивной деятельности, содержит в себе (в явном или неявном виде) анализ «классических» эффектов социальной когнитивности – мотивации поведения, рациональности мнений, формирования понятий и т.п.

1. Формальные средства качественного анализа социологических данных

1.1. Когнитивный подходКонцентрированным отображением когнитивного подхода к

социологическим исследованиям может служить одна из наиболее развитых и авторитетных методологий качественного анализа социологических данных – обоснованная теория (grounded theory) [Страусс и др., 2007]. Соответствующая теория строится на основе эмпирических фактов с использованием индуктивного анализа, причем сбор информации происходит вплоть до насыщения выборки – когда новые индикаторы, категории и т.п. (термины обоснованной теории) перестают формироваться. Такое представление о целях и методах социологического исследования

143

оказывается в корне противоположным распространенной «количественной» методологии, когда анализ данных рассматривается как процесс построения социологической модели с последующей проверкой соответствия этой модели имеющимся данным (см. [Крыштановский, 2006]). Доминирование этой точки зрения в соединении с наличием обширного экспериментального материала привело к повсеместному распространению статистических методов для анализа психосоциальных явлений (названному П. Сорокиным «квантофренией»). Будучи абсолютно оправданным и продуктивным при анализе явлений, поддающихся количественному анализу, такой подход при анализе явлений иного рода превращается в «пустую квантофреническую идею», не обеспечивающую объективной картины мира.

Для преодоления этого, для придания социологическим исследованиям черт подлинной когнитивности необходимы формализованные эвристики, реализующие, как в обоснованной теории, схему познавательной активности «анализ данных – предсказание – объяснение» [Финн, 2009] социолога-практика. Этот процесс предполагает не моделирование (вопреки упомянутому выше подходу), а систематическое извлечение знаний из неупорядоченных и неформализованных эмпирических данных с помощью предлагаемых эвристик.

Осознание потребности в создании формальных средств для анализа качественных (не количественных) данных заставляет социологов обращаться к возможностям методов искусственного интеллекта, присваивая им статус «локомотива когнитивного содружества» [Плотинский, 2001]. Это можно считать призывом к синтезу интеллектуальных возможностей исследователя и искусственного интеллекта.

1.2. Интеллектуальный анализ социологических данныхФормализация познавательной деятельности социолога предполагает

создание аппарата, нацеленного, прежде всего, на решение фундаментальных задач классической социологии. К таким задачам относится изучение действий индивидов в их социальных отношениях, а также выявление субъективных мотивов и рациональности этих действий и порождение каузальных объяснений процесса действия, его направления и последствий. Решение этих задач на основе эмпирического материала есть не что иное, как извлечение интерпретируемых зависимостей между различными факторами, неявно содержащимися в массивах данных. Соответственно, средства интеллектуального анализа данных позволяют осуществить эту деятельность автоматически, используя возможности современных Интеллектуальных систем (ИС).

144

Существенно, что компьютерная система может претендовать на наименование интеллектуальной (и, соответственно, обладающей когнитивными возможностями), если она обладает специальной архитектурой ((База фактов + База знаний) + Решатель + Интерфейс), сопоставимой со структурой (прежде всего, рационального) сознания (система знаний + мышление + субъективный мир личности) [Финн, 2009]. Интеллектуальная система осуществляет конструктивную имитацию (до некоторой степени) познавательных способностей человека: рассуждение, аргументация, рефлексия, обучение, объяснение реализуются в автоматическом режиме, адаптация, коррекция знаний и поведения, уточнение идей до понятий – в интерактивном.

Такая имитация представляет собой последовательное решение ряда непростых задач: создание точного языка с дескриптивной и аргументативной функцией для осуществления первичной структурации данных и знаний, формирования системы отношений на её основе и формализации рассуждений для рассматриваемого социума. Далее следует выбор адекватных средств анализа порожденных отношений – в зависимости от типов изучаемых зависимостей (случайных или детерминистских). Наконец, в результате анализа порождаются новые отношения, возникают новые исследовательские проблемы. Описанный процесс есть не что иное, как реализация схемы эволюционной эпистемологии К.Р. Поппера [Финн, 2009] в когнитивных социологических исследованиях.

Каузальный анализ действий индивидов, выявление детерминаций и мотиваций индивидуального поведения на основе анализа эмпирических данных опирается на представление о причинной обусловленности как предрасположенности (в смысле К.Р. Поппера) к совершению поведенческих актов (действий, установок, мнений), которая реализуется при отсутствии противодействующих влияний (как внутренних – личностных, так и внешних – контекстных или ситуационных). Источником детерминации при этом являются особенности социальных субъектов (как индивидов, так и социальных общностей), которые отображаются в их структурном описании в виде обозримого множества дифференциальных признаков. Рассмотрим множества «качественных» характеристик, представляющих социальный характер субъекта (SC), индивидуальные черты личности (IP) и нетривиальные биографические данные (BD), отражающие историю становления личности (или, по крайней мере, адаптацию в социальной среде). Пусть (Det1(SC))&(Det2(IP))& (Det3(BD)), Det = Det1Det2Det3, где некоторые из Deti (i = 1, 2, 3). Детерминанта Det представляет собой сходство индивидов и определяет поведение B субъекта С: из DetС следует, что С совершает B (в

145

соответствии с фундаментальным принципом «сходство фактов влечет наличие (отсутствие) изучаемых эффектов и их повторяемость»).

Предложенный способ структурирования знаний о субъекте оставляет широкие возможности для включения характеристик, отображающих эпистемологический тип (mindscape type) личности (иначе – когнитивный стиль) [Плотинский, 2001], что особенно важно при анализе собственно когнитивного поведения, в том числе – при анализе мнений. Это учет индивидуального стиля понимания, восприятия, концептуализации, гибкости, креативности, принятия или непринятия социальных конвенций и т.п. Если мнение субъекта подкреплено явно выраженной аргументацией, это открывает дополнительные когнитивные возможности для исследователя, о чем мы будем говорить ниже.

1.3. Формализованные эвристики для открытых и замкнутых областей

Имитация познавательной активности «анализ данных – предсказание – объяснение» может быть представлена формализациями эвристической схемы «сходство – аналогия – абдукция». Для анализа эмпирических социологических данных эта эвристика может конкретизироваться схемами «индукция – аналогия – абдукция» или «алгебра логики – аналогия – абдукция». Первая, представленная ДСМ-методом автоматического порождения гипотез [Финн, 2010], реализует синтез познавательных процедур – эмпирической индукции, структурной аналогии и конструктивной абдукции. Вторая представляет реализацию логико-алгебраического анализа сходства поведения субъекта и его характеристик (восходящую к качественному сравнительному анализу – Qualitative Comparative Analysis [Ragin, 2000], QCA) с последующим применением модификаций структурной аналогии и конструктивной абдукции. Заметим, что подход QCA, использующий средства булевой алгебры (а в дальнейшем – и средства нечетких логик) для анализа причин социальных явлений – в сравнительной политологии, исторической социологии, социология образования, социальной психологии, – обладает существенно меньшими когнитивными возможностями по сравнению с ДСМ-методом. Объясняется это особенностями формального аппарата, позволяющими исследовать лишь явления закрытого мира (с фиксированными знаниями), тогда как ДСМ-метод предназначен для формализации рассуждений о фактах открытого мира. Это различие может рассматриваться как демаркационный критерий для отделения когнитивного инструмента от процедуры обработки данных [Михеенкова, 2010].

ДСМ-метод автоматического порождения гипотез состоит из формального языка, обладающего дескриптивной и аргументативной функциями; правдоподобных ДСМ-рассуждений, являющихся синтезом познавательных процедур; квазиаксиоматических теорий (КАТ),

146

систематизирующих открытое множество знаний о предметной области; метатеоретических исследований предметных областей и ДСМ-рассуждений; интеллектуальных систем типа ДСМ (ИС-ДСМ); распознавания корректности ДСМ-рассуждений [Финн, 2010]. Решатель ИС-ДСМ в качестве подсистемы включает Рассуждатель, реализующий эвристики решения задач: эмпирическая индукция (порождение причин эффектов на основе установления сходства фактов), аналогия (перенос гипотез о причинах на случаи с неопределенным исходом), абдукция (объяснительное принятие гипотез). Примечательно, что ДСМ-рассуждение является когнитивным рассуждением, удовлетворяющим довольно сложному комплексу требований [Арский и др., 2008] (что отличает его от упрощенного представления о когнитивном рассуждении как о любом правдоподобном [Anshakov et al., 2010]).

В исходной базе фактов (БФ) ДСМ-системы представлены предикаты X1Y: «субъект Х демонстрирует эффекты поведения Y», где Y – переменная для представления действий, установок и мнений. Предикаты V2W и W 3V означают, что «подмножество характеристик V есть причина эффекта поведения W» и «эффект поведения W есть следствие подмножества характеристик V». ДСМ-рассуждение, формализованное средствами бесконечнозначной логики предикатов, состоит из последовательного и итерируемого применения индуктивных выводов (из предиката X1Y порождаются предикаты V2W или W 3V, т.е. в автоматическом режиме формируются фрагменты базы знаний интеллектуальной системы типа ДСМ) и выводов по аналогии (они используют гипотезы V2W и W 3V о причинах изучаемых эффектов, порожденные индукцией, для расширения и уточнения представленного в начальном состоянии БФ отношения 1*); цикл «индукция – аналогия» повторяется до стабилизации множества гипотез. ДСМ-рассуждение завершается применением абдукции (формализованной посредством критерия достаточного основания принятия гипотез) – процедуры объяснения исходного множества фактов. При необходимости (если порожденных гипотез недостаточно для объяснения) БФ может быть пополнена новыми примерами, и ДСМ-рассуждение выполняется заново.

Таким образом, ДСМ-метод предоставляет исследователю возможности не только выявления каузальных зависимостей, но и предсказания и, что особенно нетривиально, оправдания принятых гипотез, и тем самым может рассматриваться как когнитивный инструмент анализа социологических данных. Дополненный специальной логикой аргументации и специальными многозначными логиками для формализации m-значного опроса [Михеенкова и др., 2008], метод становится также средством анализа, прогнозирования и исследования рациональности мнений.

147

1.4. Задачи анализа социологических данныхПредложенная структурация социологических данных позволяет

рассматривать различные типы задач «субъект эффекты поведения», формализованных посредством исходного предиката X 1 Y. Массив данных содержит утверждения типа “высказывание «объект C обладает множеством свойств A» имеет истинностную оценку , n” (J, n(C 1 A) в ДСМ-языке). Здесь {1, –1, 0, }, 1, –1, 0, – типы истинностных значений «фактическая истина», «фактическая ложь», «фактическое противоречие» и «неопределенность», соответственно, n – номер шага вычислений, выражающий степень правдоподобия истинностного значения (высказывания J, 0(C 1 A) суть факты). J,n = t, если v[] = , n; J,n = f, если v[] , n, v[] есть функция оценки; , n представляет «внутренние» истинностные значения фактов и гипотез, t, f – «внешние» истинностные значения двузначной логики.

Семантика ДСМ-метода для анализа и прогнозирования социального поведения представляется алгеброй субъектов поведения В1 и алгеброй поведенческих актов (поведенческих готовностей) В2 (отметим, что булевская структура данных – лишь одна из возможных), Вi ={ , , , }, i=1, 2, U(1) и U(2) – множества характеристик социальных субъектов и множество эффектов их поведения, соответственно.

1.4.1. Анализ поведения. Пример решения задачи такого рода – изучение поведения рабочих на конфликтных предприятиях (совместно с Институтом социологии РАН) [Климова и др., 2009].

Стратегия анализа имеющихся фактов зависит от представления данных о субъекте и его свойствах. При изучении собственно поведения (или установок субъекта) данные о субъекте, как правило, представлены информативнее, чем данные о его поведении. В этом случае используется прямой ДСМ-метод, устанавливающий причинно-следственную зависимость типа «сходство субъектов поведения влечет сходство действий этих субъектов». В результате порождаются гипотезы вида J, n(C 2 A), n>0, означающие, что “высказывание «подобъект C есть причина множества свойств A» имеет истинностную оценку , n”. Таким образом, предикат V 2 W представляет отношение причинности: «V есть причина W».

Применением ДСМ-метода к результатам опроса профсоюзных активистов на двух различных предприятиях (г. Санкт-Петербург и г. Елец) были порождены социальные и личностные детерминанты солидарного поведения (готовности к участию в забастовке заводских рабочих). Наиболее интересным результатом явилась реализация (в интерактивном режиме) такой способности естественного интеллекта, как рационализация идей [Финн, 2009]: комплексы признаков (детерминанты) были

148

проинтерпретированы исследователями, как характеристические описания поведенческих типов, т.е. были сформированы эмпирические понятия. Это позволяет говорить о нетривиальных когнитивных возможностях предложенного подхода.

1.4.2. Анализ мнений. Выявление детерминаций и анализ рациональности мнений осуществлялись на примере задачи изучения электоральных предпочтений студентов старших курсов РГГУ [Михеенкова и др., 2008].

При решении задачи анализа мнений информативность характеризации мнения превосходит информативность знаний о субъекте, высказывающем мнение. Отсюда возникает потребность в формализации рассуждения, устанавливающего зависимость типа «сходство мнений субъектов есть следствие сходства самих субъектов» – обратного ДСМ-метода. В результате порождаются гипотезы вида J, n(C 3 Q), n>0, означающие, что “высказывание «мнение Q есть следствие характеристик субъекта C» имеет истинностную оценку , n”.

Отдельная задача – структурация мнений и представление их в виде, отвечающем условиям применимости ДСМ-метода. Изначальная ориентация на решение когнитивной задачи анализа рациональных мнений привела к реализации идеи аргументированного принятия темы опроса Т через представление ее в виде множества утверждений Р = {p1, …, pn}, раскрывающих ее содержание. Тогда отношение респондентов к соответствующим утверждениям из Р может быть записано в виде Jpi, т.е. оценка v[pi] = , {1, –1, 0, }. В общем случае формализации m-значного опроса [Михеенкова и др., 2008] респонденту предлагается m вариантов ответа, тогда система социологически интерпретируемых оценок

переменных Vm = {0, ,…, , 1}. Положим j ≖ p1&…& pn,

где i(j) {1, 0, }, i = 1, …, n; j = 1, …, 4n. Будем называть j –

максимальную конъюнкцию атомов pn – мнением индивида, при этом

множество членов этой конъюнкции обозначим [j]={ p1, …, pn}.

Пусть U(2) = {y½(y≖ pi)& (i{1, –1, 0, }), i =1, …, n}. Задача изучения

мнений сводится к изучению высказываний J (Cj1[j]) – «субъект Cj

имеет мнение j» – и порождению детерминант J ([yj] 3 Cj) – «мнение yj есть следствие характеристик субъекта Cj» – для дальнейшего прогнозирования мнений. Здесь Cj, Cj, [j], [yj] – константы, Cj, Cj (U(1) есть множество характеристик субъекта, представляющих, как говорилось выше, социальные, индивидуальные и биографические черты

149

личности) [j], [yj] , = j, m – оценка, полученная применением ДСМ-метода АПГ. Существенным для предлагаемого подхода является анализ стабилизированного множества мнений, когда при расширении числа опрашиваемых новые варианты мнений не появляются (ср. с понятием насыщения в обоснованной теории [Страусс и др., 2007]).

Можно усилить рациональную составляющую мнения, предположив, что не только отношение к теме аргументируемо (выбором утверждений из Р), но и содержание мнения j также опирается на явную аргументацию. Пусть А – множество аргументов (аргументационная база) относительно принятия или непринятия утверждений из Р = {p1, …, pn}. Определим функции g+: Р 2A и g–: Р 2A. Тогда для изучения рациональной детерминации мнения мы можем включить в описание j-го субъекта наряду с дифференциальными признаками Cj также его аргументационную функцию, т.е. рассматривать предикат Cj, g+

j, g–j 1 [j], j = 1, …, l, где l

– число рассматриваемых примеров. Если у каждого респондента своя аргументационная база Аj, она также должна включаться в описание субъекта Cj, Аj, g+

j, g–j. Поведение рационально, если g+

jg–j = , но в

реальности индивидуумы демонстрируют те или иные отклонения от идеального типа поведения. Расширенное описание субъекта поведения позволяет уточнить влияние его когнитивных особенностей и оценить согласованность логических (g+, g–) и психологических (C) аспектов формирования мнения.

Несомненно, анализ рациональности поведения (в том числе, мнений) есть одна из важнейших задач когнитивной социологии. Как уже ясно из сказанного, мы понимаем рациональность как аргументированный выбор (решений, мнений). Описанное представление мнений позволяет предложить численные критерии рациональности: степень непротиворечивости опроса, близость мнений социальной общности к некоторому «идеальному» мнению и степень согласованности мнений социальной общности [Михеенкова и др., 2008]. Первый критерий определяет, какая доля мнений противоречит утверждениям из заданного исследователями множества = {y1, …, ys} формул y1, …, ys m-значной логики Jm, выражающих логические зависимости между элементами Р. Второй – насколько реальные мнения социальной общности отличаются от заданного исследователями же некоторого «идеального» мнения (к примеру, при анализе электоральных предпочтений «идеальным» является мнение, соответствующее программным положениям выбранной партии). Третий характеризует сходство мнений представителей исследуемого социума.

Введение численных критериев рациональности мнений предваряет собственно анализ данных и не зависит от конкретной реализации

150

познавательной схемы, однако ДСМ-метод обладает дополнительными когнитивными возможностями и в этом случае. Напомним, что в результате работы ДСМ-системы по достижении стабилизации множества порождаемых гипотез исходная база фактов БФ (для которой и вычисляются описанные характеристики) расширяется: к ней добавляются гипотезы вида J, n(Cj1[j]) ({1, 0, }, n0), полученные средствами ДСМ-метода, о наличии у заранее не определившихся со своими мнениями респондентов тех или иных вариантов ответов. Соответственно, вычисление описанных критериев для новой БФ позволяет говорить о предсказании рациональности мнений респондентов.

2. Новые технологии опроса. Эффекты когнитивностиПредложенное представление знаний о респонденте и его поведении и

логическое описание мнений, учет аргументации при формировании мнений, стабилизация множества мнений, использование синтеза познавательных процедур для анализа эмпирических социологических данных, принятие гипотез на основании абдуктивного объяснения и, наконец, описание состояния рациональности социальной общности – все это позволяет говорить о создании новой технологии проведения социологического опроса. Особенностью этой технологии является реализация ряда познавательных способностей естественного интеллекта – как в автоматическом, так и в интерактивном режиме. Это и автоматическое порождение аргументации на основе аргументационных функций респондента, и абдуктивное объяснение имеющихся фактов (имитирующее рефлексию и объяснение как ответ на вопрос «Почему?»), и, что особенно важно, реализация познавательного процесса – синтеза познавательных процедур. Этот ряд дополняется собственными когнитивными инструментами ДСМ-метода: структурированное описание субъекта как источник мотивации его поведения (актов, установок, мнений), представление мнения как аргументированного отношения к теме, стабилизация опроса, измерение рациональности на основе качественного анализа социологических данных, анализ противоречивости мнений с учетом объективного (внешнего) знания (предложенных исследователем зависимостей между элементами опроса).

Рассмотренная технология опроса позволяет также зафиксировать явным образом влияние когнитивных эффектов на формирование мнений. Это отображается в некоммутативности различных вариантов проведения опроса. Если сначала проводится опрос по теме Т, а затем – по содержанию темы, т.е. элементам Р, непротиворечивость опроса будет отличаться от непротиворечивости в случае обратного порядка проведения опроса (сначала – Р, потом – Т), что и было отмечено в эксперименте по анализу электорального выбора студентов РГГУ (см. выше). В первом случае

151

реакция на вопросы из Р отображает когнитивный аспект восприятия, во втором – эмоциональный.

Нетривиальным результатом интеллектуального анализа социологических данных средствами ДСМ-метода является типологизация поведения, построенная нашими коллегами из Института социологии РАН (см. выше) на основе порожденных гипотез о причинах. Предложенные метафорические описания различных поведенческих типов представляют собой реализацию редкой возможности эмпирического формирования понятий, что, несомненно, является одной из важнейших задач когнитивной социологии.

ЗаключениеПредлагаемые средства не могут заменить содержательной работы

исследователя-социолога, а представляют собой лишь формализованную оболочку для решения некоторых социологических задач. Стандартные эвристики формирования массива данных предшествуют формализованным эвристикам анализа данных. Разумеется, полезные результаты могут быть получены лишь при условии подготовки данных, соответствующих условиям применимости формальных средств интеллектуального анализа данных (в нашем случае – ДСМ-метода автоматического порождения гипотез и соответствующих интеллектуальных систем). Подобное содружество представляет собой ответ на вызов потребностей формализации качественного анализа социологических данных.

Таким образом, можно говорить о возникающем разделе современной когнитивной социологии, который появляется в результате взаимодействия идей классической социологии и методов интеллектуального анализа данных, использующих средства современной логики и искусственного интеллекта.

Благодарности. Работа выполнена при финансовой поддержке РГНФ (проект № 08-03-00145а).

Список литературы[Арский и др., 2008] Арский Ю.М., Финн В.К. Принципы конструирования

интеллектуальных систем // Информационные технологии и вычислительные системы, № 4, 2008.

[Климова и др., 2009] Климова С.Г. Михеенкова М.А., Панкратов Д.В. ДСМ-метод как метод выявления детерминант социального поведения // В кн.: Автоматическое порождение гипотез в интеллектуальных системах, под ред. проф. В.К. Финна. – М.: Книжный дом «Либроком» (URSS), 2009.

[Крыштановский, 2006] Крыштановский А.О. Анализ социологических данных. – М.: Издательский дом ГУ ВШЭ, 2006.

152

[Михеенкова и др., 2008] Михеенкова М.А, Финн В.К. Интеллектуальный анализ данных для проблем когнитивной социологии // XI Национальная конференция с международным участием “Искусственный интеллект-2008”, Дубна, Сентябрь 29 – Октябрь 2, 2008, Труды конференции в 3 томах, т. 2.

[Михеенкова, 2010] Михеенкова М.А. О логических средствах интеллектуального анализа социологических данных // Искусственный интеллект и принятие решений, № 1, 2010.

[Плотинский, 2001] Плотинский Ю.М. Модели социальных процессов. – М.: Логос, 2001.

[Рогозин, 2002] Рогозин Д.М. Когнитивный анализ опросного инструмента. – М.: Институт Фонда «Общественное мнение», 2002.

[Садмен и др., 2003] Садмен С., Бредберн Н., Шварц Н. Как люди отвечают на вопросы: применение когнитивного анализа в массовых обследованиях. – М.: Институт Фонда «Общественное мнение», 2003.

[Страусс и др., 2007] Страусс А., Корбин Дж. Основы качественного исследования. Обоснованная теория. Процедуры и техники. – М.: КомКнига. – 2007.

[Финн, 2009] Финн В.К. К структурной когнитологии: феноменология сознания с точки зрения искусственного интеллекта // Вопросы философии, № 1, 2009.

[Финн, 2010] Финн В.К. Индуктивные методы миллевского типа в системах искусственного интеллекта // Материалы наст. Конференции.

[Anshakov et al., 2010] Anshakov O.M., Gergely T. Cognitive reasoning. A formal approach. – Springer, 2010.

[Ragin C.C., 2000] Ragin C.C. Fuzzy-Set Social Science. – Chicago: University of Chicago Press, 2000.

[Zerubavel, 1997] Zerubavel E. Social mindscape. An Invitation to cognitive sociology. – L.: Harvard Univ. Press, 1997.

УДК 007.5:510.66:159.955.5

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ МЕДИЦИНСКИХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ПРОЦЕДУРЫ

СЛОВАРНОГО ШКАЛИРОВАНИЯ

А.В.Воинов ([email protected]) Exelixis Inc., Сан-Франциско, США

Н.С. Демикова ([email protected])

Б.А. Кобринский ([email protected])ФГУ «МНИИ педиатрии и детской хирургии

Росмедтехнологий, Москва

153

В работе описывается усовершенствованная процедура словарного шкалирования в применении к массиву описаний клинических признаков наследственных заболеваний соединительной ткани. Представлены результаты, полученные при решении задачи интеллектуального анализа экспериментальных данных.

ВведениеПроблема классификации больных с генетически детерминированными

болезнями остается актуальной до настоящего времени. Во многом это определяется, с одной стороны, гетерогенностью (неоднородностью) этой патологии, с другой стороны, разнообразием (полиморфизмом) клинических проявлений.

С учетом крайней редкости многих наследственных заболеваний и отсутствием для многих из них специфических диагностических критериев, существенным для идентификации таких болезней являются знания и опыт врачей. Но их передача невозможна без объективизации не всегда четких субъективных представлений, характеризующихся индивидуальностью восприятия при одновременном формировании у врача некоего образа болезни.

Исходя из этого, представляют интерес методы интеллектуального анализа данных. Первый опыт применения экспериментальной процедуры словарного шкалирования в интеллектуальном анализе данных о наследственных заболеваниях описан в работе [Воинов и др., 2006]. В настоящей работе применена усовершенствованная процедура словарного шкалирования.

1. Характеристика экспертного описания заболеванийДля формализованного описания исследуемых заболеваний

использовался многоуровневый классификатор MeSH [http://www.nlm.nih.gov/mesh/meshhome.html], с помощью которого вводились клинические признаки, характеризующие заболевание. Исходя из возможностей данного классификатора, мы вынуждены были использовать в описаниях отдельных заболеваний признаки разного уровня.

Отличие от работы, представленной в 2006 году, заключается в исключении из всех описаний данных о специфических генных и биохимических изменениях, поскольку была поставлена задача долабораторной классификации болезней.

Всего описано 41 заболевание, объединение которых определяется нарушениями со стороны соединительной ткани (лизосомные болезни накопления, дизостозы и др.). В данной работе используемый массив данных был подвергнут определенной трансформации. В отношении

154

некоторых наблюдений, «выпадающих» при визуальном анализе кластеров, то есть не соответствующих принятой классификации, была осуществлена частичная переаннотация терминами MeSH, что позволило уточнить описания.

Принципиально важно использование в данной работе, в отличие от предыдущей, шкалы весовых характеристик симптомов в описаниях заболеваний, так как признаки встречаются в различных возрастных группах с изменяющейся частотой ввиду прогрессирования заболевания и, соответственно, изменения клинической картины болезней. Веса были установлены в совместном обсуждении двумя экспертами для каждого из 4-х возрастных периодов: при рождении, на 1-м году жизни ребенка, с 1 года до 3 лет, старше 3 лет. Шкала построена с учетом частоты проявления признаков: 5 – всегда (в 90 – 100%), 4 – часто (в 70 – 80%), 3 – в половине случаев (в 50%), 2 – редко (в 20 – 30%), 1 – очень редко (в 10%), 0 – отсутствие патологического признака.

2. Словарное шкалирование формализованных описаний болезней

Описания наследственных болезней соединительной ткани, представлены в виде таблиц данных, пригодных для обработки в системе Медис, обеспечивающей инструментальную поддержку исследований в области извлечения знаний, психосемантики, построения предметных онтологий [Воинов, 1996].

Необходимо отметить, что аннотированию с помощью классификатора MeSH подвергалось формальное описание болезни, сформированное на основании данных литературы и личного опыта экспертов. Оно включало дефрагментированное представление внешнего вида (образа) больного, сложившегося в виде цельного понятия в сознании специалистов, дополненное признаками, характеризующими поражение костной, нервной систем, зрения, слуха и внутренних органов у детей.

В таблице 1 приведены аннотации трех из анализируемых нами заболеваний, как они сформировались в процессе коррекции к 2010 г.

Табл. 1. Пример аннотацийMPS6 (P104) Acrocephalo-polysyndactyly

type II Carpenter (А1)Acrocephalo-syndactyly type Chotzen (А2)

Craniofacial abnormalities Craniosynostoses CraniosynostosesCorneal Opacity Syndactyly HypertelorismHypertelorism Polydactyly PrognathismHearing Loss Nose Deformities, Acquired StrabismusContracture Hip Joint Syndactyly

155

MPS6 (P104) Acrocephalo-polysyndactyly type II Carpenter (А1)

Acrocephalo-syndactyly type Chotzen (А2)

Short stature Mental RetardationHernia ObesityKyphosis Pulmonary Valve StenosisLimb DeformitiesOtitisRhinitisAortic Valve StenosisHepatomegalySplenomegalyIntervertebral Disk

Для удобства восприятия, в таблице серым фоном выделены те терминальные признаки, которые совпадают при данных заболеваниях. Кроме того, представленные заболевания сближает и наличие признаков, происходящих из единого более высокого узла классификатора MeSH, например, Aortic Valve Stenosis и Pulmonary Valve Stenosis относятся к порокам сердца, а Craniofacial abnormalities, Syndactyly и Polydactyly входят в группу мышечно-скелетных аномалий (выделены жирным курсивом). Пример построения классификатора MeSH можно видеть на нижеприведенном фрагменте (рис.1).

Рис.1. Фрагмент классификатора MeSH

3. Математические методы анализа выборок документов

156

Мера близости между аннотациями в словарном шкалировании, как и в предыдущем исследовании, основана на мере близости между отдельными терминами словаря. В данной работе был реализован тот же подход, описанный в [Resnik, 1999; Воинов и др., 2004; Воинов, 2005]. В нем используется два источника информации: таксономическая близость терминов в словаре MeSH и их информационное содержание, определяемое по частоте вхождения терминов в некоторую «обучающую» выборку данных.

Как выяснилось в процессе интерпретации результатов, полученных в предыдущем исследовании, выбор информационного содержания в качестве основы для меры близости между терминами, ведет к гипертрофированному вкладу в меру близости между документами таких терминов, которые относительно редко встречаются в обучающей выборке. В результате, взаимное расположение документов в пространстве многомерного шкалирования не всегда соответствует «экспертному», т.е. полученному в результате классического субъективного шкалирования.

В настоящем исследовании мера близости между терминами, имеющими как минимум один общий родительский термин в таксономии MeSH, определяется следующим образом:

где ni –число вхождений i-го термина в обучающую выборку, nj - число вхождений j-го термина в обучающую выборку, pij – число вхождений «минимального» родительского термина для i и j в ту же выборку. Под минимальным понимается такой термин, который входит в обучающую выборку наименьшее число раз. Частоты терминов выше некоторого порогового значения отсекаются. Тем самым достигается та же цель, что и в случае метрики, основанной на информационном содержании: исключить влияние терминов, представленных в подавляющем большинстве документов обучающей выборки и, соответственно, неинформативных для задачи исследования. При этом также исключается и чрезмерное влияние редко упоминаемых терминов. В качестве порогового значения рассматривались 50%, 25%, 10%. В настоящей работе приведены результаты, выполненные с первым из них, т.е. 50%.

157

Преимущество новой меры близости между терминами по сравнению со старой проверялось с помощью так называемых «положительных контрольных выборок», на которых эффект количественной обработки должен соответствовать ожидаемому. В нашем случае роль положительного контроля играла заданная априори таксономия наследственных болезней, выбранных для исследования. Этот вопрос рассматривается подробно в следующем разделе.

4. Собственное семантическое пространство описаний группы болезней

Описанная выше выборка из 41 пациента, аннотированная терминами MeSH, была подвергнута анализу методом многомерного шкалирования в пространстве трех измерений. Полученная конфигурация точек была обработана методом кластерного анализа, критерий группировки которого отвечает требованию максимальной сбалансированности кластерного дерева.

Результат анализа (для одного из выделяемых 5 – 6 кластеров) приведен на рис.1, из анализа которого можно сделать вывод, что в один кластер попали близкие по клиническим проявлениям и патогенетическим механизмам заболевания. Таблица 2 показывает попавшие в один кластер объекты при различных весовых категориях. Серым фоном выделены заболевания, попадающие при разных категориях весов в один и тот же первый кластер, т.е. совпадающие по клиническим проявлениям в различные возрастные периоды.

В целом, при рассмотрении рис.2 и табл. 2, можно видеть близость различных заболеваний в семантическом пространстве в первом кластере при различных категориях весов, т.е. при различном возрасте больных.

158

Рис. 2. Визуальное представление первого кластера в псевдотрехмерном пространстве

Табл. 2. Кластер 1Категория

весов 1Категория



весов 4Р105 (ML1) Р105 (ML1)

P118

(MPS3)

P118 (MPS3) P118 (MPS3)

P118 (MPS3)

Cong. lypodystrophy

Cong. lypodystrophy

Cong. lypodystrophy

P101 (MPS1H) P101 (MPS1H) P101 (MPS1H) P101 (MPS1H)

P106 (ML3) P106 (ML3) P106 (ML3) P106 (ML3)

P107 (ML2) P107 (ML2) P107 (ML2) P107 (ML2)

P103 (MPS4) P103 (MPS4) P103 (MPS4) P103 (MPS4)

P101 (MPS1S) P101 MPS1S)

P101 MPS1S)

P101 MPS1S)

P109 (BWS) P109 (BWS) P109 (BWS)

P117 (Pycnodys)

Cutis laxa Cutis laxa

P102 (ML3)

P104 (MPS6)

P111 (Kniest)

Frontometaphys. Dys.

Полученные результаты позволяют сделать следующие основные выводы:

некоторые группировки диагнозов устойчиво воспроизводились для всех возрастных групп;

визуализация показала устойчивость кластеров, обнаруженных при рассмотрении трехмерного пространства;

нетрадиционное, в отдельных случаях, объединение описаний по диагнозам в кластеры объяснялось близостью соответствующих терминов в таксономии;

в содержательном (медицинском) плане практическое значение работы заключается в том, что аналогично тому, как по отдельным признакам врач выдвигает первичную диагностическую гипотезу,

159

интеллектуальная система может включать в кластер описания, обладающие аналогичными признаками.

Полученные результаты указывают на целесообразность в дальнейшем написания программы, которая для нового пациента по аннотации автоматически будет показывать близкие объекты и подсказывать диагноз.

5. Потенциальные возможности применения словарного шкалирования

В предшествующей работе авторы [Воинов и др., 2006] обращали внимание на то, что предлагаемый подход позволяет выявлять предположительно новые нозологические формы или варианты заболеваний в случаях формирования отдельных кластеров или попадания исследуемых объектов не в «свой» кластер. Также предшествующее исследование показало, что интеллектуальный анализ данных, основанный на первично визуальной оценке различных кластеров, позволяет оценить вклад отдельных симптомов в дифференциальную диагностику заболеваний.

Результаты настоящей работы развивают спектр этих возможностей, а для случая «чистого» словарного шкалирования, когда аннотации объектов создаются авторами исследования, приведен практический сценарий поэтапного (с учетом предшествовавших результатов) уточнения экспериментальной методики.

ЗаключениеПроведенный интеллектуальный анализ данных продемонстрировал

эффективность усовершенствованной процедуры словарного шкалирования в применении к массиву описаний клинических проявлений наследственных заболеваний. При этом была показана возможность классификации и идентификации клинически сложных болезней наследственной природы при введении дополнительного условия, заключающегося в использовании весовых категорий, отвечающих нечетким представлениям, и системы повозрастной группировки признаков.

Показано влияние различных признаков на расположение объектов и их близость к образцам, характерным для отдельных заболеваний.

Подтверждено высказанное ранее предположение о чрезвычайной чувствительности метода словарного шкалирования к выбору тезауруса терминов, используемых для аннотации, как по широте охвата, так и по семантическому содержанию конкретных терминов.

Анализ данных без предварительной обучающей выборки (unsupervised learning) оставляет возможность «открытия» новых свойств изучаемых объектов, формирования гипотез о закономерностях их взаимодействия.

160

Список литературы[Воинов, 1996] Воинов А.В. Интеллектуальная система анализа данных МЕДИС //

Пятая национальная конференция с международным участием «Искусственный интеллект-96». Т.3. – Казань, 1996.

[Воинов и др., 2004] Воинов А.В., Кобринский Б.А. Иерархия локально-непротиворечивых полей знаний как модель образного мышления и интуиции эксперта в мягких предметных областях // Девятая национальная конференция по искусственному интеллекту с международным участием: Тр. конф. Т.2. – М.: Физматлит, 2004.

[Воинов, 2005] Воинов А.В. Интеграция онтологий и извлечение холистических знаний // Новости искусственного интеллекта. 2005. № 2.

[Воинов и др., 2006] Воинов А.В., Демикова Н.С., Кобринский Б.А. Словарное шкалирование в медицинской информатике: инженерия знаний и интеллектуальный анализ данных // Десятая национальная конференция по искусственному интеллекту с международным участием: Тр. конф. Т.1. – М.: Физматлит, 2006.

[Resnik, 1999] Resnik P. Semantic similarity in a taxonomy: An information-based measure and its application to problems of ambiguity in natural language // J. of Artif. Intell. Res. 1999. 11 (1).

УДК 519.1: 004.42

ЗАДАЧИ АНАЛИЗА СТРУКТУРНОГО СХОДСТВА СИСТЕМ И МЕТОДЫ ИХ РЕШЕНИЯ

В.А. Кохов ([email protected])

А.А. Незнанов ([email protected])

С.В. Ткаченко ([email protected])Государственный университет – Высшая школа экономики, Москва

161

Ключевые слова и выражения: сходство, задачи анализа сходства, подструктурный подход, методы анализа сходства.

Рассматривается современное состояние дел в области структурного анализа систем. Обсуждаются общие подходы к определению структурного сходства и методы анализа структурного сходства графовых моделей систем. Демонстрируется реализация обсуждаемых методов в различных подсистемах АСНИ «Graph Model Workshop».

ВведениеИсследование структурного сходства непрерывно повышает свою

актуальность, что определяется потребностями структурного анализа систем в различных областях (интеллектуальный анализ данных, химическая структурная информатика, структурная лингвистика, структурная социология и другие). В докладе рассматривается классификация взглядов, подходов и методов анализа структурного сходства, а также реализация методов в виде программных средств.

Уточним, что структура системы моделируется графовой моделью системы (ГМС). ГМС может принадлежать любому классу графовых моделей (от обыкновенных графов до взвешенных гиперграфов), что определяется предметной областью. Отметим резкое возрастание числа объектов исследования, моделируемых ГМС, особенно в социально-экономических науках [Jackson, 2008]. Развитие методов искусственного интеллекта актуализировало развитие методов структурного анализа в связи с расширением спектра структурных форм представления знаний [Chein et al, 2009] и развитием таких прикладных областей как структурное распознавание образов. Например, всё большее применение находят понятийные графы и решётки формальных понятий [Hitzler et al., 2009]). При анализе сходства становится важным не только сравнение классических топологических характеристик структур, но и комплексный учёт класса структур, весов вершин и рёбер/дуг, ограничений на взаиморасположение фрагментов и др. От классических мер структурного сходства переходят к рассмотрению более общих отношений толерантности и подобия. Для удобства исследований вводят различные промежуточные представления исходных ГМС, сохраняющих и рельефно акцентирующих необходимые характеристики.

Наиболее общая постановка задачи для двух структур звучит так: пусть даны две ГМС и , требуется количественно оценить степень сходства между ними. Обычно сходство выражают либо мерой сходства (чем больше мера, тем более похожи ГМС друг на друга, стандартный диапазон значений (0, 1]), либо коэквивалентной мерой различия (чем

162

больше мера, тем менее похожи ГМС, стандартный диапазон значений [0, 1)). Меры сходства/различия легко строить путём нормировки абсолютных значений расстояний. Естественно потребовать, чтобы хорошая мера различия обладала свойствами метрики. Определение меры сходства позволяет перейти к наиболее практически значимым задачам кластеризации множества ГМС, нечёткого поиска в базе ГМС и др.

1. Подходы к определению структурного сходства системВыделим два основных взгляда на процедуры определения

структурного сходства.Подструктурный взгляд (рис. 1) акцентирует внимание на проблеме

поиска максимальных общих фрагментов (МОФ) ГМС, которая является NP-полной теоретико-графовой проблемой. Из большой группы методов можно выделить классический подструктурный подход и расширенный подструктурный подход.

Рис. 1. Подструктурный взгляд на определение структурного сходства пары ГМССтандартное определение меры сходства по подструктурному подходу

для МОФ в смысле подграфа:,

а для МОФ в смысле частичного подграфа:.

Эти меры интерпретируются очевидным образом, но сложно вычисляются и обладают низкой дистинктивной способностью. Расширение подструктурного подхода заметно повышает дистинктивную способность, но увеличивает как временную, так и емкостную вычислительную сложность.

Структурно-харатеристический взгляд (рис. 2) пытается независимо рассматривать ГМС, чтобы получить промежуточные представления, выявляющие некоторый свойства ГМС, для которых уже существуют адекватные процедуры сравнения. Сюда можно отнести и популярный в

163

последнее время подход на основе графовых ядер (graph kernels) [Gartner, 2009].

Рис. 2. Структурно-характеристический взгляд на определение структурного сходства пары ГМС

Структурно-характеристический подход может предполагать учёт следующих характеристик ГМС.

11. Метрические (например, максимальной длины цепей/путей);12. Спектральные (например, факта вхождения в ГМС фрагментов

определённых типов и числа таких вхождений);13. Характеристики симметрии (например, числа орбит вершин или

более сложных фрагментов);14. Характеристики взаимного расположения фрагментов (например,

наличия непустых пересечений помеченных фрагментов определённых типов).

Многообразие структурных характеристик ГМС, которые могут быть представлены в простом для сравнения виде, чрезвычайно велико. В общем виде они изучаются теорией структурной сложности. Модели структурной сложности, которые выявляют те или иные характеристики, используются давно и плодотворно. Достаточно указать на применение в хим- и биоинформатике разнообразных топологических индексов [Devillers et al., 2000]. Несмотря на значительные успехи, мы находимся, по сути, в начале пути осознания междисциплинарной связи структурной сложности и сходства систем.

Основными формами представления моделей структурной сложности являются число, вектор и матрица. Однако интересно проанализировать, что получится в результате доведения структурно-характеристического подхода до предела выразительности с получением графовых моделей в качестве промежуточного представления. Очевидно, что к полученным структурным моделям структурной сложности (СМСС) может быть

164

применён подструктурный подход. Такая двухэтапная схема получила название обобщённого подструктурного подхода (ОПП) (рис. 3).

Рис. 3. Обобщённый подструктурный подход к анализу

структурного сходства пары ГМС

Предлагаемая реализация ОПП базируется на предложенной Коховым В.А. [Кохов, 2002] и развиваемой авторами работы системе структурных инвариантов, названных g-моделями ГМС. Модели универсальны в смысле произвольности исследуемых ГМС и произвольности структурных дескрипторов. В системе выделены подклассы моделей, обладающих свойствами, позволяющими вычислительно эффективно решать проблему поиска их МОФ. Это позволяет говорить о практической применимости обобщённого подструктурного подхода.

К достоинствам ОПП на основе g-моделей можно отнести комплексность характеризации ГМС с учётом взаимного расположения произвольных фрагментов и многообразие подмоделей с различными свойствами. Недостатком является сложность настройки на предметную область, что, однако является общим недостатком всех универсальных методов анализа структурного сходства.

2. Анализ сходства на практикеПри решении прикладных задач число ГМС, которое необходимо

исследовать, зачастую достаточно велико и может достигать десятков миллионов. В этом случае задача полного анализа попарного сходства всего множества графов лишается смысла. Как следствие, в некоторых случаях формулируется задача нечёткого поиска как задача отбора ГМС, наиболее сходных с заданной. Если же необходимо провести кластеризацию или построить и визуализировать граф сходства применяются локально-оптимальные («жадные») алгоритмы. Это делает невозможным применение подструктурного подхода и ещё больше актуализирует проблему выбора адекватных характеристик при использовании структурно-характеристического подхода. Это объясняет также популярность подхода на основе графовых ядер.

165

Понимание особенностей описания структурных характеристик позволило создать методологию применения ОПП для всех классов задач анализа сходства: пары ГМС; расположения пары помеченных фрагментов в ГМС; пары ГМС с учётом расположения помеченных фрагментов; пары ГМС с учётом сходства расположения помеченных фрагментов.

Сходство расположения помеченных фрагментов – исключительно значимая характеристика структуры системы. Эта характеристика стала приниматься во внимание исследователями не так давно (в конце 80-х годов) и сравнительно редко ввиду неразработанности математических моделей учёта расположения помеченных фрагментов, интересующих исследователя. Особую трудность представляет построение эффективно вычислимых моделей. В области хим- и биоинформатики изменение взаимного расположения фармакофоров (при неизменности всех остальных характеристик) приводит к резкому изменению активности. Перемещение подгруппы в социальной сети также резко меняет её свойства. Предлагаемая методология разделяет процессы исследования предметной области (требующегося для уточнения форматов ГМС и настройки параметров g-моделей [Незнанов и др., 2008]) и собственно анализа сходства. Параметризация заключается в выборе:

15. структурных дескрипторов;16. априорных оценок их сложности;17. типа подмодели структурной сложности по критериям выразительности и

эффективности вычисления;18. типа процедуры сравнения моделей или меры сходства при анализе

СМСС;19. набора учитываемых весов вершин и рёбер ГМС;20. вида следующего этапа исследований (повторение анализа сходства по

ОПП на суженом множестве ГМС, кластеризация выбранным методом; упорядочение; статистический анализ характеристик моделей и т.д.).

Большое число параметров ОПП актуализировало необходимость создания инструментов оценки влияния вносимых изменений на поведение получаемого отношения сходства. Это было проделано С.В. Ткаченко путём реализации подсистемы, позволяющей анализировать изменения в характере сходства при варьировании базиса структурных дескрипторов и выбирать наилучшие подбазисы.

3. Программная реализация методов анализа сходстваВсе рассматриваемые подходы к анализу структурного сходства

реализованы в АСНИ «Graph Model Workshop» (GMW), которая развивается с 1997 года и предназначена для проведения научных исследований и решения прикладных задач в области структурного анализа (рис. 4). Текущая версия GMW 4.0 обладает зрелой архитектурой, построенной на

166

модульном принципе, а её ядро поддерживает три прикладных программных интерфейса, что позволяет безболезненно и с минимальными трудозатратами расширять функциональность АСНИ.

Рис. 4. Главное окно GMW с открытым визуальным реактором ГМС

Универсальная постановка задачи анализа сходства ГМС позволила к настоящему времени создать набор подсистем АСНИ «Graph Model Workshop», предназначенных для:

1) многоэтапного анализа сходства ГМС на основе произвольных мер сходства с возможностью визуализации и обработки результатов;

2) исследования отношений структурной эквивалентности, сходства и подобия;

3) реализации обобщённого подструктурного подхода;4) исследования роли симметрии расположения фрагментов в

определении сходства их расположения;5) нечёткого структурного поиска в базах ГМС.Хотя впервые результаты применения обобщённого подструктурного

подхода в GMW докладывались в 2004 году [Кохов и др., 2004], к 2009 году этот подход был реализован в полном объёме на всех своих уровнях (уровни ОПП связаны с уровнями выразительности и сложности подмоделей g-модели). Анализ сходства можно проводить как в исследовательском режиме, когда промежуточные структурные модели сложности становятся обычными базами ГМС (рис. 5), так и в прикладном

167

режиме, когда все промежуточные модели хранятся в базе данных результатов экспериментов АСНИ (БДР).

Рис. 5. База GSO-моделей – промежуточного представления характеристик симметрии расположения фрагментов при анализе сходства по ОПП

На основе ОПП были проведены объёмные вычислительные эксперименты в области химической структурной информатики. Были проанализированы базы Национального института исследования рака (более 270 000 ГМС) и базы Российского онкологического научного центра (более 700 ГМС). Затраченное машинное время – более 400 часов. На рис. 6 показан пример визуализации графа сходства на последнем этапе экспертного анализа. Всего проанализировано 12 вариантов параметризации иерархических GSO-моделей в базисах цепей и циклов [Незнанов и др., 2008]. Этот класс моделей обладает свойством выявления полной информации о симметрии расположения помеченных фрагментов при относительно небольшом размере (числе вершин модели). Иерархичность позволяет уменьшить число рёбер модели и повысить эффективность поиска МОФ.

168

Рис. 6. Граф сходства 15 молекулярных графов базы NCI оставшихся на последнем этапе QSAR-анализа (изображены рёбра, соединяющие графы, сходные более чем на 90%)

Результаты экспериментов позволяют утверждать о возможности всестороннего и глубокого исследования сходства семейств молекулярных графов, для которых классический подструктурный подход не позволяет проводить QSAR-анализ вовсе, а классические топологические индексы вырождаются.

Структурный поиск в базах ГМС реализован в GMW также по модульной схеме. На рис. 7 показано меню поиска в базе ГМС. При выборе пункта «Поиск сходного…» можно задействовать любые расширения АСНИ, которые вычисляют меры сходства. Пространство поиска можно последовательно сужать, так как результатом поиска может быть фильтр базы ГМС. Ядро АСНИ позволяет в процессе поиска использовать информацию, ранее сохранённую в БДР.

Единый подход к решению задач анализа структурного сходства позволил создать оригинальную методологию и программные средства, используемые в областях интеллектуального анализа данных и химической структурной информатики, требующие оригинальных определений сходства и компьютерной поддержки.

169

Рис. 7. База ГМС в GMW, открыто меню выбора режима поиска

Список литературы[Кохов и др., 2004] Кохов В.А., Незнанов А.А., Ткаченко С.В.

Компьютерные методы анализа сходства графов // Девятая Национальная конференция по искусственному интеллекту с международным участием. КИИ-2004: Труды конференции. В 3-х т. Т. 1. – М.: Физматлит, 2004.

[Кохов, 2002] Кохов В.А. Концептуальные и математические модели сложности графов. // М.: Издательство МЭИ, 2002.

[Незнанов и др., 2008] Незнанов А.А., Кохов В.А. Программные средства для построения и исследования моделей структурной сложности и сходства // Одиннадцатая национальная конференция по искусственному интеллекту с международным участием. КИИ-2008. Труды конференции. Т. 1. – М.: ЛЕНАНД, 2008.

[Chein et al., 2009] Michel Chein, Marie-Laure Mugnier: Graph-based Knowledge Representation, Springer, 2009, XIV.

[Devillers et al., 2000] Topological Indices and Related Descriptors in QSAR and QSPAR, edited by James Devillers and Alexandru T Balaban, CRC Press, 2000.

[Gartner, 2009] Thomas Gartner: Kernels For Structured Data, World Scientific Publishing Company, 2009.

[Hitzler et al., 2009] Conceptual Structures in Practice, edited by Pascal Hitzler and Henrik Scharfe, Chapman & Hall, 2009.

170

[Jackson, 2008] Matthew O. Jackson, Social and Economic Networks, Princeton University Press, 2008.

[Smid et al., 2004] Jan Smid, Marek Obitko, Václav Snásel: Semantically Based Knowledge Representation, Communications in Computing, 2004.

УДК 004.832.3:001.8

ИНДУКТИВНЫЕ МЕТОДЫ МИЛЛЕВСКОГО ТИПАВ СИСТЕМАХ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

В.К. Финн ([email protected])Всероссийский институт научной и технической

информации РАН, Москва

В докладе формулируются принципы формализации индукции миллевского типа, которые распространяются на все пять индуктивных методов Д.С. Милля.

В [ДСМ-метод, 2009] и [Автоматическое порождение гипотез, 2009] были подробно представлены теоретические основания и практические применения ДСМ-метода автоматического порождения гипотез (ДСМ-метода АПГ) в интеллектуальных системах типа ДСМ (ИС-ДСМ). В [ДСМ-метод, 2009; Автоматическое порождение гипотез, 2009] были реализованы индуктивные методы сходства (прямой и обратный) Д.С. Милля [Милль, 1900] и некоторые его усиления (условие запрета на контрпримеры, условие единственности причины).

ДСМ-метод АПГ состоит из компонент:21. условий применимости,22. ДСМ-рассуждений,23. квазиаксиоматических теорий (это средство представления фактов

и знаний),24. метатеоретических исследований ДСМ-рассуждений и

предметных областей – баз фактов (БФ) (они включают дедуктивную имитацию ДСМ-рассуждений, процедурную семантику, методологические принципы конструирования ИС-ДСМ [Арский и др., 2008] и препроцессинг для настройки ИС-ДСМ на предметную область и класс задач),

25. ИС-ДСМ,26. средств распознавания корректности ДСМ-рассуждений (эта

компонента является процедурной реализацией компоненты (4)).

171

В [Финн, 2010a] впервые был реализован индуктивный метод сходства-различия Д.С. Милля [ДСМ-метод, 2009] и определены различные стратегии ДСМ-рассуждений, его включающие. В [Финн, 2010b] были представлены и формализованы все пять индуктивных методов Д.С. Милля – метод сходства, метод различия, соединенный метод сходства-различия, метод остатков и метод сопутствующих изменений6.

ИС-ДСМ имитируют естественный познавательный цикл – «анализ данных – предсказание – объяснение», что является весомым аргументом считать ДСМ-рассуждения, реализуемые Рассуждателем (модулем Решателя задач) ИС-ДСМ, когнитивными рассуждениями, извлекающими новое знание (knowledge discovery) [Fayyad, 1996] из БФ.

Этот познавательный цикл начинается с анализа данных, который осуществляется индуктивными процедурами, формализующими и усиливающими идеи пяти индуктивных методов Д.С. Милля. В [Финн, 2010а] и [Финн, 2010b] сформулированы основные принципы индукции миллевского типа. Таковыми являются (А) – (D), приводимые ниже.

(А). Принцип сходства и детерминации: сходство фактов влечет наличие (отсутствие) изучаемого эффекта и его повторяемость.

(B). Отсутствие препятствий («тормозов»): если существуют сходства, являющиеся условиями детерминации (согласно (А)), и отсутствуют препятствия («тормоза») ее реализации, то имеет место эффект (следствие причины).

(С). Наличие множества (+) – примеров и () – примеров: для обнаружения неявно заданного отношения «причина – следствие» посредством индуктивных правил правдоподобного вывода необходимо существование (+) – примеров (или () – примеров) отношения «объект – множество свойств», а число таких примеров k больше или равно 2 (k2 – изменяемый порог множества фактов, необходимый для порождения гипотез о причинах).

(D). Используемое множество сходных фактов, представляющее отношение «объект – множество свойств», должно быть максимальным для порождения нового отношения «причина – следствие».

Конструктивной идеей ДСМ-метода АПГ, которая применяется для формализаций всех индуктивных методов Д.С. Милля, является представление принципов (А) – (D) посредством позитивного и негативного предикатов сходства M+

a, n(V,W) и Ma, n(V,W) [ДСМ-метод,

6 В дипломной работе Анны Волковой были запрограммированы методы различия, соединенный метод сходства – различия и метод остатков. Экспериментальная проверка этих программ была реализована на массивах фармакологических и медицинских данных [Волкова, 2010].

172

2009; Автоматическое порождение гипотез, 2009; Арский и др., 2008; Финн, 2010b]. Каждое из четырех уточнений индуктивных методов (различия, соединенного сходства-различия, остатков и сопутствующих изменений), содержит в качестве составляющего модуля предикаты Ma, n(V,W), где {+, }.

Важной идеей формализации индуктивных методов Д.С. Милля является представление M-предикатов сходства посредством пяти необходимых условий – экзистенциального условия (ЭУ) (принцип (С), сходства фактов (СХ) (принцип (А)), эмпирической зависимости (ЭЗ) «причина – следствие» (принцип (А)), условие исчерпываемости (УИ) (принцип (D)). Принцип (В) осуществляется при задании правил правдоподобного вывода для индукции (п.п.в.-1, где {+, , 0, }). В ДСМ-методе АПГ имеются четыре типа истинностных значений 1, 1, 0 и (фактические «истина», «ложь», «противоречие» и «неопределенность», соответственно).

Простейшие п.п.в.-1 для формализации индуктивного метода сходства («а» – индекс метода сходства) имеют вид:

J(, n)(V2W), M+a,n(V,W)&M–

a,n(V,W)(I)+ .

J1, n+1(V2W)

Для (I), где {, 0, }, имеем, соответственно, посылки

М (V,W)&М (V,W),

М (V,W)&М (V,W),

М (V,W)& М (V,W)

и заключения J,n+1(V2W), где {1, 0}, и J(,n+1)(V2W), где (, n) ={1, n+1,1, n+1,0, n+1(, n+1), а V2W – предикат «V –

причина W».Индуктивный метод соединенного сходства-различия [Финн, 2010a]

определяется посредством усиления Ma, n(V,W), где {+, }, посредством условий, представляющих как сходство фактов, так и их различие.

(V,W)⇌lsZ1 ZlU1 UlX1 XlV1 Vs((ЭУ)2&(ЭЗ)2& (l2)&(s2)&M+

a,n(V,W)),

где d2 – индекс добавления для представления условия соединенного сходства-различия,

s – число сопутствующих причин Vi (для искомой причины V),

173

l – число примеров различия.Аналогично определяется предикат (V,W), а посредством

(V,W) определяются п.п.в.-1, где {+, , 0, }.В [Финн, 2010b] определяются аналоги индуктивных методов различия,

остатков и сопутствующих изменений. Отметим, что метод различия (как средство ДСМ-рассуждений) определяется посредством упрощения метода соединенного сходства-различия. Интересно, что в [Финн, 2010b] имеется и буквальный перевод метода различия Д.С. Милля [Милль, 1910].

В [Волкова, 2010] было экспериментально показано, что для тестовых массивов данных программа, реализующая метод различия Д.С. Милля (его буквальный перевод в язык ДСМ-метода АПГ), не порождает гипотез, тогда как формализация метода различия, полученная упрощением формализации индуктивного сходства-различия, порождает интересные гипотезы. Объяснением этому служит то обстоятельство, что метод различия Д.С. Милля как таковой не содержит условия сходства (не выполнен принцип (А)).

В [Финн, 2010b] впервые предложены формализации индуктивных методов остатков и сопутствующих изменений, причем в [Волкова, 2010] была построена и протестирована программа для индуктивного метода остатков.

Важным оправданием эффективности ДСМ-метода АПГ как средства интеллектуального анализа данных является созданная в ВИНИТИ РАН и РОНЦ РАМН им. Н.Н. Блохина ИС-ДСМ для анализа клинических данных больных с опухолью меланомы [Михайлова и др., 2010]. Посредством применения ДСМ-метода АПГ в ИС-ДСМ было обнаружено, что белок S100 является маркером продолжительности жизни больных с опухолью меланомы после различных вариантов проведенного лечения.

ДСМ-метод АПГ является современным средством интеллектуального анализа данных (knowledge discovery), который применяется в различных предметных областях посредством ДСМ-рассуждений, содержащих индуктивные методы миллевского типа. Важным итогом применения ДСМ-метода АПГ является его использование как средства формализованного качественного анализа социологических данных [Автоматическое порождение гипотез, 2009], так и средства «доказательной медицины» (“evidence based medicine”) [Флетчер и др., 2004].


174

[Автоматическое порождение гипотез, 2009] Автоматическое порождение гипотез в интеллектуальных системах, под ред. проф. В.К. Финна. – М.: Книжный дом «Либроком» (URSS), 2009.

[Арский и др., 2008] Арский Ю.М., Финн В.К. Принципы конструирования интеллектуальных систем // Информационные технологии и вычислительные системы, № 4, 2008.

[Волкова, 2010] Волкова А.М. Создание программных средств анализа баз фактов для применения ДСМ-метода автоматического порождения гипотез // Дипломная работа, Отделение интеллектуальных систем, РГГУ, 2010.

[ДСМ-метод, 2009] ДСМ-метод автоматического порождения гипотез: логические и эпистемологические основания, под ред. О.М. Аншакова. – М.: Книжный дом «Либроком» (URSS), 2009.

[Милль, 1900] Милль Д.С. Система логики силлогистической и индуктивной. – М.: Книжное Дело, 1900.

[Михайлова и др., 2010] Михайлова И.Н., Панкратова Е.С., Добрынин Д.А., Самойленко И.В., Решетникова В.В., Шелепова В.М., Демидов Л.В., Барышников А.Ю., Финн В.К. О применении интеллектуальной компьютерной системы для анализа клинических данных больных меланомой // Российский биотерапевтический журнал, № 2, 2010.

[Финн, 2010а] Финн В.К. Индуктивный метод соединенного сходства-различия и процедурная семантика ДСМ-метода // НТИ, Сер. 2, № 4, 2010.

[Финн, 2010b] Финн В.К. Индуктивные методы Д.С. Милля в системах искусственного интеллекта // Искусственный интеллект и принятие решений, № 2, 2010 (в печати).

[Флетчер и др., 2004] Флетчер Р., Флетчер С., Вагнер Э. Клиническая эпидемиология. Основы доказательной медицины. – М.: Изд. Медиа Сфера, 2004.

[Fayyad, 1996] Fayyad U.M., Piatetsky-Shapiro G., Smyth P, Uthurusamy R. Advances in Knowledge Discovery and Data Mining. – Menlo Park, CA: AAAI Press/The MIT Press, 1996.

175

УДК 004.85. 004.89

БИКЛАСТЕРИЗАЦИЯ ОБЪЕКТНО-ПРИЗНАКОВЫХ ДАННЫХ НА ОСНОВЕ РЕШЕТОК ЗАМКНУТЫХ

МНОЖЕСТВ

Д.И. Игнатов ([email protected])

С.О. Кузнецов ([email protected]) ГУ-ВШЭ, Москва

В работе предлагается новый метод бикластеризации объектно-признаковых данных, опирающийся на свойства решеток замкнутых множеств. Предложено определение плотного бикластера, эффективный алгоритм для поиска таких бикластеров, исследована его сложность, проведены вычислительные эксперименты на реальных данных. Исследована на практике возможность масштабирования (распараллеливания) алгоритма.

ВведениеВ настоящее время по сравнению с традиционным кластерным

анализом методы бикластеризации завоевывают все большую популярность, особенно в рядах исследователей в области биоинформатики для изучения данных генной экспрессии [Madeira et al., 2004]. Это вызвано потребностью в сохранении объектно-признаковой структуры данных, например, для адекватного понимания в каких свойствах выражено сходство некоторой группы генов. Различные приложения этих методов востребованы в области анализа Интернет-данных, например, такие алгоритмы – основа некоторых рекомендательных Интернет-сервисов [Ignatov et al., 2008].

В данной работе мы представляем метод бикластеризации, основанный на решетках формальных понятий. Благодаря средствам анализа формальных понятий (АФП) [Ganter et al., 1999] для любых объектно-признаковых данных можно построить иерархическую структуру формальных понятий (бикластеров специального вида), позволяющую отобразить их таксономические свойства в удобном для аналитика виде. Основным недостатком решеток понятий является их громоздкость, например, для объектно-признаковой таблицы размером 10х10 число бикластеров в худшем случае равно 210. Одной из задач, на

176

решение которой направлены усилия ученых, работающих в данном сообществе, является разработка методов по отбору наиболее полезных, релевантных понятий, сокращению размеров порождаемого множества понятий. Один из подходов заключается в ослаблении требований к формальным понятиям, в его рамках возможно не только сокращение числа порождаемых бикластеров, но успешное устранение влияния шума на результаты [Besson et al., 2006]. Нами предлагается метод бикластеризации, который использует только небольшую часть формальных понятий (объектные и признаковые), для порождения бикластеров особого вида. В качестве критерия отбора релевантных бикластеров применяется их плотность. В дополнение к описываемой в статье версии алгоритма предлагается ее параллельная реализация. Проводятся эксперименты на реальных данных, иллюстрирующие улучшение производительности благодаря оптимизации и распараллеливанию при различных порогах плотности.

Основные определенияКонтекстом в АФП называют тройку = (G, M, I), где G — множество

объектов, M — множество признаков, а отношение I G M говорит о том, какие объекты обладают теми или иными признаками.

Для произвольных A G и B M определены операторы Галуа:

A' = {m M | g A (g I m)};B' = {g G | m B (g I m)}.

Оператор (.)'' (двукратное применение оператора (.)') является оператором замыкания: он идемпотентен (A'''' = A''), монотонен (A B влечет A'' B'') и экстенсивен (A A'').

Множество объектов A G, для которого A'' = A, называется замкнутым. Аналогично для замкнутых множеств признаков – подмножеств множества M.

Пара множеств (A, B), таких, что A G, B M, A' = B и B' = A, называется формальным понятием контекста .

Множества A и B замкнуты и называются объемом и содержанием формального понятия (A, B) соответственно.

Для множества объектов A множество их общих признаков A' служит описанием сходства объектов из множества A, а замкнутое множество A'' является кластером сходных объектов (с множеством общих признаков A').

Множество объектных понятий образовано парами объектов (g'', g') для всех g G, а множество признаковых понятий – (m', m'') для всех mM.

Термин бикластер предложен в работе [Миркин, 1996] и означает множество объектов, сходство которых задано посредством общих значений признаков.

177

Другое определение бикластера предложено в работе [Barkov et al., 2006]. Алгоритм Bi-Max, описанный в этой работе строит максимальные по вложению бикластеры, определяемые следующим образом.

Дано m генов, n ситуаций и бинарная таблица e такая, что eij=1 (ген i активен в ситуации j) или eij=0 (ген i не активен в ситуации j) для всех i[1,m] и j[1,n].

Пара (G, C)2{1,…,n}×2{1,…,m} называется максимальным по вложению бикластером тогда и только тогда, когда выполнено (1) для любых iG и jC: eij=1 и (2) не существует (G1,C1) 2{1,…,n}×2{1,…,m} таких, что (a) для любых i1G1 и j1C1: eij=1 и (b) GG1, СC1 и (G1, C1)(G, C).

Пусть H – множество генов, S – множество ситуаций, а EH×S – бинарное отношение задаваемое таблицей e, |H|=m, |S|=n. Верно следующее утверждение

Утверждение 1. Для любой пары (G, C), GH, CS следующие два утверждения эквивалентны.

(G, C) максимальный по вложению бикластер таблицы e;(G, C) формальное понятие контекста (H, S, E).

В следующем разделе мы дадим определение бикластера, основанное на АФП.

Вычислительная модельОпределение 1. Если (g,m)I, то (m',g') называется объектно-

признаковым бикластером или оа-бикластером с плотностью ρ(m',g')=|I∩(m'×g')|/(|m'||g'|).

Приведем основные свойства оа-бикластеров (рис. 1).

Утверждение 2. 1. 0≤ρ≤1.2. оа-бикластер (m',g') является формальным понятием тогда и только

тогда, когда ρ=1.3. Если (m', g') – бикластер, то (g'', g')≤(m', m'').

178

Рис. 1. оа-бикластер

Определение 2. Пусть (A,B)2G×2M будет бикластером и ρmin

неотрицательное действительное число такое, что 0≤ρmin≤1, тогда (A, B) называется плотным, если он удовлетворяет ограничению ρ(A,B)≥ρmin.

Свойство монотонности (антимонотонности) некоторого ограничения часто используется в Data Mining, например, для поиска ассоциативных правил для улучшения эффективности алгоритма.

Отношение на множестве оа-бикластеров определяется по вложению соответствующих компонент: (A, B) (C, D)AC и BD.

Утверждение 3. Ограничение ρ(A,B)≥ ρmin не является ни монотонным, ни антимонотонным в смысле отношения .

Однако ограничение ρmin обладает другими полезными свойствами. Если ρmin=0, то мы получаем множество всех оа-бикластеров контекста . Для ρmin=0 каждое формальное понятие исходного контекста содержится в некотором его оа-бикластере, т.е. верно следующее утверждение.

Утверждение 4. Для любого (Ac, Bc)B(G, M, I) существует бикластер (Ab, Bb)B такой что (Ac, Bc)(Aa, Bb).

Утверждение 5. Для данного формального контекста = (G, M, I) и ρmin=0 наибольшее число оа-бикластеров равно |I|, а все оа-бикластеры порождаются за время O(|I|(|G|+|M|)).

179

Утверждение 6. Для данного формального контекста = (G, M, I) и ρmin>0 наибольшее число оа-бикластеров равно |I|, а все оа-бикластеры порождаются за время O(|I||G||M|).

Интересующее нас множество бикластеров является результатом работы Алгоритма 1 (табл. 1).

Табл. 1. Вход: = (G, M, I) – формальный контекст, ρmin – минимальное

значение порога плотности.Выход: B={(Ak,Bk)| 0≤k≤|B|} – множество бикластеров123456789

1011

O.size=|G|, A.size=|M|, B={}For g in G:

O[g]=g'For m in M:

A[m]=m'For g in G:

For m in O[g]:b=(O[g], A[m])if(ρ(b)≥ρmin):

B.Add(b)return B

Благодаря свойству антимонотонности оператора (.)' мы провели оптимизацию условия порождения бикластера в цикле 6-10 и избежали вычисления операции замыкания в циклах 2-3 и 4-5.

РезультатыДля экспериментальной оценки эффективности предложенного

алгоритма бикластеризации была запрограммирована версия Алгоритма 1. В качестве языка реализации был выбран C# из среды разработки Microsoft Visual Studio 2008. Дополнительно была исследована возможность распараллеливания (масштабирования) алгоритма с помощью средств библиотеки Task Parallel Library, входящей в состав Microsoft .NET Framework 4.0.

Эксперименты были проведены на данных из UCI Machine Learning Repository и на массиве данных о покупке рекламных словосочетаний компании Yahoo. В таблице 2 приведено описание этих наборов данных, для каждого из них указано количество объектов, признаков, число пар принадлежащих отношению I, плотность контекста и количество его формальных понятий.

Табл. 2. Название |G|×|M| |I| Плотн B(G, M, I)

180

остьadvertising 2000×300

09245 0,015 8950740

breast-cancer

286×43 2851 0,232 9918

flare 1389×49 18057

0,265 28742

postoperative

90×26 807 0,345 2378

SPECT 267×23 2042 0,333 21550vote 435×18 3856 0,492 10644zoo 101×28 862 0,305 379

Помимо производительности алгоритмов нас интересовала зависимость количества порождаемых оа-бикластеров от выбранного порога плотности ρmin, результаты экспериментов приведены в таблице 3.

В 6 экспериментах из 7 мы наблюдаем заметно меньшее число бикластеров по сравнению с количеством формальных понятий. Для 7 эксперимента такой результат объясняется тем, что имеется большое количество объектов, содержания которых представимы в виде пересечения содержаний других объектов (операция редуцирования контекста по объектам оставляет только 59 объектов из 100).

Табл. 3. Названи

еadvertisin

gbreast

-cancer

post-operativ

e

flare SPECT

vote zoo

B(G,M,I) 8950740 99182378

28742 21550 10644

379

ρmin=0 92345 2851807

18057 807

3856 862

ρmin=0,1 89735 2851807

18057 2042 3856 862

ρmin=0,2 80893 2851807

18057 2042 3856 862

ρmin=0,3 65881 2849807

18050 2042 3855 862

ρmin=0,4 45665 2678807

17988 2029 3829 853

ρmin=0,5 25921 1908725

17720 1753 3527 776

ρmin=0,6 10066 310402

16459 835

2575 521

181

ρmin=0,7 2081 1718

9353 262

1458 341

ρmin=0,8 165 22

1450 85 382 225

ρmin=0,9 3 22

293 32 33

63

ρmin=1 0 2 2 3 12 1 7

Отношение числа порожденных понятий к количеству бикластеров показано в таблице 4.

Табл. 4. Название advertising breast-

cancerflare postoper

ativeSPECT vote zoo

Сокращение 96,9 3,5 1,6 2,9 10,6 2,8 0,4

Приведем результаты экспериментов по оценке временной эффективности алгоритмов на самом крупном из имеющихся массивов реальных данных – advertising (рис. 2).

Зависимость количества бикластеров от величины порога носит довольно плавный характер, хотя для некоторых данных UCI Machine Learning Repository это количество остается постоянным при уменьшении значения порога на 0,1, начиная с 1, для нескольких первых точек.

По рисунку 2 можно судить о том, что параллельная версия оптимизированного алгоритма работает быстрее последовательной реализации на 45%. Дополнительные эксперименты проведены на массивах данных из UCI Machine Learning Repository, результаты носят аналогичный характер.

182

Рис. 2. Сравнение производительности алгоритмов

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 08-07-92497-НЦНИЛ_а).

Выводы и дальнейшие исследованияПолучена эффективная реализация алгоритма бикластеризации на

основе решеток замкнутых множеств для случая бинарных объектно-признаковых данных. Для некоторых задач кластеризации возможно применение жадных стратегий, которые позволяют добиться решения близкого к оптимальному за меньшее число итераций. Для предложенного алгоритма это позволит избежать применения параметра ρmin, возможны следующие жадные стратегии: покрытие (некоторой доли) отношения I или множества M (актуально для рекомендательных систем). Необходимо исследование шумоустойчивых свойств алгоритма.

В качестве направлений дальнейших исследований можно предложить разработку жадных версий разработанного алгоритма, например, по покрытию множества признаков M или отношения I, а также исследование их предсказательных свойств для рекомендательных систем и анализа данных генной экспрессии.

Список литературы[Barkov et al., 2006] Barkow, S., Bleuler, S., Prelic, A., Zimmermann, P., and E.

Zitzler. BicAT: a biclustering analysis toolbox, Bioinformatics, 22(10), 2006.

183

[Besson et al., 2004] Besson J., Robardet C., Boulicaut J-F. Constraint-based mining of formal concepts in transactional data. In: Proceedings of the 8th Pacific-Asia Conference on Knowledge Discovery and Data Mining, 2004.

[Besson et al., 2006] Besson, J., Robardet, C., Boulicaut, J.F.: Mining a New Fault-Tolerant Pattern Type as an Alternative to Formal Concept Discovery, In: Schärfe, H., Hitzler, P., Ohhrstrom, P. (eds.) ICCS 2006. LNCS (LNAI), vol. 4068, Springer, 2006.

[Ganter et al., 1999] Ganter B. and Wille R., Formal Concept Analysis: Mathematical Foundations, Springer, 1999.

[Ignatov et al., 2008] Ignatov D.I., Kuznetsov S.O. Concept-based Recommendations for Internet Advertisement//In proceedings of The Sixth International Conference Concept Lattices and Their Applications (CLA'08), Olomouc, Czech Republic, 2008.

[Madeira et al., 2004] Sara C. Madeira and Arlindo L. Oliveira, "Biclustering Algorithms for Biological Data Analysis: A Survey IEEE/ACM Transactions on Computational Biology and Bioinformatics, VOL 1, NO. 1, 2004.

[Mirkin, 1996] Mirkin B.G. Mathematical Classification and Clustering. Kluwer Academic Publishers, 1996.

184

УДК 004.85, 004.89

МЕТОД СКОЛЬЗЯЩЕГО КОНТРОЛЯ ДЛЯ ОЦЕНКИ КАЧЕСТВА РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ-

СЕРВИСОВ

Д.И. Игнатов ([email protected])

А.Ю. Каминская ([email protected])

Р.А. Магизов ([email protected])ГУ-ВШЭ, Москва

В статье описываются современные алгоритмы, применяемые в рекомендательных системах. Предлагается способ оценки их качества в терминах точности и полноты предсказаний. Данная методика основывается на технике скользящего контроля. Проведены эксперименты на реальных и синтетических наборах данных. Результаты позволяют выявить лучший метод среди исследуемых и подобрать его параметры.

Введение Современному Интернет-пользователю довольно часто приходится

сталкиваться с рекомендательными системами. Например, приобретая книгу X в Интернет-магазине, пользователь такой системы получает рекомендации вида «другие пользователи вместе с книгой X приобрели также книги Y и Z». Также существует множество сервисов для рекомендации пользователю интересных сайтов, известных как сервисы социальных закладок. Нетехнологичным способом получения рекомендаций можно назвать совет друзей и знакомых. С ростом числа вещей, для выбора которых вам нужна рекомендация, мнения знакомых становится недостаточно, они могут просто не знать о новинках. В этой затруднительной ситуации помогает так называемая коллаборативная фильтрация [Golberg et al., 1992]. Методы рекомендательных систем, основанные на коллаборативной фильтрации, часто работают по довольно простой схеме. Они просматривают большую группу людей, находят тех из них, предпочтения которых близки к вашим, а затем создают список выбранных ими вещей и ранжируют его, в итоге предлагая вам N верхних предметов такого списка. Другим менее очевидным, но востребованным приложением является рекомендация словосочетаний в системах

185

контекстной рекламы, где фирмы приобретают рекламные словосочетания, по которым поисковые системы могут находить их и выдавать рекламу на такой запрос.

1. Существующие модели рекомендательных системВ нашей работе представлены две группы методов, ставших

классическими в рассматриваемой области: user-based (основанные на сходстве пользователей) и item-based (основанные на сходстве признаков) (см. [Badrul et al., 2000]). Ключевым для работы этих методов является понятие сходства (математически это может быть мера Жаккара, корреляция Пирсона, мера косинусов и т.п.). Исходные данные представлены объектно-признаковыми матрицами, в которых столбцам соответствуют признаки (товары), а строкам объекты (пользователи). На пересечении строк и столбцов записаны 1 или 0, которые означают факт покупки или ее отсутствие. Также значениями ячеек таблицы могут быть рейтинги или оценки товаров, например, фильмов, поставленные пользователями.

1.1. Рекомендации, основанные на сходстве пользователей (User-based)

В методах группы user-based сходство ищется между пользователями и в качестве рекомендаций пользователю u0 выдается n самых часто покупаемых товаров k наиболее похожими на него покупателями. Введем обозначения: u0 – «целевой» пользователь, u0

I – предметы, которые он оценивал, sim(u0, u)– сходство пользователя u0 с пользователем u. В нашей работе для подсчета сходства мы использовали коэффициент корреляции Пирсона. Определим множество ближайших соседей (соседство) для целевого пользователя по формуле:

.На самом деле удобнее брать top-k ближайших соседей, т.е. top-k

определяет . Таким образом, во множество ближайших соседей попадают те пользователи, сходство которых с целевым выше некоторого порога. После упорядочения пользователей по убыванию сходства, нужно отбирать не только первые k, но и проверить значение сходства у следующего (k+1) по списку. Если это значение совпадает с последним, включать и k+1-го пользователя в соседство. И так до тех пор, пока сходство не изменится. Поскольку мы предсказываем оценку целевым пользователем конкретного предмета i, нам интересны только те пользователи из этого соседства, которые оценивали предмет i:

.

186

Обозначив оценку предмета i пользователем u через rui, получаем итоговую формулу для предсказанной оценки:

.

Чтобы выдать пользователю рекомендацию, нужно посчитать такие предсказания для каждого из неоцененных им предметов, ранжировать по убыванию и выдать первые n предметов в качестве рекомендованных.

1.2. Рекомендации, основанные на сходстве признаков (Item-based)

Идея метода item-based аналогична идее вышеописанного метода user-based, однако сходство уже ищется по признакам, то есть по предметам. Введем обозначения: u0 – «целевой» пользователь, u0

I – предметы, которые он оценивал, sim(i,j) – сходство товара i с товаром j. Определим соседство для предмета i аналогично тому, как определяли его для целевого пользователя: .

Это top-k ближайших к i товаров, top-k определяет . Чтобы предсказать оценку целевому пользователю, нужно сравнивать те предметы, которые он оценивал, с теми, которые нет. Поэтому «уточним» формулу для соседства в отношении к целевому пользователю:

.

Обозначим оценку предмета i пользователем u, таким образом, итоговая формула имеет вид:

.

Далее ранжируем оценки по убыванию и выдаем первые n в качестве рекомендаций.

Преимущества этому методу дает тот факт, что обычно на сайтах онлайновой торговли количество пользователей постоянно увеличивается, в то время как новые предметы добавляются не так часто. Поэтому вычисление сходства пользователей каждый раз при формировании

187

рекомендации может занимать много времени, а сходство предметов можно посчитать заранее в режиме офлайн, и потом использовать эту матрицу.

У этих методов есть ряд недостатков, например, в случае «холодного старта», когда нам ничего неизвестно о новом клиенте, такие системы не смогут ничего порекомендовать, но они успешно справляются со своей задачей, когда известна история пользователя.

2. Меры сходстваЧтобы определить сходство между объектами или признаками,

используют различные меры (метрики) сходства. Обычно эти величины принимают значения от 0 до 1 (при абсолютном сходстве). Рассмотрим некоторые из таких метрик.

2.1. Сходство, основанное на расстоянии

Для определения сходства можно сначала вычислить расстояние одним из способов:

2.1.1. Евклидово расстояние.

В данном случае каждый объект представляется как вектор в пространстве признаков (или наоборот). Тогда между любыми двумя точками можно найти Евклидово расстояние по известной формуле.

2.1.2. Расстояние Хемминга.Эта метрика применяется для бинарных данных. Расстояние в данном

случае равно количеству разных значений координат двух векторов.

Для выбранного расстояния сходство часто ищется по формуле:

.

Вернемся к метрике Хемминга. Поскольку d может принимать только натуральные значения и 0, максимальное значение s равняется 1 (при нулевом расстоянии), но уже при d = 1 значение s = 1/2, что является очевидным недостатком: если имеется два 100-мерных бинарных вектора, у которых различие лишь в одной из координат, то согласно формуле получаем, что они сходны лишь наполовину. Такой «несглаженный» характер значений сходства можно видеть на графике (рис.1):

188

Рис.1. Зависимость сходства от расстояния Хемминга

2.2. Корреляции как сходства

В данном случае сходство считается с помощью известной формулы для корреляции из математической статистики (корреляция Пирсона):

.

Главным недостатком этого способа определения сходства является то, что корреляция Пирсона не определена для векторов с постоянными значениями. Действительно, если мы имеем вектор , знаменатель становится равным нулю.

Именно поэтому мы можем терять рекомендации. В качестве примера рассмотрим два вектора: и . Если представить эти векторы как набор оценок двух пользователей, интуитивно понятно, что такие пользователи достаточно схожи. Однако корреляция посчитана не будет, поскольку она считается только по тем координатам, которые не равны нулю у обоих векторов. В нашем примере нужно посчитать корреляцию для и . Но, как было показано выше, для первого вектора она не определена. Некоторые авторы предлагают в данном случае считать корреляцию нулевой [Сегаран, 2008], но на наш взгляд, это некорректно.

2.3. Другие меры сходства

Для определения сходства существует несколько десятков разных мер. Например, косинусная мера или коэффициент Жаккара.

3. Методика оценивания качества рекомендацийВ этой работе мы предлагаем методику оценки качества

рекомендаций, выдаваемых такими системами. Пусть исходные данные представлены объектно-признаковой таблицей, бинарное отношение T

189

U×I показывает, совершил ли пользователь uU покупку iI, что выражается как uTi. Для оценки качества рекомендаций в терминах точности и полноты можно применить подход, использующий разбиение исходной выборки (множество U) на два подмножества: тестовое Utest и обучающее Utraining. Размер тестового множества, как правило, меньше размера обучающего, например, 20% и 80% соответственно. Полнота и точность поиска оценивается на тестовой выборке. Каждый элемент u тестовой выборки Utest в свою очередь разбивается на две части, на оцененные признаки Ivisible и неоцененные Ihidden, т.е. такие, которые мы намеренно скрываем. Отметим, что в существующей научной литературе отношение размеров Ivisible и Ihidden не обсуждается. Далее, например, алгоритм рекомендаций по пользователям использует сходство объектов из тестовой и обучающей выборки для формирования рекомендаций. Каждый пользователь из Utest получает рекомендации в виде множества фиксированного размера rn(u)={i1,i2,…,in}. Далее точность и полнота вычисляются следующим образом:

,

,

где uI – множество всех купленных пользователем u товаров из I. Значения этих мер вычисляются для каждого посетителя и усредняются. Эксперимент проводится для разбиения исходной выборки на тестовое и обучающее множество несколько раз, например, 100. Значения мер вновь усредняются. Помимо этого существует возможность отбора признаков для множества Ihidden скрытых признаков, процедура разбиения выполняется случайным образом, но необходимо задавать их долю, например, 20%. Идея метода оценки позаимствована из машинного обучения, и носит название скользящего контроля (cross-validation), но в случае рекомендательных систем претерпевает ряд модификаций. Нами использована модификация метода, называемая m-кратный скользящий контроль, идея которого состоит в том, что искомая выборка разбивается на m подмножеств объектов, каждое из которых затем используется в качестве тестовой выборки, а оставшиеся – в качестве обучающей. В дополнение к стандартным способам вычисления точности и полноты мы предлагаем нетрадиционные варианты раскрытия неопределенностей,

190

возникающих при их оценке. Если , то . Если

и то , иначе Эксперименты проведены на наборах данных MovieLens о рейтингах

фильмов и синтетических наборах данных, сгенерированных нами.

4. Результаты экспериментовМы провели серию экспериментов на наборе данных рейтингов

фильмов, в котором представлено 1682 фильма, 943 пользователя, каждый из которых оценил не менее 20 фильмов. Все эксперименты проведены на компьютере с процессором Intel Core 2 Duo 2.0 Гц, 3МБ ОП, под управлением Windows Vista. Алгоритмы реализованы на языке Python 2.6. Мы приводим результаты эксперимента по исследованию зависимости точности (рис.2) и полноты (рис.3) поиска от количества скрываемых признаков для указанных данных (применялся 10-кратный скользящий контроль при фиксированном количестве соседей 10).

Рис.2. Зависимость точности от числа скрытых признаков

Рис.3. Зависимость полноты от числа скрытых признаков

191

Как видим по точности поиска методы практически одинаково себя ведут, а по полноте в диапазоне от 1 до 10 скрытых признаков сходство по пользователям работает точнее. Также мы провели аналогичные эксперименты на наборе данных рейтингов фильмов, в которых поэтапно скрывали признаки от 1% до 20%. На графиках (рис.4, рис.5) для этих экспериментов метод Item-based показывает лучшие результаты только при скрывании малого количества признаков (~1%). В дальнейшем его показатели значительно ухудшаются, тогда как User-based ведет себя достаточно стабильно, более того, начиная с 6-7% полнота начинает возрастать.

Результаты по влиянию количества соседей и размера тестовой выборки мы приводим для синтетического набора данных состоящего из 20 объектов и 20 признаков по диагонали которого расположено четыре прямоугольника из единиц размером 5x5.

Рис.4. Зависимость точности от числа соседей

Рис.5. Зависимость полноты от числа соседей

192

Из этих экспериментов видно, что точность и полнота увеличиваются с ростом количества соседей, причем методу, основанному на сходстве пользователей, требуется меньше соседей, чем на сходстве признаков для достижения такого же качества результатов. Результаты для изменяющегося размера тестового множества носят похожий характер, с ростом размера тестового множества качество предсказаний улучшается, а сходство по пользователям дает лучшие результаты.

5. ЗаключениеПредложенная методика оценки качества рекомендательных Интернет-

сервисов позволяет сравнивать методы рекомендательных систем и настраивать их параметры. В ходе экспериментов было установлено, что классические методы группы user-based ведут себя лучше с точки зрения точности и полноты поиска при количестве скрытых признаков около 10 на реальных данных. Данная методика также позволяет сравнивать любые другие методы поиска рекомендаций, в том числе и основанные на алгоритмах бикластеризации [Ignatov et al., 2008], [Игнатов и др., 2008]. Сравнительные исследования этой группы методов представляют дальнейшее направление развития нашей работы.

Список литературы[Игнатов и др., 2008] Игнатов Дмитрий Игоревич, Кузнецов Сергей Олегович.

Методы разработки данных (Data Mining) для рекомендательной системы Интернет-рекламы.// Труды одиннадцатой национальной конференции по искусственному интеллекту с международным участием, 2008. Т. 2. № КИИ-2008.

[Сегаран, 2008] Тоби Сегаран. Программируем коллективный разум, СПб.: Символ-плюс, 2008.

[Badrul et al., 2000] Badrul M. Sarwar, George Karypis, Joseph A. Konstan, John Riedl, "Analysis of recommendation algorithms for e-commerce", ACM Conference on Electronic Commerce, 2000.

[Golberg et al., 1992] David Goldberg, David A. Nichols, Brian M. Oki, Douglas B. Terry. Using Collaborative Filtering to Weave an Information Tapestry. Communications of the ACM , volume 35(12), 1992.

[Ignatov et al., 2008] Ignatov, Dmitry I., Kuznecov, Sergey Olegovich. Concept-based Recommendations for Internet Advertisement. // Proceedings of the Sixth International Conference on Concept Lattices and Their Applications, 2008.

193

http://www.informatik.uni-trier.de/~ley/db/journals/cacm/index.html

УДК 519.254

ПРЕДСКАЗАТЕЛЬНОЕ МЕТАМОДЕЛИРОВАНИЕ И ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ

А.П. Кулешов ([email protected]) Институт Проблем Передачи Информации им. А.А.

Харкевича РАН, Москва

А.В. Бернштейн ([email protected]) Институт Системного Анализа РАН, Москва

В настоящей работе рассматриваются различные аспекты построения и применения метамоделей в CAD-системах, описываются основные задачи анализа данных, решение которых необходимо для построения метамодели, проводится обзор последних результатов и предлагаются новые подходы к решению задач предсказательного метамоделирования.

Введение В процессе проектирования сравниваются различные технические

решения, касающиеся структуры и параметров создаваемого объекта, механизмов его функционирования и других его элементов. Компьютерные системы для поддержки принятия инженерных решений (Knowledge Based Engineering, Computer Aided Engineering) создаются для сокращения времени проектирования и числа дорогостоящих (в материальном и временном смыслах) натурных экспериментов и являются, по существу, системами предсказательного моделирования. При проектировании объектов решаются две основные задачи:

анализ конкретного варианта построения объекта, то есть, вычисление различных характеристик (Y) объекта по входным данным (X), в общем случае состоящим из цифрового описания объекта, параметров управления объектом и параметров внешней среды (например, среды функционирования),

оптимизация структуры объекта, то есть построение цифрового описания объекта с требуемыми (наилучшими) характеристиками при заданных условиях функционирования и при наличии различных ограничений.

194

Значительный прогресс в области математического моделирования и возможностей вычислительной техники позволяет исследовать большое количество вариантов построения объекта (конфигурации, параметров и др.), предсказывать ожидаемые характеристики и находить наилучшие (рациональные) решения без проведения натурных экспериментов. Поэтому математическое моделирование (вычислительные эксперименты для исследования и оптимизации математических моделей создаваемого объекта и окружающей его среды) стало одним из самых распространенных методов анализа и оптимизации структуры технических объектов.

Традиционно в моделировании используются математические модели, основанные на «физике процессов» и описывающие физические процессы и явления, происходящие при функционировании объекта, сложными дифференциальными уравнениями в частных производных с граничными условиями, для которых зачастую неизвестны ни теоремы о существовании и единственности решения, ни характер зависимости решения от параметров и граничных условий. Численные методы решения таких уравнений имеют значительную вычислительную трудоемкость, как самих расчетов, так и подготовки исходных данных и расчетных сеток. Это существенно сокращает возможности использования моделей, основанных на «физике процессов», особенно на стадии предварительного (концептуального) проектирования, на которой рассматривается очень большое количество вариантов решений и высока цена неправильно выбранного решения.

В последние годы стало бурно развиваться новое направление математического моделирования - метамоделирование, в рамках которого рассматриваются математические модели, основанные на данных [Wang et al., 2007], [Forrester et al., 2008], [Kuleshov et al., 2009c]. Построение таких моделей основано на идеях машинного обучения (machine learning) [Vapnik, 1998], [Vapnik, 2000], [Mitchel, 1997], где модели «обучаются» по множеству прототипов входных и выходных данных (результатов натурных и/или вычислительных экспериментов, проведенных с различными объектами рассматриваемого класса).

Построенные модели фактически имитируют (заменяют) как источники получения данных, основанные на некоторой исходной модели, так и сами модели, созданные на основе изучения физики процессов. Поэтому, такие адаптивные модели иногда называют также метамоделями (модели над моделями) или суррогатными моделями (Surrogate Models).

Как правило, суррогатные модели имеют существенно более высокую вычислительную эффективность по сравнению с исходными моделями. Например, метамодели для расчета аэродинамических характеристик,

195

построенные по результатам экспериментов с помощью исходной CFD-моделью, основанной на численном решении дифференциальных уравнений аэродинамики, увеличила скорость вычислений более чем в 350 000 раз при относительной погрешности не более 1% [Bernstein et al., 2007]. Другим примером является метамодель для исходной модели расчета прочности конструктивных элементов самолета, основанной на численном методе решения уравнений с помощью метода конечных элементов, увеличившая скорость вычислений в тысячи раз [Burnaev et al., 2009a] с сохранением требуемой точности.

Стандартные широко применяемые методы построения метамоделей основаны, как правило, на решении задачи аппроксимации (восстановления) по данным неизвестной функции (построения аппроксимирующей функции, построении функции регрессии). Однако, как показал опыт авторов, при построении метамоделей для многих реальных приложений необходимо решать ряд взаимосвязанных задач интеллектуального анализа данных, в которых выходные данные одной частной задачи являются входными данными для другой задачи, и целевые функции для частных задач нельзя определить независимо [Kuleshov et al., 2008b], [Bernstein et al., 2008a], [Bernstein et al., 2009a]. Формальные постановки решаемых задач имеют ряд особенностей, отличающих их от классических постановок. Например, носители обрабатываемых многомерных данных лежат на нелинейных многообразиях меньшей размерности (многообразиях данных), что не учитывается в стандартных математических методах анализа данных.

Кроме того, при построении метамоделей возможно использовать не только данные, но и знания и модели предметной области. Когнитивная технология интеллектуального анализа данных позволяет формализовывать знания и модели предметной области в виде многообразий знаний, являющихся подмногообразиями многообразия данных [Kuleshov, 2008a], [Bernstein et al., 2009b]. Например, из содержательной задачи следует, что исходная модель является инвариантной относительно известной группы преобразований входных переменных, что позволяет строить существенно более точные суррогатные модели [Bernstein et al., 2010d].

В докладе даны примеры важных прикладных задач, в которых метамоделирование является, по существу, единственным способом решения проблемы предсказательного моделирования. Будут описаны основные требования к метамоделям и сформулированы постановки основных задач анализа данных, которые необходимо решать в процессе создания метамоделей. Более подробно будут рассмотрены взаимосвязанные задачи аппроксимации и снижения размерности, для которых будут предложены методы и алгоритмы для их решения,

196

качество которых будет проиллюстрировано результатами вычислительных экспериментов с реальными и искусственными данными.

1. Аппроксимация в метамоделированииПусть M – некоторая исходная модель (метод), позволяющая для

заданных входных данных xXRp строить функцию отклика – вычислять значение характеристики y=FM(x)Rq. Пусть DN = {(xi, yi = FM(xi)), i = 1, 2, … , N} – результаты N экспериментов с моделью M для множества входных данных XN = {xi, i = 1, 2, … , N}, по которым строится аппроксимация y = FSM(x) = FSM(xDN) для исходной зависимости y = FM(x). Если для всех x X (не только для x XN) имеет место приближенное равенство FSM(x)»FM(x), то модель SM, определяемая построенной зависимостью FSM(x), может рассматриваться как заменитель (Surrogate) для исходной модели M и является суррогатной моделью (метамоделью).

Процедуры нахождения зависимости FSM(xDN) обычно основаны на решении задачи минимизации средней ошибки аппроксимации N(FSM) = (iyi - FSM(xi)2)1/2 на обучающем множестве DN, но при этом построенная зависимость должна обладать «обобщающей способностью», то есть обеспечивать требуемую точность и для других точек xX \ XN. Обычно функция FM(x) ищется в параметрическом классе функций, представленных в виде линейных комбинаций jjh(x, j) функций из выбранного «словаря», и задача минимизации ошибки N(FSM) есть задача минимизации по множеству параметров {(j, j)}. Если функции h(x, j) имеют вид hj(x), то мы имеем обычную линейную регрессионную модель. Имеется ряд процедур построения нелинейных аппроксимационных зависимостей FSM(x) для конкретных словарей: Multidimensional non-parametric regression, Kernel ridge regression (kriging), Support Vector Regression, Artificial Neural Networks, Radial Basic Functions, etc. Новые эффективные аппроксимационные процедуры предложены в работе [Bernstein et al., 2008e], а также в ряде докладов на конференции CDAM 2010 [Burnaev et al., 2010b], [Burnaev et al., 2010c], [Burnaev et al., 2010d].

2. Снижение размерности в метамоделированииСущественной особенностью прикладных задач зачастую является

высокая размерность входных данных. Например, детальные описания геометрических объектов (кривых, поверхностей) или их компонентов в общем случае задаются набором 2D- или 3D-координат точек поверхности объекта, лежащих в выбранных узлах геометрического объекта. Другие точки объекта восстанавливаются, как правило, с использованием сплайнов (такого рода детальные описания кривых и поверхностей используются в CAD-системах, компьютерной графике и

197

других приложениях). Такие цифровые описания объекта (например, 3D-поверхности самолета в задаче расчета аэродинамических характеристик [Bernstein et al., 2007]) состоят из десятков тысяч чисел, каждое из которых, рассматриваемое изолированно, не несет смысловой нагрузки. Высокая размерность цифрового описания объектов существенно затрудняет или вообще делает невозможной аппроксимацию функции, зависящей от векторов высокой размерности.

Для анализа и оптимизации крыла пассажирского самолета необходимо построение такой суррогатной модели, вход которой состоит из 3D геометрического описания поверхности крыла и характеристик набегающего потока. Выходы такой суррогатной модели состоят из различных аэродинамических характеристик, таких, как коэффициент сопротивления, коэффициент подъемной силы и т.п. Зависимость между входами и выходами значительно нелинейная. Описание геометрии крыла в большинстве даже наиболее "кратких" инженерных моделей состоит из не менее 500 чисел. Размер обучающей выборки, используемой для построения суррогатной модели, в наилучшем случае составляет несколько тысяч. Стандартные методы восстановления неизвестной зависимости не срабатывают в описанной ситуации из-за значительной размерности входного вектора и малого объема обучающей выборки. В то же время эти 500-мерные входные вектора лежат в пространстве существенно меньшей размерности, равной нескольким десяткам. Включение внутренних процедур снижения размерности в процедуру построения суррогатной модели позволило существенно повысить точность построенной суррогатной модели.

В приложениях «осмысленные» (meaningful) (с точки зрения рассматриваемой предметной области) значения входного вектора xX удовлетворяют, как правило, различным ограничениям и между его компонентами существуют многочисленные взаимосвязи. Поэтому множество X таких значений обычно лежит, по крайней мере, приближенно, в окрестности некоторого многообразия (в общем случае, нелинейного) GmRp размерности m<<p. Следовательно, задачу аппроксимации необходимо решать лишь в окрестности многообразия Gm. Нахождение такого «аппроксимирующего» многообразия Gm очень важно и по другой причине. Для проведения вычислительных экспериментов с целью получения обучающего множества данных , необходимо генерировать входные данные (X, Y), и при этом цифровые описания X должны генерироваться в окрестности многообразия Gm (в частности, необходимо «оставаться» вблизи многообразия Gm при генерации новых значений параметра x в процессе оптимизации).

Обычно аппроксимирующее многообразие Gm неизвестно, и необходимо решать задачу его построения по множеству данных XN,

198

которую можно сформулировать как следующую классическую задачу снижения размерности: найти процедуру = {m, Cm, Rm}, определяемую заданной размерностью m, преобразованием сжатия Cm: xX=Cm(x)Rm

и преобразованием восстановления Rm: Rm x = x() = Rm()Rp, минимизирующую ошибку восстановления m() = (ixi - Rm(Cm(xi))2)1/2. В качестве значения m, являющегося оценкой внутренней размерности множества X, выбирается минимальная размерность, при которой ошибка m() не превышает заданной точности восстановления.

Обычно преобразования Cm и Rm ищутся в параметрическом классе функций, и задача минимизации ошибки m() есть задача минимизации по множеству параметров функций. Если рассматриваются классы линейных преобразований, то решение дается методом главных компонент. Имеется ряд нелинейных процедур снижения размерности, определяемых конкретными классами преобразований: Replicative Artificial Neural Networks, Radial Basis Functions, etc. Новые эффективные процедуры снижения размерности based on construction of non-linear framed orthogonal design manifolds предложены в работе [Bernstein et al., 2008b].

В метамоделировании при решении задачи снижения размерности возможно учитывать различные знания и модели предметной области, что приводит к новым неклассическим задачам снижения размерности, решения которых обеспечивают существенно более высокое качество процедур. Такие знания могут состоять в наличии прикладных параметрических моделей, описывающих объекты [Chernova et al., 2009], или в знании дополнительных характеристик экспериментов, в которых были получены данные [Bernstein et al., 2008c].

Если удалось снизить размерность множества X, то задача аппроксимации функции FM(x) может быть (приближенно) заменена задачей аппроксимации функции y = fM() FM(Rm()) Rq, зависящей от параметра меньшей размерности m<p, based on data set DN,m ={(i = Cm(xi), yi = FM(xi)), i = 1, 2, … , N}. Построенная в результате суррогатная модель FSM(xDN, ) будет иметь вид fSM(Cm(x)DN,m). Однако для того, чтобы такая суррогатная модель имела достаточную точность, необходимо, чтобы процедура снижения размерности обеспечивала не только близость в пространстве аргументов x (малую ошибку восстановления m()), но и функциональную близость FM(x) » FM(Rm(Cm(x))) [Bernstein et al., 2008d]. В докладе [Bernstein et al., 2010e] рассмотрено другое применение процедуры снижения размерности в задачах аппроксимации, в котором требуется только функциональная близость FM(x) » fM(Cm(x)).

Процедура снижения размерности определяет в Rp m-мерное параметрическое многообразие Gm = {Rm(), Rm}, аппроксимирующее

199

множество данных X. При фиксированной процедуре восстановления Rm(), оптимальная процедура сжатия Cm(x) является процедурой проектирования на многообразие Gm: Cm(x) = arg minx - Rm(). С другой стороны, при фиксированной процедуре сжатия Cm, задача построения наилучшей процедуры восстановления Rm, минимизирующей ошибку m(), может быть рассмотрена как следующая задача аппроксимации: по множеству {(xi, i = Cm(xi)), i = 1, 2, … , N} построить функцию x = Rm(), минимизирующую ошибку (ixi - Rm(i))2)1/2

[Bernstein et al., 2009c].

3. Выводы27. В настоящее время метамоделирование является одним из

наиболее популярных методов анализа и оптимизации сложных технических объектов в инженерных приложениях. По этой причине усиленно развиваются теоретические основы метамоделирования, в результате чего публикуется большое количество статей и монографий, в основном на английском языке.

28. В большинстве публикаций процесс построения суррогатной модели с помощью методов метамоделирования по существу сводится к решению задачи восстановления неизвестной зависимости. Однако детальный анализ задач предсказательного метамоделирования показал, что правильная постановка задачи предсказательного метамоделирования должна состоять в решении нескольких взаимосвязанных задач анализа данных, когда выходные данные одной частной задачи являются входными данными для другой частной задачи, и целевые функции для частных задач нельзя определить независимо для каждой из частных задач [Bernstein et al., 2008a], [Bernstein et al., 2009a], [Kuleshov et al., 2008b].

29. Предыдущий вывод может быть проиллюстрирован задачей построения суррогатной модели в ситуации, когда входные параметры модели принадлежат неизвестному многообразию меньшей размерности. В случае, когда размерность входного пространства признаков X велика, стандартные методы построения суррогатных моделей на основе методов восстановления неизвестной многомерной зависимости не срабатывают. В то же время встраивание процедуры снижения размерности в процесс построения суррогатной модели позволяет строить эффективные суррогатные модели.


200

[Bernstein et al., 2007] Bernstein A., Kuleshov A., Sviridenko Yu. and Vyshinsky V. Fast Aerodynamic Model for Design Technology // Proceedings of West-East High Speed Flow Field Conference. Nov. 19-22, Moscow, Russia. 2007. http://wehsff.imamod.ru/pages/s7.htm.

[Bernstein et al., 2008a] Bernstein A. and Kuleshov A. Mathematical Methods in Engineering Cognitive Technologies // Survey in Applied and Industrial Mathematics, Ser. “Probability and Statistics”. 2008. № 15(3), 451 – 452.

[Bernstein et al., 2008b] Bernstein A. and Kuleshov A. Construction of orthogonal non-linear manifolds in the problem of dimension reduction // Proceedings of VII-th International School-Seminar “Multivariate statistical analysis and Econometrics. 21-30 September, 2008, Tsahkadzor (Republic of Armenia)”. Central Economics and Mathematics Institute of RAS, Moscow, 2008. 25-27.

[Bernstein et al., 2008c] Bernstein A. and Kuleshov A. Dimension reduction problem with explanatory variables (predicates) // Information Processes. Electronic Scientific Journal http://www.jip.ru/Contents.htm, 2008. № 8(1), 47-57.

[Bernstein et al., 2008d] Bernstein A. and Kuleshov A. Cognitive technologies in the problem of dimension reduction of geometrical object descriptions // Information technologies and computer systems, 2008. № 2, 6-19.

[Bernstein et al., 2008e] Bernstein A., Burnaev E. and Kuleshov A. On a methodology for constructing approximations of multidimensional dependences. In Plenary and Selected Papers of the Fourth International Conference “Parallel Computations and Control Problems”, October 27-29, 2008, Moscow, Russia. 56-62.

[Bernstein et al., 2009a] Bernstein A., Burnaev E. and Kuleshov A. Intellectual Data Analysis in Metamodeling. Proceedings of XVII All-Russian Seminar “Neuroinformatics and its applications to Data Analysis (Krasnoyarsk, October 2 – 4, 2009), 2009. 23 – 28.

[Bernstein et al., 2009b] Bernstein A. and Kuleshov A. Cognitive Technologies for Data and Knowledge Application. // Survey in Applied and Industrial Mathematics, Ser. “Probability and Statistics”. 2009. № 16(5).

[Bernstein et al., 2009c] Bernstein A. Approximation of dependencies as a Dimension reduction problem // Survey in Applied and Industrial Mathematics, Ser. “Probability and Statistics”. 2009. № 16(5).

[Bernstein et al., 2010d] Bernstein A. and Burnaev E. Invariant approximation and its application for integration of data-domain knownledge into metamodels // Proceedings of 9th International Conference Computer Data Analysis and Modeling: Complex Stochastic Data and Systems, September 7-11, Minsk, Belarus, 2010.

[Bernstein et al., 2010e] Bernstein A., Burnaev E., Belyaev M. and Prihodko P. Dimension reduction as a part of function approximation problem // Proceedings of 9th International Conference Computer Data Analysis and Modeling: Complex Stochastic Data and Systems, September 7-11, Minsk, Belarus, 2010.

[Burnaev et al., 2009a] Burnaev, E., Grihon, S. Construction of the Metamodeles in Support of Stiffened Panel Optimization. Extended abstracts of VI International Conference “Mathematical Methods in Reliability. Theory. Methods. Applications” (MMR-2009), Moscow 22-29 June, 2009, p. 124 – 128.

[Burnaev et al., 2010b] Burnaev E., Belyaev M. and Prihodko P. Approximation of multidimensional dependency based on an expansion in the parametric functions from the dictionary// Proceedings of 9th International Conference Computer Data

201

Analysis and Modeling: Complex Stochastic Data and Systems, September 7-11, Minsk, Belarus, 2010.

[Burnaev et al., 2010c] Burnaev E., Belyaev M. and Lokot A. Model selection in function approximation problem based on statistical learning theor // Proceedings of 9th International Conference Computer Data Analysis and Modeling: Complex Stochastic Data and Systems, September 7-11, Minsk, Belarus, 2010.

[Burnaev et al., 2010d] Burnaev E. and Prihodko P. Clustering in dimension reduction for function approximation problem // Proceedings of 9th International Conference Computer Data Analysis and Modeling: Complex Stochastic Data and Systems, September 7-11, Minsk, Belarus, 2010.

[Chernova et al., 2009] Chernova S. and Ivanova E. Reduction of complex geometrical object dimension in the presence of particular parametric models. // Artificial Intelligence and Decision Making, 2009. № 3, 53 – 58.

[Forrester et al., 2008] Forrester A.I.J., Sobester A. and Keane A.J. Engineering Design via Surrogate Modelling. A Practical Guide. Wiley, New-York, 2008.

[Kuleshov, 2008a] Kuleshov A. Cognitive technologies in adaptive models of complex objects // Information technologies and computer systems, 2008. № 1.

[Kuleshov et al., 2008b] Kuleshov A. The problems of multivariate statistical analysis in computer design systems. // Proceedings of VII-th International School-Seminar “Multivariate statistical analysis and Econometrics. 21-30 September, 2008, Tsahkadzor (Republic of Armenia)”, Central Economics and Mathematics Institute of RAS, Moscow, 2008. 60 – 61.

[Kuleshov et al., 2009c] Kuleshov A. and Bernstein A. Cognitive technologies in adaptive models of complex plants. // Keynote papers of 13th IFAC Symposium on Information Control Problems in Manufacturing (INCOM’09), June 3 – 5, Moscow. 2009. 70 – 81.

[Mitchel, 1997] Mitchel, T. Machine Learning. McGrow Hill, New-York, 1997.[Vapnik, 1998] Vapnik, V.N. Statistical Learning Theory. Wiley, New-York, 1998.[Vapnik, 2000] Vapnik, V.N. The Nature of Statistical Learning Theory. Springer,

New-York, 2000.[Wang et al., 2007] Wang G. and Gary Shan S. Review of Metamodeling Techniques in

Support of Engineering Design Optimization // J. Mech. Des.. 2007. № 129(3), 370-381.

202

СЕКЦИЯ 3

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И СЕМАНТИЧЕСКИЙ WEB

УДК 519.763

КОНЦЕПЦИЯ ИНВЕКТИВНЫХ ИМЕН: ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ДЛЯ

ФОРМАЛИЗАЦИИ СМЫСЛА КОМИЧЕСКИХ ТЕКСТОВ

Е. В. Михалькова ([email protected])ГОУ ВПО «Тюменский государственный университет»,

Тюмень

Статья посвящена проблеме создания модели формализованного описания семантики комических текстов. Для речевого акта насмешки автор предлагает концепцию инвективных имен. Четырехкомпонентная структура инвективного имени описывает эксплицитный и имплицитный уровни семантики, содержащие информацию об объекте осмеяния. Данная структура рассматривается на примере одной шутки.

ВведениеСовременная наука о комическом давно перешагнула границы одной

дисциплины. Ученые пришли к выводу, что невозможно рассматривать смех, юмор, механизмы и манифестации комического только с точки зрения психологии, лингвистики или антропологии. Подход, называемый «computational humor» (буквально, «компьютерный юмор») объединяет различные толкования комического в прикладной лингвистике с таким направлением в информатике, как компьютерная семантика и создание «human-friendly interfaces», которые давали бы пользователю ощущение общения, дружеской беседы с компьютером.

«Компьютерный юмор» ставит перед учеными две задачи: создать программу, которая понимает юмор, и создать программу, которая

203

производит юмор. Проекты в этой области можно разделить на три вида (табл. 1).

Первую задачу можно считать исполненной только для узкой сферы источников: каламбуры, шутки типа one-liner (юмористические фразы длиной в одно предложение) и light-bulb jokes (шутки, начинающиеся фразой «Сколько N потребуется, чтобы вкрутить лампочку?»). Вторая задача затрагивает механизмы автоматизированного речепорождения, и здесь картина несколько иная. На данном этапе уже разработаны такие программы, как JAPE, HAHAcronym, STANDUP и др., которые производят/порождают каламбуры и акронимы, кажущиеся людям смешными. Они используют фонетические словари, тезаурусы типа Wordnet, программы, применяемые для грамматического и семантического анализа текста (Embodied Construction Grammar, Na¨ıve Bayes, Support Vector Machines).

Табл. 1.Создание программ, распознающих юмор

Создание программ, распознающих и

генерирующих юмор

Создание программ, генерирующих юмор

Takizawa et al. pun-detecting program,

1996[Ritchie, 2004]

Semantic Script Theory of Humor

(SSTH) by S. Attardo and V. Raskin

[Attardo, 2001]

JAPE – pun-generating program by

K. Binsted and G. Ritchie

[Binsted, 1997]Knock-knock jokes

recognizer by Taylor, J. M. and Mazlack, L.

J. [Taylor, 2004]

HAHAcronym project by C. Strapparava and O. Stock [Strapparava,

2003]

STADNUP (System to Augment Non-

speakers’ Dialogue Using Puns) by G.

Ritchie et al. [Ritchie, 2006]

One-liner joke recognizer by R. Mihalcea and C.

Strapparava [Mihalcea, 2005]

JESTER by D. Gupta, M. Digiovanni, H.

Narita, and K. Goldberg [Gupta]

Implementation of Embodied

Construction Grammar language-

understanding system in joke-analysis [Bergen, 2006]

Anaphoric resolutions (for embodied agents, like chat-bots) by A.

Nijholt [Nijholt, 2006]

204

Отрицательной стороной этих программ является то, что лишь часть полученных текстов вызывает смех или улыбку пользователя: в диалоге между человеком и компьютером машинный юмор кажется оторванным от контекста, нарочитым, ограниченным. К. Хемпельманн даже называет такие генераторы юмора программами с «нулевым интеллектом» (zero intelligence [Hempelmann, 2008]). Причин этому множество, ведь юмор является специфической чертой человеческого общения и требует реализации множества условий – семантических, грамматических, прагматических. Их изучение и формализация потребует обширного труда.

С другой стороны, юмор допускает составление любого вида таксономий, в зависимости от цели исследования. Поэтому ученые могут сосредоточить внимание на отдельном приеме (например, каламбуре), на позиции шутки в диалоге (анафора), на чертах комической семантики (поиск несоответствий). В нашем исследовании мы обратили внимание на прагматические закономерности насмешки, и обнаружили, что в ее семантике есть базовый структурный элемент, связанный с альтернативным именованием осмеиваемого объекта.

1. Концепция инвективных именРассмотрим прагматические правила, регулирующие образование

речевого акта насмешки. Прагматический анализ был осуществлен с помощью метода, предложенного Дж. Сёрлем в статье «Что такое речевой акт?» [Сёрль, 2004].:

Правило 1. Правило пропозиционального содержания. Пропозициональным содержанием насмешки будет то имя (признак или характеристика), которое говорящий приписывает адресату. Это имя в комической ситуации обозначено как инвективное.Правила 2 и 3. Подготовительные правила. Они обусловливают коммуникативные стратегии говорящего («вызывает на поединок», «нападает») и слушающего (не желает стать объектом инвективы, «готовится дать отпор»).Правило 4. Правило иллокуции. Насмешку следует произносить, только если говорящий намерен показать, что его социальный статус выше, чем статус осмеиваемого. Так возникает аспект обвинения.Правило 5. Агональное правило (перлокуция). Произнесение насмешки открывает враждебное отношение говорящего и нацелено вызвать ответную враждебность слушающего. Насмешка считается вызовом на словесный поединок и переводит реальное оскорбление в шутливое (участникам должно быть ясно, что происходящее – игра, агон). Итак, исходя из Правила 1. в комической ситуации пропозицию

высказывания составляет инвективное имя, которое в акте насмешки

205

адресант сообщения приписывает адресату – прямо (с помощью перформативных глаголов называния) или косвенно (через постановку ирреальных условий, гиперболизацию реальной ситуации и т. п.). Инвективным именем мы будем считать тот набор признаков и характеристик, который в процессе называния адресата (H – от англ. hearer «слушатель») различается с реальным именем адресата так, что снижает его статус, обнаруживая за ним какую-либо вину (например, нарушение общественного порядка). Инвективное имя (d – от англ. derision «насмешка») можно представить формулой: «Н есть не Н, а d». Можно также предположить усеченный вариант этой формулы «Н есть d», где «d не-Н». В тексте комического сообщения инвективное имя может быть представлено как отдельным словом, так и словосочетанием: чаще всего это необычная характеристика, данная объекту, и следующее за ней пояснение, которое открывает третьей стороне (аудитории, зрителям, присутствующим), почему адресант дал такое имя адресату. Это пояснение – часть инвективы – чаще всего и вызывает смех аудитории.

Остается еще один компонент, который делает структуру инвективного имени симметричной: реальные черты и характеристики Н, которые стали основанием для насмешки. Обозначим их как «не-d».

Таким образом, инвективное имя можно представить в виде пропорции: Н/не-d = не-Н/d.

Рассмотрим пример насмешки из телешоу Камеди Клаб: «Если бы Рембо провел во Вьетнамском плену двадцать лет, он бы выглядел именно так – Вадик Рембо Галыгин» [Ведущий Арташес Саркисян объявляет выход Вадика «Рембо» Галыгина, вып. 21]. Инвективное имя в данном примере состоит из следующих компонентов:

1. H (реальное имя, объект насмешки) – Вадим Рембо Галыгин, резидент/участник телешоу Камеди Клаб;

2. не-d (реальные факты, черты, характеристики объекта) – худой, хилый;

3. не-Н (инвективное имя) – Рембо (персонаж Сильвестра Сталлоне);4. d (факты, черты, характеристики, приписываемые объекту, которые

дополняют или поясняют Н) – провел 20 лет в плену во Вьетнаме.Не-Н является вторичным, окказиональным именованием Н и на

уровне экспликации не имеет с ним семантических пересечений (Вадим Галыгин мог взять себе любой сценический псевдоним, и затем этот псевдоним мог стать основанием для насмешки). Компонент d делает его закономерным, так как содержит ложную информацию об объекте насмешки, приписываемую обоим компонентам Н и не-Н: ни Рембо, ни Вадим Галыгин не были в плену в течение двадцати лет, но в насмешке такое предположение допустимо.

206

2. Проблемы формализованного описания инвективных именСчитается, что проблема автоматизированного анализа и

генерирования юмора входит в круг задач, которые могут быть решены только на поздних этапах разработки искусственного интеллекта ([Strapparava, 2003], [Nijholt, 2006]), так как юмор привязан к уровню смысла и поэтому с трудом поддается формализации. Более того, адекватное восприятие юмора требует обширных знаний о мире и его устройстве. Речь идет даже не о знании, полученном машиной в ходе систематизации адекватного употребления человеческого языка – через словари и грамматические правила (например, лексема в непривычном контексте может указывать на то, что в тексте присутствует ирония или каламбур), но о чувственных, эмпирических образах вещей. Так, в вышеуказанном примере требуется знание о внешности Вадима Галыгина (очень худой) и знание о внешности Рембо (мускулистый), чтобы сделать вывод, что Вадима Галыгина высмеивают за худобу и слабость.

Если бы в тексте присутствовала содержательно-фактуальная информация (СФИ – [Гальперин, 1981]) о том, что Вадим Галыгин воевал во Вьетнаме и попал в плен, то, очевидно, в этом контексте его высмеивали бы за то, что он неудачник (неудалой солдат, в отличие от Рембо, который благополучно вернулся из Вьетнама), т.к. не мог выбраться из плена целых двадцать лет. Тогда внешность Вадима Галыгина отличали бы черты восточной культуры либо военная символика. Но поскольку Вадима высмеивают не за военные неудачи, а за внешний вид, можно сделать вывод, что в данном примере экстра-лингвистический контекст (худоба) доминирует над лингвистическим (плен). Кроме того, сослагательное наклонение (если бы) указывает на предполагающий характер данного утверждения, а экстралингвистический контекст имплицитно заполняет лакуну между «выглядел именно так (lacuna) Вадик Рембо Галыгин»: (именно таким худым и слабым).

Таким образом, предполагается, что это утверждение будет классифицироваться зрителем «Камеди клаб» как юмористическое на том основании, что вместо СФИ об объекте речи – Вадиме Галыгине – зрителю предлагают декодировать содержательно-подтекстовую информацию (СПИ – [Гальперин, 1981]), которая имплицитно связывает Вадима Галыгина с Рембо.

В решении концепции инвективных имен для шуток о реальных лицах или предметах действительности проблемным представляется автоматизированное выявление СПИ в лакунах юмористических текстов, так как здесь существуют:

207

1. Перенос ключевой информации на уровень импликатуры: СПИ апеллирует к множеству знаний о мире, которые могут и не быть выражены вербально (так, например, сделать вывод о худобе человека можно в первую очередь визуально);

2. Множественность решений для лакун: не ясно, как определить, какая информация об объекте актуализируется на уровне импликаций в данном тексте, чтобы определить ее истинность (то, что Вадим Галыгин – худой, служил во Вьетнаме, провел 20 лет в плену, похож на Вьетнамца, похож на Рембо; только визуальный анализ внешности помогает установить, что Галыгина высмеивают за худобу).

Данную проблему представляется возможным решить с помощью создания базы данных инвективных имен и правил их образования.

2.1. Типы инвективных имен и уровни семантикиИсследование 563-х шуток, проведенное на материале выступлений из

телешоу «Камеди клаб» и «Saturday Night Live», показало, что инвективные имена делятся на десять типов: о физических недостатках, умственных недостатках, возрасте, социальном статусе, звериной природе, девиантном социальном поведении, деструктивной природе, нетипичном сексуальном поведении, странных пищевых пристрастиях, происхождении и родственных связях. Для каждого типа характерно употребление определенных лексем, которые описывают общие признаки объекта осмеяния: внешность, поведение, состояние и т.д. Так, в описании комплекции в исследованных именах встретились лексемы «худой», «тощий», «толстый», «жирный» и т.д. Уровень общих признаков в семантике имен мы обозначили как архетипический. Стоит отметить, что этот уровень реже всего выражен в СФИ – обычно адресат насмешки должен сам догадаться, почему объект был подвергнут осмеянию.

Следующий уровень – уровень стереотипной семантики. Здесь общие признаки привязаны к конкретной группе лиц, животных, предметов. Так, в осмеянии комплекции лексема «толстый» может сочетаться с лексемой «сумоист», а лексема «худой» с лексемой «военнопленный» из группы стереотипов о профессиях.

Наконец, третий уровень – уровень реалий и современного информационного контекста. В рассмотренной выше шутке реалиями являются два имени – Рембо и Вадим Рембо Галыгин, историко-географическая реалия «вьетнамский плен» и временная реалия «20 лет». Этот уровень наиболее переменчив и непроницаем для людей, помещенных в другой, нежели адресант шутки, информационный контекст (для понимания шутки необходимо знать, кто такие Рембо и Вадим Рембо Галыгин и чем опасен вьетнамский плен). Поэтому полное

208

описание его составляющих представляется невозможным. С другой стороны, его приближенность к информационному фону обычного человека обеспечивается количеством проанализированных и внесенных в базу данных инвективных имен – чем больше имен, тем больше вероятность распознавания смысла шутки.

2.2. Правила образования инвективных именПока нами не разработаны универсальные правила, по которым

строится шутка, содержащая инвективное имя, но концепция предполагает соблюдение пропорции: Н/не-d = не-Н/d. Так, рассматриваемую шутку можно представить через эти компоненты следующим образом: «Если бы не-Н сделал d, то стал бы Н, так как Н/не-d».

Неизвестным компонентом в данной шутке остается не-d (худой). Допустим, в базе данных в уровне реалий есть словосочетание «Вадим Галыгин» (Н), которое соотносится в уровне архетипа с рядом лексем, в том числе лексемами «худой», «хилый» (предположительно не-d). Тогда в правой части пропорции анализируются реалии «Рембо» (не-Н), «20 лет», «вьетнамский плен» (d). Реалия «20 лет» будет скорее всего отсутствовать или соотноситься с группой литературных стереотипов (через роман А. Дюма «20 лет спустя»). На уровне стереотипа «Рембо» и «вьетнамский плен» соотносятся с общий для этих двух реалий лексемой «военнопленный», которая в свою очередь на уровне архетипа соотносится со следующими типами инвективных имен: социальный статус – неудачник, побежденный, проигравший; внешний вид – худой, хилый, изможденный; физические недостатки – слабый, хилый. Тогда приоритетным значением не-d становится совпавшее для реалий «Вадим Галыгин», «Рембо», «вьетнамский плен» на уровне архетипа значение «хилый, худой».

2.3. ПроверкаПроверку искомого значения можно осуществлять через поиск в

Интернете по ключевым словам. Простой поиск в Google по словам «Галыгин худой» дает следующий результат:

Вадик Галыгин снова женится? // KP.RU6 фев 2010 ... Развод с супругой Дашей, с которой Вадик Галыгин прожил вместе семь .... Оба худые, ноги у нее ужас.

Рост Тимура Родригеса из Камеди Клаб?Помню смотрел невошедшее в эфир видео, так там было явно заметно, что Галыгин Ниже Батрудинова. Просто Галыгин очень худой и кажется, что высокий.

209

Comedy Club - Комеди Клаб - Галыгин и Таш - интервью в ЧелябинскеГалыгин: – На самом деле, паспорт у меня белорусский. Но латышского во мне ничего нет, зато есть польские корни. Хотя кто его знает… – Вадик, вы такой худой…

3. ПрименениеОтметим, что создание программы, осуществляющей поиск

инвективных имен в тексте, нацелено в первую очередь на научное обоснование истинности самой концепции, так как данная концепция описывает смысловую структуру юмора, а не формальные признаки, вроде фонетической игры или семантического несоответствия. Тем не менее возможно ее применение в разработке «human-friendly interfaces», а также при составлении интернет-дайджестов и пресс-портретов.

Благодарности. Работа выполнена в рамках федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» (государственный контракт № 02.740.11.0594).

Список литературы[Гальперин, 1981] Гальперин И. Р. Текст как объект лингвистического

исследования. – М.: Наука, 1981. [Сёрль, 2004] Сёрль Дж. Р. Что такое речевой акт? // Философия языка: Сб. статей

под ред. Дж. Р. Сёрля. – М.: Едиториал УРСС, 2004. [Bergen, 2006] Bergen B., Coulson S. Frame-shifting humor in simulation-based

language understanding // IEEE Intelligent Systems. – Mar./Apr. 2006. – 21(2). [Binsted, 1997] Binsted K., Ritchie G. Computational rules for generating punning

riddles // Humor: International Journal of Humor Research. – 1997.– 10(1). [Gupta] Gupta D., Digiovanni M., Narita H., Goldberg K. JESTER. –

http://shadow.ieor.berkeley.edu/humor/[Hempelmann, 2008] Hempelmann C. Computational humor: Beyond the pun? // The

Primer of Humor Research. Ed. by V. Raskin. – Berlin, New York: Mouton de Gruyter, 2008.

[Mihalcea, 2005] Mihalcea R., Strapparava C. Making computers laugh: investigations in automatic humor recognition // Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing. – Vancouver, British Columbia, Canada, 2005.

[Nijholt, 2006] Nijholt A. Embodied conversational agents: “A little humor too” // IEEE Intelligent Systems. – Mar./Apr. 2006. – 21(2).

[Ritchie, 2004] Ritchie G. The Linguistic Analysis of Jokes. – Routledge, 2004.[Ritchie, 2006] Ritchie G., Manurung R., Pain H., Waller A., O’Mara D. The

STANDUP interactive riddle-builder // IEEE Intelligent Systems. – Mar./Apr. 2006. – 21(2).

210

[Strapparava, 2003] Strapparava C., Stock O. Getting serious about the development of computational humor // Proceedings of the 18 th International Joint Conference on Artificial Intelligence. – Morgan Kaufman, 2003.

[Taylor, 2004] Taylor J. M., Mazlack, L. J. Computationally recognizing wordplay in jokes // Proceedings of Cognitive Science Conference. – Stresa, Italy, 2004.

211

УДК 681.3.01

СЕМАНТИЧЕСКИЙ СЛОВАРЬ СИСТЕМЫ ИНФОРМАЦИОННОГО МОНИТОРИНГА И

ЭЛЕМЕНТЫ ФОРМАЛИЗАЦИИ ЕГО СТАТЕЙ

О. С. Кожунова ([email protected])Учреждение Российской академии наук Институт проблем

информатики РАН (ИПИ РАН), Москва

В работе описывается лингвистический проблемно-ориентированный ресурс системы информационного мониторинга на примере макета семантического словаря информационно-технологической системы мониторинга РАН (ИТСМ РАН).

ВведениеСегодня для успешного функционирования больших систем

необходимо гибкое и адаптивное лингвистическое обеспечение. В связи с этим привлекается большое количество лингвистических ресурсов и инструментов, используемых в сфере информационных технологий. Среди таких ресурсов в качестве наиболее продуктивных зарекомендовали себя средства поиска и представления информации, таксономии, классификации, компьютерные лексиконы, лексические базы данных, тезаурусы, базы знаний, концептуальные схемы, онтологии, семантические сети [Arano, 2005].

Среди наиболее востребованных ресурсов лидируют такие средства представления знаний как онтологии и тезаурусы. Это во многом обусловлено стремлением разработчиков систем максимально приблизить описания фрагментов областей знаний к естественно-языковым реалиям с их многообразием иерархии концептов, отношений и отсылок к другим источникам информации. В частности, онтологии могут применяться для спецификации имен и значений терминов, а в тезаурусах акцент смещен в сторону семантической составляющей и связей между понятиями [Arano, 2005]. Примерами известных общедоступных онтологий могут служить OPENCYC, SUMO, DOLCE, SOWA’S ONTOLOGY, WordNet, и т.д.[Zatsman et al., 2008].

В работе описывается один из вариантов реализации проблемно-ориентированного лингвистического ресурса предметной области в системе информационного мониторинга на примере разрабатываемой в

212

Институте проблем информатики РАН информационно-технологической системы мониторинга РАН (ИТСМ РАН) и интегрированного в нее макета семантического словаря.

1. Семантический словарь системы информационного мониторинга

Как правило, традиционные семантические словари и тезаурусы позволяют получить информацию о терминах, являющихся дескрипторами словарей, их дефинициях и примерах использования. Однако для решения задач мониторинга, анализа и оценки кроме таких сведений пользователю системы мониторинга необходимо иметь дополнительную информацию об алгоритмах вычисления индикаторов7, а также основных терминов области [Зацман, 2005].

Для обеспечения согласованного понимания и использования индикаторов в процессе информационного мониторинга был разработан проблемно-ориентированный семантический словарь, который включает названия показателей следующих четырех категорий [Зацман, 2005]:индикаторы результатов, эффективности и результативности программ и проектов научных исследований [Зацман, 2005],критерии принятия решений в процессе организации и финансирования программ и проектов,нормативно заданные экономические, финансовые и другие параметры финансирования и управления программами и проектами,экспертные оценки результатов, эффективности и результативности программ и проектов.

Кроме того, разработка такого словаря была мотивирована тем, что традиционные словари и другие лингвистические ресурсы не обладают той степенью эпистемологичности, которая необходима для отображения особенностей области мониторинга и классификации ее разнородных терминов. Поэтому было принято решение сформировать структуру словаря на основе схемы классификации, полученной в результате анализа Приказа № 68 и других нормативных документов области мониторинга, а также категоризации ее терминов – показателей [Приказ, 2006]. Разные категории показателей могут быть связаны между собой родовидовыми и функциональными тезаурусными отношениями.

При использовании классификационного метода в процессе разработки семантического словаря (как средства уточнения смысла индикаторов результатов научной деятельности) автором были

7 Индикаторы – количественные оценки, вычисляемые на основе информационных ресурсов системы мониторинга.

213

рассмотрены и учтены следующие гипотезы и базовые положения [Зацман, 2008], [Кожунова, 2006]:

1. нормативные документы редко содержат явные определения индикаторов и других показателей;

2. иногда значения индикаторов с одинаковыми названиями определены по-разному в различных публикациях;

3. иногда индикаторы научной деятельности неодинаково интерпретируются лицами, принимающими решения, менеджерами, экспертами, специалистами по оценке, лингвистами и IT-специалистами;

4. существуют индикаторы, зависящие от нескольких параметров, изменение которых изменяет их численные значения (например, значения индексов цитирования зависят от глубины ретроспективы используемого массива научных статей). Кроме того, индикаторы могут зависеть от выбора варианта используемого алгоритма вычисления, что может изменить их смысл;

5. численные значения индикаторов могут зависеть от числа записей в используемых нормативных файлах и содержания этих записей (например, значения индексов цитирования зависят от списка используемых журналов).

Вышеперечисленные аспекты нашли применение при разработке автором процедуры уточнения смысла индикаторов, которая была проведена в два этапа.

На первом этапе осуществляется встраивание каждого предлагаемого к использованию индикатора в классификационную схему, полученную в результате категоризации показателей. Размещение в схеме позволяет согласовывать предварительное понимание значения индикатора, которое можно извлечь из этой схемы.

На втором этапе происходит уточнение смысла индикаторов посредством формирования и использования словарных статей, имеющих связи с нормативными, информационными и алгоритмическими компонентами системы мониторинга [Кожунова, 2006], [Кожунова, 2007].

Разработанная итеративная процедура согласования смысла индикаторов одновременно использует несколько компонентов ИТСМ РАН (рис.1) [Кожунова, 2008], [Кожунова, 2009]:нормативный компонент системы;семантический словарь с названиями и определениями видов индикаторов, критериев, параметров и экспертных оценок;информационные ресурсы ИТСМ РАН и их структурные схемы (информационный компонент системы);

214

библиотеку алгоритмов и программ ИТСМ РАН (алгоритмический компонент системы).

Рис. 1. Связи семантического словаря с видами обеспечения ИТСМ РАН

Конструктивная новизна разработанного макета семантического словаря состоит в том, что он позволяет не только решать проблемы компьютерной лингвистики, свойственные данной предметной области (например, согласование понимания смысла индикаторов и частная референция [Кожунова, 2007]), но и наглядно демонстрирует один из методов проектирования и реализации лингвистического обеспечения для новой предметной области. Словарь содержит ссылки на информационные и алгоритмические ресурсы, а также на нормативные документы как источники терминов предметной области. Инструмент с таким сочетанием функций для области информационного мониторинга предложен впервые [Кожунова, 2007], [Кожунова, 2008], [Кожунова, 2009].

2. Параметризуемые статьи семантического словаряСловарная статья разработанного семантического словаря имеет

параметрический характер, поскольку содержит несколько параметров поиска и обработки найденных информационных полей, сочетание которых является запросом для вычисления значений индикаторов. Такая характеристика словарной статьи является одним из аспектов функциональности и позволяет частично относить семантический словарь ИТСМ РАН к формальным онтологиям. Программы вычисления всех

215

вариантов хранятся в библиотеке ИТСМ РАН и могут быть использованы в задачах вычисления значений индикаторов [Кожунова, 2009].

Рассмотрим аспекты разработки семантического словаря ИТСМ РАН в ракурсе элементов формализации его статей. Словарь является частью системы информационного мониторинга, спроектированной и реализованной совместными усилиями сотрудников ИПИ РАН и ЦЭМИ РАН [Zatsman et al., 2008], [Кожунова, 2008], [Кожунова, 2009]. Семантический словарь, основанный на классификационной схеме показателей мониторинга, позволяет просматривать все уровни иерархии этой схемы (рис. 3, 4) и вычислять отдельные индикаторы (в частности, «индексы самоцитирования в описаниях изобретений»). Кроме того, ввиду особенностей проектирования и реализации схемы в ней существует возможность расширения, как существующих категорий, так и добавления новых показателей (рис. 3, 4). Xsd-представление, построенное автором для классификационной схемы словаря, основано на следующей схеме данных (рис.2):

Рис. 2. Схема данных для формирования xsd-представления классификационной схемы семантического словаря

С точки зрения программной реализации соответствующего лингвистического ресурса, xsd-представление с рекурсивной ссылкой позволяет формировать уровни иерархии внутри схемы с необходимой разработчику степенью подробности.

Таким образом, построение новых индикаторов возможно посредством их последовательной интеграции на нужные уровни иерархии и дальнейшего определения в семантическом словаре (рис. 4). Это расширяет функциональные возможности ИТСМ РАН и позволяет не только описывать новые термины и понятия в семантическом словаре, но и устанавливать между ними необходимые связи и наглядно демонстрировать их на общей схеме классификации [Кожунова, 2008], [Кожунова, 2009].

216

Словарные статьи семантического словаря в системе информационного мониторинга структурированы с учетом потребностей пользователей системы мониторинга.

Каждая статья содержит параметризуемую дефиницию (то есть определение значения индикатора, зависящее от нескольких модифицируемых параметров) и поэтому носит название параметризуемой. Для отдельно вычисляемого индикатора параметризуемая статья включает все необходимые для вычисления его значений параметры. Каждая статья связана с отдельной группой индикаторов в классификационной схеме. В ней представлены разные уровни классификации индикаторов с возможностями выбора вариантов их вычисления и ссылкой на внешние информационные, алгоритмические и нормативные компоненты системы [Кожунова, 2008], [Кожунова, 2009].

Необходимо подчеркнуть, что в основе формы параметризуемой статьи лежат параметры и поля запроса (рис. 5). Тем самым, конечными результатами выполнения запроса являются не найденные информационные поля, как это происходит при выполнении типичных поисковых запросов, а результат обработки найденных информационных полей. Поэтому, при построении запроса используются параметры обработки найденных информационных полей. Таким образом, формируемый запрос является комплексным запросом на поиск в БД и вычисление значений индикаторов на основе статей семантического словаря системы информационного мониторинга.

На данный момент в макете семантического словаря реализована параметризуемая статья для группы индикаторов «индекс самоцитирования авторов описаний изобретений» (рис. 5). В состав параметров поиска этой статьи включены фамилия, имя, отчество авторов патентов, временной промежуток (отбор патентов по дате их публикации на сайте Роспатента) и отбор патентов по рубрикам МПК. Использование вычисляемых параметров в статьях семантического словаря с обращением к внешним по отношению к словарю ресурсам реализовано впервые [Кожунова, 2009].

217

Рис. 3. Макет реализованной классификационной схемы семантического словаря ИТСМ РАН

Рис.4. Добавление новых групп индикаторов

218

Рис. 5. Классификационная схема семантического словаря ИТСМ РАН

ЗаключениеВ работе представлен разработанный для ИТСМ РАН макет

семантического словаря. Разработка макета семантического словаря для предметной области с таким набором функций и формой представления является одной из первых попыток проектирования и реализации проблемно-ориентированного лингвистического ресурса для области информационного мониторинга. В частности, среди его отличительных особенностей, характеризующихся новизной, можно отметить следующие:построение гибкой и легко модифицируемой классификационной схемы в качестве структуры семантического словаря ИСТМ РАНналичие связей словарных статей с внешними по отношению к нему ресурсами: алгоритмическими, информационными и нормативными;использование в качестве статей семантического словаря параметризуемых статей в виде текстовых дефиниций на естественном языке с интегрированными параметрами на поиск в базах данных и на вычисление значений индикаторов (на примере статьи для группы

219

индикаторов «индекс самоцитирования автора изобретения» с использованием ресурсов Роспатента).

Список литературы[Зацман, 2005] Зацман И.М. Терминологический анализ нормативно-правового

обеспечения создания систем мониторинга в сфере науки // Экономическая наука современной России, №4, 2005.

[Зацман, 2008] Зацман И.М., Веревкин Г.Ф., Шубников С.К. Моделирование систем мониторинга. – М.: ИПИ РАН, 2008.

[Кожунова, 2006] Кожунова О.С. Моделирование пополнения семантического словаря // Системы и средства информатики. Вып. 16.- М.: Наука, 2006.

[Кожунова, 2007] Кожунова О.С. Семантический словарь терминов системы оценки результативности в сфере науки // Материалы международной конференции «MegaLing’2007», Партенит, 2007.

[Кожунова, 2008] Кожунова О.С. Классификационная схема семантического словаря системы мониторинга: опыт применения в процессе оценки результативности научной деятельности // Труды международной конференции Диалог-2008 "Компьютерная лингвистика и интеллектуальные технологии". – М.: Изд-во РГГУ, 2008.

[Кожунова, 2009] Кожунова О.С. Технология разработки семантического словаря системы информационного мониторинга: диссертация канд. техн. наук / О.С. Кожунова; Учреждение Российской академии наук Институт проблем информатики РАН, 2009.

[Приказ, 2006] Совместный приказ Минобрнауки, Минздравсоцразвития и Российской академии наук N273/745/68 "Об утверждении видов, порядка и условий применения стимулирующих выплат, обеспечивающих повышение результативности деятельности научных работников и руководителей научных учреждений и научных работников научных центров РАН".

[Соловьев и др., 2006] Соловьев В.Д., Добров Б.В., Иванов В.В., Лукашевич Н.В. Онтологии и тезаурусы. – М., 2006.

[Arano, 2005] Arano S. Thesauruses and ontologies [on line]. "Hipertext.net", num. 3, 2005. http://www.hipertext.net.

[Zatsman et al., 2008] Zatsman I., Kozhunova O. Evaluating for institutional academic activities: classification scheme for R&D indicators // Proceedings of the 10th International Conference on Science and Technology Indicators (17th - 20th September 2008, University of Vienna, Austria). – Vienna: Austrian Research Center GmbH, 2008.

220

УДК 004.8

НОРМАЛИЗАЦИЯ КОНТЕКСТНО-СВОБОДНЫХ ГРАММАТИК ДЛЯ ЦЕЛЕЙ ГРАММАТИЧЕСКОГО

ВЫВОДА

C.Ю.Соловьев ([email protected])МГУ им. М.В. Ломоносова, Москва

В работе показывается, что на правила контекстно-свободных грамматик можно наложить существенные ограничения, которые позволяют развивать конструктивные методы грамматического вывода.

Задача грамматического вывода (восстановления грамматик) [Соловьев, 1985] в искусственном интеллекте и распознавании образов исследуется давно [Хант, 1978; Фу, 1977]. Считается, что построение грамматики по конечному множеству порожденных ею предложений соответствует построению базы знаний или решающего правила. Обычно конструктивные методы грамматического вывода разрабатываются для отдельных классов грамматик -суть- отдельных классов формальных языков. При этом существенно используются "тонкие" свойства порождающих грамматик. В настоящей работе показывается, что при восстановлении контекстно-свободных грамматик (КС-грамматик) можно использовать свойство факторизуемости правых частей правил вывода. Причем факторизуемость не сказывается на других важных свойствах КС-грамматик.

Контекстно-свободной грамматикой [Ахо и др., 1978] называется четверка G = < N, , P, S >, где

N - алфавит нетерминальных символов (нетерминалов); - непересекающийся с N алфавит терминальных символов

(терминалов);P - конечное множество правил вывода вида A, где A N, -

цепочка символов из N ;S - выделенный символ из N, именуемый начальным символом.В дальнейших выкладках будем полагать, что:

A, B, C обозначают нетерминалы; S - начальный символ; , обозначают непустые цепочки символов из N ; x, y обозначают непустые цепочки-предложения символов из ;

221

R(G,A) = { | A P} - множество всех правых частей A-правил из P;

Запись A {1, ..., n} означает множество правил { A1, ..., An }; запись A 1 | ... | n, также означает множество правил

{A1, ..., An}; запись G означает, что цепочка выводима из цепочки в

грамматике G, т.е. может быть получена из применением конечного числа правил;

L(G) = { x | S G x } – язык, порождаемый грамматикой G.Принятые соглашения, в частности, позволяют задавать КС-

грамматики множествами правил вывода.С точки зрения грамматического вывода класс КС-грамматик можно

изначально ограничить только такими грамматиками, в которых: отсутствуют e-правила - правила с пустой правой частью e - за

исключением быть может правила S e; отсутствуют бесполезные правила и недостижимые нетерминалы, не

участвующие в выводе предложений языка; обязательно содержится правило S #, причем начальный символ S и

уникальный терминал # в правых частях других правил вывода не встречаются.

Последнее ограничение фактически означает, что множество заданных для грамматического вывода предложений “насильно” пополнено предложением из одного уникального символа #. Использование дополнительного символа позволяет обособить начальный символ S и избежать большого числа оговорок. В частности: S не является рекурсивным; S не является простым, то есть R(G,S) содержит более одной цепочки; цепочки из R(G,S) не имеют общих префиксов и суффиксов.

Вместе с тем удалить в восстановленной грамматике правило S # труда не составляет.

Будем говорить, что нетерминал A допускает неукорачивающую левую факторизацию, если все предложения из R(G,A) могут быть представлены в виде i, где , 1, 2, ..., n - непустые строки. По-умолчанию будем полагать, что - префикс максимально возможной длины.

Если нетерминал A допускает неукорачивающую левую факторизацию в КС-грамматике G, то G можно трансформировать в грамматику GA, применив следующее ЛНФ-преобразование:- шаг 1 - исключить из G все A-правила;- шаг 2 - к оставшимся правилам добавить правила A 1 | 2 | ... | n;- шаг 3 - во всех правилах на местах нетерминала A разместить строку A.

Пример 1. Пошаговое выполнение ЛНФ-преобразования.

222

Грамматика G >> шаг 1S S | # S S | #S B | BA S B | BAA +B | +BAB D | DC B D | DCC *D | *DC C *D | *DCD (S) | a D (S) | a

>> шаг 2 >> шаг 3 = GA

S S | # S S | #S B | BA S B | B+AA B | BA A B | B+AB D | DC B D | DCC *D | *DC C *D | *DCD (S) | a D (S) | a

В общем случае:ЛНФ-преобразование является эквивалентным, т.е. L(G) = L(GA);в грамматике GA нетерминал A не допускает неукорачивающую левую факторизацию; нов грамматике GA может появиться [другой] нетерминал, допускающий неукорачивающую левую факторизацию.

Последнее обстоятельство иллюстрирует пример 2, в котором S получает статус нетерминала, допускающего левую факторизацию, по результатам ЛНФ-преобразования для нетерминала A.

Пример 2.Грамматика G >> ЛНФ для A >> ЛНФ для S

S S | # S S | # S aS | #S aa | Ab S aa | abAb S a | bAbA aba | abA A a | abA A a | abA

В связи с этим возникает вопрос: можно ли в КС-грамматиках, последовательно применяя ЛНФ-преобразования, полностью избавиться от нетерминалов, допускающих неукорачивающую левую факторизацию?

Положительный ответ на этот вопрос связан с одной численной характеристикой КС-грамматик. В КС-грамматиках (без бесполезных правил) каждому нетерминалу A можно однозначно приписать целое число h(A), равное длине самой короткой терминальной цепочки, выводимой из A. В общем случае

h() = min{ длина(x) | G x }.При этом всю грамматику можно охарактеризовать числом

h(G) = h(A) [ суммирование по всем AN ]

223

Например, для грамматики G из примера 1:h(S) = 1, h(S) = 1, h(A) = 2, h(B) = 1, h(C) = 2, h(D) = 1 и h(G) = 8.

Для результирующей грамматики GA:h(S) = 1, h(S) = 1, h(A) = 1, h(B) = 1, h(C) = 2, h(D) = 1 и h(GA) = 7.

В результате ЛНФ-преобразования всегда выполняется соотношение h(G) h(GA). В самом деле:h(B) не изменяется для нетерминалов B A; аh(A) = h(A) + h() > h(A), поскольку в грамматиках без e-правил h() 0.

Таким образом, применяя к некоторой исходной КС-грамматике G ЛНФ-преобразования, одновременно получаем убывающую последовательность положительных чисел

h1, h2, h3, …, (1)где h1 = h(G), h2 = h(GA), …, что гарантирует завершение процесса

устранения нетерминалов, допускающих неукорачивающую левую факторизацию. Для примера 2 последовательность (1) имеет вид: 6, 4, 3.

Аналогично рассматривается вопрос о неукорачивающей правой факторизации. Будем говорить, что нетерминал A допускает неукорачивающую правую факторизацию, если все предложения из R(G,A) могут быть представлены в виде i, где 1, 2, ... n, - непустые строки. По-умолчанию будем полагать, что - суффикс максимально возможной длины.

Если нетерминал A допускает неукорачивающую правую факторизацию в КС-грамматике G, то G можно трансформировать в грамматику GA, применив следующее ПНФ-преобразование:

- шаг 1 - исключить из G все A-правила;- шаг 2 - к оставшимся правилам добавить правила A 1 | 2 | ... | n;- шаг 3 - во всех правилах на местах нетерминала A разместить строку

A.Последовательность (1) для цепочки ПНФ-преобразований также

является монотонно убывающей и ограниченной снизу. Из этого следует, что в любой КС-грамматике можно избавиться от нетерминалов, допускающих неукорачивающую правую факторизацию.

Для определенности будем считать, что общий процесс неукорачивающей факторизации (НФ-преобразования) заданной грамматики состоит из последовательности процессовустранения нетерминалов, допускающих неукорачивающую левую факторизацию; иустранения нетерминалов, допускающих неукорачивающую правую факторизацию.

Рассмотрим влияние неукорачивающую факторизации на другие свойства КС-грамматик.

224

Свойство 1. Процесс устранения нетерминалов, допускающих неукорачивающую факторизацию, принципиально не порождает e-правила.

Заметим, что в традиционной задаче нисходящего синтаксического анализа [Кнут, 1978] процесс [левой] факторизации допускает порождение e-правил. Однако комбинация [левой] факторизации и удаление e-правил может породить бесконечный процесс преобразования исходной грамматики. Пример такого процесса приводится в примере 3.

Пример 3.Грамматика G >> Факторизация SS S | # S aS | #S a | a S S e | a S

>> Удалить S e >> Факторизация SS a | aS | #S a | a S и т.д.

Свойство 2. Процесс устранения нетерминалов, допускающих неукорачивающую факторизацию, не порождает простые правила. Другими словами, если исходная грамматика не содержала простые правила вывода, то это свойство сохраняется в результате НФ-преобразований.

Свойство 3. Процесс устранения нетерминалов, допускающих неукорачивающую факторизацию, может породить цепные правила вида A B. Если исходная грамматика не содержала цепные правила (за исключением быть может некоторых S-правил), то это свойство можно сохранить, включив в цепочку НФ-преобразований удаление цепных правил (см. пример 4).

Пример 4.Грамматика G >> ЛНФ для A

S S | # S S | #S aA | Ab S aaaA | aaAbA aab | aaB A b | BB (b) | a Sb B (b) | a Sb

>> Удалить A B >>S S | # h(S) = 1S aaaA | aaAb h(S) = 4A b | (b) | a Sb h(A) = 1B (b) | a Sb h(S) = 3

225

Очевидно, что удаление цепных правил не изменяет характеристику h преобразованной грамматики.

Свойство 4. Описанное в свойстве 3 удаление цепных правил может породить недостижимые нетерминалы и, соответственно, бесполезные правила вывода. Так, в примере 4 после удаления цепного правила A B нетерминал B становится недостижимым. В соответствии с принятыми ограничениями исходная грамматика не содержала бесполезных правил вывода. Это свойство можно сохранить, включив в цепочку НФ-преобразований удаление недостижимых нетерминалов.

Пример 4 (продолжение).>> Удалить BS S | # h(S) = 1S aaaA | aaAb h(S) = 4A b | (b) | a Sb h(A) = 1

Очевидно, что удаление недостижимого нетерминала уменьшает характеристику h преобразованной грамматики.

Свойство 5. Процесс устранения нетерминалов, допускающих неукорачивающую факторизацию, может породить избыточные нетерминалы.

В общем случае избыточность связана с существованием нетривиального разбиения множества нетерминалов на такие классы эквивалентности, при котором пара нетерминалов A и B принадлежит одному классу если

R+(G, A) = R+(G,B),где R+(G,C) получается из R(G,C) заменой всех нетеминалов именами

соответствующих классов эквивалентности. Так, в грамматике GA из примера 1 существует нетривиальное

разбиение нетерминалов на классы эквивалентности: {S}, {S, A}, {B}, {C}, {D}.

Если в качестве имен классов использовать имена первых нетерминалов каждого класса, то

R+(G, S) = R+(G,A) = {B, B+S},т.е. нетерминал A оказывается избыточным, и его удаление порождает

грамматику, указанную в примере 5.

Пример 5 (продолжение примера 1).Грамматика GA >> Удалить A

S S | # S S | # h(S) = 1S B | B+A S B | B+S h(S) = 1A B | B+A

226

B D | DC B D | DC h(B) = 1C *D | *DC C *D | *DC h(C) = 2D (S) | a D (S) | a h(D) = 1

Если исходная грамматика не содержала избыточные нетерминалы, то это свойство можно сохранить, включив в цепочку НФ-преобразований удаление избыточных нетерминалов. Очевидно, что такая операция уменьшает характеристику h преобразованной грамматики.

Свойство 6. Если исходная грамматика принадлежит классу LL(1) [Ахо и др., 1978], то результирующая грамматика, полученная в результате НФ-преобразований, также принадлежит классу LL(1).

Таким образом, для целей грамматического вывода можно использовать нормализованные КС-грамматики G = < N, , P, S >, удовлетворяющие всем или некоторым свойствам из перечисленного списка: в P имеется правило S → #, причем в остальных правилах вывода

терминал # не встречается; в P отсутствуют e-правила, за исключением, быть может, правила

S → e; в P отсутствуют правила, допускающие правую и левую

неукорачивающую факторизацию; в P отсутствуют цепные правила; в P отсутствуют бесполезные правила; в N отсутствуют простые нетерминалы; G не является избыточной грамматикой.

Список литературы[Ахо и др., 1978] Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и

компиляции, тт. 1,2. – М.: Мир, 1978.[Кнут, 1978] Кнут Д. Нисходящий синтаксический анализ. // Кибернетический

сборник. Вып. 15. – М.: Мир, 1978.[Соловьев, 1985] Соловьев С.Ю. Постановка задачи грамматического вывода. //

Математическое обеспечение вычислительных машин и систем. (Математические исследования, вып. 81) Кишинев: Штиинца, 1985. http://www.park.glossary.ru/serios/read_08.php

[Фу, 1977] Фу К. Структурные методы в распознавании образов. – М.: Мир, 1977. [Хант, 1978] Хант Э. Искусственный интеллект. – М.: Мир, 1978.

227

УДК 007:519.816

ГЕНЕРАЦИЯ ФОРМАЛЬНЫХ ОПИСАНИЙ НАУЧНЫХ СТАТЕЙ ДЛЯ ИНФОРМАЦИОННЫХ СИСТЕМ

О.О. Дяченко ([email protected]) Новосибирский Государственный Университет,

Новосибирск

Ю.А. Загорулько ([email protected]) Институт систем информатики им. А.П.Ершова СО РАН,

Новосибирск

Ключевые слова и выражения: библиографическая ссылка, база данных цитирования, формальное описание научной статьи, шаблон, маркер, конструктор шаблонов, алгоритм разбора цитаты.

В докладе рассматривается подход к разработке системы генерации формальных описаний научных статей. Обсуждаются принципы функционирования такой системы, а также алгоритмы автоматического создания локальной базы данных цитирования. Настройка системы обеспечивается встроенным конструктором шаблонов разбора библиографических ссылок.

ВведениеПостоянно возрастающие объемы электронных архивов научных

статей требуют удобных для пользователя средств навигации и доступа к статьям, представленным в этих архивах. В настоящее время уже недостаточно просто предоставить пользователю файл статьи, необходимо обеспечить его информацией о её содержании и связях с другими библиографическими источниками. Этим целям могут служить базы данных цитирования (или БД библиографических ссылок).

При построении базы данных цитирования необходимо решать следующие задачи:

Определение основных данных о статье (название, авторы, аннотация, ключевые слова).

Выделение списка литературы из текста статьи и разбор его на составные элементы.

228

Добавление идентифицированных элементов списка литературы в базу данных цитирования.

В настоящее время существует несколько подходов к созданию баз данных цитирования, перечислим наиболее значимые из них:

30. Модель универсальной базы данных цитирования, предложенная Дэвидом Сонгом [Сонг, 2003]. Согласно этой модели все публикации должны быть описаны в стандартном формате. Ссылки на цитаты (библиографические ссылки) должны даваться в XML-документе, построенном согласно определенной структуре.

31. Разработанная исследовательским институтом корпорации NEC автономная система индексирования цитат ResearchIndex [Lawrence et al., 1999], автоматически индексирующая публикации по информатике, обнаруженные в Web.

32. Менеджеры ссылок (Reference managers) [BiblioScape 8, 2010; I, Librarian, 2010; Mendeley Desktop, 2010], позволяющие пользователям, как правило, авторам публикаций или исследователям, создавать и использовать свои локальные базы данных цитирования.

Каждый из перечисленных подходов имеет свои достоинства и недостатки. В первом из них вся «работа» возложена на автора или издательство, во втором наоборот – ручной труд практически исключен, но при этом ухудшается качество поиска, так как некоторые атрибуты статьи (например, автор или заголовок) не всегда правильно извлекаются из текста.

Составление больших БД цитирования вручную достаточно трудоемко и не всегда возможно, поэтому предпринимаются попытки автоматизировать этот процесс. Одному из таких подходов и посвящен данный доклад.

1. Подход к автоматизации обработки текста статьи

1.1. Основные определенияВведем несколько базовых понятий [Захарова, 2003], необходимых для

описания алгоритма.Цитата – элемент списка литературы.Значимая часть текста – часть текста, о которой с высоким уровнем

уверенности известно, что она содержит необходимую для описания текста информацию.

Полем (цитаты или некоторой значимой части текста) будем называть компонент цитаты или некоторого значимого отрывка текста,

229

представленный в тексте или цитате своим значением, образуя пару <атрибут – значение>. Примеры: автор, заголовок.

Подполем будем называть составляющую часть сложного поля. Пример: поле цитаты «страницы» со значением «С. 251–256» содержит подполя: «признак поля» – «С.», «начальная страница» – «251», «конечная страница» – «256».

Индикатором (или маркером) будем называть слова или словосочетания, которые характерны для значений или признаков некоторого поля и позволяют однозначно восстановить пару «поле – значение». Как правило, набор маркеров для некоторого поля – это набор значений подполя «признак поля». Пример: «http://» является маркером для URL в тексте.

1.2. Формальное представление статьиКак уже упоминалось выше, всякое поле в цитате представлено своим

значением, по этой причине цитату можно описать набором пар «атрибут – значение». Сама же обрабатываемая статья (см. Рис.1) содержит не только поля, она еще несет в себе набор отношений «ссылается на», связывающих ее с цитатами.

Рис.1. Формальное представление статьи

1.3. Обработка текста статьиОбработку текста статьи можно разделить на несколько этапов:Выделение вводной части текста, содержащей название статьи, ее

авторов, ключевые слова и аннотацию.Определение основной информации о статье по ее вводной части.Выделение списка цитированной литературы из текста статьи.Разбор списка, полученного в п.3 на отдельные цитаты.Синтаксический разбор каждой из цитат, полученных в п.4.Выделение вводной части текста статьи (далее шапки) производится

на основе следующих посылов:

230

Предполагается, что вся основная информация о статье находится в ее первых строках.

Ключевые слова и аннотация находятся после авторов и названия.На основе этих предположений были построены следующие методы

отделения вводной значимой части текста:Если имеются индикаторы начала первой главы в статье, как правило,

это слова «Введение» или «Introduction», то часть текста до строки с этим индикатором отделяется как шапка.

Если имеются маркеры ключевых слов, такие как «Ключевые слова» или «Keywords», то часть текста, включая эту строку, считается шапкой.

В ходе изучения представительного множества научных статей, были выявлены конструкции-индикаторы для определения аннотации: как стандартные («Аннотация» или «Abstract»), так и используемые в определенной форме словосочетания, например, «статья содержит», «в работе рассматривается» и др. Здесь выделение шапки происходит аналогично п.2.

Пользуясь набором примитивных шаблонов для определения автора статьи, как например, «Фамилия И.О.» или «Фамилия Имя О.», можно определить строки, содержащие имена авторов.

В случае, если ни один из предложенных методов не отделяет шапку, то предполагается, что либо это не текст статьи, либо оформленная не по стандарту статья. Отделение начальной части в таком случае нужно сделать вручную. Дальнейшие шаги обработки текста будут продолжены, поскольку список литературы все равно может присутствовать в тексте.

После того, как шапка отделена, при помощи тех же шаблонов и маркеров происходит определение основных данных о статье.

Значимая часть текста со списком цитируемой литературы (далее хвост), как правило, находится в конце статьи, за исключением случая, когда статья содержит приложения, помещаемые после списка литературы. По этой причине выделение списка литературы разбивается на два этапа: отделение «сверху», т.е. нахождение первой строки списка, и отделение «снизу» – последней строки.

Выполнение отделения «сверху» – задача сравнительно более простая, чем отделение «снизу», ввиду того, что имеется ряд характерных признаков, по которым можно отыскать первую строку списка:

Существует набор маркеров, однозначно определяющих начало списка литературы: «Источники», «Список использованной литературы», «References» и др.

Список литературы обычно содержит очень много конструкций, подходящих под поле «автор», например, «Фамилия И.О.».

В случае, если подобные методы не отделяют никакой список литературы, делается вывод, что его либо нет, либо имеются серьезные

231

ошибки в его описании. В последнем случае применяется ручное отделение «хвоста».

Отделение «снизу» применяется уже к отделенной «сверху» части текста и проводится на основе следующих эвристических признаков – список литературы заканчивается, если выполнено одно из условий:

Если в списке имеется нумерация, тогда список отделяется однозначно.

Нашлись две подряд идущих «пустых» строки (предполагается, что цитаты идут одна за другой).

Если «пустых» строк нет, значит, вся отделенная «сверху» часть является списком цитат.

После выделения списка литературы из текста его необходимо разделить на отдельные цитаты. В работе [Захарова, 2003] был предложен метод поиска начала цитаты по шаблону <перевод строки><номер цитаты><точка>, но этого, как показывают и практика, и многочисленные правила оформления библиографических ссылок, недостаточно.

Поэтому в дополнение к этому методу используются следующие методы разделения списка литературы на отдельные цитаты:

Разделение цитат на основе нумерации (это основной метод, так как большинство списков литературы нумеруется). При этом ведется счетчик цитат, что позволяет свести ошибки к минимуму.

Определение начала цитаты по комбинации полей «Фамилии авторов» + «год». В некоторых статьях библиографические ссылки именуются с помощью этой комбинации, например, «Guarino, 1998». Поэтому такое сочетание может служить основанием для определения начала цитаты.

Если строка начинается с комбинации слов, соответствующей полю «автор», то эта комбинация отбирается как начало ссылки.

Как показали эксперименты, этих методов достаточно для успешного отделения шапки и хвоста приблизительно у 95% статей.

2. Синтаксический разбор цитаты при помощи шаблоновПод синтаксическим разбором цитаты [Захарова, 2003] мы будем

понимать определение полей, входящих в нее, и нахождение их значений. Согласно нашему подходу, синтаксический разбор осуществляется

путем сопоставления цитаты различным шаблонам. В случае, если цитата подходит под какой-либо шаблон, то указанным в шаблоне полям ставится в соответствие их текстовое значение.

Каждый шаблон описывается упорядоченным набором блок-полей или символьных блоков.

<шаблон> ::= {<блок-поле>|<симв.блок>}+Блок-поле в записи шаблона представляют собой имя поля,

заключенное в угловые скобки. Определение в цитате значения

232

некоторого блок-поля происходит при помощи других шаблонов (будем называть их частичными) путем нахождения им соответствий в цитате.

Частичные шаблоны описываются на языке PCRE (Perl Compatible Regular Expressions) [PCRE, 2010]. Редактирование и создание их требует от пользователя хорошего знания этого языка. Пример частичного шаблона «Фамилия И.О.» поля <Автор>:

[A-ZА-Я][a-zа-я]?[\’\-]?[A-ZА-Я]?[a-zа-я]+\s[A-ZА-Я]\.[A-ZА-Я]\.В цитате может быть как один, так и несколько элементов,

соответствующих указанному полю (например, у рассматриваемого источника может быть несколько авторов), при этом одно блок-поле может выделять из цитаты несколько значений этого поля.

В синтаксическом разборе мы используем следующие блок-поля: «Автор», «Название», «Год», «Название журнала», «Том», «Выпуск», «Стартовая страница», «Конечная страница», «URL» и другие.

Символьные блоки – это набор символов, как правило, присутствующий в шаблоне для описания характерных для библиографической ссылки элементов. Например, согласно [ГОСТ 7.1-84, 1984] название статьи и название журнала в библиографической ссылке разделяются комбинацией «//». Символьные блоки располагаются в шаблоне между блок-полями.

Синтаксический разбор цитаты можно разделить на три этапа:Нормализация цитаты – это устранение из цитаты незначимых

символов, приведение ее к виду, удобному для сопоставления с шаблонами.

Поиск цитаты в уже имеющейся библиографической базе данных.Применение шаблонов.Нормализация цитаты в предлагаемом нами варианте включает в себя:Удаление всех повторяющихся пробелов.Удаление и исправление некоторых комбинаций символов.Приведение значений некоторых полей к удобному для сопоставления

виду.Замена сокращений на полные варианты слов [ГОСТ 7.12-93, 1994].Наличие этого этапа необязательно, но в ряде случаев улучшает

качество разбора цитаты.После нормализации происходит проверка совпадения значений полей

цитаты с уже имеющейся в библиографической базе данных информацией: фамилиями авторов, названиями и др. Если цитата уже имеется в базе, то она определяется однозначно, в противном случае делается попытка ее разбора с помощью шаблонов.

Разбор включает следующие действия:Определение типа цитаты. Используется несколько типов цитат:

журнальная статья (основной), труды конференций, книги, электронные

233

источники, серийные издания. Каждому из типов соответствуют свои наборы полей, которые могут входить в ссылку. По их наличию и определяется тип цитаты.

Применение шаблонов в последовательности, зависящей от типа цитаты. Каждый из шаблонов соответствует определенному типу ссылки, поэтому с целью скорейшего и более точного разбора ссылки в первую очередь применяются шаблоны, соответствующие данному типу ссылки, а затем все остальные.

Отделение данных при помощи частичных шаблонов. Если никакой из имеющихся шаблонов не соответствует цитате, то делается попытка обнаружить хоть какую-нибудь информацию о ссылке при помощи частичных шаблонов.

Применение каждого шаблона происходит по следующему алгоритму:Если в шаблон входят символьные блоки, проверяется их наличие и

правильная последовательность в ссылке, иначе – переход к следующему шаблону.

Каждая из частей цитаты, заключенная между символьными блоками, проверяется на соответствие блок-полям, стоящим в шаблоне между ними, в случае несоответствия – переход к следующему шаблону.

Если всем полям установлены соответствия, то цитата считается разобранной.

Важным в описанном выше алгоритме является решение пункта 2.Если в шаблоне нет символьных блоков, первым проверяется наличие

блок-полей, соответствующих дополнительной информации, например, такой как «Выпуск», «Том». Если такие блок-поля отсутствуют в ссылке или находятся в неправильной последовательности, то отбор прекращается, иначе происходит переход к первостепенным блок-полям: «Автор», «Название», «Источник».

Поиск начинается с поля «Автор». Для него имеется широкий спектр шаблонов, позволяющих извлекать данные об авторах с высокой долей точности:

<Автор> ::= <Фамилия И.О.> |<И.О.Фамилия> |…Далее, учитывая положение остальных первостепенных полей

относительно поля «Автор», определяются их значения.В качестве примера, рассмотрим применение к библиографической

ссылке «Загорулько Ю.А., Боровикова О.И. Технология построения онтологий для порталов знаний по гуманитарным наукам // Труды Всероссийской конференции с международным участием “Знания-Онтологии-Теории” (ЗОНТ-07). Новосибирск, 2007. Т.1, С.191-200.» следующих трех шаблонов:

1: <Автор><Название>//<Источник>:<Выпуск><Год>2: <Автор><Название>//<Источник><Том><Год>

234

3: <Автор><Название>//<Источник><Город><Год> <Том> <Страницы>

Первый шаблон отбрасывается ввиду отсутствия символьного блока «:» в тексте ссылки. Происходит переход ко второму шаблону. Его часть <Источник><Том><Год> справа от символьного блока «//» применяется к части цитаты «Труды Всероссийской конференции с международным участием “Знания-Онтологии-Теории ”(ЗОНТ-07). Новосибирск, 2007. Т.1, С.191-200.», но ввиду отличного порядка значений блок-полей в цитате, шаблон отбрасывается.

Третий шаблон срабатывает правильно, отделяя все элементы ссылки.

3. Программная реализацияНа данный момент создана рабочая версия системы, использующая

описанные методы и включающая в себя: пользовательский интерфейс, позволяющий редактировать и создавать формальные описания статей; конструкторский интерфейс, позволяющий редактировать полные и частичные шаблоны; редактор базы данных цитирования.

Система позволяет проводить обработку статьи в трех режимах: ручном, автоматическом и полуавтоматическом.

Полуавтоматический режим в данном случае – это совместное применение автоматического (выполняется автоматическая обработка текста) и ручного (данные предлагаются пользователю на редактирование в отдельном окне).

В ручном режиме в окно выводится полный текст статьи, в котором пользователь может при помощи выделения цветом пометить значимую информацию о статье, выделить элементы списка литературы и таким же образом отметить значения полей в них. Данный способ ручного создания формального описания статьи в отличие от простого ввода текста быстрее, нагляднее и удобнее. Дополнительную информацию, не представленную в тексте, пользователь может ввести посредством редактирования таблицы в главном окне программы.

В автоматическом режиме статья обрабатывается и помещается в таблицу, выводимую в главном окне программы.

Пользователь может управлять работой программы в автоматическом режиме путем включения/выключения некоторых шаблонов, а также редактирования полных и частичных шаблонов при помощи конструктора шаблонов. Полные шаблоны пользователь может задать, используя в качестве конструктивов уже имеющиеся в системе частичные шаблоны. Вид полных шаблонов показан в примерах из раздела 2.

Тестирование системы проводилось на материалах конференции «Диалог» за 2006-2009 гг. [Диалог, 2009].

235

4. ЗаключениеВ докладе предложены принципы построения и алгоритмы работы

системы, нацеленной на генерацию формальных описаний научных статей и создание локальной базы данных цитирования. Ввиду того, что правила оформления статей подвержены частым изменениям, обеспечивается настройка системы при помощи изменения набора шаблонов обработки.

В дальнейшем функциональность системы будет расширена за счет реализации ряда возможностей, характерных для менеджеров ссылок, как например, вставка цитат, имеющихся в базе данных ссылок, в документы в требуемых форматах, а также визуализации связей между статьями и авторами, обработки документов, представленных в других форматах (*.pdf, *.html, *.doc и др.), и поддержки конвертирования базы данных цитирования в стандартные форматы, например, XML, BibTex.


Список литературы[ГОСТ 7.12-93, 1994] ГОСТ 7.12-93. Библиографическая запись. Сокращение слов

на русском языке. Общие требования и правила. – М., 1994.[ГОСТ 7.1-84, 1984] ГОСТ 7.1-84. Библиографическое описание документа.

Общие требования и правила составления. – М., 1984. [Диалог, 2009] Материалы конференции «Диалог». – http://dialog-21.ru.[Захарова, 2003] Захарова И.В. Методы автоматического разбора списка цитат в

научных статьях на составляющие библиографические элементы для построения базы данных цитирования. – Челябинск, 2003.

[Сонг, 2003] Дэвид Сонг. Новая модель базы данных цитирования на языке XML с использованием XQuery в качестве поискового языка // Сборник трудов десятой юбилейной международной конференции "Крым 2003. Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества". Украина, Крым, 2003.

[BiblioScape 8, 2010] BiblioScape 8. – www.biblioscape.com. [I, Librarian, 2010] I, Librarian. URL: www.bioinformatics.org/librarian.[Lawrence et al., 1999] Lawrence, S., Giles, C.L. & Bollacker, K. (1999). Digital

libraries and autonomous citation indexing. IEEE Computer. 32(6).[Mendeley Desktop, 2010] Mendeley Desktop. URL: www.mendeley.com.[PCRE, 2010] Perl Compatible Regular Expressions (PCRE). – http://pcre.org.

236

УДК 007:519.816

О СХЕМЕ ВЗАИМОДЕЙСТВИЯ В КОМПЛЕКСЕ «АНАЛИЗ И СИНТЕЗ ЕСТЕСТВЕННОГО ЯЗЫКА И

ИЗОБРАЖЕНИЙ»

С.С. Курбатов ([email protected])ОАО НИЦЭВТ, Москва

К.А. Найденова ([email protected])Военно-медицинская академия, Санкт-Петербург

Г.К. Хахалин ([email protected])независимый исследователь, Москва

Для комплекса, объединяющего разномодальные системы концептуального распознавания и синтеза изображений, анализа и синтеза ЕЯ-текстов, рассматривается схема их взаимодействия через общую прикладную онтологию. Прикладная онтология представляется на языке семантического гиперграфа. Даны примеры из области «Планиметрия», которые иллюстрируют разные типы взаимодействия.

ВведениеДанная работа является продолжением рассмотрения вопросов по

проекту с условным названием «естественный язык (ЕЯ) + зрение + рисование», в котором ставится задача интеграции разномодальных систем искусственного интеллекта: систем анализа/синтеза естественного языка и изображений [Хахалин и др., 2008].

Связующим данные системы звеном является общая для них прикладная онтология, представленная на языке семантического гиперграфа. В качестве прикладной области выбрана «Планиметрия» - область, изобилующая как изображениями (плоские фигуры и их комбинации), так и текстовыми описаниями объектов реальной среды.

В данной работе рассматриваются некоторые особенности интегрируемых систем для предварительного выбора кандидатов на включение в комплекс и схемы взаимодействия систем при различных режимах работы.

237

1. Требования к компонентам комплекса Комплекс состоит из прикладной онтологии, двух систем анализа и

двух систем синтеза. Системы анализа должны выдавать результаты своей работы на языке прикладной онтологии – на языке семантического гиперграфа, который описан в [Хахалин, 2009]. А для систем синтеза этот язык является входным, т.е. эти системы должны «понимать» язык семантического гиперграфа, на котором задаются описания синтезируемых ситуаций.

Язык семантического гиперграфа является расширением семантических сетей, где естественным образом представляются n-арные отношения, которые позволяют задавать не только атрибуты объектов, но и представлять их структурные, «целостные» описания. На нем можно в зависимости от типов связей реализовывать классифицирующие, функциональные, ситуационные, структурные сети и сценарии. На наш взгляд этот язык наиболее адекватен для представления знаний в интегральной системе искусственного интеллекта.

Следует сразу подчеркнуть, что каждая система внутри себя может обладать своими языками представления знаний и базами знаний, необходимыми им для внутренней работы. Например, системы анализа и синтеза ЕЯ-текста имеют морфологическую и синтаксическую модели, которые являются специфическими только для данных систем.

Исходя из функциональной структуры комплекса, опишем некоторые особенности каждой из систем и возможности их выбора из реально существующих для включения в комплекс. При этом отметим, что на сегодняшний день нет систем, полностью отвечающих предъявляемым требованиям, которые можно было бы по технологии «plug and play» интегрировать в комплекс.

Система концептуального анализа изображений. Сегментация изображения на отдельные фрагменты, а также интерпретация этих фрагментов осуществляются непосредственно в ходе анализа изображения (этапы предварительной сегментации и описания отсутствуют). Процесс анализа носит итеративный характер: выдвигается гипотеза о присутствии в определенном месте изображения представителя того или иного класса анализируемых объектов; проверяется выдвинутая гипотеза, т.е. осуществляется целенаправленный поиск непосредственно на входном изображении совокупности элементов, удовлетворяющих структурному описанию; и принимается решение о справедливости той или иной гипотезы.

В качестве систем, обеспечивающих в разной степени «нижние и верхние» уровни анализа можно привести систему IcadGT (фирма recsoft Inc) [IcadGT] и программный продукт Raster Arts (фирмы CSoft) [CSoft]. А

238

процедуры, организующие распознавание «непроизводных» объектов («отрезок прямой», «угол», «дуга» и т.п.), обеспечиваются с помощью машинного обучения [Naidenova, 2009].

Система концептуального синтеза изображений. Задача построения фигуры по имени, структуре и по означенным параметрам решается путем вычисления координат вершин и составления общепринятого в машинной графике описания.

Система должна избегать возможных коллизий, т.е. реагировать на недостаток и противоречивость данных означивания, а, следовательно, невозможность однозначного вычисления экземпляра фигуры. При этом она выдает сообщение и список параметров, которые противоречат друг другу или системе не удается их вычислить.

В качестве системы, обеспечивающей «нижний» уровень графического синтеза можно привести программный продукт Autodesk (фирмы CSoft) [CSoft]. А в качестве концептуальной надстройки над ним предполагается использовать наработки при создании экспериментальных систем ТЕКРИС (ВЦ РАН) и ПСИ [Власов и др., 1988].

Система лингвистического анализа естественного языка. Задача анализа текста заключается в построении по ЕЯ-тексту концептуальной структуры описания ситуации в терминах понятий и отношений прикладной онтологии. Такое построение трактуется как отображение, которое должно устранить неопределенности поверхностного уровня ЕЯ (многозначность, омонимию, омографию, неполноту, анафоричность, некорректность и другие), сводя их к однозначному семантическому представлению. Это осуществляется за счет реализации нескольких отображений: грамматический анализ, семантическая интерпретация и семантический анализ, которые в совокупности реализуют лингвистический анализ текста. Особенностью системы является отсутствие необходимости проводить полный и последовательный лингвистический анализ текста. Системой реализуется спектральность полноты и последовательности анализа, которая зависит от прикладной онтологии, тематической однородности и сложности самого текста (эллиптические, осложненные, сложные и анафорические предложения).

Система анализа текста может быть выбрана на основе обзора [Найденова и др., 2008] и системы АДАЛИТ, принципы которого описаны в [Хахалин и др., 2006].

Система синтеза естественного языка. Задача синтеза текстов на ЕЯ заключается в генерировании текста по структурным описаниям онтологических представлений. Полный синтез фраз ЕЯ предполагает этапы семантического синтеза, синтаксических интерпретации и синтеза, морфологического синтеза и форматирования (графематический синтез). Синтаксический, морфологический синтез и форматирование достаточно

239

разработанные процедуры (например, в системе ЭТАП-3), а вот семантический синтез и интерпретация в ограниченных пределах представлена только в системах ПОЭТ и АДАЛИТ. Поэтому при выборе системы синтеза текста для комплекса акцент будет сделан на них.

2. Режимы работы комплексаРассмотрим последовательно разные взаимодействия систем, которые

условно представлены на рис. 1. Каждое взаимодействие характеризуется названием, трассировкой этапов, иногда комментариями и по возможности иллюстрацией.

Рис. 1. Схема взаимодействия подсистем

КАИ – система концептуального анализа изображений; КСИ – система концептуального синтеза изображений; АЕЯ – система лингвистического анализа естественного языка; СЕЯ – система лингвистического синтеза естественного языка. In – (входное/выходное) изображение; {In} – множество изображений; Ti – текст на ЕЯ; {Ti} – множество текстов на ЕЯ (перефразировки); Mk – описание объекта или ситуации в прикладной онтологии на языке семантического гиперграфа. ЯПЗ – язык представление знаний (семантический гиперграф).

КАИ КСИ

АЕЯ СЕЯ

1 2 3

6 7

11Прикладная онтология

12

8

10

4 5

9

In

Ti

{In}

{Ti}Mk

Mk

240

1. Анализ/понимание изображения{1, 2} – вход – изображение; в онтологии – имя класса объекта или

ситуации; описание зрительной ситуации (всей или части) на ЯПЗ + означенная структура объекта или ситуации.

Рис. 2. Входное изображение и означенная структура объекта «Прямоугольник» в онтологии

2. Анализ изображения и проверка экспертом описаний геометрических ситуаций на ЯПЗ по синтезируемым геометрическим объектам

{1, 2, 3} – вход – изображение; в онтологии – описание зрительной ситуации (всей или части) на ЯПЗ; выход – множество примеров изображений класса ситуаций (всего или части).

Рис. 3. Синтез множества экземпляров понятия «равнобедренный треугольник»

3. Анализ изображения, проверка экспертом описаний (геометрических ситуаций) на ЯПЗ и проверка описаний самой системой анализа изображений при использовании обратной связи

{1, 2, 3, 9, 1} – вход – изображение; в онтологии – описание зрительной ситуации (всей или части) на ЯПЗ; выход – множество примеров изображений класса ситуаций (всего или части); функция сравнения – проверка правильности анализа изображения самой системой.

4. Генерирование текста по рисунку

241

Сторона (сd)

Сторона (вс)

имеетпо_формуле

им_структуру

Площадь

Периметримеетпо_формуле

Параллелограмм

вид

Сторона (ав)

Сторона (аd)

F22 (S= l1*l2)

F20 (P=2*(ав+вс))

параллельны

l1

соприк_к.т.В

соприк_к.т.Аим_

длину соприк_к.т.С

соприк_к.т.Dим_

длину

Прямоугольник

l2перпенд. перпенд.

{1, 4, 8} – вход – изображение; в онтологии – описание геометрической ситуации (всей или части) на ЯПЗ; выход – ЕЯ-текст, описывающий геометрическую ситуацию.

ЕЯ-тексты: Треугольник, две стороны которого равны 6 и

8, а медиана, заключенная между ними, равна 5. Треугольник со сторонами АВ=8, АС=6.

Медиана, проведенная из вершины А, равна 5. Задан треугольник ABC. Сторона АС (равна 6)

меньше стороны АВ (равна 8). Из вершины А к основанию CB опущена медиана AD (равна 5).

Рис. 4. Входное изображение треугольника с медианой и выходные тексты

Эквивалентность этих формулировок (перифраз) на «словесном» уровне не очень выражена. Но если при этом использовать рисунок и онтологическую структуру, то для эксперта сопоставление этих текстов не вызовет больших затруднений.

Этот же режим используется тогда, когда системе анализа изображений недостаточно информации или она противоречива для понимания изображения.

5. Создание рисунка по тексту{6, 5, 3} – вход – ЕЯ-текст; в онтологии – семантическое описание

текстовой ситуации на ЯПЗ; выход – множество изображений, описывающих текстовую ситуацию.

Здесь существует два подрежима: один – выполнение команд над уже нарисованным объектом (команды: «сдвинуть», «повернуть» и т.д.); второй – генерирование рисунка по ЕЯ-тексту.

Рис. 5. Сдвиг и поворот на плоскости с нарисованным на ней домиком

242

А

BC

ЕЯ-текст: В прямоугольном треугольнике ABC ( C = 90) с катетами 3 и 4 провели высоту CH. В получившиеся треугольники ACH и BCH вписали две окружности, которые касаются CH в точках K и L.

Рис. 6. ЕЯ-текст и синтезированное графическое изображение

6. Понимание текста и проверка описаний экспертом текстовой ситуации на ЯПЗ

{6, 7} – вход – ЕЯ-текст; в онтологии – семантическое описание текстовой ситуации на ЯПЗ.

Входной текст: Основание равнобедренного треугольника, равно 8. Длина высоты, проведенная к основанию треугольника, равна 3.

Рис. 7. Фрагмент структуры понятия «Равнобедренный треугольник»(r1 – исходит_из; r2 – опущена_на)

7. Перефразирование входного текста (текстовой анализ/синтез){6, 7, 8} – вход – ЕЯ-текст; в онтологии – семантическое описание

текстовой ситуации на ЯПЗ; выход – множество ЕЯ-текстов, описывающих ситуацию (перефразировки).

Входной текст: Постройте круг данного радиуса r, который включает точку с координатами X1 и Y1.

Выходные тексты: - Задана точка с координатами X1 и Y1. Она находится внутри круга с

радиусом r. Построить такой круг.- Построить круг с радиусом r, который включает точку с

координатами X1 и Y1.- Внутри круга находится точка с координатами X1 и Y1. Постройте

такой круг, радиус которого равен r.

243

Сторона (ав)

имеет

по_формуле

им_структуру

Площадь

Периметр

Равнобедр_Тре-к имеет

по_формуле

Треугольник

вид

Сторона (ас)

Основание (вс)

F7 (S=1/2вc*h)

F6 (P=l2 + 2*l1) l1

l2

соприк_к.т. соприк_к.т.С

им_длину

соприк_к.т.В

им_длину

им_длину

A

Высота r2

r1

Выходной текст может быть представлен на языке, отличным от входного языка:

- Build circle with radius r, which include point with coordinate X1 and Y1.8. Понимание текста, проверка описаний экспертом текстовой

ситуации на ЯПЗ и проверка описаний самой системой анализа текста при использовании обратной связи

{6, 7, 8, 10, 6} – вход – ЕЯ-текст; в онтологии – семантическое описание текстовой ситуации на ЯПЗ; выход – множество ЕЯ-текстов, описывающих ситуацию (перефразировки); функция сравнения – проверка правильности лингвистического анализа текста.

9. Понимание текста, проверка описаний экспертом текстовой ситуации на ЯПЗ, синтез изображения по тексту и проверка описаний самой системой анализа изображений при использовании обратной связи

{6, 5, 3, 9, 1} – вход – ЕЯ-текст; в онтологии – семантическое описание текстовой ситуации на ЯПЗ; изображение, описывающее текстовую ситуацию; анализ изображения.

10. Понимание изображения, проверка описаний экспертом зрительных ситуаций на ЯПЗ, текстовое описание рисунка и проверка описаний самой системой анализа текста при использовании обратной связи

{1, 4, 8, 10, 6} – вход – изображение; в онтологии – описание зрительной ситуации (всей или части) на ЯПЗ; выход – множество ЕЯ-текстов, описывающих ситуацию (перефразировки); функция сравнения – проверка правильности лингвистического анализа текста.

11. Одновременная подача на входы анализаторов изображения и текста текстового описания и рисунка, представляющих одну и ту же внешнюю ситуацию

{1, 2; 6, 7} – вход – изображение; описание зрительной ситуации (всей или части) на ЯПЗ; – вход – ЕЯ-текст; семантическое описание текстовой ситуации на ЯПЗ; функция – сравнение описаний.

Остальные взаимодействия относятся к тем случаям, когда сам текст представлен как фрагмент изображения.

{1, 11} – вход – изображение, на котором кроме самого рисунка присутствует текст на ЕЯ (как изображение); выход – результат работы OCR-подсистемы (преобразование текста как изображения в символьный текст).

{1, 11, 6} – вход – изображение, на котором кроме самого рисунка присутствует текст на ЕЯ (как изображение); промежуточный выход – результат работы OCR-системы (преобразование текста как изображения в символьный текст); лингвистический анализ текста.

{12, 3} – символьный текст поступает на генерацию изображения в качестве изображения текста.

244

{1, 11, 6, 7, 8} – вход – на изображении текст на ЕЯ (как изображение); описание текстовой ситуации на ЯПЗ; выход – ЕЯ-текст, описывающий ситуацию (перефразировки).

ЗаключениеВзаимодействия систем рассмотрены в предположении наличия

исчерпывающей информации в прикладной онтологии. Очевидно, что заложить вручную все знания в онтологию даже для одной прикладной области практически невозможно. Комплекс должен быть обучаемым, а системы синтеза при этом выступают в качестве средств проверки накапливаемых знаний. Разработка методов обучения целостной системы должна производиться с учетом интегрирования разномодальных систем и с учетом неопределенностей, противоречий во входной информации и онтологии. При этом методы обучения должны носить как индуктивный, так и дедуктивный характер. Их сочленение – работа будущего. И если для индуктивной составляющей можно применять методы машинного обучения [Naidenova, 2009], то для дедуктивной (аналитической) составляющей предстоит адаптировать дидактические методы, используемые в педагогике. Некоторые возможности использования элементов аналогии и индуктивного вывода применительно к автоматизированному формированию базы знаний для задач планиметрии исследуются в [Курбатов, 2010].

Список литературы[Власов и др., 1988] Власов А.В., Аредова И.И. Экспериментальная система

синтеза графических изображений по их описанию в терминах геометрических понятий. Материалы конференции "Развитие интеллектуальных возможностей современных и перспективных ЭВМ". – М., МДНТП, 1988.

[Курбатов, 2010] Курбатов С.С. Высокоуровневые эвристики для автоматизированного формирования базы знаний (представлена на данной конференции).

[Найденова и др., 2008] Найденова К.А., Невзорова О.А. Машинное обучение в задачах обработки естественного языка: обзор современного состояния исследований.

[Хахалин и др., 2006] Хахалин Г.К., Воскресенский А.Л. Контекстное фрагментирование в лингвистическом анализе // Труды Х национальной конференции по Искусственному Интеллекту с международным участием – КИИ-2006. – М.: Физматлит, 2006.

[Хахалин и др., 2008] Хахалин Г.К., Воскресенский А.Л. Мультизадачное использование прикладной онтологии. // Труды ХI национальной конференции по Искусственному Интеллекту с международным участием – КИИ-2008. М.: URSS, 2008.

[Хахалин, 2009] Хахалин Г.К. Прикладная онтология на языке гиперграфов // Труды второй Всероссийской Конференции с международным участием

245

"Знания-Онтологии-Теории" (ЗОНТ-09). Новосибирск, 20-22 октября 2009 г. – Новосибирск, 2009.

[CSoft] www. CSoft.ru.[IcadGT] Система IcadGT, www.recsoft.com.[Naidenova, 2009] Xenia Naidenova. Machine Learning Methods for Commonsense

Reasoning Processes: Interactive Models. IDI Global. Scientific Research Centre Military Medical Academy Saint-Petersburg Russian Federation. – S-Pt.: 2009.

246

УДК 004.822

ПРИМЕНЕНИЕ НЕЧЕТКИХ ТЕОРЕТИКО-ГРАФОВЫХ МОДЕЛЕЙ В ЗАДАЧАХ МОДЕЛИРОВАНИЯ И

ПОИСКА ПЕСЕННЫХ МОТИВОВ

Н.Д. Москин ([email protected]) Петрозаводский государственный университет,

Петрозаводск

В статье рассматриваются нечеткие теоретико-графовые модели семантической структуры песенных мотивов Заонежья XIX – начала XX вв. На их основе строится процедура поиска схожих мотивов, которая была реализована в информационной системе «Фольклор».

ВведениеБогатство и уникальность песенного фольклора Северо-Запада России,

а также его относительная неизученность требуют новых подходов к анализу полученного материала. Одной из важных задач, возникающих при работе с фольклорной коллекцией, является проблема обнаружения в текстах схожих мотивов и их классификация. Мотивы – это композиционные фрагменты, которые повторяются в других текстах (не всегда в одной и той же последовательности) и служат исходными элементами для построения новых текстов. По выражению известного фольклориста Б. Н. Путилова мотив является «узловой категорией художественной организации произведения фольклора». Для поиска и классификации мотивов применяются различные методы (например, мотивный анализ, сравнительно-типологический метод, описание по лексико-семантическим группам), однако они оказываются не всегда достаточными, особенно при обработке больших массивов текстов.

В данной статье показано, как можно применить математические модели и компьютерные технологии в задаче поиска песенных мотивов.

1. Теоретико-графовые модели фольклорных мотивов и задача поиска

Рассмотрим применение теоретико-графовых моделей в задаче поиска мотивов на примере коллекции бесёдных песен Заонежья XIX – начала XX века [Калашникова, 1999]. Бесёдными назывались песни,

247

исполнявшиеся в закрытом помещении – избе – во время заонежских молодежных вечеринок в осенне-зимний период. Предположим, перед исследователем стоит задача обнаружить мотив песни «Затопила млада печь» [Студитский, 1841] в других текстах коллекции (возможно в скрытой форме):

На матушке на НевеГуси, лебеди сидели,Гуси, лебеди сидели,Серы утки налетели,Серы утки налетели,Свежу воду помутили.

Самый простой способ – это поиск по ключевым словам: гуси, лебеди, Нева, серы утки, вода. Однако это решение будет недостаточным по следующим причинам. Во-первых, автор, исполняя произведение, мог заменить существительные, прилагательные и глаголы синонимами или близкими по звучанию словами. Во-вторых, наличие в тексте ключевых слов еще не говорит об их семантической связности, тем более о наличие схожего мотива. Например, объекты «девушка» или «парень» встречаются почти во всех текстах, образуя совершенно разные сюжеты.

Другое решение основано на использовании графов. Как показано в [Москин, 2006], содержательную основу мотива можно представить в виде помеченного мультиграфа, в узлах которого находятся основные персонажи текста, животные, постройки, предметы обихода, явления природы и т. д. Между объектами устанавливаются связи двух типов: локальные и глобальные, соответствующие синтагматическим и парадигматическим отношениям в тексте (например, для данного фрагмента текста искомый граф изображен на рис. 1).

Рис. 3. Граф мотива песни

В этом случае задачу обнаружения схожего мотива можно свести к задаче поиска схожего по структуре подграфа. Достаточно часто подобный подграф является изоморфным по отношению к искомому графу, что значительно упрощает процедуру поиска [Москин, 2009b]. Однако из-за большой вариативности фольклорных текстов подобный

248

поиск не позволяет выявить скрытые мотивы, поэтому процедуру поиска необходимо усовершенствовать.

2. Моделирование семантической структуры песенных мотивов при помощи нечетких графов

Введение нечетких объектов и отношений обусловлено следующими причинами:Задача построения графа мотива является достаточно сложной, требующей привлечения знаний эксперта-фольклориста. В настоящее время ввод и редактирование текстов, а также их теоретико-графовых моделей производится с помощью автоматизированной пошаговой процедуры, которая реализована в информационной системе «Фольклор» [Москин, 2006]. В некоторых случаях у разных экспертов могут возникнуть противоположные мнения относительно того, существует ли определенная связь в графе, к какой группе принадлежит объект, каким образом определить границы фольклорного мотива. Эту важную информацию можно отразить в графе, используя нечеткие объекты и отношения, определив значения функции принадлежности в зависимости от квалификации экспертов. При обработке больших массивов текстов возникает задача автоматического выполнения отдельных этапов построения графов. Например, определение группы объекта на основе уже построенных моделей. В этом случае роль эксперта выполняет компьютерная программа, которая выдает заключение с той или иной степенью вероятности. В некоторых случаях это можно сделать автоматически (очевидно, что объекты «девушка» или «парень» принадлежат группе «люди»), а в некоторых случаях требуются дополнительные знания эксперта (объект «коса» можно отнести как к группе «части человеческого тела», так и к группам «разные предметы» или «географические объекты»). Фольклорный текст очень вариативен, т. е. один и тот же сюжет может быть записан в разных местах разными собирателями. Ниже представлен мотив бесёдной песни «Все мужовья до жон добры», записанной Ф. Студитским в 1841 году [Студитский, 1841]:

Все мужовья до жон добры,Покупили жонам тафты;Ещё мой муж не доброй до меня,Он купил, мутил,Коровушку купил,Жены лишнюю работу снарядил.

249

Рис. 4. Граф мотива песни «Все мужовья до жон добры»

Похожий мотив встречается в записи В. Д. Дашкова, однако имеет другую структуру [Дашков, 1842]:

Все мужья до жен добры,Накупили женам тафты;Мой муж не ласков до меня,Не купил мне шелкова платка.Он коровку купил,Мне заботу снарядил.

Как видно на рис. 2 и 3, во втором графе добавилась новая вершина «шелков платок» и соответствующая связь «не купил». Кроме того, отличаются группы объектов «забота» и «работа».

Рис. 5. Граф мотива песни «Все мужья до жен добры»

На основе нескольких вариантов одного мотива можно построить обобщенный граф с нечеткими объектами и связями, который показывает, насколько они важны в структуре графа. Рассмотрим определение

250

нечеткого графа второго вида )~,(~

UXG , которое приводится в [Берштейн, 2005]. Пусть имеется некоторое универсальное множество A и задано нечеткое множество X~ в A , имеющее вид

}/)({~ xxX X , Ax ,

где 1)(0 xX – значение функции принадлежности для вершины x .Зададим нечеткое множество ребер

},),/(),({~ jijiU xxxxU Xxx ji , ,

где 1),(0 jiU xx – значение функции принадлежности для ребра ),( ji xx , X – носитель множества X~ .

Тогда обобщенный граф для данных мотивов будет иметь вид:,/1,/5,0,/1,/1,/1,/1,/1{~

7654321 xxxxxxxX}/1 8 x

,),/(1),/(5,0,),/(1,),/(1,),/(1{~7464543121 xxxxxxxxxxU

}),/(1,),/(1,),/(1,),/(1 87524184 xxxxxxxx

Здесь значение функции принадлежности )(xX вычисляется как отношение числа вхождения вершины x в графы мотивов к общему числу мотивов, на основе которых строится обобщенный граф. Функция

),( jiU xx определяется аналогично.

3. Алгоритм поиска мотивов на основе нечетких теоретико-графовых моделей

Для построения процедуры поиска песенных мотивов модифицируем классический алгоритм Ульмана поиска изоморфизма подграфу [Ullmann, 1976]. Пусть задан нечеткий граф вида ),,,,,,~,(

~UXUX LLUXG с

нечетким множеством вершин }/)({~ xxX X , носителем которого

является четкое множество },,,{ 21 nxxxX , и нечетким множеством

ребер },),/(),({~ jijiU xxxxU Xxx ji , . Функции XLX : и

ULU ~: определяют группы объектов и связей соответственно.

Данный граф можно представить с помощью двух матриц смежности: 1. n

jiijmM 1,1

1 }{ , где )(1iii xm и )),((1

jiij xxm для ji .

2. njiijmM 1,

22 }{ , где )(2

iXii xm и )),((2jiUij xxm для ji .

Рассмотрим матрицу перестановок njiijpP 1,}{ , для которой

выполняются следующие условия:

251

1. }1,0{ijp для nji ,,1, ;

2.

n

iijp

1

1 для nj ,,1 ;

3.

n

jijp

1

1 для ni ,,1 .

Тогда матрицы *1M и *

2M , которые получаются по формуламTPPMM 1

*1 и TPPMM 2

*2 ,

где TP – транспонированная матрица P , также являются матрицами смежности для графа G~ . При этом если 1ijp , то j -я вершина в 1M и

2M становится i -й вершиной в *1M и *

2M соответственно.

Введем также матрицу )(, ilk MS размерности lk , которая получена из iM путем удаления строк с номерами nk ,,1 и столбцов nl ,,1 , где nlk , . Теперь можно говорить в том, что изоморфизм графа 1

~G

подграфу в 2~G существует тогда, когда существует матрица перестановок

P размерности nn , такая что)( 2

,1 T

illi PPMSM .

где 1iM и 2

iM – матрицы смежности графов 1~G и 2

~G размерности ll и nn соответственно, где nl , и 2,1i . Описание рекурсивной

процедуры Backtrack, которая последовательно определяет строка за строкой матрицу перестановок P , приводится в [Москин, 2009b].

Во время выполнения этой процедуры, когда все строки матрицы P успешно установлены, вычислим значение функционала 1J

l

i

l

jijij mmJ

1 1

*21 ,

где 2ijm и *

ijm – элементы матриц 12M и )( 2

2,*2

Tll PPMSM

соответственно. Чем больше значение 1J отличается от нуля, тем более матрицы нечетких графы различны.

Для определения близости групп объектов введем вспомогательную матрицу t

jiijdD 1,}{ , где t – общее число групп объектов, т. е. XLt , а 0),( jiddij – показывает, насколько группа i похожа на группу j

(например, объекты групп «люди» и «части человеческого тела» более схожи, чем групп «люди» и «постройки»). Для одинаковых групп эта мера

252

равна нулю, т. е. 0),( iid . Тогда значение второго функционала 2J вычислим по формуле

l

iiiii mmdJ

1

*12 ),( ,

где 1ijm и *

ijm – элементы матриц 11M и )( 2

1,*1

Tll PPMSM

соответственно. Таким образом, можно построить итоговый функционал2211 JkJkJ ,

где 0, 21 kk – коэффициенты, показывающие значимость первого и второго критерия соответственно. Вычислив значение функционала J , можно упорядочить найденные мотивы по степени схожести.

4. Реализация процедуры поиска песенных мотивов в информационной системе «Фольклор»

Для организации поиска песенных мотивов на основе теоретико-графовых моделей была реализована соответствующая процедура в информационной системе «Фольклор», разработанной в среде визуального программирования Delphi 7.0 [Москин, 2006]. В настоящее время система содержит 562 текста из четырех фольклорных коллекций, одной из которых является корпус бесёдных песен Заонежья XIX – начала XX века, состоящий из 118 текстов. Искомый мотив можно задать двумя способами: либо пользователь самостоятельно определяет объекты и связи, либо выделяет в тексте границы мотива и программа автоматически строит граф (рис. 4).

Для хранения и последующего редактирования теоретико-графовых моделей песенных мотивов, а также результатов поиска используется язык TextGML, основанный на XML [Москин, 2009b]. Ниже приводится пример разметки мотива, который был рассмотрен во втором параграфе:

<graph id="g1" name="мотив 1-1" directed="true"> Все <node id="n1" type="H" fuzzy="1">мужовья</node> до <node id="n2" type="H" fuzzy="1">жон</node> добры, Покупили <node id="n2" type="H" fuzzy="1">жонам</node> <node id="n3" type="CL" fuzzy="1">тафты</node>; Ещё мой <node id="n4" type="H" fuzzy="1">муж</node> не доброй

до <node id="n5" type="H" fuzzy="1">меня</node>, <node id="n4" type="H" fuzzy="1">Он</node> купил, мутил, <node id="n6" type="A" fuzzy="1">Коровушку</node> купил, <node id="n5" type="H" fuzzy="1">Жены</node> лишнюю <node id="n7" type="TR" fuzzy="1">работу</node> снарядил;

253

обнаружить «скрытые» мотивы (например, если составляющие мотивы находятся в нескольких частях текста), которые сложно определить традиционными методами.

Для того чтобы метод давал лучшие результаты, можно дополнительно ввести ограничения на порядок появления объектов и связей в тексте, на принадлежность связей к определенной группе, возможно усложнить модель до нечетких гиперграфов. Применение подобных теоретико-графовых моделей также может быть полезно при решении других важных задач в фольклористике: например, при реконструкции мотивов и сравнительном анализе текстов различных жанров.

В данном исследовании при построении теоретико-графовых моделей и интерпретации результатов принимали участие фольклористы Института языка, литературы и истории Карельского научного Центра Российской Академии Наук и сотрудники отдела фольклора музея-заповедника «Кижи».

Список литературы[Берштейн, 2005] Берштейн Л. С., Боженюк А. В. Нечеткие графы и гиперграфы.

– М.: Научный мир, 2005. [Варфоломеев и др., 2008] Варфоломеев А. Г., Каргинова Н. В., Кравцов И. В.,

Москин Н. Д. Применение RuleML для представления и вывода знаний о семантической структуре фольклорных текстов, полученных на основе их теоретико-графовых моделей // Труды XI национальной конференции по искусственному интеллекту с международным участием КИИ-2008. Т. 2. – М.: ЛЕНАНД, 2008.

[Дашков, 1842] Описание Олонецкой губернии в историческом, статистическом и этнографическом отношениях. Сост. В. Дашков. – Санкт-Петербург: тип. мин-ва внутренних дел, 1842.

[Калашникова, 1999] Калашникова Р. Б. Бесёды и бесёдные песни Заонежья второй половины XIX века. – Петрозаводск: Изд-во ПетрГУ, 1999.

[Москин, 2006] Москин Н. Д. Теоретико-графовые модели структуры фольклорных текстов, алгоритмы поиска закономерностей и их программная реализация. Автореф. дисс. на соиск. уч. степени к.т.н. – Петрозаводск, 2006.

[Москин, 2009a] Москин Н. Д. Математические модели и алгоритмы в задачах атрибуции фольклорных текстов // Сборник докладов 14-ой Всероссийской конференции «Математические методы распознавания образов». – Суздаль, 2009.

[Москин, 2009b] Москин Н. Д. Решение задач визуализации и поиска мотивов в электронной библиотеке фольклорных текстов // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды ХI Всероссийской конференции RCDL'2009. – Петрозаводск: КарНЦ РАН, 2009.

[Студитский, 1841] Народные песни Вологодской и Олонецкой губерний, собранные Ф. Студитским. – Санкт-Петербург, 1841.

255

[Ullmann, 1976] Ullmann J. R. An algorithm for subgraph isomorphism // Journal of the Association for Computing Machinery. – 1976. – Vol. 23, № 1.

256

УДК 004.852

АВТОМАТИЧЕСКИЙ ПОИСКПЕРЕВОДНЫХ СЛОВОСОЧЕТАНИЙ

В.И. Новицкий ([email protected]) МФТИ, Москва

В работе описывается подход к автоматическому построению списка словосочетаний по корпусу выровненных параллельных текстов (текстов и их переводов, сопоставленных по предложениям).

ВведениеРаспространённые естественные языки содержат сотни тысяч слов.

Количество всевозможных их комбинаций представляется числом порядка 1010 (если рассматривать словосочетания только из двух слов), В то же время, практически встречаются и представляют интерес для изучения и применения только небольшое их подмножество – семантически связанные словосочетания (устойчивые обороты речи). Их поиску и посвящена данная работа. В частности – поиску переводных словосочетаний, т.е. словосочетаний вместе с их переводами на другой язык.

Особенностью данной работы является набор эвристических фильтров для выделения семантически значимых словосочетаний среди всех встретившихся в корпусе.

Постановка задачиДан корпус параллельных текстов (текстов и их переводов на другой

язык). Тексты выровнены по предложениям (см. определения ниже). Требуется найти по ним словосочетания и их переводы.

Данная работа преследует следующие цели:Получение словосочетаний (статистических данных) для улучшения

работы синтаксического анализатора (применяемого в том числе в данной работе).

Расширение переводного словаря (так же используемого в данной работе) за счёт нахождения новых переводных статей.

Создание ТМ-базы (Translation memory) словосочетаний.

257

Известные подходы к решению задачиСуществует ряд известных работ, посвященных извлечению

словосочетаний, В первую очередь следуют упомянуть работу [Smadja, 1993], считающуюся классической в этой области, В её основе лежит статистический подход. Словосочетания порождаются для слов, часто встречающихся совместно и в определённых позициях друг относительно друга.

Использование различных чисто статистических подходов можно в первую очередь объяснить их простотой и отсутствием общедоступных и в то же время достаточно надёжных синтаксических анализаторов. Описываемый в данной работе подход в свою очередь базируется на использовании синтаксического анализатора, разработанного в компании ABBYY и имеющего достаточно хорошую точность. Это позволяет рассматривать предложение не как случайный поток слов, а как граф, определяющий связи между словами предложения (представление в виде «дерева зависимостей» будет описано ниже). В этом случае словосочетание представляет собой подграф, для которого мы знаем не только слова, входящие в словосочетание, но и зависимости между ними («меловой период» – главным является «период», подчинённым определением – «меловой»). Это позволяет нам задать лингвистические критерии фильтрации «шумовых» (неинтересных нам) словосочетаний (например, с сочинительной связью – через союз «и»).

Лингвистический подход к выделению словосочетаний даёт более адекватный и логичный результат (в силу учёта специфики языка, а не только статистических закономерностей).

Используемая терминологияОпишем терминологию, применяемую в данной работе:Словосочетание – грамматически и семантически связанный

устойчивый набор слов.Переводное словосочетание – словосочетание и его перевод на

другой язык.Значимое слово – семантически значимое слово, т.е. несущее

смысловую нагрузку.Грамматическое слово – служебное подчинённое слово, не имеющее

самостоятельного семантического значения. К грамматическим словам относятся следующие части речи: предлоги, артикли, междометия, частицы и т.п.

Параллельные тексты – текст и его перевод на другой язык (или на несколько языков в общем случае). Для качественных параллельных текстов характерно практически дословное соответствие (с точностью до устойчивых оборотов).

258

Выравнивание параллельных текстов – процесс (и результат) сопоставления параллельных текстов. Нас будет интересовать выравнивание по предложениям – сопоставление одного или нескольких предложений текста на одном языке одному или нескольким предложениям на другом языке (зачастую при переводе предложения разбиваются на несколько частей или, наоборот, «склеиваются» из нескольких предложений).

Синтаксический анализатор (парсер) – алгоритм или его программная реализация, порождающая дерево синтаксического разбора по тексту предложения.

Дерево синтаксического разбора (дерево зависимостей) – специальное представление предложения в виде ациклического направленного графа (дерева), в котором вершинам соответствуют слова предложения, а рёбрам – связи между ними (подробнее будет описано ниже).

Используемые обозначенияВведём следующие обозначения:w – слово (в лингвистическом понимании).c – словосочетание (от англ. «collocation»).

cC – множество всех словосочетаний на одном языке и различной длины.

pc – переводное словосочетание (от англ. «parallel collocation»), т.е. словосочетание и его перевод на другой язык.

Cp = {cp} – множество переводных словосочетаний.pcf – частота («frequency») переводного словосочетания в

рассматриваемом корпусе текстов.maxl – ограничение сверху на длину словосочетания (количество

неграмматических слов в словосочетании).

Виды представления синтаксической структуры предложенияСуществуют два наиболее известных способа представления

синтаксической структуры предложения [Bolshakov, 2004].Дерево непосредственных составляющих.Дерево зависимостей.Представление синтаксической структуры предложения в виде набора

составляющих было разработано в 50-х годах XX века на заре компьютерной эры американским лингвистом Ноамом Хомским (Noam Chomsky).

Представление синтаксической структуры деревом зависимостей изначально требует более тщательной проработки описания языка. Результатом разбора является дерево зависимостей (от главного слова к подчинённому), для которого нет ограничения на порядок слов в

259

предложении (которые изначально накладывает представление контекстно-свободными грамматиками в модели Хомского).

Исторически первый подход (на основе составляющих) характерен для лингвистической школы Северной Америки, Англии, Второй (на основе деревьев зависимости) – для части Европы (Франция, Германия) и России.

Используемые средстваВ работе используются следующие алгоритмы и данные,

разработанные ранее в компании ABBYY:Переводной словарь (русско-английский).Синтаксический анализатор (парсер).Алгоритм пословного выравнивания предложений.В основе переводного словаря лежат семантические инварианты

(межъязыковые статьи). Для каждого из языков описаны различные возможные реализации этих инвариантов – синонимы (например, «бегемот» и «гиппопотам» будут лежать в одном классе). В то же самое время, омонимы будут принадлежать сразу нескольким статьям (слово «bank» будет относится и к финансовому учреждению, и к подводной мели). Задача разрешения омонимии производится на этапе анализа текста и выходит за рамки данной работы.

Анализатор возвращает лучшее дерево синтаксического разбора предложения (на основе внутренних оценок качества деревьев). В вершинах этого дерева расположены семантические инварианты, рёбра – связи («главное-подчинённое»). Алгоритм может ошибаться и возвращать неправильное дерево (с неверно разрешённой омонимией). В этом случае мы полагаем, что либо словосочетания не будут порождены совсем (деревья на разных языках слишком сильно отличаются), либо будут порождены неправильные (а значит редкие) переводные словосочетания, которые будут удалены при фильтрации.

Пословное выравнивание – алгоритм, сопоставляющий слова параллельных фрагментов текста (т.е. текста и его перевода на другой язык). Данный алгоритм во время своей работы использует результаты синтаксического разбора предложения. Некоторые особенности его реализации будут описаны ниже.

Описание применяемого подходаПоиск словосочетаний можно разделить на следующие этапы :Пословное сопоставление предложений.Генерация одноязычных словосочетаний по деревьям синтаксического

разбора.Генерация переводных словосочетаний.

260

Фильтрация кандидатов с учётом частоты их появления в корпусе текстов.

Сортировка полученных результатов (словосочетания и новые переводы для словаря).

Ниже рассмотрим каждый этап подробнее.

Пословное выравнивание предложенийНапомним, что пословное выравнивание – процесс сопоставления слов

параллельных фрагментов текста. Мы используем словарь на основе семантических межъязыковых инвариантов. Здесь мы сталкиваемся с двумя основными сложностями:

Сопоставление омонимов (в случае неправильного выбора межъязыкового инварианта).

Сопоставление нескольких синонимов в предложении.Первая проблема решается сравнительно легко. Мы можем взять

всевозможные межъязыковые инварианты для слова и сравнивать их со всеми возможными переводами второго слова. В случае не пустого их пересечения можно считать, что слова сопоставились (табл. 1).

Табл.1Пример пересечения множества межъязыковых инвариантов

Клю

ч

родник

Key

…двер

нойдвер

нойреше

ниереше

ние…клав

ишаВторая проблема интереснее и будет рассмотрена ниже. Простейшим

способом её решения могло бы быть линейное (в порядке их появления в предложении) сопоставление синонимов.

Но этот способ даст ошибочный результат, если при переводе поменяются местами части предложения (табл. 2). Другая сложность – одно из слов может быть заменено местоимением или вообще опущено (во фрагментах будет различное число синонимов). Чаще всего описанная проблема проявляется при попытке сопоставить предлоги, местоимения, союзы и другие вспомогательные конструкции языка. Но так же может возникать и для значимых частей речи.

Табл. 2Нелинейное сопоставление синонимов.

261

Бегемот смотрел на него, а он – на бегемота.

He was staring at hippopotamus, and hippopotamus – at him

Применяемый в данной работе алгоритм сопоставляет предложения, опираясь на результаты работы синтаксического анализатора. Это позволяет учесть зависимости слов в предложении. В частности, в примере выше можно заметить, что в одной части предложения «бегемот» – дополнение при сказуемом («смотрел на бегемота»), а в другой – подлежащее. Обнаружив описанную (или аналогичную) зависимость в предложении, мы с уверенностью можем сопоставить рассматриваемые слова.

Наша цель – сопоставить все слова словосочетания. Мы будем рассматривать все возможные сопоставления слов, оценивая для каждой пары «качество» такого сопоставления. Для заведомо неправильных пар будем начислять запрещающий штраф. Из всевозможных пар мы выберем наилучший набор. Эта задача сводится к поиску набора оптимальных парасочетаний в полном двудольном графе с весами на рёбрах.

Генерация одноязычных словосочетанийНаложим следующие ограничения на словосочетания (и их переводы):Количество значимых (неграмматических) слов в словосочетании от

одного до пяти ( 5max l ).Слова образуют поддерево в дереве разбора предложения.Среди слов словосочетания нет местоимений.Вершиной синтаксического поддерева словосочетания не может быть

грамматическое слово.Разница в количестве значимых слов по сравнению с переводом не

может быть больше одного.Должно быть не более одной «дырки» (разрыва в линейном

представлении словосочетания в предложении).Будем идти по дереву разбора и строить всевозможные сочетания

слов, удовлетворяющие описанным выше критериям.

Перебор словосочетаний в предложенииНаша задача – перебрать всевозможные поддеревья дерева разбора

предложения, удовлетворяющие описанным выше условиям (размер не более пяти слов, связанность и т.д.). При этом будет считать, что проверка «корректности» словосочетания имеет сложность 1O .

Данная задача решается обходом дерева «снизу вверх». При этом в каждой рассматриваемой вершине w для всех её дочерних вершин iw~

словосочетания iw~c уже построены, поэтому задача сводится к перебору

262

всевозможных комбинаций текущей вершины и её дочерних словосочетаний:

iwcw ~, .

Генерация переводных словосчетанийВоспользуемся результатами, полученными на двух предыдущих

шагах – пословным выравниванием параллельных предложений и множеством вариантов словосочетаний, полученных по этим же предложениям. Найдём на основе этих данных всевозможные переводные словосочетания (точнее, кандидатов на роль переводных словосочетаний). Наложим на них следующие ограничения:

Разница в длине словосочетания и его перевода (без учёта грамматических частей) должна быть не больше одного слова.

Наличие пословных соответствий среди словосочетания (чем длиннее словосочетание, тем больше должно быть соответствий).

Для коротких словосочетаний (1-2 слова) пословных соответствий может не быть, но тогда должны совпадать предок корня и все исходящие вершины в дереве синтаксического разбора.

Если удалось сопоставить входящие или исходящие вершины одного из словосочетаний, то эти связи должны соответствовать соответственно входящим или исходящим вершинам второго словосочетания.

На этом этапе порождаются всевозможные словосочетания. На корпусе текстов размером 4,1 млн. фрагментов (параллельных предложений) получается порядка 62 млн. различных переводных словосочетаний, из которых только менее 6 млн. встречаются 2 и более раза.

Фильтрация кандидатовНа предыдущем шаге было получено большое количество

словосочетаний и их переводов, встречающихся в корпусе параллельных текстов. Возникает задача отобрать из них семантически значимые и устойчивые. Выделим следующие этапы фильтрации:

Удаляем редкие словосочетания (предварительная фильтрация по частоте).

Удаляем словосочетания, содержащие стоп-слова (неинтересные нам запрещённые слова, например, артикли).

Для двух словосочетаний, одно из которых является подмножеством другого, удаляем объемлющее словосочетание, если оно отличается от вложенного только грамматическими дочками корня (предлогами, частицами и т.п. при главном слове словосочетания) и при этом встречается значительно реже.

Аналогично удаляем вложенные словосочетания (например, «объединённых наций» – часть словосочетания «организация

263

объединённых наций»), если их частота не сильно превышает частоту объемлющего словосочетания.

Из множества неоднозначных переводов выбираем наиболее вероятные. При этом проверяем, чтобы выбранный вариант был доминирующим (составлял не менее 90% от возможных переводов словосочетания).

Снова удаляем редкие словосочетания, но уже с большим порогом.Удаляем известные словарные переводы.Отделение новых (несловарных) переводов.

Количественные результатыЭксперименты проводились на русско-английском корпусе,

содержащем 4,2 млн. фрагментов (параллельных предложений).Алгоритм порождения переводных словосочетаний даёт 62 млн.

различных пар (всего порождается около 107 млн. словосочетаний). Из них подавляющее большинство (56 млн.) встречаются только один раз. Динамика количества остающихся словосочетаний на различных этапах фильтрации показана в табл. 3.

Табл. 3Динамика фильтрации словосочетаний

Название фильтра Слосочетаний на выходе

Время работы

По частоте (предварительно) 2,5 млн. 30 секПо списку стоп-слов 1,1 млн 20Грамматические дочки корня 793 тыс. 1 мин.Вложенные словосочетания 568 тыс. 2 мин.Неоднозначные переводы 105 тыс. 30

сек.Словарные переводы 66,5 тыс. 5 сек.По частоте (окончательно) 42 636 3 сек.Отделение новых несловарных

переводов42 535 2 сек.

Таким образом, на экспериментальном корпусе удаётся получить 00042» переводных словосочетаний.

Можно заметить, что на последнем этапе наблюдается совсем небольшое количество отфильтрованных словосочетаний. Это можно объяснить тщательной проработкой словаря. Несколько примеров новых переводов, найденных на этом этапе приведены в табл. 4.

Табл. 4Новые переводы (отсутствовали в используемом словаре)

264

Английский РусскийGlib бойкийMeatball фрикаделькаLedger гроссбухReciter чтец

Несколько примеров найденных словосочетаний приведены в табл. 5.

Табл. 5. Примеры найденных словосочетанийАнглийский Русский Встретило

сь в корпусеjob time срок задания 12galaxy space космическое пространство 13other foreign

objectиной посторонний объект 5

air transport field область воздушного транспорта

30

ЗаключениеРазработанный алгоритм показал свою практическую применимость, и

используется сейчас в компании ABBYY.Есть несколько направлений возможного дальнейшего его развития.Более тщательная настройка параметров алгоритма (пороговых

значений для фильтров).Добавление новых фильтров (например, оценка «случайности»

словосочетания на основе частоты его появления в корпусе, а так же частот всех входящих в него слов).

Сейчас основные усилия сосредоточены на первом пункте – выборе оптимальных параметров.

Список литературы[Bolshakov, 2004] Bolshakov, I. A. Computational Linguistics: Models, Resources,

Applications / I. A. Bolshakov, A. F. Gelbukh. — IPN - UNAM - Fondo de Cultura Economica, 2004.

[Smadja, 1993] Smadja, F. A. Retrieving collocations from text: Xtract / F. A. Smadja // Computational Linguistics. — 1993. — Vol. 19, № 1.

265

УДК 004.89

ПОВЫШЕНИЕ РЕЛЕВАНТНОСТИ МЕТА-ПОИСКА С ИСПОЛЬЗОВАНИЕМ ДЕРЕВЬЕВ СИНТАКСИЧЕСКОГО РАЗБОРА

Б.А. Галицкий ([email protected])Университет Girona, Испания

Д. А. Дремов ([email protected]) Московский Физико-Технический Институт, Москва

С.О. Кузнецов ([email protected])Высшая Школа Экономики, Москва

В работе описаны подходы к упорядочению текстов выдачи поисковой системы по близости к запросу с использованием модели машинного обучения, основанной на сравнении деревьев синтаксического разбора. Для машинного обучения используется выборка запросов и упорядоченных ответов на английском языке.

1. ВведениеИспользование синтаксической структуры предложений для анализа

семантики предложений встречается в различных методах извлечения информации и при создании вопросно-ответных систем [Allen, 1987], [Cardie et al., 1999], [Ravichandran et al., 2002]. В последнее десятилетие произошел существенный сдвиг в компьютерной лингвистике от полностью ручного конструирования грамматик и баз знаний до частичной и полной автоматизации процесса, с использованием статистических методов с обучением на больших языковых корпусах.

В этой работе сначала схематически излагается процесс построения общей части двух предложений, использующий деревья синтаксического разбора. Затем для задачи поиска описана модель использования результатов сравнения для упорядочения предложений.

Для указанной модели предложен способ сведения задачи к задаче обучения по множеству поисковых запросов и соответствующих запросу правильно упорядоченных найденных фрагментов текста. Обучающая выборка строится при помощи поиска в Yahoo, через поисковый API Yahoo ручным упорядочиванием и фильтрацией.

266

2. Построение общего двух предложенийВ работе используется идея и программная реализация построения

обобщения двух предложений, предложенная в работах [Galitsky et al., 2008], [Galitsky, 2010].

Операция построения общего двух предложений является формальной операцией на деревьях синтаксического разбора предложений. Она выделяет семантическую информацию о схожести двух предложений в виде синтаксической структуры, которая может быть семантически интерпретирована как общий смысл двух предложений.

2.1. Обобщение пары предложенийОбщее двух предложений находится следующим образом:

Для каждого предложения производится синтаксический разбор. Результатом являются деревья синтаксического разбора, каждая из вершин которых – слово (lemma), часть речи (Part of speech, POS), информация о форме слова. Для этих целей используется open source продукт OpenNLP, реализованный на java. Разобранные предложения разбиваются на поддеревья-фразы разных типов: verb, noun, prepositional и другие. Поддеревья хранятся так, что сохраняется информация об их вхождении в дерево синтаксического разбора предложения.Все поддеревья разбиваются на группы по типам фраз.В множество всех поддеревьев добавляются деревья, полученные из них рядом эквивалентных преобразований, меняющих структуру предложения с сохранением семантики. Например: «Cell phone can be easily grasped by a hand palm» и «Hand palm can easily grasp the cell phone» Обобщается каждая пара поддеревьев одного типа разных предложений:Для каждой пары поддеревьев производится выравнивание. Выравнивние здесь обозначает — соответствие конечных вершин-слов. Выравнивание производится при помощи алгоритма выравнивания последовательностей принятого в биоинформатике «protein sequence alignment» [Smith et al., 1981]. Затем для полученного выравнивания производится обобщение поддеревьев по парам соответствующих вершин (как производится обобщение пары вершин описано ниже). Для полученного множества деревьев результатов обобщения вычисляем числовую функцию, отвечающую за общность полученного обобщения (она описана ниже).Для каждой пары поддеревьев по каждой фразе из множества фраз выбирается дерево, полученное обобщением с наибольшим значением функции посчитанной выше (наименее общую).Полученные деревья группируются в множества по типам фразы (verb, noun, и др.).

267

Из каждого множества, соответствующего типу фразы, исключаются все деревья-обобщения, более общие, чем другие деревья-обобщения этого множества.

2.2. Обобщение пары вершинДля пары вершин, представляемых тройкой (POS, lemma, form),

обобщение происходит следующим образом:Если тройки совпадают — обобщением является та же тройка.Если различается только форма (например, для слов в единственном и множественном числе), обобщением является тройка (POS, lemma, *).Если различается только слово, обобщением является (POS, *, *), то есть у слов считается общей только часть речи.Если различается часть речи, то обобщение пустое: (*, *, *), даже если слова одинаковые.

2.3. Функция, используемая для выбора наименее общего дереваДля каждой вершины являющейся обобщением пары вершин

вычисляется вес, быстро убывающих в таком порядке: noun и verb, другие части речи, совпадения части речи без совпадения слова. Веса для дерева складываются.

3. Обобщение предложений в задаче поиска документовПо каждому запросу предлагается осуществлять обычный

полнотекстовый поиск, использующий поиск документов по включению в них слов, содержащихся в запросе, и затем производить операцию поиска общего предложения запроса-фразы и отрывков документа, где встречаются найденные слова запроса. Далее, используя функцию оценки релевантности (описанную ниже), считаемую на обобщении, можно переупорядочить документы, в частности фильтровать документы, имеющие малое отношение к запросу.

3.1. Переход к числовому признаковому описаниюМы строим дискретные числовые признаки описания общего двух

предложений:Для каждой общей части двух фраз определяются количества совпавших одновременно частей речи вместе со словом.Когда слова разные, определяются количества совпавших частей речи. Группировка некоторых близких форм частей речи (например, разные единственная и множественная формы одной части речи).

Тем самым осуществляется переход от структурного описания общего к числовому признаковому описанию, которое представляется в виде столбца неотрицательных целых чисел. На данном этапе мы теряем информацию о структуре «общего», но полагаем что информация о

268

структуре, в первую очередь, нужна для нахождения общих частей, а для оценки «значимости» общей части достаточно выбранного признакового описания.

В данной работе рассматривается линейный вид функции релевантности, параметрами которой являются указанные выше числовые признаки. Таким образом, функция релевантности – линейная комбинация количества появлений в обобщениях фраз каждой из частей речи (с совпадением слова и без, то есть имеющие разные признаки и коэффициенты).

4. Сведение задачи оптимизации коэффициентов модели к задаче машинного обучения

Одним из способов оптимизации коэффициентов функции релевантности является использование обучающей выборки правильно упорядоченных предложений, связанных с некоторым запросом. Данные получаются при помощи поиска Yahoo, через поисковый API Yahoo.

В рамках модели предложенной выше, на выборке отсортированной и отфильтрованной вручную из запросов на тему налогов, было произведено обучение с использованием метода опорных векторов, в частности пакета svm_rank (часть пакета svm_light, оптимизированного для обучения по наборам упорядоченных величин).

Результаты оцениваются по следующей мере: среднее отклонение верного порядка от порядка, получаемого при сортировке по функции релевантности. Отклонения порядков считаются как расстояния тау кендала между списками, которое определяется, как отношение количества пар элементов стоящих в неверном порядке, к общему числу пар элементов списка. Расстояние, таким образом, лежит в интервале [0; 1].

5. Компьютерный эксперимент и обсуждение результатовЭкспериментальные расчеты производились для данных, полученных

из 200 предложений (запросов и ответов в сумме), состоящих из примерно 1000 неравенств в обучающей выборке и 500 в тестовой.

Вычисления производились на персональном компьютере с процессором Intel Core 2DUO T8100 (2.1GHz) и 2Гб оперативной памяти под управлением ОС Ubuntu linux. Время, затраченное на обучение, зависело от параметров обучения и составляло от ~100 мс до ~100 с.

В таблице 1 приведены экспериментальные значения ошибок для некоторых обучающей и тестовой выборок, параметр “с” отвечает за соотношение важности ошибки обучения и зазора. Больший параметр “c” приводит к переобученности.

269

Ошибку следует сравнивать с ошибкой случайно упорядоченного списка, которая составляет примерно 0,5 (примерно, так как для части элементов списка функция релевантности будет совпадать, что будет считаться за неверный порядок).

Для обучающей выборки ошибка считается для тех же значений, по которым проводилось обучение.

Табл. 1Описание Ошибка на

обучающей выборкеОшибка на тестовой

выборке

Линейная (с=10) 0,36 0,37

Линейная (с=1) 0,35 0,36

Линейная (с=0,1) 0,36 0,35

Полиномиальная(с=0,1)

0,26 0,43


0,29 0,39


0,34 0,37


0,34 0,34

Используемая модель оценки сходства структур предложений позволяет среди поисковых ответов на заданный запрос частично восстановить верный порядок, отвечающий пользовательскому ранжированию релевантности ответов. Важно заметить, что ранжирование происходит среди уже отфильтрованных поисковой машиной по релевантности первых 30 отрывках документа (с удалением дубликатов), то есть среди отрывков, которые имеют большую оценку поискового движка схожести с запросом. Эта схожесть обычно выражается в наличии в отрывках документа слов запроса, в соответствии с моделью “Bag of words”.

6. Заключение

270

Результаты компьютерных экспериментов говорят о том, что сходство структур предложений, описанное даже небольшим набором простых числовых признаков, может быть эффективно использовано для восстановления порядка близости предложений в списках к целевому предложению (запросу). Имея обучающую выборку запросов и найденных документов, упорядоченных пользователем, можно автоматически восстанавливать функцию релевантности, отвечающую за близость запроса к документу. Функция релевантности, в свою очередь, может быть использована для улучшения релевантности поиска путем переупорядочивания результатов поисков документов по включению слов запроса.

Список литературы[Вапник, 1979] Вапник В.Н., Восстановление зависимостей по эмпирическим

данным. – М.: Наука, 1979.[Allen, 1987] Allen J. F., Natural Language Understanding // Benjamin Cummings.[Cardie et al., 1999] Cardie C., Mooney R.J. Machine Learning and Natural

Language // Machine Learning, 1(5), 1999.[Galitsky et al.] Galitsky B., Lluis de la Rosa J., Dobrocsi G. Inferring semantic

properties of sentences mining syntactic parse trees Galitsky, Lluis de la Rosa и Dobrocsi // В печати.

[Galitsky et al., 2008] Galitsky B., Kuznetsov SO Learning communicative actions of conflicting human agents // J. Exp. Theor. Artif. Intell. 20(4): 277-317 (2008).

[Ravichandran et al., 2002] Ravichandran D., Hovy E. Learning surface text patterns for a Question Answering system // In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL 2002), Philadelphia, PA.

[Smith et al., 1981] Comparative biosequence metrics // Springer New York.

271

УДК 004.89

СЕМАНТИЧЕСКАЯ КЛАССИФИКАЦИЯ НА ОСНОВЕ ОБУЧЕНИЯ ПО ДЕРЕВЬЯМ СИНТАКСИЧЕСКОГО

РАЗБОРА

Б. А. Галицкий ([email protected]) Universitat de Girona, Girona

С. О. Кузнецов ([email protected]) Высшая школа экономики, Москва

С. В. Якимович ([email protected]) Московский Физико-Технический Институт

(Государственный университет), Москва

Исследуется возможность построения описаний предложений на основе их деревьев синтаксического разбора, а также применимость этих типов описаний для семантической классификации предложений.

ВведениеИспользование деревьев синтаксического разбора позволяет решать

задачи, требующие высокого уровня понимания языка, например, извлечения информации и ответы на вопросы [Bar-Haim et al., 2005] [Ravihandran et al., 2002]. В данной работе на основе деревьев синтаксического разбора создаются наборы признаков, с помощью которых проводиться семантическая классификация предложений. Используются предложения, взятые из отзывов покупателей на цифровые камеры на сайте Amason.com. Они классифицируются на являющиеся информативными отзывами на продукт и на не являющиеся таковыми. Информативными считаются отзывы, которые содержат информацию о свойствах товара, например, “Auto focus is really quick”. Такие отзывы представляют потенциальный интерес для производителя и продавца товаров, в отличии от неинформативных вроде “I bought this as a gift”. Также информативные отзывы классифицируются на положительные, например, “Very little noise” и отрицательные, например “Battery life is short”. Рассматриваются различные способы введения признаков предложений на основе их деревьев синтаксического разбора:

272

словосочетания, последовательности слов и их тэгов, поддеревьев дерева синтаксического разбора.

1. Подходы к представлению предложенийТрадиционным подходом к классификации является введение

некоторых свойств или признаков объектов и определение числовых значений, соответствующих данному признаку для данного объекта. Объекты представляются в виде числовых векторов.

В случае представления предложения в виде множества слов, в него входящих в качестве признаков, можно выбрать все слова, встречающиеся в предложениях обучающей выборки. Значение, соответствующее некоторому слову, в векторе, соответствующем некоторому предложению, равно 1, если слово содержится в предложении, и 0, если не содержится.

В случае представления предложения в виде дерева синтаксического разбора обычно не вводят фиксированный набор свойств, а вводят меру сходства двух деревьев [Vishwanathan et al., 2002] [Collins et al., 2002] [Moschitti, 2004]. Для многих методов классификации, например, для метода k ближайших соседей этого достаточно, чтобы провести классификацию.

Однако подход в виде набора признаков и представления предложения в виде числового вектора имеет ряд преимуществ. Он необходим для использования некоторых методов классификации, например, наивного байесовского. Он позволяет использовать различные методы отбора признаков и значительно сократить вычисления. После перехода от деревьев к числовым векторам все расчеты значительно упрощаются. Недостатком является то, что числовым вектором сложно адекватно отразить информацию, заложенную в дереве.

Классификация в данной работе осуществлялось на основе следующих признаков:

1. Слов2. Словосочетаний3. Последовательностей слов и их тэгов 4. Поддеревьев дерева синтаксического разбора предложения

При этом для поддеревьев рассматривалось введение как бинарных, так и числовых значений признаков.

Далее более подробно описываются признаки, введенные в работе.

СловоВ качестве признаков используются слова, содержащиеся в

предложении. Используются алгоритмы морфологического поиска

273

(stemming), позволяющие свести все формы одного и того же слова к одной. В работе используется открытая программа Snowball Stemmer.

СловосочетаниеВ качестве признаков используются последовательности слов,

соответствующие узлам дерева синтаксического разбора предложения, то есть все слова, являющиеся дочерними узлами по отношению к этому узлу. В этом случае дерево синтаксического разбора используется только для построения признаков. Оно позволяет сделать выбор словосочетаний осмысленным. Информация о тэгах при этом не используется и нигде не сохраняется.

Последовательность слов и их тэговПод последовательностью в данной работе понимается

последовательность слов и их тэгов, соответствующие некоторому узлу дерева синтаксического разбора. Каждой последовательности соответствует её тип, являющийся типом соответствующего узла. Опишем построение последовательности, соответствующей некоторому узлу синтаксического дерева. Берется некоторый узел синтаксического дерева, не являющийся терминальным, то есть словом. Затем строиться последовательность всех слов, являющихся потомками этого узла. Далее каждому слову поставим в соответствие его тэг, то есть непосредственного предка. В качестве примера последовательности можно привести [NP:JJ-great NN-picture NN-quality]. Вводится функция, которая возвращает меру схожести двух последовательностей. Если последовательности имеют разные типы, то возвращается 0. Если последовательности имеют один тип, находится наибольшая общая последовательность этих последовательностей. Если тэги каких-то слов совпадают, а сами слова нет, то в наибольшей общей подпоследовательности на месте этих слов стоит *. Вводиться вес общего слова и вес общего тэга. Функция, характеризующая сходство двух последовательностей, равна количеству слов в наибольшей общей подпоследовательности, умноженному на вес общего слова, плюс количеству общих тэгов, умноженному на вес тэга.

Если последовательность является атрибутом при классификации, то значение, соответствующее некоторому предложению, равно максимальному значению введенной выше функции сходства и всех последовательностей предложения.

Поддерево дерева синтаксического разбораПоддерево дерева синтаксического разбора предложения в данной

работе использовалось как в качестве бинарного признака, так и в качестве числового признака. При использовании в качестве бинарного

274

признака проверяется, является ли дерево-признак поддеревом дерева синтаксического разбора предложения.

Для использования в качестве числового признака вводится функция, которая возвращает меру схожести двух поддеревьев. Функция вводится аналогично функции сходства двух последовательностей. Если поддеревья имеют разные типы, то возвращается 0. Если поддеревья имеют один тип, то есть самый верхний узел совпадает, находиться наибольшая общая подпоследовательность дочерних тэгов или слов. Далее для каждого общего тэга находиться наибольшая общая подпоследовательность дочерних тэгов или слов и т.д. Вводиться вес общего слова и вес общего тэга. Функция, характеризующая сходство двух поддеревьев, равна количеству слов в полученном общем поддереве, умноженному на вес общего слова, плюс количеству общих тэгов, умноженному на вес тэга.

В случае если поддерево является атрибутом при классификации, значение, соответствующее некоторому предложению, равно максимальному значению функции сходства этого поддерева и всех поддеревьев дерева синтаксического разбора предложения.

2. Методы классификации и компьютерные экспериментыКлассификация осуществлялась с помощью следующих методов:Метод K ближайших соседей (KNN) Наивный байесовский классификатор (NB)SVM методы (методы опорных векторов):SVM light (Joachims 1998)SMO (Platt 1998)Использовалась реализация этих методов в открытых проектах Weka и

RapidMiner. Методы приведены в порядке, в котором расположены показанные ими результаты. В таблице 1 приведены результаты классификации, полученные с помощью SVM SMO, который показал наилучшие результаты.

Для обучения и проверки результатов использовались 1600 предложений. Проводилась кросс-валидация с разбиением на 4 группы.

Табл. 1. Результаты классификации

Атрибут Точностьинформ./неинфм. полож./отриц.

Слово 80,1 87,9Словосочетание 83,6 88,1

Последовательность 83,6 83,4дерево бин. знач. 79,5 77,4дерево числ. знач. 84,1 83,1

275

3. Временные затратыДля вычислений использовался компьютер с процессором Intel Core 2

Duo 2.0 GHz и памятью 2GB. В таблице 14 приведено время, затраченное на кросс-валидацию при использовании метода SVM SMO и различных атрибутов классификации.

Табл. 2. Время, затраченное на кросс-валидацию

атрибут время (сек)

слово 15словосочетание 300последовательн

ость1200

дерево бин. зн. 4300дерево числ. зн. 800

4. Лучшие атрибутыДалее (таблицы 3, 4) приведены слова и деревья, которые являются

наиболее характерными атрибутами семантических классов, рассматриваемых в работе. Атрибуты выбирались в соответствии с критерием χ2. χ2 является мерой отсутствия статистической независимости между классом и свойством. В каждой таблице первые 5 отзывов являются наиболее характерными для 1 класса, а последние 5 для 2.

Табл. 3. Лучшие атрибуты при классификации отзывов на информативные и неинформативные

Слово инф неинф дерево инф неинфIs 178 68 (ADJP(JJ *)) 210 54Qualiti 72 6 (ADJP *) 219 63Easi 41 1 (VP(ADJP *)) 171 37Great 57 11 (VP(VBZ *)(ADJP *)) 118 10Veri 53 10 (S(VP(ADJP *))) 138 23I 79 232 (NP(PRP I)) 74 204My 20 72 (NP(PRP *)) 159 291This 51 110 (S(NP(PRP I))(VP *)) 69 191purchas 0 25 (S(NP(PRP I))) 71 191Bought 0 23 (VBD *) 65 175

276

Табл. 4. Лучшие атрибуты при классификации отзывов на положительные и отрицательные

слово пол отр Дерево Пол отрeasi 107 3 (JJ easy) 97 3great 70 6 (ADJP(JJ easy)) 72 2qualiti 75 12 (JJ great) 66 6use 90 27 (NN quality) 69 11excel 23 0 (VP(ADJP(JJ easy))) 43 2focus 6 53 (VP(RB not)) 4 48not 8 55 (RB not) 8 55no 1 25 (VP(RB *)) 7 51problem 0 22 (S(VP(RB not))) 4 37poor 0 19 (S(NP *)(VP(RB not))) 2 32Роль синтаксической информации при классификации отзывов на

информативные и неинформативные значительно больше, чем при классификации на положительные и отрицательные. Если среди самых характерных поддеревьев информативных и неинформативных отзывов поддеревьев с узлами-словами практически нет, то в случае положительных и отрицательных отзывов они составляют большинство. Даже те конструкции, которые не являются словами, например, (VP(RB *)) без слов не имеют классификационной ценности. (VP(RB *)) встречается в положительных и отрицательных отзывах 7 и 51 раз. При этом конструкция (VP(RB not)) встречается 4 и 48 раз, то есть без слова “not” конструкция (VP(RB *)) встречается только 6 раз, 3 раза в положительных отзывах и 3 раза в отрицательных, то есть не имеет самостоятельной классификационной ценности. Есть и обратный пример. На первом месте в списке самых характерных слов для информативных отзывов оказалось слово “is”. В информативных и неинформативных предложениях оно встречается 178 и 68 раз. В списке самых характерных конструкций есть конструкция (VP(VBZ is)(ADJP *)) (к сожалению, она не попала в таблицу) которая встречается 107 и 10 раз. Отсюда видно, что вне конструкции слово “is” встречается 61 и 58 раз, то есть практически не имеет классификационной ценности.

5. ЗаключениеВ работе на основе деревьев синтаксического разбора исследованы

следующие типы представления предложений для задачи семантической классификации текстов:словосочетания

277

последовательности слов и их тэговподдеревья дерева синтаксического разбора.

Проведено сравнительное исследование классификаций предложений на основе представлений указанных типов. Анализ результатов экспериментов показывает, что точность классификации отзыва на положительность (положительный-отрицательный) не повышается при использовании более сложного представления (последовательности слов, синтаксические деревья), тогда как точность классификации на информативность при использовании синтаксических деревьев больше, чем в случае использования примитивных представлений (слова, словосочетания).

Список литературы[Bar-Haim еt al., 2005] Bar-Haim R., Dagan I., Greental I. Shnarch E. Semantic

inference at the lexical-syntactic level. // In proceeding of AAAI-05, 2005.[Collins еt al., 2002] Collins M. and Duffy N. Convolution Kernels for Natural

Language. // In proceeding of ACL-02, 2002.[Galitsky et al., 2009] Galitsky Inferring semantic properties of sentences mining

syntactic parse trees. // In proceeding of ICCS-09, 2009.[Joachims, 1998] Making large-Scale SVM Learning Practical. // Advances in Kernel

Methods - Support Vector Learning, chapter 11. MIT Press, 1998.[Jurafsky еt al., 2000] Semantic Speech And Language Processing. // Prentice Hall,

2000.[Moschitti, 2004] A study on convolution kernels for shallow semantic parsing. // In

proceeding of ACL-04, 2004.[Platt., 1998] Sequential Minimal Optimization: A Fast Algorithm for Training Support

Vector Machines. // Advances in Kernel Methods - Support Vector Learning, chapter 12. MIT Press, 1998.

[Ravichandran еt al., 2002] Learning surface text patterns for a Question Answering system. // In proceeding of ACL-02, 2002.

[Vishwanathan еt al., 2002] Vishwanathatn S.V.N. and Smola A.J. Fast kernels on strings and trees.// In proceeding of Neural Information Processing Systems, 2002.

278

УДК 004.85: 81.32

АВТОМАТИЧЕСКОЕ ПОРОЖДЕНИЕ ПРАВИЛ ТРАНСКРИПЦИИ ФАМИЛЬНО-ИМЕННЫХ ГРУПП

Э.С. Клышинский ([email protected])

В.К. Логачева ([email protected])ИПМ им. М.В. Келдыша РАН

В работе излагается метод транскрипции имен собственных с иностранного языка на русский. Метод комбинирует такие подходы, как использование правил и конечных автоматов. Приводится методика порождения правил транскрипции по обучающему множеству.

ВведениеПроблема передачи фамильно-именных групп и имен собственных в

целом средствами другого языка постоянно возникает в самых разных областях. В разное время наибольшей популярностью пользовались разные подходы, но с середины XX века господствующей тенденцией стала передача звучания имени при его переводе на иностранный язык. К ранним работам в области создания систем автоматической транслитерации и транскрипции имен собственных относятся работы группы Найта. Изначально проводилась транслитерация с японского языка на английский [Knight et al., 1998]. Вскоре этот метод был адаптирован для работы с арабским языком [Al-Onaizan et al., 2002]. Основной задачей метода являлось обнаружение и восстановление имен собственных, уже переданных с использованием другого алфавита. В качестве основы использовался модифицированный алгоритм Витерби.

Однако базовый принцип использования лишь отдельных символов алфавита не позволял получить высокие показатель качества передачи. В связи с этим стали применяться методы, использующие подстроки [Sherif, 2007]. Применение подстрок взамен отдельных символов позволило повысить качество транслитерации примерно с 30 до 90%.

Еще одной важной задачей здесь является автоматическое обучение системы переходов конечного автомата (КА), используемого в перечисленных методах. На данный момент развиваются методы как обучения с учителем [Knight et al., 1998], так и без него [Tao et al., 2006].

279

Последние работы позволили перейти к обучению по одноязычному корпусу [Ravi et al., 2009], что привело, правда, к существенному падению качества передачи.

Данная работа основана на программе «Трансскриба» [Klyshinsky et al., 2008]. В отличие от рассмотренных работ, здесь используется не стохастический, а детерминированный подход, при котором правила пишет эксперт. Метод позволяет повысить эффективность передачи, но требует создания системы правил – правила для одного языка создаются от нескольких недель до нескольких месяцев, в зависимости от сложности задачи.

1. Метод транскрипцииПредлагаемый в данной работе метод объединяет удобство и скорость

разбора с использованием КА с удобством представления правил преобразования в привычном для человека виде. Правила преобразования цепочек из одного языка на другой представляются в виде «входная цепочка» «выходная цепочка». Скорость работы алгоритма зависит от размеров базы и длины входной цепочки. В данной статье используется КА, скорость работы которого линейна. Скорость разбора с использованием КА пропорциональна длине цепочки.

Здесь мы считаем, что набор правил может быть создан лингвистом или получен в ходе машинного обучения. При необходимости специалист работает в привычных ему терминах правил. Далее набор правил может быть расширен за счет дообучения. В другом случае набор правил может быть изначально автоматически сформирован с использованием предлагаемого метода. Набор правил преобразуется в КА, который используется для передачи имен собственных с языка на язык.

1.1. Структура конечного автомата.Используемый нами автомат представляет собой преобразователь. Его

можно представить как множество g = <VI, VO, Q, q0, F, δ> VI – входной алфавит (алфавит языка оригинала); VO – выходной алфавит (алфавит языка перевода)8;Q – множество состояний автомата;q0 – начальное состояние автомата; F – множество конечных состояний; δ – функция переходов QVI <Q, a>.Здесь a – это действие, совершаемое при переходе, причем aA –

множеству действий, выполняемых КА при переходе.

8 Входной и выходной алфавиты включают символы начала “<” и конца “>” слова.

280

A = {out(), shift()}Out(s) – функция, подающая на выход строку символов s (в том числе

пустую) из алфавита перевода. Shift(n) – функция, выполняющая сдвиг рассматриваемой строки на n

символов.

1.2. Описание правил транскрипцииЗа основу был взят метод, описанный в [Klyshinsky et al., 2008]. Так

как в предлагаемом методе правила используются прежде всего для пополнения матрицы переходов КА и генерируются компьютером, а не человеком, их структура отличается от базового варианта.

В нашем случае правило представляется в виде тройки r = <p, c>, где: p – непустое упорядоченное множество символов из алфавита языка

оригинала, p=<p1, p2, p3>, где p1 и p3 – пред- и постусловия соответственно (левый и правый контекст правила), а p2 – преобразуемая подстрока, p2=<v1, v2, …, vn2>, p1=<{v1}, {v2}, …, {vn1}>, p3=<{v1}, {v2}, …, {vn3}>, где viVI, i[1,nj], nj=|pj|.

c – упорядоченное множество символов из алфавита языка перевода, которым передается множество символов p в языке перевода, c=<w1, w2, …, wnс>, где wiVO , i[1,nc], nc=|c|.

Правило применимо с текущей позиции, если на текущей позиции находится подстрока p2, перед ней – подстрока, на соответствующих позициях которой находятся символы из p1, а после нее – подстрока, на соответствующих позициях которой находятся символы из p3.

Считается, что к входной строке последовательно ищутся применяемые правила. При нахождении такого правила текущая позиция сдвигается вправо на n2, а на выход подается c.

1.3. Преобразование правил в конечный автоматДля правила r = <p, c> процедура добавления в КА будет следующей.

Здесь за исключением начального состояния q0, все состояния заводятся для данного правила заново. При этом дополнительным алгоритмом обеспечивается уникальность нумерации состояний.

Для правил, в которых левый контекст пуст, в КА добавляется переход из состояния qi-1 в qi по символу vi из p2, i[1,n2]. При этом никакие действия не совершаются. Состояние qn2 помечается как конечное.

Для правил, в которых правый контекст пуст, в КА добавляется переход из qn2 в q0 по e-символу, сопровождаемый Shift(n2) и Out(c).

Для правил, в которых правый контекст не пуст, в КА добавляется переход из состояния qn2+i-1 в состояние qn2+i по всем символам из {vi} из p3, i[1,n3]. Далее в КА добавляется переход из qn2+n3 в q0 по пустому символу, сопровождаемый действиями Shift(n2) и Out(c).

281

Для правил, в которых левый контекст не пуст, для всех qfF в КА добавляется переход из qf в qn2+n3+1 по всем символам {v1} из p1, и переходы из состояния qn2+n3+i-1 в состояние qn2+n3+i по всем символам из {vi} из p1, i(1,n1]. При этом никакие действия не совершаются. Далее в КА добавляется переход из qn1+n2+n3 в q0 по пустому символу, сопровождаемый действиями Shift(n2) и Out(c).

Подобные операции проводятся для всех правил.

2. Порождение правилДля облегчения поиска соответствий в строках на языке оригинала и

перевода каждое слово и его перевод делятся на слоги. Поскольку мы не имеем никакой информации о структуре языка и правилах слогоделения в этом языке, деление производится по формальным признакам. В порождении правил участвуют только слова, для которых установлено взаимно однозначное соответствие слогов в оригинале и переводе.

2.1. Разделение слова на слогиТермин «слог» в данном контексте употребляется в смысле, отличном

от того, в котором он используется в трудах по фонетике. Поэтому необходимо дать его определение. Слог – это непустое множество букв, содержащее один или более символов, обозначающих гласные звуки. Слово делится на слоги по следующим правилам:

деление осуществляется по гласной букве. Граница слога – после гласной;

2 и более гласных подряд не разделяются; 2 и более согласных не разделяются; множество элементов, среди которых нет гласной, не выделяется в

отдельный слог; символы начала и конца слова считаются согласными буквами; (для русского) не отделять «ь» от предыдущей согласной.

Таким образом, слог – это цепочка вида C*V+, где С – буква, обозначающая согласный звук, V – буква, обозначающая гласный звук. Слог может иметь вид C*V+C+ только случае, если это последний слог в слове и заключительное множество согласных не может быть выделено в отдельный слог, так как среди них нет слогообразующего символа.

Полученные таким образом слоги (кроме последнего) формально являются открытыми (то есть, заканчиваются на гласную). Несмотря на это, у слога присутствует параметр открытости/закрытости, определяемый при делении: для каждого слога проверяется количество начальных согласных в следующем слоге и если их больше одной, слог считается закрытым. Введение этого параметра связано с тем, что во многих языках он может влиять на правила чтения гласных букв.

282

2.2. Порождение первичных правилПервый этап порождения правил – порождение первичных правил.

Первичными правилами мы называем правила транслитерации, то есть правила, для которых |p2| = |c| = 1.

Первичные правила порождаются на основе слогов вида CV → CV: i-му символу слога ставится в соответствие i-й символ его перевода, при условии, что оба символа обозначают звуки одного и того же типа (гласные или согласные). При таком подходе вероятность порождения некорректного правила очень мала.

В порожденном множестве первичных правил могут содержаться неоднозначности, то есть пары правил r1 = <p, c> и r2 = <p, c> такие, что r1(p2) = r2(p2) и r1(c) ≠ r2(c). Такие ситуации в принципе возможны в языке, но на данном этапе неоднозначность, скорее всего, обозначает влияние на букву окружающих ее букв. Для избавления от неоднозначностей вводится новый тип правил – временные правила.

Временными правилами мы называем правила, используемые при обучении системы правил. Временное правило представляет собой тройку r = <p, c, s>, где p и c описаны выше (см. п. 1.2); s – множество слогов, удовлетворяющих правилу.

При генерации правила в его множество s добавляется слог, на основе которого оно было сгенерировано. При обучении системы правил слог, к которому удалось применить правило, добавляется в множество s. Хранение всех слогов позволяет при обнаружении неоднозначностей в правилах составлять более полные контексты, а также выявлять частотность употребления правила (например, если правилу удовлетворяет только один слог, можно с большой вероятностью утверждать, что это исключение).

Избавление от неоднозначностей производится следующим образом.Для каждого правила ri, для которого существует rj, такое что

ri(p2) = rj(p2), ri(c) ≠ rj(c), для каждого sk из ri(s) составляется новое правило rik = <p, c, s>, такое, что: rik(p2) = ri(p2), rik(c) = ri(c), rik(p1) = <{v1}>, где v1VI – символ, предшествующий p2 в слоге sk, rik(p3) = <{v3}>, где v2VI – символ, следующий за p2 в слоге sk. В случае если p2 – начальная или заключительная подстрока в слоге, v1 и v2 берутся из предыдущего или следующего слога соответственно.

После порождения системы первичных правил производится расширение их контекстов на основе слогов вида CnV → CnV, где n > 1. Каждый слог si, который не может быть целиком разобран с помощью существующей системы правил, можно представить как <pi1, …, pik, px, pik+1, …, pin> → <ci1, …, cik, cx, cik+1, …, cim>, где px → cx – подстрока, не удовлетворяющая ни одному из существующих правил. Можно выделить три случая несоответствия px правилам:

283

существует ri такое, что px = ri(p2), cx = ri(c), но pik {v11} или pik+1 {v31} (т.к. ri(p1) = <{v11}>, ri(p3) = <{v31}>). В этом случае контекст правила ri расширяется: ri(p1) = <{v11, pik}>, ri(p3) = <{v31, pik+1}>;

не существует ri такого, что px = ri(p2) и cx = ri(c). В этом случае составляется новое правило rj такое, что rj(p1) = <{pik}>, rj(p2) = px, rj(p3) = <{pik+1}>, rj(c) = cx, rj(s) = {si};

существует ri такое, что px = ri(p2), pik {v11} и pik+1 {v31} (т.к. ri(p1) = <{v11}>, ri(p3) = <{v31}>), cx ≠ ri(c). Это может объясняться одной из следующих причин:

o контекст правила ri недостаточен для правильной интерпретации подстроки, и надо рассматривать не один, а несколько символов, предшествующих ей или следующих за ней. Например, для имени Marin → Марен (франц.) было порождено правило i → е, которое при избавлении от неоднозначностей приобрело вид i{n}→ е. Но имя Marine → Марин не удовлетворяет этому правилу, потому что i переходит в е(э) только если после него стоит n и слог является закрытым (заканчивается на согласную). В этом случае нужно проверять не один, а два следующих за i символа.o Подстрока может читаться двумя различными способами в силу

причин, не зависящих от контекста. В шведском языке å читается как «о», однако в машиночитаемых текстах без диакритик å заменяется на аа. Между тем сочетание двух шведских букв а будет передаваться на русский язык как «аа». В тестовой выборке для шведского языка можно встретить примеры неоднозначностей Baad → Баад, Baang → Бонг, Haapanen → Хаапанен Haafman → Хофман, которые нельзя предугадать, имея в качестве обучающей выборки машиночитаемый файл. Значит, для каждого шведского имени, содержащего подстроку «aa», будет сгенерировано два варианта перевода.

В настоящее время нет алгоритма выбора одной из двух описанных причин и избавления от подобных неоднозначностей.

2.3. Порождение сложных правилБолее сложные правила порождаются по следующему алгоритму: отбираются слоги определенной структуры; множество отобранных слогов проверяется с помощью КА; к подмножеству, не принятому КА (то есть, к слогам, для которых

выход КА не совпал с переводом), снова применяются правила: происходит проверка слога справа налево и слева направо для выделения подстроки, не удовлетворяющей существующим правилам;

по возможности на основе подстроки, не удовлетворяющей правилам, производится расширение контекста какого-либо из существующих правил (по алгоритму, описанному в п.2.2);

284

для каждого слога, который не удалось объяснить после расширения контекста существующих правил, составляется кандидат в правило: подстрока оригинала слога и подстрока перевода, не объясненные правилами;

кандидаты в правила, удовлетворяющие определенным требованиям, добавляются в систему правил;

при появлении в системе правил неоднозначностей правила уточняются путем добавления контекста;

алгоритм повторяется на одном и том же множестве слогов, пока порождаются новые кандидаты заданной структуры.

Порядок рассмотрения слогов: слоги вида CnV → CnV – принимаются кандидаты в правила вида

v1 → v2, где v1VI, v2VO (пополнение системы первичных правил) ; слоги вида CnV → CmV, n > m – принимаются кандидаты вида

<v1> → v2, где v<v1>: vVI, v2VO (правила передачи устойчивых сочетаний согласных одной буквой русского алфавита);

слоги вида CnV → CmV, n < m – принимаются кандидаты вида K → B, где KVI, BVO (правила передачи согласной несколькими буквами русского алфавита);

слоги вида CpVn → CqVm, n > m – принимаются кандидаты вида K → B, где KVI, BVO (правила передачи устойчивых сочетаний гласных);

прочие слоги – принимаются кандидаты произвольного вида.Во избежание появления недетерминированного вывода в КА, нам

стоит проверять каждое вновь добавляемое правило на однозначность. Если для добавляемого правила r1 среди уже принятых правил существует такое r2, что r1(p) и r2(p) имеют общий префикс, формируется правый контекст для правила с более короткой входной строкой. После каждого этапа (порождение новых правил, расширение контекста существующих правил) осуществляется нормализация системы правил.

2.4. Нормализация системы правилНормализация системы правил состоит в избавлении от правил,

полностью или частично дублирующих друг друга.Для двух правил r1 = <p, c, s> и r2 = <p, c, s>, где r1(p1) = r2(p1) =

r1(p3) = r2(p3) = справедливо утверждение r1 = r2, если r1(p2) = r2(p2) и r1(c) = r2(c). В этом случае правила r1 и r2 заменяются правилом r3 = r1r2 = <p, c, s>, где r3(p1) = r3(p3) = , r3(p2) = r1(p2) = r2(p2), r3(c) = r1(c) = r2(c) и r3(s) = r1(s) r2(s).

Два правила r1 = <p, c, s> и r2 = <p, c, s>, для которых хотя бы одно из множеств r1(p1), r2(p1), r1(p3), r2(p3) не пусто, считаются эквивалентными, если r1(p2) = r2(p2), r1(c) = r2(c), |r1(p1)| = |r2(p1)|, |r1(p3)| = |r2(p3)|, и

285

выполняется хотя бы одно из неравенств r1(p1) r2(p1) ≠ , r1(p3) r2(p3) ≠ . В этом случае правила r1 и r2 заменяются правилом r3 = r1 r2 = <p, c, s>, где r3(p1) = r1(p1) r2(p1), r2(p3) = r1(p3) r2(p3), r3(p2) = r1(p2) = r2(p2), r3(c) = r1(c) = r2(c) и r3(s) = r1(s) r2(s).

В конце этапа нормализации проводится проверка на предмет порождения «фантомных» правил, для которых имеются противоречащие им тестовые примеры, и их удаление.

3. Реализация метода. Результаты экспериментовНами были программно реализована часть этапов описанного метода:

происходит деление слов из тестовой выборки на слоги, отбор слов, подходящих для участия в порождении правил, составление первичной системы правил, избавление ее от неоднозначностей (правил с одинаковыми левыми и различающимися правыми частями) и добавление полученной системы к КА. Программа протестирована на примерах из французского и шведского языков. В обоих случаях полученная система правил не полна, но корректна. Процедура избавления от неоднозначностей выделяет различия в правилах чтения некоторых согласных перед гласными (см. 1), и в начальной и неначальной позициях (см. 2). Напомним, что для букв также выделяются правила их чтения без учета контекста. Порождаются некоторые правила преобразования устойчивых сочетаний согласных (см. 3).

(1) правила чтения буквы «c» перед гласными переднего и заднего рядов (шведский язык):

<ca → <ка , <co → <ко , <ce → <се , <ci → <си(2) правила чтения буквы «s» в позиции в начале и в середине слова

(французский язык):si → зи , <si → <си , se → зе , <se → <се , sa → за(3) правила чтения устойчивых сочетаний согласных:rs → ш (швед.), ph → ф (франц.), ch → ш (франц.)

4. Обсуждение методаТекущая реализация метода имеет некоторые недостатки. Метод имеет

низкую устойчивость к ошибкам в тестовых данных и исключениям из правил. Для каждого слога, не объясненного уже существующими правилами, порождается новое правило, все слоги имеют одинаковый вес. С другой стороны, это свойство позволяет генерировать адекватные системы правил с помощью небольшой тестовой выборки, при условии, что в ней отражены основные правила орфографии данного языка. Для таких языков как английский, метод может оказаться неприменим. Впрочем, в случае английского языка даже составленные экспертом правила не всегда являются однозначными.

286

Механизм использования контекста в настоящее время также несовершенен. В правилах используются только «простые» контексты: составляются множества символов, которые могут стоять на n-й позиции слева и справа от рассматриваемой цепочки. Однако иногда необходимо учитывать более сложные условия, например, закрытый слог.

Данный метод, в отличие от многих предшествующих, использует информацию о буквах, но весь анализ на данном этапе происходит исключительно на фонетическом уровне – то есть в слове не выделяются морфемы и не учитывается принадлежность буквы к той или иной морфеме. Отчасти это объясняется тем, что система применяется для машинной транскрипции имен собственных произвольных языков, и единственной доступной информацией об этих языках является список тестовых примеров. В некоторых случаях принадлежностью буквы к префиксу или суффиксу определяется, как она будет читаться, и сформировать соответствующее правило, рассматривая слово исключительно на фонетическом уровне, невозможно.

Наконец, в текущей программной реализации метода частично отсутствует генерация контекста, и как следствие часть экспериментов для французского и немецкого языков проводилась вручную.


Список литературы[Al-Onaizan et al., 2002] Al-Onaizan Y., Knight K. Machine Transliteration of Names

in Arabic Text. In Proceedings of the ACL Workshop on Computational Approaches to Semitic Languages. – 2002.

[Klyshinsky et al., 2008] Klyshinsky E., Maximov V., Yolkeen S. Cross-Language Transcription of Proper Names: Language Forum. Vol. 34, № 1. 2008.

[Knight et al., 1998] Knight K., Graehl J. Machine transliteration. Computational Linguistics, 24(4), 1998.

[Ravi et al., 2009] Ravi S., Knight K., Learning Phoneme Mappings for Transliteration without Parallel Data. Human Language Technology Conference archive Proceedings of Human Language Technologies: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics. 2009.

[Sherif et al., 2007] Sherif T., Kondrak G. Substring-Based Transliteration. In Proceedings of the ACL Workshop on Computational Approaches to Semitic Languages. 2007.

[Tao et al., 2006] Tao T., Yoon S., Fister A., Sproat R., Zhai C. Unsupervised named entity transliteration using temporal and phonetic correlation. In Proc. of EMNLP. 2006.

287

УДК 519.766.23

О СВОЙСТВАХОБОБЩЁННЫХ КАТЕГОРИАЛЬНЫХ

ГРАММАТИК ЗАВИСИМОСТЕЙ

Б.Н. Карлов ([email protected]) Тверской государственный университет, Тверь

В работе рассматриваются обобщённые категориальные грамматики зависимостей (оКГЗ), введённые в [Dekhtyar et al., 2008]. Для них определяется нормальная форма. Доказывается, что множество оКГЗ-языков является абстрактным семейством языков. Устанавливается существование неполулинейных оКГЗ-языков. Доказывается, что проблема принадлежности предложения оКГЗ-языку является NP-полной. Рассматривается расширение синтаксиса и алгоритм анализа.

ВведениеФормальные способы описания синтаксической структуры

предложения имеют первостепенную важность для большинства задач информатики, связанных с обработкой информации на естественном языке. После основополагающих работ Н. Хомского, определившего четыре базовых класса порождающих грамматик, был определен ещё целый ряд типов грамматик, позволяющих получить ту или иную информацию о синтаксической структуре предложения. В частности, специальный тип грамматик, грамматики зависимостей, присваивают структуры зависимостей (структуры подчинения) предложениям языка, который они определяют (см. [Гладкий и др., 1969; Gaifman, 1965]).

Структура зависимостей (СЗ) предложения – это ориентированный граф, вершинами которого являются слова предложения, а рёбра помечены именами зависимостей. Таким образом, структура предложения задается в терминах некоторых бинарных отношений на словах. Для естественных языков СЗ являются деревьями (иногда их называют деревьями подчинения).

Для большинства «типичных» предложений их деревья зависимостей являются проективными: для любых трех слов v, w и u из того, что v → u и w лежит между v и u, следует, что w зависит от v. С другой стороны, в естественных языках достаточно распространены (особенно в

288

художественной литературе) и непроективные конструкции, когда подчинённое слово стоит вне синтаксической группы своего хозяина. В качестве примера приведём оригинальную строчку А.С. Пушкина:

Непроективность всегда связана с разрывными зависимостями. В нашем примере такая зависимость показана штриховой линией.

Классические кс-грамматики, как и обычные категориальные грамматики неспособны обнаруживать в подобных предложениях разрывные составляющие. М.И. Дехтярь и А.Я. Диковский в работах [Dekhtyar et al., 2004; Dekhtyar et al., 2008] определили новые виды грамматик – категориальные грамматики зависимостей (КГЗ) и обобщенные категориальные грамматики зависимостей (оКГЗ). Эти грамматики работают как грамматики-распознаватели и структуру предложения раскрывают подобно грамматикам зависимостей. Их особенностью является то, что они способны обнаруживать дальние связи (как в приведённом примере из Пушкина). Подобные ситуации обрабатываются в них с помощью так называемых поляризованных валентностей: положительных, отвечающих за слово-хозяин, и отрицательных, отвечающих за подчинённое слово.

Настоящая работа продолжает исследование свойств оКГЗ. В ней определена нормальная форма оКГЗ и установлено, что класс оКГЗ-языков образует абстрактное семейство языков. Показано существование неполулинейных оКГЗ-языков. Кроме того, доказано, что проблема принадлежности предложения оКГЗ-языку является NP-полной.

1. Основные определенияДля формализации лингвистического понятия синтаксического типа

мы будем использовать понятие категории. Пусть C – непустое множество элементарных грамматических категорий (например, сказуемое, определение, дополнение и т. д.). Элементарные категории могут быть итерированы: для C из C пусть C* означает соответствующую итеративную категорию. Множество всех итеративных категорий будем обозначать C*.

Для описания дальних связей в [Dekhtyar et al., 2004] вводятся понятия полярности и поляризованной валентности. Полярностью v называется элемент множества { , , , }V . Поляризованная валентность β – это выражение вида vC, где ,v V C C. Пары двойственных

289

валентностей ( , )C C и ( , )C C назовём правильными (являются соответствующими «скобками»). Последовательность поляризованных валентностей называется потенциалом. Множество всех возможных потенциалов обозначается Pot(C). Потенциал называется сбалансированным, если его проекция на каждую пару двойственных поляризованных валентностей является правильным скобочным словом.

Определение 1. Множество локальных категорий LCat(C) – это минимальное множество такое, что:

1) { } ( )LCat C C , где ε – пустой символ;2) если ( ), *LCat A C C C , то [ \ ],[ / ] ( )A A LCat C .Из локальных категорий и потенциалов строятся категории.Определение 2. Категорией γ называется выражение вида , где α –

локальная категория, θ – потенциал. Множество всех категорий обозначается Cat(C).

Пример 1. В приведённом выше предложении глагол «воздвиг» имеет категорию [доп*\подл\Пр], а существительное «памятник» – опр[доп] .

Полагаем, что конструкторы \ и / ассоциативны. Поэтому любая категория γ может быть представлена в виде

1 1[ \ \ \ / / / ]k mL L C R R . Теперь дадим определение обобщённой категориальной категориальной грамматики зависимостей.

Определение 3. Обобщённой категориальной грамматикой зависимостей (оКГЗ) называется система , , , ,G W S C , где:

W – конечное множество слов,C – конечное множество элементарных категорий,S – выделенная в C главная категория,δ – лексикон, функция на W такая, что ( ) ( )w Cat C для каждого

слова w из W (мы будем задавать его в виде ( )w w ),: 2 CC – ограничения на пересечение дальних зависимостей.

Для строки категорий определены следующие правила сокращения.Определение 4. Пусть дана строка категорий 1 ( )*n Cat C . Правила локальной зависимости:

1 2 1 21 2 1 2: [ ] [ \ ] [ ]lL C C ,

1 2 1 21 2 1 2: [ / ] [ ] [ ]rL C C ,

где { }C C .Правила итеративной зависимости:

1 2 1 21 2 1 2: [ ] [ * \ ] [ * \ ]lI C C C ,

0 1 2 1 2: [ * \ ] [ ]lI C ,

290

1 2 1 21 2 1 2: [ / *] [ ] [ / *]rI C C C ,

0 1 2 1 2: [ / *] [ ]rI C ,где { }C C .Правило дальней зависимости:

1 2 3 1 2 31 2 1 2: ,D

где ( , )

образуют правильную пару, θ2 не содержит ,

, а также, , ,B B B B для всех ( )B A , где A – тип валентности β.

При выполнении сокращения по одному из правил в структуру зависимостей добавляется стрелка, идущая в направлении зависимой категории и имеющая такое же название, что и сократившаяся категория.

Определение 5. Предложение 1 *ns w w W принадлежит языку L(G), если существует строка категорий Γ такая, что:

1) 1 n , где ( )i iw для i=1,…,n;2) *S .Класс всех языков, порождаемых обобщёнными категориальными

грамматиками зависимостей, обозначим L(gCDG).Пример 2. В качестве примера рассмотрим язык

1{ | { , } }L ww w w a b . Известно, что он не является контекстно-свободным. Однако его можно задать при помощи следующей оКГЗ

, , , ,G W S C .

' ' ' '

' ' ' '

{ , , , , ', '}

[ / ] ,[ / ] ,[ / ] ,[ / ] ,[ / ] ,[ / ] ,[ ]

[ / ] ,[ / ] ,[ / ] ,[ / ] ,[ / ] ,[ / ] ,[ ]( ) { }, ( ) { }, ( ') { '}, ( ') { '}

A A A A A A A A A

B B B B B B B B B

S A B C A B

a S A A A A B B B B C C C C

b S A A A A B B B B C C C CA B B A A B B A

C

Несложно видеть, что локальные правила сокращения 0 0, , , , ,l r l l r rL L I I I I действуют только на локальную часть категории, тогда

как правило сокращения потенциала D затрагивает только потенциал. Это даёт возможность разделить анализ предложения в оКГЗ на два независимых теста: первый – в терминах локальных категорий и локальных правил сокращения, а второй – в терминах сбалансированности потенциала. Имеет место теорема об анализе для оКГЗ.

Теорема 1. Предложение 1 ns w w принадлежит языку L(G), задаваемому оКГЗ , , , ,G W S C , тогда и только тогда, когда существует строка категорий 1

1n

n , где ( )i

i iw , такая, что:

291

1) 1 *n S ,2) 1 n сбалансирован.

2. Нормальная форма оКГЗИзвестно, что для кс-грамматик существуют различные специальные

формы (нормальная форма Хомского, нормальная форма Грейбах (см. [Гладкий, 1973])), упрощающие анализ порождаемых ими языков. В этом разделе мы определяем нормальную форму для оКГЗ, аналогичную нормальной форме Грейбах.

Определение 7. Будем называть оКГЗ , , , ,G W S C грамматикой в нормальной форме, если все её категории имеют один из следующих видов:[ ]X , [ / ]X Y , [ / / ]X Y Z , где X, Y, Z – элементарные категории, θ – потенциал.

Теорема 2. Для любой оКГЗ , , , ,G W S C существует оКГЗ ' , ', , ',G W S C в нормальной форме такая, что ( ) ( ')L G L G .Доказательство этой теоремы для оКГЗ аналогично доказательству о

нормальной форме из [Карлов, 2008].

3. Свойства замкнутостиРяд свойств замкнутости был ранее установлен для класса языков,

задаваемых КГЗ (см. [Dekhtyar et al., 2008; Карлов, 2008]). Вопрос о замкнутости этого класса языков относительно итерации до сих пор остаётся открытым. Оказалось, что класс оКГЗ-языков замкнут относительно этой операции.

Теорема 3. Если L является оКГЗ-языком, то L* также является оКГЗ-языком.

Набросок доказательства. Пусть язык L задаётся грамматикой , , , ,G W S C . Приведём основную конструкцию для грамматики

'G , задающей язык L*. Будем считать, что G – грамматика в нормальной форме, не содержащая S в списках зависимостей. Построим индукцией по i последовательность грамматик , , , ,i i iG W S C .

Базис индукции.1i . Если в G у слова w есть категория [ / / ]S A , то в G1 добавим

этому слову категорию [ / '/ ]S A .Индукционный шаг.Пусть в грамматике Gi есть новые категории 1, , kA A . Если в Gi у

слова w была категория [ / ] ,1jA j k , то в Gi+1 добавим для w

категорию [ / ]jA . После этого для каждой категории [ / / ]jA A

292

добавим категорию [ / / ]jA A . Этот процесс остановится не более чем через |C| шагов. Пусть последняя грамматика – , , , ,m m mG W S C . Пусть mbC – новая категория. Построим грамматику

, { }, , ,m m mG W b S C следующим образом. Категории вида [ ]A

заменим на [ ] bA , категории вида [ / / ]S A заменим на [ / / ] bS A .

Если в Gm есть категории вида [ ]S , то их заменим на [ ] b bS . Наконец, ( ) ( ) { }A A b для всех , ( )m mA b C C . Теперь можно построить

грамматику, задающую итерацию исходного языка: 0, { }, , ,mG W b S C . Если в mG есть категория [ / ]S , то в G

добавим 0[ / * / ]S S .Утверждение. ( ) *L G L . Результаты о замкнутости класса КГЗ-языков относительно операций

объединения, конкатенации, пересечения с регулярными множествами, неукорачивающего гомоморфизма и обращения гомоморфизма легко переносятся на класс оКГЗ-языков. С учётом этого справедливо следующее утверждение.

Теорема 4. Класс L(gCDG) является абстрактным семейством языков.

4. НеполулинейностьКак известно, кс-языки обладают свойством полулинейности. В

частности, длины входящих в них слов содержат бесконечные арифметические прогрессии. В этом разделе мы показываем, что класс оКГЗ-языков содержит неполулинейные языки. Примером такого языка является 2{101001 10 1| 2}

k

L k . Язык L задаётся следующей грамматикой.

1 1 2

2 2 2

1 1

2 2 2 2

1 [ / ] ,[ / ] ,[ / ] ,[ / ] ,[ / ] ,

[ / ] ,[ ] ,[ ]

0 [ / ] ,[ / ] ,[ / ] ,[ / ] ,

[ / ] ,[ / ] ,[ / ]( ) { }, ( ) { }, ( ) { }, ( ) { }.

X Y X X Y Y X X

Y Y X Y X Y

B B A B B A B B B A A

B A A A B

S A D C B A D C B A

D C A C

A D A A A D C C

C B A A C CX B B X Y A A Y

Идея конструкции состоит в том, что каждый блок нулей ловит слева стрелки, а направо выпускает их в два раза больше. Чтобы блок не поймал свои же стрелки, используется чередование стрелок A и B. Чтобы стрелки не прошли дальше своего блока, добавлены зависимости X и Y.

Теорема 5. Класс оКГЗ-языков не является полулинейным.

293

5. Сложность проблемы принадлежностиВ работе [Dekhtyar et al., 2004] было показано, что проблема

определения по КГЗ G и слову w, принадлежит ли w языку L(G), является NP-полной. Для класса оКГЗ-языков этот результат может быть усилен.

Теорема 6. Существует оКГЗ G такая, что проблема принадлежности ( )w L G является NP-полной.

Набросок доказательства. Построим оКГЗ , , , ,G W S C следующим образом. Пусть { , , , , , }W x x y b f , { ,0,1,0 ',1', , , }C S A B T . Далее определим ограничения на стрелки: (0) {1} ,

(1) {0}, (0 ') {1'}, (1') {0 '} . Теперь опишем словарь δ.[ ]S 0 1[ ] ,[ ]b [ \ ]T

0 0' 1 1'[ ] ,[ ] ,[ ] ,[ ]f 1 1' 1 1' 0 0 ' 1 1' 0 0 '

1 1' 1 1' 0 0 ' 1 1' 1' 1 1' 1

0 ' 0 1' 1 0 ' 0 1' 1 1' 1 0 ' 0

1' 1

[ \ / ] ,[ \ ] ,[ \ ] ,[ / ] ,[ / ] ,

[ \ ] ,[ / ] ,[ ] ,[ ] ,[ \ / ] ,[ \ ] ,

[ \ ] ,[ / ] ,[ / ] ,[ \ ] ,[ / ] ,[ ] ,

[ ]

x A T A A A A A A A A A

A T T A A A B T B B B

B B B B B B B T T B B

B

0 0' 1 1' 0 0 ' 1 1' 0 0 '

0 0 ' 0 0 ' 0 0 ' 1 1' 0 ' 0 1' 1

0 ' 0 1' 1 0 ' 0 0 ' 0 0 ' 0 0 ' 0

1' 1

[ \ / ] ,[ \ ] ,[ \ ] ,[ / ] ,[ / ] ,

[ \ ] ,[ / ] ,[ ] ,[ ] ,[ \ / ] ,[ \ ] ,

[ \ ] ,[ / ] ,[ / ] ,[ \ ] ,[ / ] ,[ ] ,

[ ]

x A T A A A A A A A A A

A T T A A A B T B B B

B B B B B B B T T B B

B

1 1' 0 0 ' 1 1' 0 0 ' 1 1' 0 0 '

1' 1 0 ' 0 1' 1 0 ' 0 1' 1 0 ' 0

[ \ ] ,[ \ ] ,[ / ] ,[ / ] ,[ ] ,[ ] ,

[ \ ] ,[ \ ] ,[ / ] ,[ / ] ,[ ] ,[ ] .

y A A A A A A A A A A

B B B B B B B B B B

Покажем, как проблема выполнимости КНФ сводится к проблеме принадлежности для грамматики G. Пусть 1 mC C – КНФ, содержащая переменные x1,…,xn. Каждому дизъюнкту Ci сопоставим предложение 1( )i ng C z z , где jz x , если xj входит в Ci, jz x , если

jx входит в Ci и jz y , если xj не входит в Ci. Определим для Ф предложение 1 ( 1)

1 2( ) ( ) ( )n nmw b g C g C g C f

.Утверждение. Ф выполнима тогда и только тогда, когда ( )w L G .

6. Алгоритм анализа для расширенного синтаксиса оКГЗЕстественные языки содержат очень большое количество слов, а

каждое слово имеет большое количество категорий. Это затрудняет их

294

анализ и построение адекватной грамматики. Чтобы приспособить оКГЗ для анализа естественных языков А.Я. Диковский в [Dikovsky, 2009] предложил использовать в категориях плоские регулярные выражения. Например, выражение вида [(A|B)*\C/D?/{E,F,G}] задаёт категории, в которых левее C идёт произвольная последовательность категорий A и B, D может присутствовать или отсутствовать правее C, а E, F и G должны стоять правее C в произвольном порядке. Например, одной из них будет категория [B\A\B\C/G/D/E/F]. Правила сокращения для оКГЗ естественным образом расширяются на этот синтаксис. Обозначим через L(gCDGext) класс языков, задаваемых оКГЗ в расширенном синтаксисе. Это расширение оказывается консервативным.

Теорема 7. L(gCDG)=L(gCDGext).Для указанного расширенного синтаксиса был реализован алгоритм

синтаксического анализа ExtCdgAnalyst, основанный на методе динамического программирования. В худшем случае его сложность экспоненциальна, но для класса грамматик, в которых отсутствуют ограничения π на пересечение дальних зависимостей, время работы этого алгоритма полиномиально от размеров входного предложения.

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проекты № 08-01-00241 и 10-01-00532а). Автор благодарен М.И. Дехтярю и А.Я. Диковскому за поддержку этой работы.

Список литературы[Гладкий, 1973] Гладкий А.В. Формальные грамматики и языки. – М.: Наука,

1973.[Гладкий и др., 1969] Гладкий А.В., Мельчук И.А. Элементы математической

лингвистики. – М.: Наука, 1969.[Карлов, 2008] Карлов Б.Н. Нормальные формы и автоматы для категориальных

грамматик зависимостей // Вестник Тверского государственного университета, серия «Прикладная математика», 2008, №35 (95).

[Dekhtyar et al., 2004] Dekhtyar M., Dikovsky A. Categorial Dependency Grammars // Proc. of Int. Conf. on Categorial Grammars, 2004.

[Dekhtyar et al., 2008] Dekhtyar M., Dikovsky A. Generalized Categorial Dependency Grammars // Pillars of Computer Science: Essays Dedicated to Boris (Boaz) Trakhtenbrot on the Occasion of His 85th Birthday. LNCS, v. 4800, 2008.

[Dikovsky, 2009] Dikovsky A. Towards Wide Coverage Categorial Dependency Grammars // Proc. of the ESSLLI'2009 Workshop on Parsing with Categorial Grammars, Bordeaux, France, 2009.

[Gaifman, 1965] Gaifman H. Dependency systems and phrase structure systems // Information and Control, 1965, v. 8, №3.

295

УДК 004.853

ИСПОЛЬЗОВАНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ИЗВЛЕЧЕНИЯ СЛОВ-ТЕРМИНОВ

Н.В. Лукашевич ([email protected]) НИВЦ МГУ, Москва

Ю.М. Логачев ([email protected]) ВМиК МГУ, Москва

Ключевые слова: извлечение знаний из текстов, извлечение терминов, машинное обучение.

В статье описывается метод для автоматического извлечения однословных терминов. Отдельные признаки слов извлекаются на основе обработки текстовой коллекции и анализа поисковой выдачи на запросы глобальной поисковой машины. Полученные признаки комбинируются с помощью методов машинного обучения. Показано, что путем комбинирования признаков удается достичь наилучшего качества извлечения однословных терминов.

ВведениеВажным аспектом создания прикладных систем в конкретных

предметных областях является учет терминологии предметной области. Поэтому одним из важных направлений исследований в области создания понятийных моделей предметных областей, прикладных онтологий являются технологии извлечения из текстов терминов предметной области.

При извлечении терминов предметной области большое внимание уделяется извлечению терминологических словосочетаний, и значительно меньшее исследований посвящено извлечению отдельных слов-терминов [Zhang et al., 2008].

Вместе с тем известно, что список самых частотных словосочетаний, извлеченных из текстов предметной области, содержит очень высокую долю терминологических словосочетаний. В то время как подавляющее число наиболее частотных слов, извлеченных из коллекции текстов предметной области, представляют собой слова литературного языка, и,

296

следовательно, не являются терминами. Применение статистических мер, позволяющих оценить особенность употребления слов в данной коллекции по сравнению с некоторой контрастной коллекцией документов таких, как tf.idf или странность (weirdness) [Zhang et al., 2008] повышает долю слов-терминов, получивших высокие веса по этим мерам, однако все еще остается относительно низкой.

Другой мерой, которая может применяться для выделения терминологических слов, является мера, оценивающая их вхождение как фрагмента в объемлющие словосочетания [Ananiadou, 1994].

В данной работе мы рассмотрим различные признаки выявления терминологичности отдельного слова (прилагательных и существительных), оценим их качество на основе меры средней точности, заимствованной из информационного поиска. Используемые нами признаки могут быть разделены на три типа:

- признаки, построенные на основе текстовой коллекции предметной области;

- признаки, полученные на основе информации глобальной поисковой машины,

- признаки, полученные на основе заданного тезауруса предметной области. Здесь мы моделируем ситуацию развития существующего тезауруса и хотим выяснить, насколько знания, описанные в текущей версии тезауруса, могут улучшить качество автоматического извлечения следующих терминов.

Далее мы применяем методы машинного обучения для наилучшего комбинирования выделенных признаков с целью получения терминологических слов. Как показано в ряде публикаций, комбинирование признаков для выделения терминологических словосочетаний, устойчивых словосочетаний других видов позволяет значительно улучшить качество их извлечения [Pecina et al., 2006; Zhang et al., 2008].

Эксперименты проводятся в широкой области естественных наук. Качество методов определения терминологичности слов признаков оценивается на создаваемой вручную Онтологии по естественным наукам и технологиям ОЕНТ [Добров и др., 2005].

1. Текстовая коллекция и способ оценки качества извлечения терминов

В качестве базы для экспериментов по извлечению слов-терминов мы используем текстовую коллекцию, которая была собрана в начале работы над онтологией ОЕНТ [Добров и др., 2005].

Онтология ОЕНТ представляет собой, так называемую лингвистическую онтологию, то есть онтологию, понятия в которой

297

основаны на значениях существующих языковых выражений – в данном случае естественнонаучных терминов. Одновременно онтология ОЕНТ может рассматриваться как тезаурус, поскольку описывает формализованные отношения между терминами предметной области.

В настоящее время онтология ОЕНТ включает 56 тысяч понятий и 150 тысяч различных терминов математики, химии, физики, геологии, биологии.

На первом шаге разработки онтологии ОЕНТ (в 2004 году) были собраны коллекции текстов по таким наукам как, математика, физика, химия, геология (от 3000 до 8000 документов, от 50 до 90 Мб по каждой из наук). Автоматически извлеченные слова и словосочетания из собранных коллекций текстов можно использовать для тестирования различных методов извлечения и упорядочения терминов-кандидатов, поскольку за это время Онтология ОЕНТ выросла, и включенные в ее состав термины могут служить хорошей основой для оценки качества методов.

Эксперименты проводились на пяти тысячах наиболее частотных слов, извлеченных из этой коллекции. Задачей применения методов является переупорядочение исходного списка слов (первоначально упорядоченного по мере снижения частотности) так, чтобы в начало списка попало как можно больше слов-терминов. Таким образом, наилучшее переупорядочение списка снизит трудозатраты эксперта по вводу терминов в онтологию – эксперт будет меньше просматривать слова, не являющиеся терминами.

Для оценки качества такого упорядочения используется мера, заимствованная из информационного поиска – так называемая средняя точность – AvP [Агеев и др., 2004].

Характеристика средней точности AvP в задаче извлечения слов-терминов вычисляется следующим образом. Пусть в упорядоченном списке слов имеется k терминов, и pos(i) – позиция i-го термина от начала списка. Тогда точность на уровне i-го термина PrecTermi в упорядоченном списке равна PrecTerm(pos(i)), то есть величина точности PrecTermi подсчитывается в момент поступления в список i-го термина и равна доле терминов в списке от 1 до i позиции. Средняя точность для данного упорядочения списка слов равна среднему значению величины PrecTermi:

AvP = i1 PrecTerm

ik .

298

Данная мера позволяет оценить качество извлечения терминов с помощью одной числовой величины за счет того, что, чем большая доля терминов из списка сосредоточена в начале списка, тем эта мера выше.

2. Используемые признаки словРассмотрим подробнее признаки, которые можно использовать для

выявления терминологичности слова, встретившегося в коллекции текстов предметной области.

2.1. Частотность (Freq). Частотность употребления слова в коллекции.

2.2.Частотность с учетом частоты употребления в объемлющей коллекции (Tf*idf)

Данный признак широко употребляется в информационно-поисковых системах и позволяет снижать вес употребительных слов. Tf – это просто частотность слова в текущей коллекции.

Tf*Idf (w) = *log(( ) / )Tf n b b ,где n – размер контрастной коллекции, b – число документов, в

которых употреблялось слово w в контрастной коллекции.В качестве контрастной коллекции для данного признака была

выбрана коллекция Интернет-страниц белорусского Интернета, которая распространяется в качестве базовой коллекции для экспериментов в Интернет-поиске в рамках семинара РОМИП [Некрестьянов и др., 2008].

2.3. Признак Странность (Weirdness) Данный признак учитывает пропорциональное соотношение

частотности употребления слова в рабочей текстовой коллекции по сравнению с контрастной коллекцией [Ahmad et al., 1999].

Пусть w – слово. Тогда( ) ( / ) / ( / )Weirdness w Ws Ts Wg Tg ,

где Ws частотность слова в коллекции предметной области; Ts – совокупная частотность слов в коллекции предметной области; Wg частотность слова в контрастной коллекции белорусского интернета; Tg – совокупная частотность слов в контрастной коллекции белорусского интернета.

2.4. Признак С-Value Данный признак основывает рейтинг терминологичности слов с

учетом частотности объемлющих словосочетаний, в которое входит данное слово [Ananiadou, 1994]. Пусть w – слово. Тогда

299

C-Value(w)= по всем словосочетаниям b из множества Та freq(b)freq(w)

P(Ta)

,

где Ta – множество всех словосочетаний в коллекции, содержащих слово w; P(Ta) – мощность множества Ta.

2.5. Наиболее частотное объемлющее словосочетание (Inside)Данный признак учитывает частотность наиболее частотного

словосочетания, в состав которого входит данное слово.Пусть w – слово. Среди всех словосочетаний, содержащих слово w,

выберем наиболее частотное. Пусть Fmax – его частота. Тогда

maxInside(w)( )

Ffreq x

.

Данный признак проверяет, не употребляется ли данное слово в составе одного и того же словосочетания. Чем выше значение признака, тем ниже вероятность того, что слово является самостоятельным значимым элементом предметной области, а, скорее, является компонентом более длинного устойчивого словосочетания.

2.6. Признаки употребления слова в наборе словосочетаний (Sum3, Sum10, Sum50)

Данные признаки проверяют, насколько данное слово было продуктивным в образовании словосочетаний предметной области.

Пусть w – слово. Среди всех словосочетаний, содержащих слово w, выберем k наиболее частотных. Пусть Sum – cумма их частотностей. Тогда

SumX( ) ( ) / ( )Sumw freq wX

.

2.7. Признаки, полученные на основе выдачи глобальной поисковой машины

Для вычисления следующих двух признаков были использованы контексты употребления слов. В качестве таких контекстов мы используем сниппеты (аннотации документов в выдаче), получаемые от поисковой машины Яндекс через xml-интерфейс. Для вычисления признаков использовалось по 100 сниппетов из выдачи. Сниппеты, получаемые по одному запросу, соединяются в один документ и обрабатываются программой морфологического анализа. В результате для каждого набора сниппетов может быть определена совокупность лемм (слов в словарной форме) и их частотность встречаемости в данном наборе сниппетов.

300

Для терминов существенным является принадлежность к предметной области. Простейший способ учесть фактор принадлежности к предметной области является задание списка маркеров предметной области, включающих некую совокупность (от нескольких единиц до нескольких десятков) наиболее характерных слов предметной области. Признак Markers учитывает количество таких слов, встретившихся в сниппетах, полученных для исходного слова. В данном случае в качестве маркеров мы использовали названия основных наук и образованных от них прилагательных: математика, математический, физика, физический, химия, химический и др.

Другим признаком, получаемым на основе сниппетов, является количество слов-определений в сниппете слова. Смысл признака Neardefwords (количество слов-определений в сниппетах) заключается в том, что если в сниппетах рядом с исходным словом встречаются слова, характерные для определения в терминологических словарях (это, тип, вид, класс и др.), то, скорее всего, это термин, для которого вводится определение. Признак Neardefwords равен количеству таких слов, появившихся непосредственно рядом (слева или справа) с исходным словом в сниппетах, полученных по запросу, совпадающему с исходным словом.

2.8 Признак встречаемости слова в терминах тезаурусаПредположим, что разработка тезауруса предметной области уже

начата, и в тезаурус внесена некоторая совокупность терминов. Тогда как дополнительный признак для определения терминологичности слова можно использовать признак количества терминологических словосочетаний, в которые входит данное слово – признак FreqByThes.

В текущем эксперименте мы использовали полную совокупность многословных терминов онтологии ОЕНТ и, таким образом, пытались оценить, насколько можно предсказать терминологичность отдельного слова на этой основе.

3. Результаты экспериментаВсе эксперименты проводились с выборкой величиной 5 тысяч слов,

для которых были обсчитаны все вышеперечисленные признаки. В качестве эталонного множества терминов использовались

однословные термины, включенные в состав Онтологии ОЕНТ. Табл.1 представляет характеристику средней точности AvP для отдельных характеристик слов. Отметим, что в качестве базового уровня, в котором не было сделано реально никакого разумного упорядочения, для эксперимента можно взять простое упорядочение по алфавиту, для которого величина средней точности оказалась равной 22%.

301

Как видно в таблице 1, такие признаки как Tf*idf и Странность, которые учитывают контрастные коллекции, показали более хорошие значения средней точности по сравнению с простым признаком частотности, однако очевидно, что их использование не решает проблему определения терминологичности отдельных слов.

Табл.1Признак AvPЧастотность 46%Tf*idf 51%C-value 46%Странность 52%Наиболее частотное словосочетание Inside 51%Sum3 52%Sum10 54%Sum50 54%Близкие слова-определения NearDefWords 54%Ключевые слова Markers 46%Частотность по терминам FreqByThes 66%

Предложенные нами признаки Sum10 и Sum50 показали самые высокие показатели средней точности среди признаков, полученных на коллекции документов.

Самые высокие результаты по предсказанию однословных терминов показал признак частотности по многословным терминам FreqByThes.

Поскольку можно предположить, что вычисленные признаки отражают разные особенности однословных терминов, то является важным подобрать оптимальную комбинацию этих признаков. Для поиска наилучшей комбинации были использованы алгоритмы машинного обучения. При этом выборка слов случайным образом разбивалась на две части (обучающая выборка и контрольная выборка) в соотношении 3 к 1.

Для подбора алгоритма комбинирования полученных признаков был использован программный пакет алгоритмов машинного обучения RapidMiner (www.rapidminer.com). Наилучшим методом по величине средней точности оказался метод логистической регрессии W-Logistic, на основе которого было достигнуто значение средней точности AvP=72%.

Таким образом, мы видим, что комбинация всех признаков дала результат по мере средней точности, почти на 40% превышающий наиболее известный способ упорядочения слов-кандидатов в термины tf*idf .


302

В данной статье было предложено для извлечения однословных терминов использовать три различных типа признаков слов. Помимо наиболее известного способа формирования признаков слов на основе обработки текстовой коллекции предметной области используются также признаки, порожденные на основе выдачи глобальных поисковых машин, а также признак, вычисляемый на основе известных терминологических словосочетаний предметной области.

Кроме того, мы предложили новые признаки, основанные на коллекции текстов предметной области. Это признаки, которые учитывают частотность употребления данного слова в заданном числе наиболее частотных словосочетаний.

Наконец, было выполнено комбинирование всех собранных признаков посредством использования методов машинного обучения, и был получен результат средней точности по упорядочению слов-терминов в упорядоченном списке, который на 40% превышает результат по наиболее часто используемому признаку – tf*idf.

Список литературы[Агеев и др., 2004] Агеев М.С., Кураленок И.Е. Официальные метрики

РОМИП’2004 // Российский семинар по Оценке Методов Информационного Поиска (РОМИП 2004). – Пущино, 2004.

[Браславский и др., 2006] Браславский П.И., Соколов Е.А. Сравнение четырёх методов автоматического извлечения двусловных терминов из текста // Компьютерная лингвистика и интеллектуальные технологии Труды международной конференции «Диалог 2006». М.: Изд-во РГГУ, 2006.

[Добров и др., 2005] Добров Б.В., Лукашевич Н.В., Синицын М.Н., Шапкин В.Н. Разработка лингвистической онтологии по естественным наукам для решения задач информационного поиска. // Труды 7-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» RCDL-2005.

[Некрестьянов и др., 2008] Некрестьянов И., Некрестьянова М. Особенности организации и проведения РОМИП 2008. Код доступа: http://romip.ru/romip2008/2008_01_organizers.pdf.

[Ahmad et al., 1999] Ahmad K., Gillam L., Tostevin L. University of Surrey participation in Trec8: Weirdness indexing for logical documents extrapolation and retrieval // In the Proceedings of Eigth Text Retrieval Conference (Trec-8). 1999.

[Ananiadou, 1994] Ananiadou S. A methodology for automatic term recognition // In the Proceedings of COLING-1994, 1994.

[Pecina et al., 2006] Pecina P., Schlesinger P. Combining association measures for collocation extraction // Annual Meeting of the Association for Computational Linguistics, ACL 2006. ACM: 2006.

[Zhang et al., 2008] Zhang Z., Iria J., Brewster Ch., Ciravegna F. A Comparative Evaluation of Term Recognition Algorithms // In Proceedings of the Sixth International Language Resources and Evaluation (LREC'08). 2008.

303

УДК 004.853

АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ОТЗЫВОВ НА ОСНОВЕ ОЦЕНОЧНЫХ СЛОВ

Н.В. Лукашевич ([email protected]) НИВЦ МГУ, Москва

И.И. Четверкин ([email protected]) Факультет вычислительной математики и кибернетики

МГУ, Москва

Ключевые слова: классификация отзывов, смысловой анализ, оценка текстов.

Для упрощения поиска и выбора товаров и услуг в интернете необходимы методы оценивания отзывов об объектах. В данной работе предлагается новый подход к классификации отзывов, основанный на использовании оценочных слов из конкретной предметной области.

ВведениеС развитием сети Интернет неуклонно растет количество

неструктурированной информации, например, такой, как мнения и отзывы людей о различных товарах и услугах. Существует множество интернет ресурсов, которые аккумулируют в себе терабайты этих данных: форумы, блоги, социальные сети. В этих данных содержится полезная информация, полученная людьми в результате их профессиональной и бытовой деятельности.

Для того чтобы использовать эту информацию и составить собственное мнение о некотором объекте, человеку требуется ознакомиться с отзывами других людей и определить, как каждый из них оценивает рассматриваемую сущность. Эта процедура достаточно трудоёмкая ввиду большого количества данных.

Для многих сущностей актуальным является сравнение с другими подобными объектами. В таких случаях простой оценки «понравилось» или «не понравилось» уже не достаточно. Для решения этой задачи необходимо уметь оценивать объект по некоторой шкале. В связи с этим

304

актуальной является задача автоматической классификации отзывов более чем на два класса.

В данной статье предложен метод классификации отзывов о фильмах на три класса, основанный на использовании множества оценочных слов данной предметной области. Для этого заранее формируются списки оценочных слов со средней оценкой для каждого слова. Особенность предлагаемого нового метода извлечения оценочных слов заключается в том, что извлекаются оценочные слова, характерные для данной предметной области.

Составляя для каждого отзыва вектор используемых в нем слов, мы применяем методы машинного обучения для распределения отзывов по классам. Предметная область – кинематограф.

1. Методы извлечения оценочных слов и проставления оценок отзывам

Задача классификации отзывов уже решалась в ряде работ, но в большинстве из них отзывы разделялись на два класса: положительные и отрицательные.

Существует два основных подхода к оцениванию отзывов об объекте:Агрегирование оценочных слов и выражений, входящих в отзыв;Построение классификатора отзывов.

В рамках первого подхода необходимо выделять оценочные слова и выражения, вычислять для них семантическую ориентированность и выбрать, каким образом выполнить агрегацию вычисленных значений, чтобы классифицировать отзыв. Существует несколько подходов к извлечению оценочных слов и вычислению их семантической направленности.

В работе [Hatzivassiloglou et al., 1997] выделение оценочных прилагательных и определение их семантической направленности основано на синтаксических шаблонах и союзах И, ИЛИ, НО. В работе [Turney, 2002] изначально выбирается два эталонных множества оценочных слов: положительное и отрицательное множества. Далее для каждого слова в отзыве вычисляется семантическая направленность путем оценивания совместной встречаемости со словами из эталонного множества.

Для получения оценочных слов и вычисления их направленности могут использоваться словари. Метод, предложенный в [Hu et al., 2004], предполагает использование тезауруса для обогащения заданного вручную, эталонного множества оценочных слов. Основная идея в том, что если слово оценочное, то его синонимы, гипонимы также будут оценочными и одинаково семантически направлены, в случае антонимов – противоположно направлены. Еще один подход представлен в работе

305

[Esuli et al., 2005], где с помощью толкований слов в словаре выясняется их ориентация. Данный метод основывается на том, что слова с одинаковой ориентацией имеют «похожие» толкования. Используя эту идею, был построен классификатор слов на положительно ориентированные слова и отрицательно ориентированные (точность метода 87%).

Еще один подход, который использует как словари, так и информацию из корпуса, представлен в работе [Popescu et al., 2005]. В данной работе описана система OPINE, которая служит для извлечения из отзывов атрибутов описанных продуктов, а также оценок по ним. Предполагается, что оценочные фразы появляются в непосредственной близости от атрибутов объекта. Для извлечения оценочных слов используются правила, основанные на синтаксической структуре предложения.

Для агрегации выделенных слов существует несколько способов:Вычисление суммы или среднего по отзыву [Turney, 2002] [Hu et al., 2004];Построение классификатора использующего ориентированность слов как атрибуты [Das et al., 2001].

Второй подход к оцениванию отзывов об объекте не связан с предварительным выделением оценочных слов.

В работе [Pang et al., 2002] производилась классификация отзывов о фильмах на два класса: рекомендуемый и нерекомендуемый отзыв с использованием разных методов машинного обучения. В качестве атрибутов обзоров выбирались отдельные слова, биграммы, слова по частям речи. Наилучший показатель по точности получился 82,9% для метода опорных векторов.

В более поздних публикациях [Pang et. al., 2005] ставится задача выставления численной оценки отзывам. Отзывы, используемые для работы, разделены по авторам. Сравниваются три алгоритма, построенные на основе SVM: один против всех, регрессия и метрический подход. В работе показывается, что метрический подход с использованием метрики на базе количества положительных предложений в отзыве, работает лучше.

2. Формирование множества оценочных словДля решения задачи классификации отзывов мы предварительно

автоматически извлекали оценочные слова, характерные для данной предметной области. Извлечение основывалось на сопоставлении статистических данных употребления слова в наборе различных корпусов.

306

2.1 Формирование данныхДля формирования качественного списка оценочных слов было

составлено четыре корпуса данных:Корпус мнений о фильмах (30 тысяч отзывов с пользовательскими оценками от 1 до 10);Корпус описаний фильмов (20 тысяч);Малый корпус (состоит из частей корпуса мнений, с более высокой концентрацией оценочных слов);Новостной корпус (статистика встречаемости слов в 1 млн. новостных документов) [Четверкин и др., 2010].

Для работы были выбраны только первые десять тысяч слов, в списке, упорядоченном по частотности слов в корпусе мнений.

2.2 Характеристики словДля каждого слова был вычислен набор из 18 характеристик,

позволяющий выделять оценочные слова. В наборе характеристик выделяется две подгруппы.

Первый класс характеристик оценивает частотные характеристики употребления слова в вышеупомянутых корпусах. Подсчитывается частотность словоупотреблений и количество документов, в которых употреблялось слово (5 характеристик).

Второй класс характеристик фиксирует соотношение частотности словоупотреблений и частотности по документам в разных парах корпусов. Для этого используются две меры: известная в информационном поиске мера tf*idf, которая прямо пропорциональна частотности употребления слова в документе (в нашем случае в одной из коллекций) и обратно пропорциональна логарифму подокументной частотности в некоторой контрастной коллекции [Агеев и др., 2004].

Второй мерой, используемой для сопоставления употребления слова в коллекциях, является мера странности (weirdness) [Ahmad и др., 1999], которая сопоставляет пропорцию употребления слова по отношению к общему числу словоупотреблений в разных коллекциях. Всего имеется 10 характеристик, сопоставляющих частотность слова в паре коллекций (подробнее см. [Четверкин и др., 2010]).

Кроме этих подгрупп используются несколько отдельных характеристик.

Мы подсчитываем количество употреблений слова с прописной буквы. Предполагается, что имена собственные не являются оценочными словами.

Две последние используемые характеристики – характеристика отклонения оценки слова от средней оценки отзывов и характеристика, вычисляемая для существительных, следующих за оценочными

307

прилагательными, будут подробнее рассмотрены в следующих подразделах.

2.2.1. Отклонение оценки слова от средней оценки отзывов. Для вычисления данной характеристики использовалась пользовательская оценка (от 1 до 10), сохраненная для каждого отзыва. С помощью этих оценок, для каждого слова вычислялась его средняя оценка (т.е. брались оценки тех отзывов, где оно встретилось, и их сумма разделялась на количество таких отзывов). Разность средней оценки для каждого слова и средней оценки отзывов по всему корпусу и является отклонением. Таким образом, мы получаем суммарную оценочную ориентацию для каждого слова.

,где l – рассматриваемая лемма,n – общее количество отзывов,mi – оценка i-го отзыва,ki – число словоупотреблений леммы в i-ом отзыве (если не

употребляется, тогда 0).Приведем несколько примеров слов с их отклонениями от средней

оценки. Если отклонение положительное, то и слово положительное, если отрицательное, то и слово соответственно отрицательное.

ахинея -4.943 фильм-шедевр 2.065бездарный -3.542 заворожить 1.802блеклый -1.817 любимейший 1.661тупой -1.783 офигенный 1.602зловещий -1.010 овация 1.498

Для решения основной задачи классификации отзывов в данной работе использовалась только средняя оценка каждого слова без учета ее отклонения от средней оценки по корпусу.

2.2.2. Признак встречаемости существительных после оценочных прилагательных. Для подсчета этой характеристики были взяты первые двести прилагательных из выдачи классификатора после предварительной классификации. Количество оценочных прилагательных среди этих двухсот слов составило 90%. Далее для каждого прилагательного были найдены существительные, которые следуют непосредственно за ним и не разделены знаками препинания.

308

Для каждого такого существительного подсчитана его частота появления после вышеуказанных двухсот прилагательных. На основе полученных значений и была сформирована новая характеристика. Ее смысл заключается в том, что существительные, которые часто следуют за оценочными прилагательными, наиболее вероятно не являются оценочными, а скорее всего, среди них достаточно большое количество атрибутов объекта, на который составлен отзыв [Popescu et al., 2005].

2.3 Машинное обучениеПосле того, как для каждого слова сформирован вектор характеристик,

была поставлена задача классификации слов на оценочные и неоценочные слова. Исходные десять тысяч слов были размечены на два вышеуказанных класса (3200 и 6800 слов соответственно). Для классификации были опробованы наиболее употребительные алгоритмы. Оценка качества работы алгоритмов производилась по двум параметрам: F-мера Количество оценочных слов, попавших в первую тысячу слов, упорядоченных по «вероятности» их принадлежности к классу оценочных.

Для получения достоверных показателей использовался механизм кросс-валидации. Наилучшие результаты среди опробованных алгоритмов показали алгоритм логистической регрессии для прилагательных и трехслойная нейронная сеть для неприлагательных. Результаты работы классификаторов приведены в таблице 1.

Табл. 1

F P1000Прилагательные 68,09% 69,1%

Неприлагательные 50,83% 50,9%Дополнительные исследования были проведены для

неприлагательных, поскольку для них стоит проблема несбалансированных данных (1700 оценочных слов против 6000 неоценочных). Была проведена балансировка данных в обучающей выборке, а также понижение порога принятия решения по отнесению объекта к некоторому классу. Значительных изменений в качестве классификации слов получить не удалось.

3. Эксперименты по классификации отзывовДля решения задачи автоматического разбиения отзывов на классы, с

портала www.imhonet.ru было собрано две с половиной тысячи отзывов на

309

фантастические фильмы вместе с оценками от одного до десяти, проставленными пользователями (тестовый корпус).

Необходимо было автоматически разделить собранные отзывы на три класса и сравнить с пользовательскими оценками. Для этого собранные оценки по десятибалльной шкале конвертировались в трехбалльную систему по принципу: {1-6} →”1” (скорее не понравился), {7,8} →”2” (понравился, но есть недостатки),{9,10} →”3” (понравился). Такое разделение на три класса оценок обусловлено тем, что пользователи проставляют значительно большее количество положительных оценок (см. рис.1-2).

Таким образом, есть два корпуса с проставленными оценками от одного до трех: корпус мнений и тестовый корпус. Первый корпус используется для обучения, а второй для оценки работы алгоритмов классификации.

Рис. 1. Корпус мнений Рис. 2. Тестовый корпус

Основной идеей предлагаемого метода является использование некоторого набора слов с вычисленными по какому-либо принципу значениями для них. Для каждого отзыва рассматриваются вхождения слов из исходного набора в этот отзыв. В случае если слово входит в отзыв – то в признаковое описание этого отзыва попадает численная характеристика рассматриваемого слова. На последней стадии все отзывы вместе со своими признаковыми описаниями классифицируются с использованием методов машинного обучения.

В качестве наборов слов рассматривались: 33. Две тысячи слов, полученных по методу, описанному в разделе 3

(Оценочный набор),1. Две тысячи слов с самым высоким значением tf*idf по корпусам

мнений и новостей (Контрастный набор).Веса для каждого слова вычислялись по одному из следующих

принципов: Вероятность принадлежности слова к оценочным словам в

выдаче классификатора, Встретилось слово в отзыве или нет (0 или 1),

310

Средняя оценка слова, Tf*idf слова в корпусах мнений-новостей.

Для классификации отзывов с полученным признаковым описанием использовались три принципиально разных алгоритма с целью выяснить, какой из подходов лучше для классификации субъективных данных:

Наивный Байесовский алгоритм, Метод k ближайших соседей, Метод опорных векторов (каждый против каждого).

Оценка качества работы алгоритмов проводилась по мере аккуратности (accuracy). Аккуратность классификации определяется как отношение правильно классифицированных отзывов к общему количеству отзывов. Результаты классификации по множествам слов приведены в таблицах.

Табл.2Набор оценочных словВес слов Naïve Bayes kNN SVMВероятность 47,52 48,66 53,10

Средняя оценка 48,01 46,29 52,41

Встречаемость 47,74 47,09 52,64

Tf*idf 47,74 47,02 41,97

Табл. 3

Набор слов по Tf*idfВес слов Naïve Bayes kNN SVMВстречаемость 52,22 44,38 53,29

Tf*idf 52,29 41,32 34,90

Средняя оценка 52,18 43,73 54,28Из полученных выше результатов можно сделать несколько выводов:Во-первых, веса слов практически не влияют на качество

классификации.Во-вторых, линейный разделитель (SVM) показывает лучшие

результаты, чем метрический и байесовский подходы.Хотя результаты по аккуратности получились практически

идентичными, стоит заметить, что при классификации с использованием оценочного набора слов хорошие результаты получались для третьего класса (т.к. оценочные слова в основном положительные), а при классификации с контрастным набором – для первого класса (слова из второго набора в основном неоценочные атрибуты). Поэтому, взяв около

311

500 самых частотных слов из оценочного набора и 500 первых слов из контрастного, при помощи метода опорных векторов мы получили максимальный результат по аккуратности классификации – 57,61% .

ЗаключениеВ работе мы показали, что путем извлечения оценочных слов для

заданной предметной области и составления с их помощью характеристического описания отзывов, можно решать задачу классификации на три класса. Решение этой задачи с использованием набора оценочных слов показало лучшие результаты для третьего класса отзывов (понравился), а с использованием набора слов по tf*idf – для первого класса (скорее не понравился). Комбинирование двух рассмотренных наборов слов дало существенный прирост в аккуратности классификации.

Список литературы[Агеев и др., 2004] Агеев М.С., Добров Б.В., Лукашевич Н.В., Сидоров А.В.

Экспериментальные алгоритмы поиска/классификации и сравнение с «basic line» // РОМИП , 2004.

[Четверкин и др., 2010] Четверкин И.И., Лукашевич Н.В. Автоматическое извлечение оценочных слов для конкретной предметной области // Диалог, Бекасово. 2010.

[Ahmad et al., 1999] Ahmad K., Gillam L., Tostevin L. University of Surrey participation in Trec8: Weirdness indexing for logical documents extrapolation and retrieval // In the Proceedings of Eigth Text Retrieval Conference (Trec-8), 1999.

[Das et al., 2001] Das, S. R. and Chen M. Y. Yahoo! for Amazon: Sentiment Parsing from Small Talk on the Web // Proceedings of European Finance Association Annual Conference, Barcelona. 2001.

[Esuli et al., 2005] Esuli A., Sebastiani F. Determining the Semantic Orientation of Terms through Gloss Classification // Conference of Information and Knowledge Management, Bremen. 2005.

[Hatzivassiloglou et al., 1997] Hatzivassiloglou V., McKeown K. Predicting the Semantic Orientation of Adjectives // ACL, Madrid. 1997.

[Hu et al., 2004] Hu M., Liu B. Mining and Summarizing Customer Reviews // KDD, Seattle. 2004.

[Pang et al., 2002] Pang, B., Lee, L., and Vaithyanathan, S. Thumbs up? sentiment classification using machine learning techniques // In Proceedings of EMNLP-02, the Conference on Empirical Methods in Natural Language Processing, Philadelphia. 2002.

[Pang et al., 2005] Pang, B. and L. Lee Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales // Proceedings of ACL-05, 43nd Meeting of the Association for Computational Linguistics, Ann Arbor. 2005.

[Popescu et al., 2005] Popescu A., Etzioni O. Extracting Product Features and Opinions from Reviews // EMNLP, Vancouver. 2005.

[Turney, 2002] Turney P.D. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews // ACL, Philadelphia. 2002.

312

УДК 007:519.816

ПРОЕКТ ONTOSMINER:ВОСПОМИНАНИЯ О БУДУЩЕМ

И.В. Ефименко ([email protected])

П.П. Жалыбин ([email protected])

С.Г. Минор ([email protected])ЗАО «Авикомп Сервисез», Москва

А.С. Старостин ([email protected]) Компания ABBYY, Москва

В.Ф. Хорошевский ([email protected]) Вычислительный центр им. А.А. Дородницына РАН, Москва

Ключевые слова и выражения: проект OntosMiner, извлечение информации из текстов, семантизация контента, Semantic Web.

В работе дано ретроспективное описание проекта OntosMiner, обсуждаются инструментальные средства для создания систем извлечения информации из текстов на различных естественных языках, разработанные в рамках проекта, и реализация семейства соответствующих лингвистических процессоров. Представлены основные результаты проекта и анализ проблем в процессе его выполнения.

ВведениеНачало работ по проекту OntosMiner датируется 2003 годом, когда

российской IT-компанией ЗАО «Авикомп Сервисез» и швейцарской компанией Ontos был открыт инновационный проект по созданию прикладных систем извлечения информации из текстов.

В проекте, который получил название OntosMiner, а в последствии развился в комплексный проект Ontos, была поставлена задача разработки прикладных систем извлечения информации из текстов с характеристиками качества, удовлетворяющими требованиям практики, на базе создания промышленной технологии обработки ЕЯ-текстов.

За 7 лет своего существования проект OntosMiner прошел все стадии – от исследовательских прототипов до коммерчески значимых систем, а

313

сформированный в рамках проекта коллектив получил признание как в нашей стране, так и за рубежом. Результаты по проекту OntosMiner неоднократно представлялись на таких IT-выставках, как CeBIT, а также европейских конференциях ESTC, ESWC и всемирных форумах SemTech За время существования проекта было опубликовано 37 статей, получено 2 патента, подготовлена глава в коллективную монографию, вышедшую в издательстве IN-TECH. Учитывая значительный объем библиографии по проекту OntosMiner, в данной статье приводятся лишь некоторые ссылки.

Целью работы является ретроспективное обсуждение проекта, анализ тех проблем, с которыми встретилась команда OntosMiner, и полученных результатов.

1. Становление проекта и первые результатыПонимание того, что поставленная перед проектом задача, в силу

своей наукоемкости, не под силу даже высокотехнологичным, но традиционным IT-компаниям, привело к тому, что для формирования проектного коллектива в качестве консультанта был приглашен В.Ф. Хорошевский из ВЦ РАН, а затем и другие специалисты из институтов РАН и МГУ. В разное время в работах по проекту OntosMiner принимали участие такие известные в нашей стране специалисты, как Н.В. Перцов и Н.Н. Перцова, Н.Н. Леонтьева, а основной костяк лингвистической команды OntosMiner, благодаря поддержке и вниманию А.Е. Кибрика, был сформирован из выпускников и аспирантов кафедры теоретической и прикладной лингвистики МГУ. В команду также вошли выпускники и аспиранты ВМиК МГУ и МФТИ. В результате был образован работоспособный коллектив программирующих лингвистов и достаточно глубоко понимающих проблемы компьютерной лингвистики системных программистов, к работам которых были также подключены специалисты по базам данных и другие IT-специалисты ЗАО «Авикомп Сервисез».

Опыт привлеченных к проекту специалистов, а также проведенный анализ состояния исследований и разработок показал, что основные усилия разработчиков во всем мире сосредоточены в области создания систем типа IE (Information Extraction) для обработки мультиязычных коллекций документов из различных источников в заданных предметных областях. С учетом вышесказанного проект OntosMiner был также сориентирован на создание семейства систем типа MIE (Multilingual Information Extraction).

При этом подход OntosMiner к обработке ЕЯ-текстов отличается от подходов большинства других исследовательских коллективов и коммерческих компаний, прежде всего, в следующем: в OntosMiner НЕ решается и даже НЕ ставится задача абсолютно полного и правильного анализа произвольных ЕЯ-текстов. Задача OntosMiner – не пропустить те

314

конструкции, которые могут быть обработаны правильно и которые содержат информацию, релевантную для заданной предметной области, и не обрабатывать то, что пока правильно обработано быть не может. Такой подход, как показывает опыт, позволяет пользователям получать адекватное интегральное видение проблемы.

Следующим принципом, положенным в основу проекта OntosMiner, является принцип разработки и многоплатформенной реализации повторно используемых компонент, интеграция которых в рамках мощной инструментальной среды позволяет достаточно быстро проектировать и реализовывать коммерческие системы извлечения информации из ЕЯ-текстов в заданных предметных областях.

И, наконец, последним по счету, но не по важности является принцип использования для управления анализом ЕЯ-текстов моделей предметных областей, специфицированных в виде предметных онтологий.

Таким образом, основные требования, которые предъявляются к системам семейства OntosMiner, следующие:

Работа с мультиязычными коллекциями документов.Обработка монотематических коллекций документов одной версией системы.Достаточно полное и точное выделение из текстов основных объектов и отношений между ними в соответствии с предметной онтологией.Представление результатов обработки в виде когнитивных карт, которые являются семантическими сетями специального вида.Масштабируемость решений и многоплатформенность всех систем семейства.

С учетом перечисленных выше требований, а также с учетом понимания того, что разработка собственного инструментария «с нуля» была бы непозволительной роскошью, в качестве технологичесого базиса проекта OntosMiner была выбрана мощная многоплатформенная среда GATE (General Architecture for Text Engineering), созданная в Шеффилдском университете Великобритании [Cunningham et al., 2002] и распространяемая на условиях Open Source.

При этом уже на начальной стадии проекта OntosMiner были развернуты работы по развитию и модификации среды GATE. На первом этапе проекта эти работы велись в 3-х направлениях:

Модификация ядра среды GATE9 (разработка и реализация интерактивного отладчика для базового ЯПЗ Jape среды GATE; разработка собственного расширения ЯПЗ Jape (Jape+) и реализация компилятора с этого языка [Karasev et al., 2004]).

9 Компоненты ядра переданы Шеффилдскому университету и распространяются с релизом GATE 3.0.

315

Модификация и расширение состава GATE-компонент (модификация базового модуля лексического форматирования входных текстов (Tokenizer); создание wrapper-ов для свободно распространяемых POS-модулей для французского и немецкого языков (POS Tagger); модификация блока русской морфологии С. Старостина и включение его в состав базовых обработчиков среды GATE (Morph); модификация базового блока словарей среды GATE для обработки структурных атрибутов (Gazetteer); разработка модуля генерации когнитивных карт (XML Generator)).Разработка и реализация новых инструментальных компонент (создание системы Dix для формирования и сопровождения словарей терминов; создание системы LightOntos для спецификации предметных онтологий и визуализации когнитивных карт). Одновременно с разработкой инструментария были развернуты

работы по реализации новых ресурсов-обработчиков, например, модуля выделения из текстов предикатных конструкций (глаголов и аналитических глагольных форм).

Одним из первых прототипов систем извлечения информации из русскоязычных текстов, разработанных в рамках проекта OntosMiner, стала система анализа сводок об угонах автомобилей – OntosMiner/CarCrime [Khoroshevsky, 2003], а в 2004 году были начаты планомерные исследования и разработки по первым системам семейства OntosMiner, которые, с одной стороны, подтвердили правильность основных принципов, положенных в основу проекта, а с другой – показали необходимость вовлечения в процессы обработки текстов более мощных методов (по сравнению с т.н. shallow-методами [Engels et al., 2000]).

Практически значимыми результатами I этапа проекта OntosMiner можно считать формирование работоспособного коллектива, создание (на базе среды GATE) основы собственной технологической платформы обработки текстов, а также государственный заказ на создание прикладной системы извлечения информации из документов-сводок.

2. Формирование технологии и прикладные системыНа втором этапе (2005-2008 г.г.) проект OntosMiner развивался в

следующих направлениях:Формирование промышленной технологии извлечения информации из мультиязычных коллекций документов.Расширение состава моделей предметных областей и спецификация соответствующих предметных онтологий с использованием стандартов W3C.

316

Развитие методов обработки ЕЯ-текстов, формирование методологии извлечения информации и методов интеграции полученных результатов в базах знаний, построенных на основе RDF-хранилищ.Разработка прикладных систем в рамках государственных контрактов и инициативных проектов.

2.1. Промышленная технология обработки ЕЯ-информацииФормирование промышленной технологии извлечения информации из

мультиязычных коллекций документов – закономерная стадия развития проекта OntosMiner, соответствующие работы выполнялись в рамках Госконтракта ЗАО «Авикомп Сервисез» с Федеральным Агентством по Науке и Инновациям РФ в 2007-2009 г.г.10

Детальное обсуждение этого масштабного проекта с ФАНИ выходит за рамки настоящей работы. Поэтому здесь отметим лишь следующее: успешная его реализация позволила развернуть на базе РНЦ «Курчатовский институт» программно-технический комплекс из более чем 40 физических серверов и дисковых систем хранения, функционирующих в среде распределенных GRID-вычислений, который позволяет обрабатывать до 15000 док/час при объёме документа до 10К, поддерживает формирование БЗ для таких предметных областей, как политика и бизнес, нанотехнологии, медицина и др., хранит не менее 10млн. документов для одной предметной области с объемами БЗ не менее 1млрд. фактов БЗ, обеспечивает режим работы 24х7х365 и поддерживает до 10000 конкурентных сессий пользователей.

2.2. Инструментарий онтологического инжинирингаОнтологический подход к проектированию систем семейства

OntosMiner стимулировал, на втором этапе развития проекта, создание собственного инструментария онтологического инжиниринга, одним из основных функционалов которого является поддержка онтологических словарей. При этом словарные входы до погружения в БЗ обрабатываются диалоговым модулем синтаксического анализа словосочетаний [Старостин и др., 2010], а результаты обработки всех словарных статей, после «утверждения» пользователем, компилируются в эффективный автомат, который подключается в качестве словарного ресурса к соответствующим системам семейства OntosMiner на этапе исполнения.

10 ОКР «Разработка технологий извлечения данных и анализа текстовых информационных ресурсов на различных естественных языках для информационно-аналитических систем нового поколения в глобальных и локальных информационных сетях».

317

Объекты (NE) Факты & Отношения

Ссылки на документы

Входные тексты

OntosMinerOntosMiner™™

Triples Triples ConverterConverter

Mapping Ontologies

Domain Ontologies

rules

CoreferencerCoreferencer rulesSemantic TaggerSemantic Taggerrules

Named Named EntitEntitiesiesExtractorExtractor

MinimizerMinimizer

rules

rules

ParserParser rules

GazetteerGazetteer

dictionaries

rules

Morph TaggerMorph Taggerrules

dictionaries

TokenizerTokenizer rules

2.3. Предметные онтологииНа втором этапе развития проекта OntosMiner в рамках нескольких

заказных и инвестиционных НИОКР были, в частности, разработаны предметные онтологии «Политика и Бизнес» (русская и английская версии), «Фармацевтика» (русская версия), «Anti money laundering» и «Homeland Security» (английская и немецкая версии), «Нанотехнологии» (русская и английская версии), «Незримые коллективы» (кросс-языковая версия) и др.

2.4. Лингвистические процессоры семейства OntosMinerНа втором этапе выполнения проекта внимание разработчиков было

сфокусировано и на лингвистических процессорах семейства OntosMiner, общая архитектура которых представлена на рис. 1.

Рис. 1. Архитектура систем семейства OntosMiner

В данной архитектуре задействованы как классические модули систем типа IE (Tokenizer, MorphTagger, Gazetteer, NE-extractor), так и такие «нетипичные» и/или новые для этого класса систем модули, как Parser, Minimizer, Coreferencer, Semantic Tagger и Triples Converter.

Parser играет в структуре систем семейства OntosMiner роль модуля, обеспечивающего выполнение частичного синтаксического анализа в объеме, продиктованном требованиями практики.

Основной задачей модуля Minimizer является разрешение неоднозначностей на выходе модуля NE-extractor. Для этого используется достаточно сложная система весов и правил, которые их учитывают.

Как известно [Orasan et al., 2008], автоматический анализ кореферентных и анафорических связей является одной из самых сложных проблем современной прикладной лингвистики, которая до настоящего времени не имеет полного решения. Поэтому в системах семейства OntosMiner модуль Coreferencer решает несколько практически

318

важных, но частных задач. Это обработка наиболее частотных случаев местоименной анафоры и простейших эллипсисов, а также установление кореферентных связей между именованными сущностями с использованием как лингвистических правил, так и статистических методов.

Принципиально новым для IE-систем модулем в системах семейства OntosMiner является модуль Semantic Tagger. На уровне этого модуля из обрабатываемого текста под управлением предметной онтологии с помощью системы семантико-синтаксических правил извлекаются отношения между именованными сущностями и атрибуты этих отношений, что соответствует связям между объектами и событиям реального мира.

Новым для IE-систем модулем является и модуль Triples Converter, поскольку в классических системах его простейшую функцию – вывод результатов обработки – берет на себя инструментальная среда. В нашем случае этого недостаточно, и в системах семейства OntosMiner Triples Converter не только конвертирует результаты обработки текста во внешнее представление в соответствии со стандартами W3C, но и осуществляет отображение их на внешние предметные онтологии, что позволяет использовать единое внутреннее представление для разных языков (русский, английский, немецкий и др.).

2.5. Прикладные системы обработки текстовРеализация прикладных систем обработки больших коллекций

документов выполнялась специалистами команды OntosMiner и других подразделений ЗАО «Авикомп Сервисез» как в рамках госконтрактов с различными министерствами и ведомствами РФ, так и по инициативным проектам самой компании. Ниже представлены результаты по одному из проектов, поскольку на публикацию материалов по некоторым госконтрактам имеются определенные ограничения.

2.5.1. Информационно-аналитическая система NanoTrack разработана в рамках пилотного проекта с госкорпорацией «Роснанотех». Основные задачи, которые стояли перед разработчиками в этом проекте, – следующие: семантическая обработка разнородной информации из области нанотехнологий, ее интеграция в БЗ, реализованной в соответствии со стандартами W3C, использование концепции SemanticWiki для представления результатов, а также предоставление пользователям набора аналитических сервисов. В системе представлены следующие основные разделы: мониторинг новостей в области нанотехнологий, профили экспертов и центров компетенции, «скрытые коллективы» исследователей, wiki-страницы по продуктам наноиндустрии, патентный анализ, семантическая ГИС (гео-

319

информационная система), навигация по графу базы знаний, мониторинг хода финансирования международных проектов и др. (рис. 2).

Рис. 2. Web-сервисы информационно-аналитической системы NanoTrack

Все разделы работают с БЗ, которая строится на результатах работы систем семейства OntosMiner. Сформированная БЗ используется для семантической навигации по информационным источникам, а также для генерации wiki-статей и аналитики на знаниях.

3. Текущее состояние и уроки проектаНа текущем этапе развития проекта OntosMiner основные усилия

разработчиков концентрируются на решении следующих задач:Переход процессоров семейства на новую версию ЯПЗ – Jape4, основные отличия которого от ЯПЗ Jape+ состоят в смещении парадигмы языка от продукционной к объектно-ориентированной, существенно более мощных средствах задания образцов в левых частях правил и повышении уровня спецификации алгоритмов преобразования в правых частях правил.Уход от концепции бинарных отношений к концепции событий в представлении смысла обрабатываемых текстов.Активное использование статистических методов обработки текстов и интеграция их в систему правил для построения гибридных систем извлечения информации.Использование энциклопедических знаний для повышения точности и полноты извлечения информации, а также повышения качества идентификации объектов, полученных на коллекциях документов.

В дополнение к перечисленным научно-техническим задачам командой OntosMiner осуществляется разработка MIE-систем для новых предметных областей и, в частности, оценки тональности документов, а также поддержка активностей комплексного проекта Ontos по реализации решений для Semantic Web и прикладных аналитических сервисов.

К основным урокам проекта можно отнести понимание сложности формирования, сохранения и гармоничного развития междисциплинарной

320

высоко квалифицированной команды, а также противоречий между фундаментальным характером стоящих перед проектом проблем и прессингом рынка в части быстрого получения коммерчески значимых результатов. Благодарности. Авторы считают своим долгом поблагодарить руководство компаний ЗАО «Авикомп Сервисез» и Ontos за многолетнее финансирование проекта, а также всех членов команды OntosMiner и проекта Ontos за плодотворное сотрудничество.

Список литературы[Старостин и др., 2010] Старостин А.С., Арефьев Н.В., Мальковский М.Г.

Синтаксический анализатор « TreeVial ». принцип динамического ранжирования гипотез. Сб. Трудов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2010». (Бекасово, 26-30 мая 2010 г.).

[Хорошевский, 2004] Хорошевский В.Ф. OntosMiner: семейство систем извлечения информации из мультиязычных коллекций документов. Труды конференции КИИ-2004. – Тверь, 2004.

[Cunningham et al., 2002] Cunningham, H., Maynard D., Bontcheva K., Tablan V., GATE: an Architecture for Development of Robust HLT Applications, Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL), Philadelphia, July 2002.

[Efimenko et al., 2009] Efimenko I., Minor S., Starostin A., Drobyazko G., Khoroshevsky V., Generating Semantic Content for the Next Generation Web, Chapter in Monograph “Semantic Web”, Publisher IN-TECH, 2009, ISBN 978-953-7619-33-6.

[Engels et al., 2000] Engels R., Bremdal B. Information Extraction: State-of-the-Art Report, CognIT a.s., Asker, Norway, 2000.

[Karasev et al., 2004] Karasev V., Khoroshevsky V.F., Shafirin A., New Flexible KRL JAPE+: Development & Implementation, In Proc. of Joint Conference on Knowledge-Based Software Engineering 2004, JCKBSE-2004, 24-27 August 2004, Protvino, Russia.

[Khoroshevsky, 2003] Khoroshevsky V. F., Shallow Ontology-Driven Information Extraction from Russian Texts with GATE, In: Proc. International Workshop “Information Extraction for Slavonic and Other Central and Eastern European Languages”, IESL-2003, Borovec, Bulgaria, 2003.

[Khoroshevsky, 2009] Khoroshevsky V. F., Ontology Driven Multilingual Information Extraction and Intelligent Analytics, In: Proc. of NATO Advanced Research Workshop on Web Intelligence and Security, November 18-20, 2009 in Ein-Bokek, Israel, 2009.

[Orasan et al., 2008] Orasan, C., Cristea, D., Mitkov, R. and Branco, A. Anaphora Resolution Exercise – an overview. Proceedings of 6th Language Resources and Evaluation Conference (LREC2008), Marrakesh, Morocco, 28 – 30 May 2008.

321

http://www.dialog-21.ru/dialog2010/materials/html/71.htm

http://www.dialog-21.ru/dialog2010/materials/html/71.htm

УДК 004.852

КОМПЛЕКСНЫЙ МЕТОД СНЯТИЯ ЧАСТЕРЕЧНОЙ ОМОНИМИИ С ИСПОЛЬЗОВАНИЕМ СТАТИСТИКИ СОВМЕСТНОГО УПОТРЕБЛЕНИЯ СЛОВ В ТЕКСТЕ

НА РУССКОМ ЯЗЫКЕ

М.И. Литвинов ([email protected]) Московский государственный институт электроники и

математики, Москва

Статья посвящена описанию комплексного метода снятия частеречной омонимиии в тексте на русском языке. Производится сравнительная оценка эффективности классического N-граммного подхода и собранной статистики совместной сочетаемости слов для задачи POS-tagging в составе комплексного подхода.

ВведениеНа основании широкоизвестных N-граммных тэггеров было сделано

множество практических систем. Например, крупные поисковые системы Yandex [Зеленков, 2005] и Google[Google, 2006] используют этот подход для различных задач автоматической обработки текста на естественном языке. Несмотря на то, что триграммные модели хорошо зарекомендовали себя, существенным недостатком для них является потребность в тщательно размеченном эталонном корпусе, где каждому слову приписана однозначная морфологическая интерпретация в рамках данного контекста. Общемировая практика привела к идее создания национальных корпусов, содержащих в себе метатекстовую, частеречную, морфологическую и семантическую разметку. К сожалению, не всегда такие размеченные корпуса доступны широкому кругу исследователей. Исключением не стал и проект «Национальный Корпус Русского Языка» [НКРЯ], доступ к которому формально есть через открытую поисковую форму на сайте, но тем не менее не доступен для проведения вычислительных экспериментов по обработке текстов.

По исследованиям компании Google на 22 сентября 2006 имеющаяся в их распоряжении цифровая коллекция англоязычных текстов содержит 1012 словоупотреблений. Национальные корпуса Англии [BNC, 2010] и США[ANC, 2010] содержат порядка 108 размеченных словоупотреблений. По последней информации на январь 2008 года (на момент написания

322

статьи прошло больше двух лет) в «Национальном Корпусе Русского Языка» содержится около 5,8*106 словоупотреблений со снятой омонимией. Провести даже автоматизированную разметку 1012

словоупотреблений11 представляется трудно выполнимой с экономической точки зрения задачей, возможно даже и не нужной. Реализация практических приложений для работы с 109 триграмм (оценку количества для английского языка см. в [Google, 2006]) потребует значительных вычислительных ресурсов или медленной производительности в настольных системах.

Во избежание вышеуказанных проблем было решено использовать свойство синтаксических хозяев и применять обучение на неразмеченных корпусах большого объема, что позволило получить статистику совместного употребления слов и значительно сократить число комбинаций по сравнению с триграммами12.

1. Получение статистики совместного употребления словПрежде всего, для автоматического определения связей в предложении

необходимо решить проблему лексической и синтаксической неоднозначностей. В текстах на русском языке встречается порядка 30% однозначных слов и, как следствие, вероятность встретить группу однозначных слов достаточно велика. В работе [Клышинский, 2010] нами были выдвинуты две гипотезы. Первая гипотеза – в тексте достаточно большого объема группы из однозначных с точки зрения морфологического анализа слов будут встречаться достаточно часто, чтобы собрать статистически значимые результаты. Вторая гипотеза – в предложении может быть однозначно определено синтаксическое подчинение13 слов друг другу даже без проведения синтаксического анализа. В соответствии со сформулированными гипотезами для сбора статистики совместного употребления слов нами были использованы следующие простые положения.

1. Следующая за единственным в предложении глаголом группа существительного синтаксически подчиняется данному глаголу.

2. Единственная группа существительного, расположенная в начале предложения перед единственным глаголом, синтаксически подчиняется данному глаголу.

3. Прилагательные, расположенные перед первым в предложении существительным или между глаголом и существительным, синтаксически подчиняются данному существительному.

11 Такое число словоупотреблений взято для качественных сравнений.12 Имеется в виду оценочное количество 109 триграмм для английского языка.13 Так называемое понятие синтаксических хозяев.

323

4. Положения 1-3 могут быть применены к деепричастиям и причастиям.

5. В тексте на русском языке должно быть представлено достаточно большое количество неомонимичных групп, попадающих под положения 1-4.

Таким образом, на основании вышеприведенных гипотез удалось получить 6 достаточно простых правил:

I. verb + noun* ( глагол + существительное )II. adj + noun* (прилагательное + существительное )

III. deepr + noun* ( деепричастие + существительное )IV. participle + noun ( причастие + существительное )V. adv + verb ( наречие + глагол )

VI. adv + deepr ( деепричастие + наречие )* Возможно наличие предлога (prep).

По результатам экспериментов при помощи полностью автоматического обучения были получены базы сочетаемости глаголов и существительных, деепричастий и существительных, существительных и прилагательных, существительных и причастий. Описание состава получившихся баз приведено в источнике [Клышинский, 2010].

В цифровой коллекции текстов из 109 словоупотреблений приняло участие 21500 глаголов из 26400, представленных в морфологическом словаре «Кросслятор», 53300 существительных из 83000, 23700 прилагательных из 45300 имеющихся. После обучения в нашем распоряжении имеется чуть менее 107 словосочетаний, что меньше оценки в 109 триграмм14. Однако результаты получены за очень короткий срок без ручной разметки корпусов лингвистами. Кроме того, несомненное достоинство базы – это использование как локальных зависимостей между словами, так и дальнодействующих15, но избегая проблемы редких данных, которая усложняет как процесс обучения, так и обработки текстов (см. [Протасов, 2008]).

2. Комплексный метод снятия омонимииВ нашей системе используется комплексный подход для снятия

частеречной омонимии, качественные показатели работы каждого подхода по отдельности и в совокупности будут приведены в следующем

14 Для русского языка, имеющего более богатую морфологию, число триграмм может быть гораздо больше.15 Согласно оценкам в источнике [Протасов, 2008], зависимые слова в предложении отстоят друг от друга на 5-7 слов, и триграммная модель не может учесть эту зависимость.

324

разделе. Классические системы по автоматической обработки текстов работают по следующим основным этапам: графематический анализ, морфологический анализ, снятие омонимии с помощью триграмм и дальнейшая обработка, в зависимости от требований системы. Отчасти из-за отсутствия размеченных корпусов в свободном доступе, отчасти из-за желания отказаться от обучения по вручную размеченным эталонным коллекциям, в нашей системе после морфологической разметки слов используется база сочетаемости слов для снятия частеречной омонимии вместо триграммного метода.

В общем виде N-граммная модель записывается следующим образом:1 2( ) arg max ( | )* ( | )*...* ( | )i i i i i i i NP w P w w P w w P w w

и означает вероятность встречи неизвестного тэга iw , если

Niw соседей известны.Для триграммной модели, чтобы избежать проблемы редких данных и

не получить нулевую вероятность появления комбинации тэгов 321| iiii wwww применяют сглаженную вероятность

2 1 3 2 1

2 1 1

_( | * ) * ( | * )* ( | ) * ( ),

i i i i i i

i i i

Psmooth w w w P w w wP w w P w

где 1331 .При проверке на сочетаемость слов между собой в нашей системе

используется следующая биграммная модель:)|(maxarg)( liii wwPwP ,

где l означает расстояние, на котором может быть неизвестное слово от известного. Обычно величина l варьируется в пределах 5-7 и позволяет учитывать дальнодействующие связи в предложении.

В источнике [Зеленков, 2005] авторы заложили в свою модель снятия омонимии определение неизвестного тэга iw не только левыми соседями, но и по правым. Аналогичный подход используется и нами при работе системы с включенной триграммной моделью – неизвестный тэг определяется по левым соседям:

iii www ,, 12 , (2.1)по правым:

21,, iii www , (2.2) по левому и правому соседям:

11 ,, iii www . (2.3)

325

Как бы это прозаично не звучало, поток электронных текстовых корпусов неумолимо растет – появляются новые труды и переводятся в цифровой вид прежние. Ввиду этого, практически невозможно собрать в одном месте абсолютно все текстовые коллекции и обучиться по ним, а уж тем более создать золотые стандарты на все случаи жизни. Чтобы как-то справиться с этой проблемой мы решили заложить в нашу систему методы, основанные на триграммных правилах и частичной оптимизации совокупности лексических признаков слов в предложении. Два последних подхода позволят модели принимать решения в условиях неполной информации.

В нашем понимании правила – это определение морфологической структуры16 неизвестного слова по информации о морфологических структурах17 соседей, без использования лексем как таковых. Правила, как и триграммы, используют левых и правых соседей – выражения (2.1, 2.2, 2.3). Здесь можно отметить, что привлекательным направлением исследований выступает автоматическое пополнение морфологического словаря по наборам текстов новых предметных областей с использованием триграммных правил. Стоит признаться, что в нашей системе триграммные правила были получены по статистике появления связок из трёх слов, взятых из тщательно размеченной эталонной дорожки, но, тем не менее, мы рассматриваем возможность получения таких правил неконтролируемым обучением.

После снятия омонимии с помощью базы сочетаемости (или триграммной модели) и триграммных правил в тексте может остаться процент неизвестных слов, особенно если обрабатывать тексты неизвестной системе предметной области. Возможный выход из такой ситуации – это оптимизация совокупности морфологических структур слов в предложении, который мы заложили в свою систему и подробнее о нём будет рассказано ниже. Среди публикаций отечественных исследователей не удалось найти применение какой-либо оптимизации при решении задачи по устранению частеречной омонимии.

В рамках нашего подхода, оптимизация – это нахождение морфологических структур слов в предложении по определенным раннее соседям, путём перебора вариантов возможных значений неизвестных слов. Следуя сказанному раннее, задача состоит в том, чтобы найти наибольшую вероятность совокупности морфологических структур слов в предложении:

16 В данном случае части речи.17 Лексическая информация используется в триграммной моделе и при проверке на сочетаемость.

326

)|(maxarg 12

ii

Ns

i

mmPPsentence , (2.4)

где Ns - число слов в предложении, im - морфологическая структура i-го слова. Оптимизация всего предложения пригодна скорей для языков с бедной морфологией и зачастую не имеет смысла, так как в предложении изначально есть процент однозначных слов. В нашей системе оптимизация идёт самым последним этапом в модуле снятия омонимии, и к этому моменту неоднозначность понижена с помощью статистики совместного словоупотребления и триграммных правил. Таким образом, с использованием априорной информации и результатов предыдущей обработки предложение делится на фрагменты, которые будут оптимизироваться по отдельности. Границы фрагментов выбираются так, чтобы левой и правой границей были известные слова. Но, если предложение оканчивается или начинается с неизвестного слова, то приходится отступать от этого правила. В любом случае нахождение наилучшего значения идёт от периферии фрагмента к центру. Сама оптимизация даёт относительно большой прирост процента разбора слов в предложении, но в сравнении с триграммами и даже правилами имеет низкое качество.

Оптимизация фрагмента будет происходить аналогично выражению (2.4) для всего предложения:

12

fragment arg max ( | )Nf

i ii

P P m m

,

где Nf - число слов, которые содержит в себе фрагмент.

Оптимальное значение ifragmentP каждого фрагмента по отдельности должно в итоге привести к наилучшей комбинации морфологических структур во всем предложении. Следующий раздел будет посвящен качественной оценки работы каждого метода по отдельности, комбинации методов и всех методов одновременно.

3. Условия проведения экспериментаОценка результатов работы системы с различными параметрами

велась по тщательно размеченной дорожке, содержащей около 2300 словоупотреблений, но, тем не менее, содержащий некий процент словоформ, которые могут разбираться двояким образом. По аналогии с областью информационного поиска брались 2 оценки качества работы системы - Precision (процент правильных ответов из всех выданных системой) и Accurancy (процент правильных ответов из всей предложенной дорожки).

327

At – число правильно выданных ответов.Afa – число неправильно выданных ответов.Afn – число не выданных ответов.Precision = At / (At + Afa )Accurancy = At / (At + Afa + Afn )

Расшифровка настроек, с которыми работала система при проведении эксперимента:

Триграммы – работа модуля морфологического анализа совместно с триграммами.

База – работа модуля морфологического анализа совместно с базой сочетаемости слов.

Правила – работа модуля морфологического анализа совместно с триграммными правилами.

Оптимизация – работа модуля морфологического анализа совместно с модулем оптимизации совместного употребления морфологических структур слов в предложении.

База+Правила – работа модуля морфологического анализа совместно с базой сочетаемости слов и триграммными правилами (аналогично для других совместных настроек).

Табл. 1.Параметры Покрытие

AccurancyТочностьPrecision

Триграммы 71.5089 98.2185 База 71.9844 96.7461

Правила 77.7345 95.9445 Триграммы+База 72.0277 96.748

Триграммы+Правила 77.7345 95.9445Триграммы+База+Правила 78.0372 95.6038

Триграммы+Правила+Оптимизация 81.15 94.6546База+Правила 78.0372 95.6038

Правила+Оптимизация 81.15 94.6546База+Правила+Оптимизация 81.2797 94.6626

Триграммы+База+Правила+Оптимизация 81.2797 94.6626В таблице 1 приведены качественные показатели работы системы со

всеми возможными настройками, чтобы наглядно показать какой относительный прирост даёт каждый метод.

При снятии частеречной омонимии наша реализация метода Триграмм и Базы Сочетаемости Слов даёт сопоставимый результат, с высоким качеством выдаваемых результатов, но в то же время и с низким процентом разбора дорожки. Добавление метода, основанного на правилах и частичной оптимизации совокупных лексических признаков, значительно повышает процент разбора, но с несколько меньшим качеством. На основании того, что настройки системы «Триграммы +База+Правила+Оптимизация», «База+Правила+Оптимизация» и

328

«Триграммы+Правила+Оптимизация» дают не сильно различающиеся результаты как по показателю Precision, так и по Accurancy, то можно использовать что-то одно в качестве базового метода для снятия частеречной омонимии.

В источнике [Сокирко, 2004] указано, что системы Inxight и Trigram дают точность 94,5 и 94,6 соответственно, что сопоставимо с результатами нашей системы, но стоит особо подчеркнуть, что всё сильно зависит от исходных данных и условий проведения эксперимента. Чтобы однозначно сказать, насколько одна система лучше другой, нужно проводить эксперимент на одной дорожке. Основная цель данной работы – показать, что полностью автоматическими методами обучения можно с меньшими затратами получить результат, сопоставимый с обучением на эталонных корпусах.

4. Заключение и возможные направления исследованийВ процессе исследований удалось получить полностью

автоматический метод получения базы совместного употребления слов. Проведены эксперименты по эффективному применению этой базы для разрешения частеречной омонимии в текстах на русском языке. После добавления новых слов в морфологический словарь и обучения на неразмеченном корпусе текстов соответствующей предметной области, возможно снятие частеречной омонимии без дополнительного привлечения лингвистов для разметки эталонных дорожек, как это было в случае использования классических N-граммных тэггеров. По скромным оценкам база сочетаемости слов может служить для решения задач глубинного синтаксического анализа, вероятностного синтаксического анализа, разрешения омонимии разных видов, построения семантических отношений (после кластеризации результатов). Несмотря на то, что есть класс задач, которым достаточно проведения только POS-tagging стоит отметить, что накопленную статистику можно использовать для задачи Lemma-tagging, но после проведения соответствующих исследований. Помимо всего прочего, интересным направлением исследований выглядит получение N-граммных правил полностью автоматическими методами на неразмеченных корпусах текстов любого жанра и обучение морфологического словаря с помощью них.

Благодарности. Данная работа выполнена при частичной финансовой поддержке ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы.

329

Список литературы [Агеев, 2009] М. Агеев, И. Кураленок, И. Некрестьянов Приложение А.

Официальные метрики РОМИП 2009 // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2009 (Петрозаводск, 16 сентября 2009г.). – Санкт-Петербург: НУ ЦСИ, 2009.

[Зеленков, 2005] Зеленков Ю.Г., Сегалович Ю.А., Титов В.А. Вероятностная модель снятия морфологической омонимии на основе нормализующих подстановок и позиций соседних слов // Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара Диалог’2005., 2005.

[Клышинский, 2010] Клышинский Э.С., Кочеткова Н.А., Литвинов М.И., Максимов В.Ю. Автоматическое формирование базы сочетаемости слов на основе очень большого корпуса текстов. // Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара Диалог’2010., 2010.

[Литвинов, 2010] Литвинов М.И. Модели управления на основе сочетаний из трех слов и глагольное управление для поверхностного синтаксического анализа. // Сб. трудов научно-практического семинара «Новые информационные технологии в автоматизированных системах-13». – М.: МИЭМ, 2010.

[НКРЯ] Национальный корпус русского языка, http://www.ruscorpora.ru. [Протасов, 2008] Протасов С.В. Вывод и оценка параметров дальнодействующей

триграммной модели языка. // Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара Диалог’2008., 2008.

[Сокирко, 2004] Сокирко А.В., Толдова С.Ю. Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп) // Международная конференция «Корпусная лингвистика 2004». – Санкт-Петербург, 2004.

[ANC, 2010] Национальный корпус США, http://americannationalcorpus.org.[BNC, 2010] Национальный корпус Великобритании, http://www.natcorp.ox.ac.uk.[Google, 2006] Официальный сайт компании Google,

http://googleresearch.blogspot.com/2006/08/all-our-n-gram-are-belong-to-you.html.

330

СЕКЦИЯ 4

КОГНИТИВНЫЕ ИССЛЕДОВАНИЯ

УДК 007.5

ЕЩЕ О РЕШЕНИИ ТВОРЧЕСКИХ ЗАДАЧ СПЕЦИАЛИСТОМ

И.Б.Фоминых ([email protected])Российский НИИ информационных технологий и систем

автоматизированного проектирования, Москва

Рассматриваются некоторые новые результаты в решении творческих задач с помощью принципа максимума взаимной информации. Формулируются условия, стимулирующие работу интуиции и способствующие поиску решения. Выявляется важная роль феномена целостности при решении творческих задач.

Введение Как отмечалось ранее [Голицын и др., 1991], [Фоминых, 2002], многие

трудности при решении творческих задач определяются присутствием в человеческом мышлении ложных, часто неосознаваемых представлений (знаний): предрассудков, заблуждений. Напомним, что процесс решения задачи рассматривается как формирование представления (нового знания) на основе заданных признаков, которые определяются условиями задачи. Условие задачи задается предикатом, определяющим некоторое свойство. Тогда решение задачи можно трактовать как конъюнкцию предикатов (пересечение решающих множеств). Если пересечение не пусто, то решение может быть получено обычными регулярными методами. Если два каких-то подмножества не пересекаются, то множество решений пустое соответствующие условия задачи противоречат друг другу, т.е. отсутствует представление, отвечающее этим условиям. Это и есть ситуация творческой задачи.

В этих терминах под творческой задачей понимается задача, условия которой выглядят противоречивыми и несовместимыми. Под решением

331

творческой задачи – разрешение противоречия [Голицын и др., 1996], но важно, что оно не абсолютно и является следствием ограниченности исходного множества представлений субъекта: решающие множества не пересекаются только в пределах исходного множества, но могут пересекаться за его пределами. Для решения задачи необходимо выйти за эти пределы.

Сложность ситуации состоит в том, что ограниченность исходного множества представлений (т.е. собственных знаний) обычно не осознается субъектом (человеком), что является следствием некритически усвоенных представлений, предрассудков Общий источник предрассудков ограниченность опыта субъекта, его слишком узкая специализации. Согласно нашей гипотезы, интуиция и есть такая техника, которая позволяет преодолевать это ограничение, не осознавая его.

1.Логика и интуицияОбычно интуиция противопоставляется логике. Если логику определить

как мышление с помощью понятий, то интуицию следует соотнести с мышлением посредством образов. Отсюда становятся понятны такие ее черты, как целостность, непосредственность и одновременность «схватывания» представления.

Напомним, в чем состоят различия между образом и понятием. Прежде всего, образ складывается на основе индивидуального опыта,

поэтому распределение вероятностей в пространстве признаков для него, как правило, неравномерно. Типичной является холмообразная форма, свойственная, например, нормальному распределению. При этом в качестве наиболее типичного образа обычно выступает состояние с максимальным значением вероятности («вершина холма»).

Понятие, как правило, заимствуется из коллективного опыта, и распределение вероятностей в пространстве признаков для него предполагается равномерным. В многомерном пространстве признаков распределение вероятности для образа выглядит как некий «гиперхолм», для понятия – как «гиперплато». Конечно это идеальные формы образа и понятия. На практике встречается, множество промежуточных форм.

Таким образом, главное отличие логики от интуиции состоит в том, что интуиция оперирует образами и, значит, размытыми сглаженными распределениями, тогда как логика имеет дело с понятиями и. следовательно, с идеализированными, равномерными распределениями. Из определений образа и понятия вытекает ряд важных различий в их свойствах. Такие как целостность и конкретность образа и абстрактность понятия. Признаки образа всегда присутствуют вместе, так что в этой целостности часто просто невозможно бывает вычленить какой-то один.

332

Напротив, признаки понятия легко отделяются друг от друга, абстрагируются и могут задаваться и рассматриваться по отдельности.

В соответствии с принятым подходом работа интуиции описывается информационными закономерностями, среди которых важнейшими являются условия преодоления порога (соотношение (1.1)) [Голицын и др., 1996]:

pij = pio p0j/ р00-1+exp(- 1- β(rij – R)) , (1.1)

где pij – вероятность комбинации переменных(xi,уi) , pio, p0j – вероятности неадекватных реакций соответственно на xi и уi,

р00 – вероятность, характеризующая частоту ответа на комбинацию переменных (x0,у0) (контраст, фон),

β – множитель Лагранжа,rij – ресурс, затрачиваемый на комбинацию переменных (xi,уi) ,R – общее количество располагаемых системой ресурсов. Интуиция переводит подпороговое, неосознаваемое представление

через порог, делает его достоянием сознания. Условия преодоления порога являются одновременно условиями, стимулирующими работу интуиции и способствующими поиску решения. Эти условия могут служить объяснением и теоретическим оправданием разнообразных эмпирических приемов решения творческих задач. Перечислим эти условия, интерпретируя их применительно к решению творческой задачи.

1) Фиксация и повторение стимулов (условий задачи), что формально описывается как увеличение вероятности комбинации р(xi,уi). Требование это кажется столь простым и очевидным, что едва ли о нем стоило бы говорить как об особом приеме, если бы на практике им не пренебрегали сплошь и рядом. По свидетельству Г.С. Альтшуллера [Альтшуллер, 1991] «анкетный опрос изобретателей и непосредственное наблюдение за их творчеством показывают, что в большинстве случаен изобретатель пытается решить задачу, не разобравшись достаточно внимательно в ее условиях».

Между тем отвлечение внимания на посторонние стимулы создает ложные связи истинных признаков решения с ложными, то есть увеличивает смешанные вероятности pio, p0j, а с ними и порог для решения.

Еще один «прием», сходный с повторением: умение ждать. Разумеется, ожидание бывает и бесполезным. Время, проведенное в разумном бездействии, при условии концентрации внимания само работает на решение: необходимо только уяснить себе условия задачи и сосредоточиться на них, не отвлекаясь на побочные стимулы. Для иллюстрации приведем простую аналогию: чтобы получить пламя при помощи увеличительного стекла, нужно сфокусировать лучи на одной

333

точке и просто ждать. Если же нетерпеливо перемещать фокус из одного положения в другое, то вы никогда не дождетесь вспышки.

2) Отсутствие «вредных привычек» предубеждений, предрассудков, стереотипов и т.п. Формально это означает – низкие значения вероятностей pio, p0j, то есть, например, данные условия задачи xi не должны быть связаны в памяти субъекта с каким-то «другим» решением у0. Важность этого условия применительно к творческой задаче достаточно очевидна. Недаром на практике иногда используют такой прием: для получения принципиально нового решения приглашают не опытного профессионала с закостенелыми стереотипами, а свободного от них новичка.

3) Переключение время от времени на другую, контрастную деятельность, т.е. «другие» реакции на «другие» стимулы. Формально это означает увеличение вероятности р00, что, как видно из (1.1), ведет к снижению порога. Из практики известно множество случаев, когда субъект, отвлеченный на какую-то постороннюю деятельность, возвращается затем к своей задаче и находит ее уже решенной! За время «отключения» порог снизился настолько, что возвращение к стимулу сразу приводит к искомому решению. Отвлечение, отдых, таким образом, может использоваться как прием решения творческих задач.

4) Облегчение задачи в смысле уменьшения затрат ресурсов rij, устранение всех излишних, необязательных факторов, которые требуют затрат, но не помогают решению. В частности, «ядро» задачи должно быть очищено от всего постороннего и представлено в наиболее экономной, компактной и наглядной форме. Такая работа часто носит чисто технический характер, и потому значение ее опять-таки недооценивается.

5) Мобилизация и концентрация ресурсов (что формально описывается как уменьшение дефицита ресурсов β). Утомление, истощение, голод, отравление, болезнь, старость и т.п. явно не способствуют творческим успехам, тогда как отдых, избыток сил, здоровье, молодость благоприятствуют им.

6) Роль конкретности. В процессе решения творческой задачи в поле внимания субъекта постоянно попадают внешние объекты, которые обладают некоторыми признаками решения и потому способны так или иначе влиять на вероятность искомого представления.

Конечно, лучше всего было бы найти объект, обладающий всеми признаками решения, т.е. само решение в готовом виде. Но это исключительный случай; чаще можно встретить объект, обладающий не всеми, но многими признаками решения. Именно такой объект нередко играет роль подсказки. Подчеркнем, что подсказка эффективна только тогда, когда проделана достаточно большая предварительная работа по формированию искомого представления, и его вероятность стала близка к

334

пороговой. Без этого можно многократно пройти мимо такого объекта и не увидеть в нем подсказки.

2. Феномен целостностиСпособность человека к формированию конкретных целостных образов

при решении творческих задач кажется очевидной и естественной. Чтобы оценить ее истинное значение, нужно искусственно нарушить ее работу, заставив субъекта воспринимать вместо целостного образа отдельные абстрактные признаки. Иногда природа ставит жестокий эксперимент на человеке, показывая, что его способность к целостному восприятию не безгранична и легко может быть утрачена. Есть такая болезнь - агнозия: больной видит вещи, но не узнает их. Не узнает лица, буквы, предметы, не понимает смысла сложных ситуаций, не ориентируется в окружающей обстановке. При этом он может описать предмет, перечислить его детали и признаки и все-таки не узнать. Когда ему показывают изображение лопаты, он может сказать: «Это нечто удлиненное, здесь есть ручка и т.п.», на вопрос же, что это такое, - молчит или высказывает более или менее удачные догадки.

Вы показываете больному букву «Р».- Что это за буква?

Посмотрим... Кружочек... Палочка... Мягкий знак? – Нет.

Так... Палочка... Кружочек... Может быть, «Б»?Нет.Тогда – «Р»?

Больной перебрал по сути дела все возможные варианты и случайно наткнулся на правильный, но и то не уверен в своем ответе. Между тем он правильно назвал все элементы буквы. Что, собственно, нарушено у больного? Острота зрения – нормальная, интеллект сохранен, больной здраво рассуждает, склонен к юмору, критически относится к своему

335

заболеванию и, в то же время, не может решить простейших зрительных задач. ЧЕГО же ему не хватает? Оказывается, у больного нарушена способность к целостному восприятию.

Попробуем промоделировать эту ситуацию и проделаем простой опыт: возьмем лист плотной бумаги или картона. Прорежем в нем окошко диаметром 5 мм. Закроем этим листом какую-нибудь картинку (портрет, изображение буквы, предмета, сцены и т.п.) и попросим испытуемого узнать, что изображено, передвигая окошко по картинке. Оказывается, это не так просто сделать. Вот протокол, фиксирующий высказывания испытуемого во время опыта (в скобках приводятся время и комментарии экспериментатора).

Испытуемому предъявлено перечеркнутое «Б».Экспериментатор: Что это такое?Исп.: Какая-то сложная фигура. Что-то не пойму. Вроде сердца,

пронзенного стрелой. Нет, какая-то фигура (1 мин.).Экспериментатор: Это буква, но перечеркнутая.Исп.: Посмотрим. Не поймy. То ли вверх ногами, то ли боком.

Не пойму. Не знаю. Вроде «Р», но вверх ногами (2 мин. Экспериментатор убирает заслонку). Буква «Б».

Эксперименты с сужением объема восприятия показывают, что невозможность одномоментного восприятия признаков объекта часто приводит к подмене непосредственного интуитивного «схватывания» объекта логическим рассуждением. Эти и подобные им примеры напоминают поведение больных агнозией. Есть данные о том, что и в случае агнозии у больных резко сужен объем восприятия – уже не из-за ограничения поля зрения, а по другим причинам.

С другой стороны, затруднения испытуемых очень похожи на трудности, с которыми сталкивается человек при познании «большой» системы. И для этого есть основания: объем восприятия ограничен не только у больных. Здоровый человек по отношению к вещам «слишком большим» находится в том же положении, что и больной по отношению к вещам средних размеров: он не может сразу, с одного взгляда составить о них целостное представление. Вспомним, как воспринимается незнакомый город, крупное архитектурное сооружение и т.п. Сначала – множество деталей, и лишь со временем, уже в памяти, они складываются в нечто целое. Это ограничение способности к одномоментному «схватыванию» больших объектов в принципе не отличается от агнозии; но поскольку оно свойственно всем нормальным людям, то и считается нормальным.

Над этим фактом – ограниченностью объема нашего нормального восприятия – имеет смысл задуматься. Пять чувств, с помощью которых человек познает мир, это, в сущности, то же окошко, ограничивающее нашу способность к целостному восприятию мира. Вместо того, чтобы

336

«схватывать» его сразу, мы вынуждены познавать его по частям, выявляя один за другим его «элементы» и устанавливая связи между ними. Для этого мы должны, подобно нашим испытуемым, прибегать к рассуждению, к логике и т.п. методам. Будь объем нашего восприятия шире, возможно, эти методы сделались бы ненужными.

Способность человека к целостному восприятию сложных объектов как простых и неразложимых играет важнейшую роль в поведении человека. Эта способность лежит в основе «свертывания» и сокращения того огромного количества информации, которое поступает на наши органы чувств и которое без этого свертывания человек не мог бы использовать. Целостное восприятие позволяет человеку подняться над множеством элементов сложной системы и не заниматься ими в отдельности, а иметь дело непосредственно со всей системой как единое целое. Вообще следует сказать, что сложность – понятие относительное и зависит от нашего умения или неумения видеть предмет как целое. Сужая объем восприятия, можно видеть, как простая задача узнавания превращается в сложную. Можно ожидать обратного эффекта - превращения сложных задач в простые, если мы сумеем расширить объем восприятия по сравнению с нормальным.

Какими же средствами располагает человек, чтобы добиться расширения объема восприятия? Все, что способствует мобилизации энергетических ресурсов нервной системы, расширяет и объем восприятия. Из естественных средств это – отдых, укрепление организма. Есть гораздо более мощное средство увеличения объема восприятия – иерархическая организация самого материала восприятия. И такая организация становится возможна благодаря переходу от образа к знаку (символу). Вот простейший пример: известно, что человек может одновременно воспринять и запомнить шесть-семь разрозненных букв. Но если организовать эти буквы в слова, слова в предложения, предложения в осмысленный текст, то объем восприятия (число воспринимаемых букв) резко расширится.

Есть еще одна причина, заставляющая человека перейти от образа к знаку, от интуиции к логике: образ может не только помогать решению творческой задачи, но, как ни парадоксально, и мешать ему. Действительно, образность резко усиливает эффективность и конкурентоспособность представления. И это хорошо, когда речь идет об истинном представлении. А если оно ложное – тогда усиливаться и закрепляться будет ложный образ, что становится серьезной помехой на пути к решению.

Образ – это всегда представление конкретное. Этим он отличается от понятия. Однако часто образ выступает как «типичный представитель» более широкого класса, т.е. замещает соответствующее этому классу понятие. Но образ и понятие совершенно по-разному соотносятся с

337

классом описываемых объектов. Если понятие описывает весь класс, то образ – только один объект этого класса, но объект типичный для этого класса. Такой объект, естественно, обладает только одним значением каждого из признаков. Выступая как представитель класса, образ невольно заставляет нас принять его частные особенные свойства за всеобщие, абсолютизировать эти свойства. Этим и обуславливается важная черта образного мышления: сужение круга рассматриваемых представлений, сужение, которое становится опасным, когда относится не к решению, а к условиям творческой задачи – возникают предрассудки.

Итак, решение творческой задачи требует расширения круга рассматриваемых представлений, в то время как для образного мышления характерно сужение этого круга. Следовательно, видеть условия задачи (включая ложное) в образной форме – значит заведомо ограничивать круг своих представлений с риском потерять то, которое ведет к решению. Этот переход от образа к понятию и изображающему его знаку – процесс закономерный.

3. ЗнакЧтобы понять, почему развитие человеческой психики оказалось

необходимо связано со знаком, с языком, с синтаксисом и логикой, следует выяснить, какими преимуществами обладает знак перед образом, почему он оказался «усилителем» психических способностей человека. Среди этих преимуществ основными являются следующие.

1) Независимость знака. Основа этого преимущества – в самой природе знака как средства обозначения, т.е. произвольного соотнесения знака с предметом. Форма образа привязана к форме предмета; знак независим от нее. Слово «кошка» ничем не похоже на реальную кошку, оно не вызывает представления о кошке у животного или у человека, не знающего русского языка. Тогда как изображение кошки будет правильно понято не только иностранцем, но при определенных условиях даже и животным.

2) Разнообразие связей с предметом. Ввиду независимости формы знака от формы предмета, связи между предметом и знаком могут быть гораздо более разнообразными, чем между предметом и образом. Так, знак может представлять не только отдельный предмет, но и совокупность предметов, причем совокупность столь большую, что ее невозможно представить себе в виде образа. Знак может представлять явление, вообще не имеющее видимого образа. Так, невозможно вообразить себе длину или скорость не привязанными ни к какому предмету, но их можно обозначить символами и благодаря этому мыслить отдельно от предметов.

3) Жесткость. Одним из условий, обеспечивающих дискретность и предотвращающих слияние различных знаков, является жесткая и неизменная форма знака. Для обеспечения этой неизменности в обществе

338

существует целая система мер: с одной стороны – нормативные документы, задающие нормальную форму знака (азбуки, словари, законы, касающиеся языка и т.п.); с другой – различные социальные механизмы защиты знака и наказания для тех, кто искажает его форму (низкие баллы в школе, ограничения в приеме на работу, и пр.). Большую роль сыграло изобретение письменности, а затем книгопечатания.

Жесткость знака позволила сделать символьное мышление более надежным, чем образное, строить более длинные цепи рассуждений без потери их достоверности. Только благодаря этому стали возможны логика и математика, позволяющие интегрировать воедино огромные совокупности фактов и от непосредственных наблюдений переходить к выводам, которые непосредственно ни увидеть, ни даже представить нельзя. Жесткость знака сделала передачу информации во времени и пространстве более точной и надежной.

4) Большая точность в представлении количественных величин. Трудно отличить образ 99 точек от образа 100 точек, однако представляющие их знаки легко различимы.

5) Экономия ресурсов. Более экономное использование ресурсов, чем при образном представлении предметов.

6) Рефлексивность, возможность использовать знак для обозначения другого знака или группы знаков. Это свойство позволяет строить иерархию знаков, обозначать сложные знаковые структуры одним знаком. Простейший пример: трудно отличить число 10000000000000000 от 1000000000000000 – приходится считать нули. Но благодаря рефлексивности знаков можно обозначить число знаков (нулей) новым знаком и написать: 1016 и 1015 . Эти знаки уже легко различаются.

Заметим, что подобные операции принципиально невозможны среди образов: образ, если его использовать для обозначения, уже перестает быть образом, превращаясь в знак. Следовательно, уже сама необходимость перекодирования информации выводит нас за пределы образности и ведет к символизации. Как известно, это свойство знаков широко используется в математике, физике и других точных науках. Оно позволяет сокращать число используемых знаков и экономить ресурсы. Но еще важнее, что эта способность к переобозначениям и подстановкам позволяет создавать развитые дедуктивные системы, охватывающие и связывающие в единое целое широкие области фактов.

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 08-01-00109, проект № 09-07-00054).

Список литературы[Альтшуллер, 1991] Альтшуллер Г.С. Найти идею. – Новосибирск: Наука,1991.

339

[Голицын и др., 1991] Голицын Г.А., Петров В.М. Информация поведение творчество. М.: Наука, 1991.

[Голицын и др., 1996] Голицын Г.А., Фоминых И.Б. Нейронные сети и экспертные системы: перспективы интеграции// «Новости искусственного интеллекта». – М.,1996, №4

[Фоминых, 2004] Фоминых И.Б. О технологии решения творческих задач.// В сб. трудов 8 Национ. Конф. по искусств. интеллекту “КИИ-2002”, т.1. – М.:изд.физ.-мат.литературы, 2002.

УДК 519.711.74

РЕАЛИЗАЦИЯ РЕКУРСИВНЫХ ЗАПРОСОВ В ДИНАМИЧЕСКОЙ АССОЦИАТИВНОЙ РЕСУРСНОЙ

СЕТИ

Л.Ю. Жилякова ([email protected]) Педагогический институт ЮФУ, г. Ростов-на-Дону

Ключевые слова: ассоциативная память, сеть, проводимость, ресурс, рекурсивный запрос.

Предложенная модель представляет собой двусторонний взвешенный граф с петлями; вершины обозначают сущности предметной области, ребра отвечают за ассоциативные связи между ними. При обращении с запросом в некоторое множество вершин передается ресурс, распространяющийся по сети в дискретном времени. Веса ребер обозначают их пропускную способность. Для управления движением ресурса используются рекурсивные запросы.

ВведениеВ работе предложена структура памяти, названная динамической

ассоциативной ресурсной сетью [Кузнецов, 2009]. Способ хранения информации в ней таков, что наиболее часто используемые данные оказываются и наиболее доступными. Эта особенность позволяет значительно упростить обработку частых запросов; запросы к мало востребованным данным требуют для обработки больше времени.

В основе ассоциативной ресурсной сети лежит несимметричная двусторонняя ресурсная сеть [Кузнецов и др., 2010], которая

340

принципиально отличается от классических потоковых моделей, (см. например, [Форд и др., 1966]).

Быстрый доступ к часто используемым данным обеспечивается следующими особенностями сети: каждая вершина обладает способностью хранить неограниченное количество ресурса, отвечающего за ее яркость, которая повышает ее доступность при поиске; каждое ребро сети имеет проводимость, соответствующую силе ассоциативной связи между сущностями.

Разность между суммарной входной и выходной проводимостью вершины задает ее дивергенцию. Некоторые вершины с неотрицательной дивергенцией играют роль аттракторов, которые способны аккумулировать значительную часть яркости при выполнении запросов.

При ненаправленном распространении ресурса по сети во время поиска зона яркости увеличивается равномерно во все стороны. Чтобы локализовать распространение яркости и задать направление движения пятна яркости по сети, используются рекурсивные запросы.

1. Ресурсная сеть. Основные определенияРесурсная сеть представляет собой ориентированный граф, вершинам vi

которого приписаны неотрицательные числа qi(t), называемые ресурсами, и изменяющиеся в дискретном времени t.

Сеть двусторонняя, т.е., если существует ребро (vi, vj), то существует и противоположно ориентированное ребро (vj, vi).

Ребра графа взвешены – каждому ребру (vj, vi) приписано неотрицательное число rij, называемое его проводимостью. Проводимость ребра отвечает за его способность передавать ресурс от вершины к вершине. Каждая вершина имеет петлю (vi, vi) с проводимостью, равной rii. Петля отвечает за ресурс, который будет возвращен в вершину в процессе его перераспределения. Вершины обладают способностью удерживать неограниченное количество ресурса.

Матрицей проводимости называется матрица R = ||rij||n n, где rij – проводимость ребра (vi, vj).

Если пары <(vi, vj), (vj, vi)> не существует, rij = 0 и rji = 0.Из определения ресурсной сети вытекают следующие свойства матрицы

R: 1. R – неотрицательная матрица: i, j rij 02. i rii > 03. i, j (rij > 0 rji > 0)Суммарной проводимостью сети, rsum, называется сумма проводимостей

всех ее ребер:

341

.

Суммарную проводимость входных ребер вершины с номером i будем называть ее входной проводимостью; суммарную проводимость выходных ребер назовем выходной проводимостью и обозначим их через и соответственно. Проводимость петли входит в обе суммы.

= ; = .

Сеть функционирует в дискретном времени t.Распределение ресурса в сети происходит по одному из двух правил,

выбор которых зависит от величины ресурса в вершинах. В момент t + 1 вершина vi в ребро, соединяющее ее с вершиной vk, отдаст:

правило 1: rik единиц ресурса, если ;

правило 2: в противном случае.

По правилу 1 вершина отдаст за такт работы всего: = ресурса.

По правилу 2 вершина отдает весь свой ресурс. Если ресурс в вершине равен выходной проводимости вершины: , – то применение обоих правил даст один и тот же результат.

Суммарный ресурс, находящийся во всех вершинах, обозначим через W. В сети выполняется закон сохранения: при ее функционировании ресурс не

поступает извне и не расходуется: t = W.

Ресурсная сеть называется однородной, если проводимости всех ребер одинаковы. В противном случае сеть называется неоднородной.

Ресурсная сеть называется симметричной, если симметрична ее матрица проводимости.

В симметричных сетях у каждой вершины входная и выходная проводимости совпадают. Ресурсная сеть называется квазисимметричной, если

i: = . (1.1)Если сеть не квазисимметрична, в ней существует хотя бы пара вершин,

для которых выполнится: . Для произвольной вершины vi

342

обозначим эту разность через ri: ri = – . Тогда все вершины сети можно разделить на три класса:

1) вершины-приемники, для которых ri > 0;2) вершины-источники, для которых ri < 0;3) нейтральные вершины, для которых ri = 0.В симметричных и квазисимметричных сетях все вершины нейтральны. Сеть будем называть несимметричной, если она не удовлетворяет

условию квазисимметричности (1.1). Несимметричная сеть обладает как минимум одним источником и одним приемником.

Состоянием Q(t) сети в момент t будем считать вектор Q(t) = (q1(t), …, qn(t)), состоящий из значений ресурсов в каждой вершине.

Состояние Q(t) называется устойчивым, если Q(t) = Q(t + 1) = Q(t + 2) = Q(t + 3) = …

Состояние Q* = (q1*, …, qn

*) называется асимптотически достижимым из состояния Q(0), если для любого > 0 существует t такое, что для всех t > t

qi* – qi(t) < , i = 1, 2, …, n.

Состояние сети называется предельным, если оно либо устойчиво и достижимо из Q(0) за конечное время, либо асимптотически достижимо из Q(0).

Распределение ресурса в сети представляет собой Марковский процесс. На основании свойств регулярных стохастических матриц [Гантмахер, 2004] доказана сходимость процесса распределения ресурса для любой конфигурации сети.

2. Динамическое изменение топологии в ассоциативной ресурсной сети

Динамическая ассоциативная ресурсная сеть представляет собой ресурсную сеть, каждая вершина которой обозначает некоторую сущность: объект, атрибут или класс, – и имеет имя vi из множества имен V. Рёбра сети обозначают ассоциации между сущностями.

Двусторонность сети отвечает за существование как прямой, так и обратной ассоциации (не всегда одинаковой силы).

Ресурс в ассоциативной сети отвечает за яркость понятия в памяти. В неактивном состоянии сеть не имеет яркости. Яркость поступает в

сеть только на стадии обращения к ней с запросом. Запрос – это задание начального множества вершин с указанием

количества ресурса (начальной яркости) в каждой из них.Следуя правилам 1 и 2 из п.1, яркость начинает распространяться по

сети от каждой вершины по всем инцидентным ребрам. Сеть функционирует в быстром времени t.

343

Обращение к сети с каждым новым запросом, так же как и наполнение ее новой информацией, изменяет топологию сети и, соответственно, влияет на результаты будущих запросов [Жилякова, 2010].

Занесение новой информации и обращение с запросами происходит в медленном времени . Одному такту соответствует выполнение одного запроса или занесение новой единицы информации.

Информация заносится в сеть минимальными структурными единицами. Они могут быть двух типов:

1) двусторонняя пара, связывающая две существующие вершины;2) новая вершина с петлей и двусторонняя пара, связывающая эту

вершину с уже имеющейся.На каждом такте все ребра, которые участвовали в передаче яркости,

включая петли вершин, увеличивают проводимость на некоторую величину (). Таким образом, чем чаще вершины участвуют в запросах, тем больше проводимость их петель и тем больше яркости они могут удержать. Чем выше проводимость ребер, ведущих к вершине, тем больше яркости она получит из других областей сети. Вершины, способные вблизи предельного состояния удержать или накопить яркость, превышающую их выходную проводимость, будем называть потенциальными аттракторами.

3. Управление движением ресурса3.1. Реализация рекурсивных запросов В больших сетях яркость может растекаться от каждой вершины

неограниченно во все стороны. Чтобы локализовать область поиска и управлять движением «пятна яркости» в сети, используются рекурсивные запросы. Под рекурсивным запросом будем понимать многократный запрос, входное множество вершин которого изменяется в зависимости от полученного ответа по одному из наперед заданных правил. Глубина рекурсии может варьироваться от запроса к запросу.

Входным множеством вершин очередного запроса в рекурсии не обязательно должно быть выходное множество от предыдущего запроса, то есть множество вершин, входящих в ответ на предыдущий запрос. Каждое новое входное множество состоит из предыдущего входного множества, подвергнутого определенным изменениям. Эти изменения могут быть двух видов.

I. Добавление одной или нескольких вершин из выходного множества предыдущего запроса. Обозначим количество добавляемых вершин через k+: k+ = 1, 2, … l – l*, где l – количество вершин в ответе, l* – мощность пересечения входного и выходного множества. Этот тип изменений соответствует ситуации, когда самый ожидаемый (вероятный) ответ на поставленный запрос является удовлетворительным, но его нужно расширить и/или уточнить.

344

В таком случае из множества вершин, входящих в ответ, выбираются некоторые дополнительные вершины (вместе со своим ресурсом) и добавляются в исходное множество вершин, участвующих в запросе. После чего снова происходит увеличение проводимостей соответствующих ребер, и весь процесс перераспределения ресурса повторяется заново – для нового начального состояния.

Количество новых запросов, которые возможно сгенерировать таким

способом, составит: N+ =

*

*

1

ll

i

lliC .

II. Удаление одной или нескольких вершин из входного множества предыдущего запроса. Количество удаляемых вершин обозначим через k –: k – = 1, 2, … m.

Этот вид изменений входного множества может преследовать различные цели.

II a) Удаляются вершины из пересечения множеств вопрос-ответ, т.е. входного и выходного множеств предыдущего запроса. Такие изменения предназначены для отсекания самого очевидного ответа и поиска других, менее очевидных. То есть, чтобы получить заведомо «нетривиальный» ответ, сначала нужно узнать ответ тривиальный, и только затем его отсечь.

Количество удаляемых вершин может изменяться от 1 до l*, где l* – мощность пересечения множеств запроса и ответа.

Общее количество запросов, сгенерированных этим правилом, будет:

.

II b) Удаляются вершины из предыдущего входного множества, которых не оказалось в множестве выходном. Эти изменения производятся, если нужно создать длинные ассоциативные цепочки, – создать движение яркости сквозь сеть. Чем меньше вершин из предыдущего входного множества перейдет в следующее, тем быстрее будет передвигаться «пятно яркости» по сети, охватывая каждый раз новые участки. Если же основную массу из входного множества не трогать, пятно яркости будет блуждать около фиксированного центра. С помощью этого правила можно составить

Итоговые формулы для N+ и N – : N+ = ,

345

Комбинируя все возможные сочетания добавления и удаления вершин,

получим N = различных множеств, каждое из которых

претендует на то, чтобы быть входным множеством запроса на следующем шаге рекурсии.

3.2. Операции над графами При описании входных множеств рекурсивных запросов фрагменты

сети рассматривались как множества вершин, имеющих яркость. Т.е. нигде не учитывалась структура графов, содержащих эти вершины.

Перейдем к графам и опишем последовательность действий, которые необходимо произвести, чтобы добавить новые вершины или удалить уже существующие из подграфов с известной топологией.

Ответом на единичный запрос к сети является некоторый фрагмент сети с предельным распределением яркостей. Иными словами, это подграф, каждой вершине которого сопоставлено некоторое число, обозначающее находящееся в ней количество ресурса.

Эти числовые значения задают частичный порядок на множестве вершин. Пронумеруем вершины графа, независимо от его конфигурации, от более ярких к менее ярким. Если фрагмент содержит несколько вершин с одинаковой яркостью, упорядочим это подмножество в соответствии с некоторым заданным правилом, например, в лексикографическом порядке имен. Таким образом, получим линейный порядок на множествах вершин входного и выходного подграфов.

Входной граф запроса на шаге с номером i обозначим GIn(i). Выходной граф этого же запроса обозначим GOut(i). Вершины этих графов представляют собой пары: имя+яркость.

Если в качестве ответа на запрос брать весь подграф, то будет выполняться следующее вложение: GIn(i) GOut(i).

Если же отсекать вершины с самой низкой яркостью (порог яркости может быть относительной величиной и зависеть от суммарной яркости вершин фрагмента), то вложение уже, возможно, не будет иметь места. Более того, в таком случае множества вершин графов GIn(i) и GOut(i) могут даже не пересекаться.

Введем оператор Т, действующий на графах. T(G) – транзитивное замыкание графа G. Действует он следующим образом: для любого графа G T(G) – такой граф, что для любых двух вершин верно: если есть путь любой длины из вершины vi в вершину vj, то есть и двусторонняя пара <(vi, vj),(vj, vi)>, связывающая эти вершины напрямую.

Если граф G состоит из одной компоненты связности, то T(G) – полный граф.

346

Как только на шаге i по входному графу GIn(i) получается выходной граф GOut(i), к объединению графов GIn(i) GOut(i) применяется оператор Т.

Получается граф GInOut(i) = T(GIn(i) GOut(i)). Множество его вершин – это по-прежнему вершины графа GIn(i) GOut(i).

Проводимость каждого вновь созданного ребра рассчитывается как среднее геометрическое проводимостей ребер, составляющих цепочку.

Если из вершины в вершину существует несколько путей, выбирается максимальное из средних геометрических их проводимостей.

При построении замыкания проводимости рассчитываются только по «опорным ребрам», т.е. тем, которые существовали в графе GIn(i) GOut(i).

Введем еще два оператора, действующие на графах: А – добавление вершин к графу; Е – удаление вершин из графа.

Добавление и удаление вершин, разумеется, производится со всеми инцидентными ребрами, соединяющими вершину со всеми смежными вершинами рассматриваемого графа.

Оператор А применяется к двум подграфам, – возможно, лежащим в одной компоненте связности. Запись: (G1, G2) означает, что из графа G2 в граф G1 будет добавлено k вершин с номерами j1, …, jk вместе со всеми ребрами, соединяющими эти вершины с вершинами G1.

Тогда на шаге i + 1 добавление во входной подграф вершин с номерами j1, …, jk, где k l – l* (l – l*– мощность множества вершин графа GOut(i)\GIn(i)), запишется в следующем виде:

GIn(i +1) = (GIn(i), GOut(i)).Ребра в полученный граф добавляются из транзитивного замыкания

GInOut(i) = T(GIn(i) GOut(i)), чтобы не были потеряны ассоциации, если прервались их цепочки.

Оператор Е применяется к одному графу. Запись: (G) означает, что из графа G будет удалено h вершин

с номерами j1', …, jh' вместе с их инцидентными ребрами.Тогда на шаге i + 1 удаление из графа GIn(i) вершин с номерами

j1', …, jh', где h m (m – мощность множества вершин GIn(i)), запишется в следующем виде:

GIn (i +1) = (GIn(i)).Будем считать, что сначала к графу GIn(i) применяется оператор Е, а

затем к результату – оператор А. Операторы не коммутируют, порядок их применения важен. Заметим, что индексы j1', …, jh' – это номера вершин графа GIn(i), а j1,

…, jk – номера вершин GOut(i). Поэтому если сначала применить оператор А, то в GIn(i) добавится k вершин, после чего всё множество вершин

347

переупорядочится. Тогда набор индексов j1', …, jh' оператора Е будет обозначать совсем не те вершины, что были на этих местах до применения оператора А.

Таким образом, на шаге i + 1 входной граф запроса находится по следующей рекуррентной формуле:

GIn(i +1) = ( (GIn(i))).Непосредственно из этой формулы вытекает, что каждый новый

входной подграф однозначно определяется входным и выходным подграфами на предыдущем шаге и парой последовательностей натуральных чисел переменной длины: ({j1', …, jh'}; { j1, …, jk}).

Например, пара ({1, 3, 10}; {8, 12}) означает, что из графа, который был входным на прошлом шаге, нужно удалить вершины с номерами 1, 3 и 10 и присоединить вершины с номерами: 8, 12 из графа выходного. Затем заново перенумеровать вершины полученного графа.

Любой рекурсивный запрос будет однозначно идентифицироваться цепочкой таких пар множеств индексов. Длина цепочки совпадает с глубиной рекурсии.

ЗаключениеВ работе описана структура и основные свойства динамической

ассоциативной ресурсной сети, принципы и алгоритм ее построения; управление распространением ресурса, отвечающего за яркость понятий, при выполнении запросов.

Топология изменяется автоматически таким образом, что наиболее востребованная информация оказывается наиболее доступной. Ассоциативность сети заключается не только в адресации по содержанию, но и в структуре взаимосвязей моделируемой предметной области, в которой близость понятий определяется не только и не столько семантикой, сколько самим функционированием сети, т.е. пользовательскими запросами и ответами на них.

Управление движением ресурса сквозь сеть осуществляется как самой топологией сети, которая направляет ресурс по ребрам с большей проводимостью, так и рекурсивным заданием нового входного множества и продолжением поиска в заданном направлении.

Список литературы[Гантмахер, 2004] Гантмахер Ф.Р. Теория матриц. – М.: Физматлит. 2004.[Жилякова, 2010] Жилякова Л.Ю. Процессы изменения проводимости в

ассоциативной ресурсной сети. // X международная конференция имени Т.А. Таран ИАИ-2010. – Киев, «Просвiта», 2010.

[Кузнецов и др., 2010] Кузнецов О.П., Жилякова Л.Ю. Исследование эргодичности ресурсных сетей с произвольной проводимостью. // X

348

международная конференция имени Т.А. Таран ИАИ-2010. – Киев, «Просвiта», 2010.

[Кузнецов, 2009] Кузнецов О.П. Однородные ресурсные сети I. Полные графы. // Автоматика и телемеханика, 2009, № 11.

[Форд и др., 1966] Форд Л.Р., Фалкерсон Д. Потоки в сетях. – М.: Мир, 1966.

349

УДК 007:681.512.2

СТРУКТУРА ОБРАЗА: ДОФОРМАЛЬНОЕ ИССЛЕДОВАНИЕ

Ю. Р. Валькман ([email protected]) Международный научно-учебный центр информационных

технологий и систем НАН и МОН Украины, Киев

В работе анализируется структура образа. Определяются свойства образных структур. Рассматриваются свойства образа как понятия. Анализируется методы мерономии и таксономии в приложении к образным структурам. Вводятся уровни абстракции образов и строится иерархическая многоуровневая структура образной информации. Исследование проводится с целью последующего построения формальных структур образов для моделирования процессов образно-понятийного мышления в компьютерных технологиях.

ВведениеДанная работа является продолжением исследований процессов

образного мышления (см., в частности, [Валькман, 2007; Валькман, 2008; Валькман, 2009; Валькман, 2010]). Здесь объектом исследования является технологии управления образными знаниями в интеллектуальных системах. Предмет исследования – структуры образной информации. Цель исследования – разработка моделей представления структур образной информации и методов их использования в практической деятельности.

Название заимствовано из работы [Нариньяни, 2003]. Мне кажется, аналогично можно было бы назвать работы [Белов и др., 2009; Хокинс и др., 2007], которые для нас представляют особый интерес. Рассмотрим некоторые свойства и характеристики структур образной информации.

1. Образы: определения, разновидности и свойстваПоскольку мы исследуем процессы мышления, то логично использовать

это понятие в определении психологов: ОБРАЗ — чувственная форма психического явления, имеющая в идеальном плане пространственную организацию и временную динамику. Такие образы различные исследователи еще называют «мысленными» (imagery, в отличие от pattern), «чувственными», «вторичными», «внутренними». Важно подчеркнуть их

350

значительное отличие от образов в кибернетическом понимании (в проблематике распознавание образов). Фактически, в кибернетике образ определяется как понятие в логике.

В психологии в настоящее время понимание механизма создания различных образов базируется в основном на отнесении их к различным психическим функциям (восприятию, представлению, воображению). Поэтому психологи выделяют, в частности, три класса образов: образ восприятия, образ представления и образ воображения.

Различие их усматривается обычно в динамике соотношения чувственных и понятийных компонентов, в преобладании единичного или общего, можно говорить о трех уровнях абстракции (см. [Валькман, 2009]).

В чувственном образе может быть воплощено любое абстрактное содержание. В этом случае материалом для образа служат не только пространственно-временные представления (зрительные, слуховые, тактильные и т.д.), но и внутренняя речь (в виде абстрактного понятия или описания его с помощью ключевых слов). Следовательно, идеи, понятия, концепции и многое другое являются разновидностями образов. В Оксфордском английском словаре даже дано следующее определение «Образ... Ментальная репрезентация чего-либо (в особенности видимого объекта) не путем прямого восприятия, а при участии памяти или воображения; мысленная картина или впечатление; идея, понятие...».

Из этого определения вытекают следующие важные свойства образа. Во-первых, речь идет о ментальных представлениях. Поэтому,

любой образ субъективен и в вычислительной среде мы всегда будем вынуждены формировать «отчужденную» модель образа. И обсуждать полноту образа бессмысленно, поскольку в любой модели отражаются только некоторые свойства. Многие аспекты, необходимые для интерпретации образа остаются в голове автора. Полнота образа скорее относится к операциям, которые мы хотим проводить над ним. Хватит ли соответствующих признаков для возможности применения операции и получения корректного результата. А если эта операция проводится в вычислительной среде? Поэтому, видимо, больше подходит понятие «достаточности».

Во-вторых, представления (и, тем более воображения) – это не понятия в логическом смысле. В логическом понятии отражаются существенные признаки, а в представлении – обобщенные (имеющиеся у всех представителей группы объектов, отражаемых в образе). Выбор существенных признаков определяется решаемой задачей (проблемой), в которой используется данное понятие. Это такие признаки, которые являются необходимыми и достаточными для выделения всех объектов (входящих в это понятие) из множества всех объектов. И для разных задач

351

у одного понятия (или образа) могут оказаться значимыми разные свойства.

В-третьих, образ строится «…при участи памяти и воображения». А это значит, что любой образ тесно связан с «естественной базой знаний (БЗ)». Поэтому, выделять и рассматривать образ локально очень трудно. Часто вообще невозможно провести демаркационную линию между исследуемым образом и «средой его существования» в тезаурусе наших знаний (см. соответствующие примеры в [Валькман, 2007; Валькман, 2008; Валькман, 2009]). Отсюда проблемы с определением «внешней целостности» образа. Поэтому образы хранятся в БЗ распределено на логическом и концептуальном уровнях. И лучше сразу говорить о структурах образов.

В-четвертых, образы имеют много различных форм представлений: идеи, понятия, концепции. Все эти формы существенно отличаются в уровне формальности. Понятия используются в формальной логике. Они наиболее формальны: множество признаков (интенсионал, содержание) понятия четко определено и фиксировано. В настоящее время даже развивается специальная теория «Анализ формальных понятий» [Wille, 1989]. Образ в форме идеи (полагаю, образы воображения и многие другие) можно назвать плохо формализованными (слабо структурированными). Их множество признаков недоопределено (открыто), признаки имеют весовые характеристики (см. [Валькман, 2007]). И, поэтому, образы одного и того же объекта можно упорядочить по степеням четкости, конкретности, однозначности.

2. Структура образаЛюбая структура – это система отношений. Отношения возможны

только между некоторыми компонентами. Поэтому, построение структуры образа предполагает его деление на части. В этом отношении целесообразно по аналогии с понятием рассматривать в образе объем и содержание. Теперь вспомним «логико-кибернетическое» определение класса. Класс — множество предметов, каждому из которых присущи признаки, отраженные в содержании соответствующего понятия. Поэтому мы обратились к методам классификации.

В [Мейен и др., 1976] при построении теории классификации предлагается рассматривать весь спектр возможных классификаций на полярной (оппозиционной) шкале «Экстенсиональность — Интенсиональность». И действительно, на одном полюсе находятся классификации экстенсиональные, дескриптивные, использующие внешние характеристики объектов, а на другом полюсе — классификации интенсиональные, сущностные. Нам представляется целесообразным использовать данный подход для построения структуры образов.

352

Естественно, интенсионал соотносится с содержанием понятия (или образа), а экстенсионал – с объемом (денотатом) понятия (образа). Отметим два интересных и полезных для построения и анализа образных структур, свойства этой шкалы.

Во-первых, левая часть этой шкалы (содержание образа), при корректном построении интенсионала, должна полностью определять ее правую часть - денотат (объем, экстенсионал) образа. И, наоборот, правая часть этой шкалы должна однозначно определять левую. Именно так целесообразно трактовать необходимость и достаточность множества признаков содержания понятия для определения полноты объема понятия. Теперь мы имеем возможность анализировать целостность образов. Заметим, в самом общем смысле, с точки зрения логиков определение — это логическая операция, раскрывающая содержание понятия. Такие определения должны обеспечивать выделение множества объектов, соответствующих данному множеству признаков. В случае «замкнутого» множества признаков мы получаем класс эквивалентности, а в случае «открытости» множества признаков – кластер Кулинича [Кулинич, 2002], ряд Кобринского [Кобринский, 2009], облако знаний Финна [Финн, 2006] и т.д. Для элементов (в нашем случае, образов) этих множеств характерно отношение толерантности.

Во-вторых, перевод некоторого признака из интенсионала (левая часть шкалы) в экстенсионал (правую часть) соответствует движению вверх по иерархическому классификатору образной информации. Можно говорить об онтологии соответствующего фрагмента действительности. И, наоборот, перевод признака из экстенсионала в интенсионал соответствует движению вниз по этой иерархической структуре.

При этом важно отметить, что интенсионал характеризует отношения «часть-целое», а экстенсионал – отношения «род-вид». Поэтому, видимо, целесообразно говорить о мерономии и таксономии в приложении к анализу образной информации.

Важность привлечения аппарата мерономии состоит в том, что, неявно, часто в интенсионале понятия (образа) многие признаки не отображаются. Например, в любом столе можно выделить три мерона: рабочая поверхность (крышка, доска), основание (ножки, тумбы) и назначение стола. Первые две части (мероны) связаны между собой отношением «на». Первый и третий — отношением «для». Обычно мероны-отношения не рассматривают и в содержании понятия не отображаются.

Теперь понятия можно рассматривать как модели соответствующих объектов. И, интенсионал – это система, а не множество признаков.

Вообще, часто, отношения между признаками остаются «в голове» автора. Мерономия (или мереология Лесневского) вынуждает вводить в

353

систему все свойства отношения «часть-целое». Конечно, в образах невозможно представить все свойства.

Заметим, что нельзя в образных структурах рассматривать мерономию без таксономии. В [Мейен и др., 1976] это свойство названо принципом двойственности. В соответствии с этим принципом любая классификационная система имеет две стороны: «Таксономию» и «Мерономию», которые двойственны по отношению друг к другу.

Таксономия является «внешней стороной» классификации, которая описывается стандартными теоретико-множественными отношениями (объединение, пересечение, класс-подкласс и т.п.). Мерономия описывает «внутреннюю сторону» классификации, связанную со «свойствами и частями» системы (архетип в терминологии теории классификации).

В соответствии с этим будем дифференцированно рассматривать внешнюю и внутреннюю целостность образа.

3. Образ как абстракцияВ [Валькман, 2010] мы рассматривали структуру образа на основе

анализа понятия и его «окружения». Анализ структуры образа касается и проблемы абстрагирования. В

процессе соответствующих исследований мы должны получить ответы на вопросы: какие свойства моделируемого объекта отражаются в образе, почему именно они, какова их значимость, в решении каких задач.

Некоторые исследователи подчеркивают конкретность образов. Это свойство, с нашей точки зрения, характерно для образов, которые используются в операциях наглядно-действенного и наглядно-образного («допонятийного») мышления. Образы этого класса хранятся в кратковременной памяти. Здесь обсуждаются образы, которые «обслуживаются средствами» долговременной памяти. А для этих образов характерно свойство абстрактности, т. к. они используются в процессах «понятийно-образного» мышления.

В логике под абстрагированием — понимается [Ивин, 1998] мысленное выделение, вычленение некоторых элементов конкретного множества и отвлечение их от прочих элементов данного множества. Это один из основных процессов умственной деятельности человека, опирающийся на знаковое опосредствование и позволяющий превратить в объект рассмотрения разные свойства предметов. Это теоретическое обобщение позволяет отразить основные закономерности (архетип) исследуемых объектов или явлений, изучать их, а так же прогнозировать новые, неизвестные закономерности. В качестве абстрактных объектов выступают целостные образования, составляющие непосредственное содержание человеческого мышления — образы, понятия, суждения, умозаключения, законы, математические структуры и др. Для моделирования процессов

354

образного мышления, с нашей точки зрения, представляют интерес следующие основные виды абстракции [Ивин, 1998]:

примитивная чувственная абстракция — отвлекается от одних свойств предмета или явления, выделяя другие его свойства или качества (например, выделение формы предмета, отвлекшись от его цвета) (1);

изолирующая — вычленение исследуемого явления из некоторой целостности (тесным образом связана с непроизвольным вниманием, поскольку при этом выделяется то содержание, на котором сосредоточивается внимание) (2);

обобщающая — представление обобщенной картины явления, отвлечённой от частных отклонений (в результате такой абстракции выделяется общее свойство исследуемых явлений; данный вид абстракции считается основным в математике) (3);

идеализирующая — замещение реального эмпирического явления, процесса идеализированной схемой, структурой (4).

1. В силу бесконечного многообразия действительности никакое восприятие не в состоянии охватить все ее стороны, поэтому примитивная чувственная абстракция (фактически, построение образа восприятия) совершается в каждом процессе восприятия и неизбежно связана с ним.

2. Примером изолирующей абстракции является образ понятия «предприятия» так как оно относится к определенной целостности — «отрасли» и обладает общими для всех предприятий данной отрасли признаками: однотипные сырье, технологии и продукты.

3. Исследуя предприятие как единое целое, можно представить его как социально-экономическую систему — это обобщающая абстракция.

Работники каждого подразделения узкоспециализированы, они чаще всего не видят того, как вклад отдельных подразделений сливаются, создавая общий результат. И не может быть такого подразделения, которое с философской точки зрения явилось бы итогом «восхождения от абстрактного к конкретному», поскольку им является само предприятие.

4. Чтобы преодолеть эту разобщенность и позволить всем сотрудникам предприятия увидеть целое — систему, можно использовать абстракцию в двух ее видах — идеализации и обобщения.

Таким образом, в логике абстрагирование трактуется, как правило, как способ поэтапного продуцирования понятий и образов, которые образуют все более общие изображения реальности (иерархию абстракций). Наиболее развитой системой абстракций обладает математика. Степень отвлечённости обсуждаемого понятия называется уровнем абстракции. Например, в зависимости от целей и задач, можно рассуждать об одном и том же объекте на разных уровнях абстракции: от конкретного Ивана Ивановича, например, можно абстрагироваться до доцента, можно — до мужчины, до млекопитающего, существа, и т. п.

355

Целостность образа заключается в том, что он имеет самостоятельный смысл и значение. Смысл – это понимание его значения. А значение – это возможность его вхождения в роли компонента в другие образы или участвовать в некоторых операциях.

Идеализация как замещение реального эмпирического явления идеализированной схемой носит и другое название — моделирование. А модели, как известно, строят когнитивные (для познания) и прагматические (для создания). В первом случае, в моделях отображаются свойства существующего объекта, а во втором – признаки будущего (пока не существующего) объекта. Заметим, эти рассуждения в равной степени касаются и образов, и понятий.

Теперь рассмотрим признаки, отраженные в понятиях и образах, с стороны существенности. С нашей точки зрения, существенность – это то, что свойства, отображаемые в образе (или понятии) объекта, «переводит в ранг» признаков.

Многие исследователи полагают, что в образах отражаются общие (для обобщаемых образов) признаки. И они определяются с помощью операции ассоциации. А в интенсионалах понятий представлены существенные свойства моделируемого объекта. В отличие от ассоциации выделение существенных свойств имеет некоторую целенаправленность, цель; т. к. существенность предполагает ориентацию на некие явления, объекты, процессы. Но термин «существенное свойство» может иметь двоякое значение: важность одного предмета для другого; свойство, определяющее характер, природу предмета безотносительно к другим предметам.

Первое значение термина «существенное свойство» содержит возможность интерпретации понятия в зависимости от его применения, точки зрения на изучаемый предмет и т.д. Таким образом, одно и то же свойство может быть существенным и несущественным при различных толкованиях понятия. Эту «существенность» можно назвать субъективной. Второе значение термина «существенное свойство» позволяет находить общий «язык», точки соприкосновения в разговоре, понимание друг друга различными специалистами. В этом случае можно говорить об объективных аспектах существенности. Однако, заметим, что ассоциация тоже имеет направленность (на объект или процесс, который определяет ассоциативные образы). На основании выше изложенного приходим к следующим выводам:

356

1) любой образ или понятие всегда являются абстракциями;2) уровней абстракции образов всегда несколько (т. е. образы хранятся на

нескольких уровнях абстракции);3) операции абстрагирования, которые порождают образы (понятия),

значительно различаются по целям (в зависимости от планируемого использования образов);

4) свойства и отношения между ними, отражаемые в понятиях и/или образах, в значительной степени определяются планируемым их использованием (в частности, решаемой задачей, проблемой);

5) выделение существенных признаков, видимо, всегда имеет характер направленности;

6) признаки в образах или понятиях можно разделить на «субъективно» и «субъективно» существенные;

7) на разных уровнях абстракции используются разные языки (операции синтеза и анализа новых объектов); отсюда вытекают сложности общения между уровнями;

8) в образах (понятиях) могут присутствовать признаки, которые могут трансформировать наше представление о синтезируемых или анализируемых объектах;

9) некоторые (в значительной мере, неожиданные) образы могут породить новые задачи и/или новые способы их решения;

Следовательно, структура образа представляет собой многоуровневую иерархическую конструкцию, в которой отражаются отношения «род-вид» и «часть-целое». Эти отношения можно интерпретировать как отношения абстракции. Такая точка зрения явно и неявно согласуется с концепциями, представленными в [Гладун, 1994; Шамис, 2006; Хокинс и др., 2007; Белов и др., 2009]. И многие операции мышления, видимо, «осуществляют» перемещения наших мыслей вверх-вниз по этой структуре.

ЗаключениеОбщеизвестно, моделирование мышления в вычислительной среде

эквивалентно реализации искусственного интеллекта. Данное исследование предпринято для построения концептуальных моделей хранения и использования образных структур в решении проблем. Однако, здесь изложены только некоторые принципы и концепции. В последующих публикациях будет представлен структурно-содержательный анализ образа на уровне доформального исследования. Далее, на основе этих моделей, будут построены формальные структуры, которые являются базой для создания компьютерных технологий моделирования образно-понятийного мышления и рассуждений. При этом, мы согласны с автором [Шамис, 2006] в том, что «мышление – это не изощренные алгоритмы решения задач, а специфический принцип их реализации в живом мозге». Поэтому, речь идет

357

о моделировании процессов образного мышления при решении некоторых проблем и задач.

Список литературы[Белов и др., 2009] Белов Ю. А., Рабинович З. Л. Память человека и мышление -

образное и символьное. Концептуальное модельное представление. // Доклады Академии Наук. – М.: Наука, 2009, том 427, № 6.

[Валькман, 2007] Валькман Ю. Р. Мультимодальность, мультимедийность, мультиконтекстность, мультимодельность представлений понятий в базах знаний // Тр. IV-го Междун. науч-практ. семинара «Интегрированные модели и мягкие вычисления в искусственном интеллекте». – М.: Физматлит, 2007.

[Валькман, 2008] Валькман Ю. Р. Анализ понятия образ: отношения «образы – понятия» // Сб. тр. ХI Междунар. конференции «Искусственный интеллект (КИИ-2008)». – Дубна, 2008.

[Валькман, 2009] Валькман Ю.Р. О моделировании образного мышления: классификация, отношения и структуры образов // Труды IX-й Международ. конференции "Интеллектуальный анализ информации ИАИ-2009". – Киев, 2009.

[Валькман, 2010] Валькман Ю.Р. О структуре образа: доформальное исследование // Труды X-й Международ. конференции "Интеллектуальный анализ информации ИАИ-2009". – Киев, 2010.

[Гладун, 1994] Гладун В.П. Процессы формирования новых знаний - София: СД "Педагог 6", - 1994.

[Ивин, 1998] Ивин А. А. Логика Учебное пособие. – М.: Изд-во «Знание» - 1998.[Кобринский, 2009] Кобринский Б.А. Нечеткий образный ряд в клинической

медицине. // Труды V-й Междун. конфер. «Интегрированные модели и мягкие вычисления в искусственном интеллекте», Коломна. – М.: Физматлит, 2009.

[Кулинич, 2002] Кулинич А. А. Модель активизации мышления субъекта в системах когнитивного моделирования. //Восьмая национальная конференция по искусственному интеллекту Коломна. 2002.

[Мейен и др., 1976] Мейен С.В., Шрейдер Ю.А. Методологические аспекты теории классификации // Вопросы философии.- 1976.- №12.

[Нариньяни, 2003] Нариньяни А.С. Не-факторы: Неоднозначность (доформальное исследование) (1-я часть) // Новости искусственного интеллекта. – 2003. – №5.

[Финн, 2006] Финн В. К. Интеллектуальные системы и общество. – М.: Ком-Книга, 2006.

[Хокинс и др., 2007] Хокинс Д., Блейксли С. Об интеллекте. М.: Изд. Дом. Вильямс, 2007.

[Шамис, 2006] Шамис А.Л. Пути моделирования мышления. Активные синергические нейронные сети, мышление и творчество, формальные модели поведения и "распознавания с пониманием". – М.: Ком-Книга, 2006.

[Wille, 1989] Wille R. Knowledge Acquisition by methods of Formal Concept Analysis // Preprint Nr. 1238. Technische Hochschule Darmstadt. – 1989.

358

УДК 004.822:159.955

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ В ЦЕННОСТНЫХ СУЖДЕНИЯХ

(НА МАТЕРИАЛЕ РУССКИХ ПОСЛОВИЦ)

А.С. Малкова ([email protected]) Российский государственный гуманитарный университет,

Москва

В работе описывается формальная модель семантики пословицы, отражающая глубинную семантическую структуру ценностного суждения. При разработке модели использовался методический аппарат дисциплин, для которых пословица является традиционным объектом исследования: филологии, когнитивной лингвистики.

ВведениеПредставление знаний в настоящее время является одним из

центральных направлений развития информационных технологий. Ядром интеллектуальных систем, основанных на знаниях, является формализованная модель реальности – структурное описание, в котором основные закономерности строения и функционирования элементов предметной области описаны в терминах формальных объектов и отношений. Строгое формальное описание позволяет формулировать алгоритмы для манипулирования знаниями: вывода новых знаний на основе имеющихся, выдачи ответов по запросам, сканирования на предмет наличия противоречий и т.п.

Анализ семантики ценностно-ориентированных текстов – это одна из областей, где методы представления знаний до сих пор практически не применялись. Термин ценностно-ориентированные применяется здесь для обозначения текстов, описывающих явления, лежащие в области этики и морали. Это пословицы, басни, притчи, афоризмы. Семантическую основу ЦОТ составляет проблемная ситуация или комплекс проблемных ситуаций: реализация морального выбора, разрешение социального конфликта, предписание поведенческого сценария, этическая оценка людей и событий.

Актуальность создания семантических моделей для ЦОТ обусловлена тем, что ЦОТ являются важным компонентом языка, как самостоятельно, так и входя в состав других, более крупных произведений, где они часто

359

занимают акцентные позиции: заголовки, эпиграфы, резюме (мораль) и т.п. В более широкой перспективе исследование структуры и семантической организации ЦОТ позволит глубже понять природу когнитивных процессов, лежащих в основе таких видов деятельности как вынесение этической оценки, установление причинно-следственных связей, анализ связности текста на уровне сюжета и др.

Отсутствие практики применения методов представления знаний для анализа семантики ЦОТ связано с объективной сложностью выделения формальных объектов в данной предметной области. Для решения поставленной задачи предлагается адаптировать методы, разработанные в дисциплинах, для которых ЦОТ является традиционным объектом: филологии, отчасти психологии, когнитивной лингвистики.

В работе была осуществлена формализация структурного подхода, развившегося на базе классической филологии (О.М. Фрейденберг), структурной антропологии (К. Леви-Стросс, Е.М. Мелетинский, А. Дандис) и когнитивной лингвистики (Дж. Лакофф) для построения формальной семантической модели частного случая ЦОТ – пословицы.

1. Анализ предметной области1.1. Определение границ предметной областиЦОТ обладают рядом характерных особенностей, из-за которых

традиционные методы представления семантики становятся малоэффективными. Это:

34. сложная семантическая структура: в основе семантики лежит проблемная этическая ситуация (или комплекс ситуаций);

35. особые языковые средства: метафоры, поэтические образы, не позволяющие осуществить переход от поверхностного представления к глубинной семантике традиционными средствами;

36. важным компонентом семантики ЦОТ являются этические оценки, аксиологическая составляющая, с трудом поддающиеся формализации ввиду их субъективности, неоднозначности;

37. в ЦОТ как нигде остро стоит проблема многозначности; интерпретация ЦОТ сильно зависит от внетекстовых факторов: культурно-исторического контекста, личности читателя и др.

Удачный выбор фактического материала позволяет минимизировать данные неопределенности. Исходя из таких критериев, как компактность, стабильность, изученность, объектом исследования была избрана русская пословица.

38. Пословица хорошо изучена в фольклористике. Она содержит моральное предписание, обладающее свойствами устойчивости, воспроизводимости во времени и в различных культурных традициях. Пословица референциально соотносится с бытовой

360

ситуацией, в контексте которой употребляется. Текст пословицы компактен, по объему не превосходит одно предложение.

39. Пословица является жанром фольклора, поэтому образы и метафоры, задействованные в ней, относительно стабильны и традиционны (в отличие от авторских).

40. Этические оценки в пословицах (одобрение, осуждение), как правило, выражены явно и однозначно, что обусловлено спецификой жанра, его дидактичностью.

41. Несмотря на возможное появление у пословицы в различных ситуационных контекстах окказиональных значений, существует семантическое ядро пословицы, зафиксированное в толковом словаре – одна (в редких случаях две-три) основная интерпретация.

1.2. Решаемые задачиПредполагается, что полученная формальная модель может быть

использована для решения следующих задач интеллектуальной обработки:

42. Семантический поиск текстов, находящихся между собой в различных семантических отношениях: синонимии, частичного сходства и т.п. Для пословиц эта задача наиболее актуальна в контексте создания электронных мультиязычных словарей.

43. Семантический поиск по запросам на естественном языке (например: пословицы о труде, о дружбе, об обманчивости внешности, о смирении с судьбой и т.п.). Данный формат запросов (а не по лексике или тегам) наиболее естественен при обращении к пословичному фонду.

Для того чтобы указанные задачи могли быть решены, необходимо обеспечить однозначность семантических описаний. Если одна и та же семантика может быть выражена несколькими различными способами, то это приведет к резкому усложнению алгоритмов семантического анализа. Семантическое сходство двух высказываний должно влечь за собой совпадения в их формальной структуре, и значит, ни один из базовых элементов модели не может быть выражен через комбинацию других. Таким образом, базовый словарь модели формирует очень компактный набор достаточно абстрактных элементов.

Обобщая, можно сказать, что критерием успешности модели является формирование системы классов подобия, сохраняющей семантические отношения (синонимии, частичного сходства) на множестве пословиц.

В качестве экспериментальной выборки использован словарь современных русских пословиц под ред. В.М.Мокиенко [Мокиенко, 2007], содержащий 505 единиц. Выбор обусловлен тем, что в словаре имеется

361

обширный справочный аппарат и при относительно сжатом объеме словарь охватывает большое тематическое многообразие пословиц.

1.2. Структура объекта исследованияКак было сказано, лингвистические методы анализа недостаточны для

адекватного представления семантики ЦОТ. Поэтому теоретической базой для исследования послужили подходы, разработанные в дисциплинах, для которых ЦОТ является традиционным объектом исследования: филологии, отчасти психологии, когнитивной лингвистики.

Согласно выводам, полученным исследователями мифа и первобытной культуры (К.Леви-Стросс, О.М. Фрейденберг), со структурной точки зрения фольклорное произведение представляет собой последовательность элементарных микросюжетов, строение которой подчинено двум базовым ментальным механизмам: оппозиционного противопоставления и мифологического отождествления (уподобления).

Бинарная оппозиция – это пара противопоставленных понятий, из которых одно, как правило, имеет позитивную оценку, а другое – негативную. Среди наиболее сильных оппозиций: холодное – теплое, низкое – высокое, сырое – вареное, темное – светлое, женское – мужское, мертвое – живое и другие. При этом тепло, свет, жизнь, верх, правда, сакральное наделяются позитивной оценкой, а холод, тьма, смерть, низ, ложь, профанное – негативной. Не только сюжетные линии в фольклоре, но и системы верований и обрядов имеют в своей основе подобные оппозиционные противопоставления.

В настоящее время аппарат бинарных оппозиций представляет собой широко распространенный и активно используемый рабочий инструмент этнографических и фольклористических исследований.

С другой стороны, своего рода «обратным» механизмом является отождествление. Это бессознательное ощущение глубинной взаимосвязи между двумя явлениями вплоть до полного стирания границ между ними. В повествовании отождествление может принимать характер причинно-следственной, экзистенциальной связи, имплицитного логического перехода. Основные направления отождествления [Фрейденберг, 1997]: равенства целого и части, мнимого и реального, прошлого, настоящего и будущего, актера и роли, акции и реакции, постоянного и временного, лидера и возглавляемого им коллектива и др.

Практически любое базовое отождествление может быть преобразовано в утверждение, по структуре близкое к пословичному:

Какое целое, такая и часть.Какой лидер, такие и подчиненные.Какое начало [дела], таков и конец. и др.

362

Полученные выводы о ключевой значимости указанных двух ментальных механизмов (оппозиционного противопоставления и отождествления) подтверждает также один из основателей когнитивной лингвистики Дж. Лакофф [Лакофф и др., 2004]. В своей классической работе «Метафоры, которыми мы живем» Дж. Лакофф показывает несостоятельность подхода к метафоре, как к тропу, имеющему периферийную значимость в языке, и предлагает рассматривать ее как один из фундаментальных когнитивных механизмов. Он определяет два основных вида метафор: структурные и ориентационные.

Структурные метафоры «осмысляют понятия одного рода в терминах понятий другого рода» (т.е. построены на механизме отождествления), например: СПОР как БИТВА, ВРЕМЯ как ДЕНЬГИ, ЛЮБОВЬ как ПУТЕШЕСТВИЕ и т.п.

Ориентационные метафоры восходят к противопоставлению ВЕРХ–НИЗ (НИЗ при этом оценивается отрицательно, а ВЕРХ – положительно). След противопоставления ВЕРХ–НИЗ прослеживается в широком круге метафорических пар: РАДОСТЬ–ГРУСТЬ (Он пребывал в приподнятом настроении. – Он был подавлен.), ЗДОРОВЬЕ–БОЛЕЗНЬ (Он выкарабкался из болезни. – Его подкосило.), и многие другие.

2. Формальная модель семантики пословицыФормальная модель описана в синтаксисе языка ПРОЛОГ, поскольку

он содержит логический аппарат вывода знаний, прост и удобочитаем для человека. Одновременно с этим был разработан графический язык диаграмм, призванный облегчить визуальное восприятие модели. Между графическими диаграммами и записями на языке ПРОЛОГ существует взаимнооднозначное соответствие.

2.1. Базовые элементы моделиБазовыми объектами модели являются единицы, имеющие бинарную

структуру, или оппозиции. Это понятия (как правило, абстрактно характеризующие человека или некоторые внешние обстоятельства) с двух сторон – позитивно и негативно. Оппозиции описываются предикатом:

oppos(Meta, Positive, Negative).где Meta – семантический маркер оппозиции,

Positive – понятие с позитивной оценкой,Negative – понятие с негативной оценкой

Маркер Meta указывает, к какой из двух сфер (характеристика человека, либо внешних обстоятельств) относится оппозиция, и принимает значения "man" или "univ" соответственно. К характеристикам человека относятся такие понятия как добродетель/порок, труд/безделье,

363

знания/глупость, помощь/вред, воля/покорность и другие. К независящим от человека обстоятельствам и последствиям его поступков: неудача/успех, доход/убыток, удовольствие/страдание честь/позор и др.

Примеры: oppos("man","труд","безделье"). oppos("univ","успех","неудача").В графической записи оппозиции описываются двумя

расположенными одна над другой окружностями. Верхняя окружность соответствует позитивному элементу оппозиции, а нижняя – негативному.

povitivenegative

успехнеудача

В модели предикаты oppos(M, P, N) задаются списком фактов. Базовым отношением модели является маркированное отношение

между двумя оппозициями. Оно описывается предикатом:link(rel(Mr, O, А), oppos(M1, P1, N1), oppos(M2, P2, N2), config(Mc,

T, R)).где rel(Mr, O, А) – семантический маркер отношения,

oppos(M1, P1, N1) и oppos(M2, P2, N2) – две оппозиции, config(Mc, T, R) – конфигурация: стандартное распределение

±-оценок оппозиций, входящих в отношение.Значениями аргументов Omega и Alpha семантического маркера

rel(Meta, Omega, Аlpha), являются константные пары вида часть–целое, форма–содержание, мнимо–реально и др. (уподобления).

В графической записи две оппозиции находятся рядом, и каждая из них соотносится с одной из частей маркера rel(Meta, Omega, Аlpha).

omega alpha

positive1negative1

отношение positive2negative2

Как правило, в отношении одна из оппозиций занимает доминирующую позицию (целое доминирует над частью, содержание – над формой и т.п.). В графической схеме расстояние между полюсами у доминирующей оппозиции больше, чем у субдоминантной. Тип отношения (равнозначное/ доминирующее) отражает первый аргумент предиката rel(Meta, O, А), принимающий значения: "domin" или "euqiv".

Предикат config(Meta, Type, Result) служит для обозначения конфигурации (взаимного расположения) ±-оценок оппозиций в высказывании: ++,+–, –+, – –. Кроме того, он включает итоговую оценку высказывания – аргумент Result, принимающий значения "plus" (одобрение, оправдание) или "minus" (осуждение, констатация несправедливости). Аргумент Meta, также как и в предикате rel(Meta, O, А) указывает на тип отношения: "domin" или "euqiv". Конфигурация

364

является независимым параметром в отношении и несет самостоятельную смысловую нагрузку.

Рассмотрим пример отношения.Семантика: Человек с виду добродетельный в действительности

может оказаться дурным. link(R, O1, O2, C) :- R = rel("domin", "форма","содержание"), O1 = oppos("man","добродетель","порок"), O2 = oppos("man","добродетель","порок"), C = config("domin", "and", "minus").Графическая схема:

форма содержаниедобродетель

порокдобродетельпорок

Здесь оппозиция, помеченная маркером форма, принимает положительное значение, однако она оказывается в субдоминантной позиции по отношению к оппозиции, помеченной маркером содержание, имеющей негативное значение. Итоговая оценка высказывания – негативная.

2.2. Модель реальности. Полная схема пословицыВ результате анализа текстов из экспериментальной выборки

выяснилось, что с точки зрения моделируемой реальности, пословичные высказывания отражают взаимодействие человека с окружающим миром. Соответственно, четыре основных вида утверждений, представленных в пословицах – это:

1. ЧЕЛОВЕК → МИР: влияние поступков, черт характера человека на его судьбу, отношение к нему других людей.

2. МИР → ЧЕЛОВЕК: влияние внешних обстоятельств на поступки человека; необходимость совершать вынужденные действия.

3. ЧЕЛОВЕК > ЧЕЛОВЕК: установление приоритетов, зависимостей между чертами характера человека или внутри коллектива.

4. МИР > МИР: установление приоритетов, зависимостей между внешними обстоятельствами.

Все многообразие семантических отношений в пословице может быть описано в рамках следующей трехчастной структуры:

ЧЕЛОВЕК МИР

365

O11 O12 O21 O22Оппозиции О11 и О12 относятся к сфере ЧЕЛОВЕК, между ними

установлено отношение доминирующего типа. Аналогичная ситуация с оппозициями О21 и О22, принадлежащими к сфере МИР.

Между двумя частями высказывания (МИР и ЧЕЛОВЕК) установлена причинно-следственная связь либо в одну, либо в другую сторону. Эта связь является равнозначной, поскольку как одна, так и другая часть может занимать доминирующую позицию (либо «человек сильнее обстоятельств», либо «обстоятельства сильнее человека»), в то время как в классических доминирующих отношениях соотношение сторон фиксировано (содержание всегда доминирует над формой, результат состояние – над процессом и т.п.).

Полная структура пословицы описывается предикатом:proverb(R, L1, L2, C) :- R = rel("equiv", Omega, Alpha), L1 = link(rel("domin", O1, A1), oppos("man", P11, N11), oppos("man", P12, N12), config("domin", T1, R1)), L2 = link(rel("domin", O2, A2), oppos("univ", P21, N21), oppos("univ", P22, N22), config("domin", T2, R2)), C = config("equiv", T, R)).То есть включает в себя два отношения доминирующего типа (одно

лежит в сфере ЧЕЛОВЕК, другое – в сфере МИР), связанных третьим отношением равнозначного типа. Оценки всех трех отношений, входящих в состав высказывания, взаимосогласованы (либо все положительны, либо все отрицательны).

В большинстве случаев часть оппозиций в высказывании остается незадействованной (аргументы предикатов принимают значения nil).

3. Аппарат семантического поискаОсновной предпосылкой для создания алгоритмов семантического

поиска является тот факт, что модель базируется не на лексическом составе высказывания, а на структуре описанной в пословице ситуации (отражает строение предметной области). Соответственно, если два высказывания описывают схожие ситуации, то они будут иметь определенные совпадения в формальных описаниях.

Рабочий словарь модели состоит из минимального набора абстрактных элементов: 11 оппозиций (6 из класса ЧЕЛОВЕК, 5 из класса МИР), 6 видов доминирующих отношений и 8 видов конфигураций, что позволило описать семантику 80% высказываний из выборки.

366

3.1. Поиск по различным критериям семантического сходства.Модель позволяет определить следующие семантические отношения,

базирующиеся на регулярных совпадениях в формальных описаниях: 1. Синонимия. Синонимичными можно считать высказывания,

обладающие идентичной семантической структурой. 2. Контрапозиция либо антонимия. Таковыми можно считать

высказывания, содержащие одинаковые оппозиции и отношения, но противоположные по ±-оценке. Здесь: контрапозиция – выражение одной и той же идеи через отрицание (знание приводит к успеху, глупость приводит к неудаче); антонимия – описание противоположных ситуаций (внешность хорошая, натура плохая и наоборот: внешность плохая, натура хорошая).

3. Для определения частичного сходства нет четких критериев. Любое совпадение фрагментов семантической структуры высказываний может быть проинтерпретировано как семантическая близость.

3.2. Поиск по запросам, состоящим из ключевых слов.Модель также может быть использована для поиска с помощью

поисковых запросов. Она позволяет формулировать запросы в форме, приближенной к запросам на естественном языке, например: об обманчивости внешности о том, что дружба важнее денег и др. Основу такого запроса составляет комбинация ключевых слов.

Принципиальное особенность предлагаемого подхода заключается в том, что ключевые слова интерпретируются не как теги, а как семантические сущности: каждому ключевому слову сопоставлены одно или несколько, объединенных логическим ИЛИ, фиксированных сочетаний элементов семантической схемы высказывания.

За счет комбинационных возможностей модели возможно определять широкий спектр понятий, не входящих в базовый словарь, но выразимых через сочетания его элементов (такие понятия как смелость, неблагодарность, терпение, жадность, помощь, богатство и др.)

В настоящий момент поисковые слова заносятся в базу данных и выверяются в итеративном процессе анализа пословичных высказываний.

Благодарности. Работа выполнена при финансовой поддержке РГНФ (грант № 07-03-00658а).

Список литературы[Лакофф и др., 2004] Лакофф Дж, Джонсон М. Метафоры, которыми мы живем.

— М.: Едиториал УРСС, 2004.[Малкова, 2007] Малкова А.С., Январев В.И. Формальная модель семантики

художественного текста (на материале русских пословиц) // Моделирование и анализ информационных систем, 2007, T. 14, №.4.

367

[Мокиенко, 2007] Словарь русских пословиц / В.М. Мокиенко, Ю.А. Ермолаева, А.А. Зайнульдинов и др.; под ред. В.М. Мокиенко. — М.: Астрель: АСТ, 2007.

[Фрейденберг, 1997] Фрейденберг О.М. Поэтика сюжета и жанра / Ред. и коммент. Н.В.Брагинской. — М.:Лабиринт, 1997.

368

УДК 007:535.417

О ЗАКОНОМЕРНОСТИ ФОРМИРОВАНИЯ ИНДУКТИВНОГО ОБОБЩЕНИЯ НЕЙРОСЕТЬЮ СО

СВЯЗЯМИ ПО СХЕМЕ ГОЛОГРАФИИ ФУРЬЕ

А.В. Павлов ([email protected])

А. М. АлексеевСанкт-Петербургский Государственный университет

информационных технологий, механики и оптики, Санкт-Петербург

В развитие подхода к формированию правдоподобных выводов на нейросетях со связями по схеме голографии Фурье показано, что индуктивное обобщение закономерно формируется как следствие фундаментального свойства ограниченности динамического диапазона сред, используемых для записи связей нейронных слоев.

ВведениеОдна из актуальных задач искусственного интеллекта – реализация

правдоподобных рассуждений. Наряду с моделированием на основе использования формально-логического аппарата [Вагин, 2008], интерес представляет и реализация рассуждений в рамках концепции образного мышления и нейросетевой парадигмы [Кузнецов 1998; Фоминых 2002]. В работе [Павлов 2010] предложен подход к реализации правдоподобных выводов на нейросетях со связями, формируемыми методом голографии Фурье. В настоящем докладе, в развитие данного подхода, показано, что на таких сетях индуктивное обобщение закономерно формируется как следствие фундаментального свойства ограниченности динамического диапазона сред, используемых для записи межнейронных связей.

1. Подход к задаче и модель нейросетиИспользуем пример классификации рассуждений по Ч.Пирсу:Дедукция: Правило (Все люди смертны) (1.1)

Случай (Сократ человек) (1.2)Результат (Сократ смертен) (1.3)

Индукция: (1.2) Случай (Сократ человек)(1.3) Результат (Сократ смертен)

369

(1.1) Правило (Все люди смертны)Абдукция: (1.1) Правило (Все люди смертны)

(1.3) Результат (Сократ смертен)(1.2) Случай (Сократ человек)

Рассмотрим возможность реализации этих связок двухслойной нейросетью (НС) с двунаправленными связями, реализуемыми методом голографии Фурье (рис.1.). Веса связей (1.4) формируются в пространстве Фурье в виде голограммы – зарегистрированной картины интерференции фурье-образов двух паттернов (вывод опустим)

, (1.4)

где F – символ преобразования Фурье, ImR(x,y) и ImC(Δx,Δy) - паттерны, описывающие состояние нейронных слоев R и C на этапе обучения, астериск обозначает комплексное сопряжение, а (νx,νy) – частоты. В дальнейшем изложении для упрощения выражений аргументы опустим. Данная модель реализует правило обучения Хэбба.

Рис.1. Схема нейросетиR и C – нейронные слои, H – матрица связей нейронных слоев (голограмма

Фурье)

Определим как методы представления входящих в данные связки операндов посредством паттернов внутренней репрезентации (ПВР), так и характеристики этих ПВР, существенные для определения методов их ассоциирования.

В примере используются три типа операндов и, соответственно, ПВР: ПВР «человек», представляющий свойство быть человеком

вообще (а не обезьяной, например), который обозначим ImH; ПВР, представляющий свойство смертности, понимаемое также

вообще, абстрагируясь от частностей, который обозначим ImD; ПВР, представляющие только индивидуальные признаки персоны

(Сократа, Платона, Пупкина, etc.), которые будем обозначать ImInd с указанием, при необходимости, имени персоны и/или свойства.

Два первых ПВР можно определить скорее как вербальные понятия, а последний – как сенсорный образ. Напомним, что в рамках концепции образного мышления принято выделять (и отчасти противопоставлять) две категории - образ и понятие [Фоминых, 2002; Валькман и др., 2009]. При

370

этом как образ, так и понятие суть ПВР, формирующиеся в коре головного мозга. Различие между ними в том, что образ является сенсорным ПВР, то есть формируется на основе непосредственно воспринимаемой (а затем вспоминаемой) сенсорной информации, а понятие – это ПВР, формируемый мозгом уже в результате обработки сенсорной информации. Условная шкала «образ – понятие» отнюдь не бинарна – переход от образа к понятию происходит постепенно, большая часть хранящихся в памяти паттернов включает в себя как сенсорную, так и вербальную информацию, то есть находится между сугубо сенсорным образом и «чистым» понятием. В данном примере ПВР ImH, определенный как «скорее понятие», включает в себя и сенсорную составляющую.

Таким образом, правило (1.1) связывает два понятия - ImH и ImD. Случай (1.2) связывает ПВР-образ, представляющий только

индивидуальные свойства персоны ImIndPerson, с понятием ImH. Здесь важно, что по условиям примера сугубо сенсорный образ ImIndPerson, не включает в себя ПВР ImH (понятие), поскольку о том, что данная персона – человек, мы узнаем только в результате связи этих ПВР. Установление этой связи и является целью абдукции как интеллектуальной деятельности.

Результат (1.3), также как и случай (1.2), связывает сенсорный образ ImIndPerson с понятием ImD.

В таблице 1 приведен вариант представления ПВР слоями НС, позволяющий реализовать и правило (1.1), и результат (1.3). Для того, чтобы реализовать рассуждения, то есть все три связки (1.1-1.3), необходимо ассоциировать паттерны ImH и ImInd применительно к случаю (1.2).

Табл. 1. Слой R Слой C

Правило (1.1) ImH ImD

Результат (1.3) ImInd ImD

В работе [Павлов, 2010] предложено для связи этих паттернов ввести шкалу общности свойств, в качестве которой использовать шкалу частот в пространстве Фурье – пространстве весов межнейронных связей. Тогда, ПВР персоны может быть представлен в виде суммы субпаттернов, каждый из которых репрезентирует признаки, отличающиеся от признаков другого субпаттерна степенью своей общности. Крайние значения шкалы представлены субпаттернами ImH и ImInd, а между ними на шкале общности расположены другие субпаттерны, представляющие иные свойства и признаки персоны (пол ImG, возраст ImA, etc.). Эти субпаттерны накладываются друг на друга в пространстве паттернов, имея одну область определения (в слое R), но их фурье-образы разнесены в пространстве

371

Фурье (пространстве весов связей), поскольку занимают разные частотные диапазоны, как это схематически изображено на рис.2.

(1.5)

Рис.2. Схема представления случая (2) «Данная персона – человек» в слое R и пространстве Фурье H нейронной сети рис.1. Субпаттерн ImInd представляет

сугубо индивидуальные свойства персоны, а субпаттерн ImH – свойство «человек».

2. Реализация индуктивного вывода

2.1. Индуктивное обобщение как расширение спектра образа При реализации индуктивного вывода сеть должна обучаться

примерами результатов (1.3), связывающих паттерн персоны (1.5) с ПВР свойства «смертен», которое рассматривается здесь (по условиям задачи индукции) как сугубо индивидуальное – обозначим его ImDInd.

При этом, поскольку в слое R предъявляется случай (1.2), ПВР (1.5) включает в себя, как минимум, субпаттерны ImH и ImInd. Матрица связей, формируемых в результате такого обучения, описывается выражением

. (2.1)

Если при реализации дедукции частотный диапазон ImD пересекался с диапазоном ImH, то есть ImD был низкочастотным (или включал в себя

372

низкочастотную компоненту), то теперь F(ImDInd) должен пересекаться с F(ImInd). По условиям задачи индукции пересечения F(ImDInd) с F(ImH) на этапе обучения нет - F(ImDInd) локализован только в области высоких частот. Задача индукции заключается, таким образом, в терминах нашего подхода в расширении спектра ПВР ImDInd в область низких частот с последующей записью новой голограммы, связывающей новый ПВР с расширенным спектром, который обозначим ImDExt, с ПВР ImH.

Решение задачи индукции – новая матрица связей с более широким частотным диапазоном. Таким образом, расширение теории, т.е. знания переднего плана, достигаемое индуктивным методом, в данной модели интерпретируется в пространстве Фурье как расширение частотного диапазона знаний.

В работе [Павлов, 2010] показано, что задача индукции в такой постановке решается в сети рис.1. посредством итерационной процедуры, предполагающей в каждом цикле следующие этапы:

Первоначальное обучение сети по правилу (2.1); Предъявление обученной сети в слое R ПВР Imperson, который

пройдя через матрицу связей (2.1) активирует в слое С ПВР Im1DInd;

Нелинейную запись в слое С с последующим обращением нелинейно записанного ПВР Nl(Im1

DInd). В результате нелинейной записи фурье-образ (спектр) этого ПВР расширяется;

Запись новой матрицы связей (голограммы), связывающей Imperson

с новым ПВР с расширенным спектром Im1DInd

,где верхний индекс при H и Im обозначает номер итерации, а индекс ext обозначает расширение спектра, обусловленное нелинейностью активационной функции нейронов слоя С.

В результате такой процедуры на каждой итерации фурье-образ ПВР смертности расширяется и в пределе стремится к спектру с постоянной спектральной плотностью, перекрывающему весь диапазон частот - диапазон общности свойств. Соответственно, на каждой итерации записывается новая матрица связей - устанавливаются новые связи с более низкочастотными субпаттернами в слое R, репрезентирующими более общие свойства. Тем самым, сугубо сенсорный образ индивидуальной смертности превращается в понятие «смертности вообще». Скорость этой трансформации образа в понятие зависит от степени нелинейности активационной функции С-нейронов.

В работе [Павлов, 2010] использовано допущение, что в слое С при первоначальном обучении сети результатом (1.3) предъявляется ПВР ImDInd, не включающий в себя низкочастотный субпаттерн ImD. Это допущение представляется недостаточно обоснованным, поскольку механизм

373

ограничения частотного диапазона при запоминании сенсорной информации, т.е. формирования паттерна ImDInd, должен быть включен в модель НС, а не навязываться извне «учителем», выступающим в роли «Deus ex machina». Попробуем найти такой естественный механизм для НС со связями, формируемыми методом голографии Фурье.

2.2. Механизм формирования связей в пространстве Фурье как механизм формирования индуктивного обобщения

Подойдем к задаче с противоположной позиции и примем, что при первоначальном обучении НС в слое С представлен сенсорный образ ImD со спектром F(ImD), занимающим весь частотный диапазон. Опустим детальное рассмотрение физики формирования связей нейронных слоев, выходящее за рамки интересов большинства читателей, а также громоздкие выкладки и сформулируем только общие положения и следствия из них.

Суть важно, что любая среда, могущая быть использована для записи связей как интерференционной картины, обладает ограниченным динамическим диапазоном. Вследствие этого картина интерференции двух фурье-образов может быть зарегистрирована только в ограниченном частотном диапазоне, величина которого определяется как размером динамического диапазона регистрирующей среды с учетом условий записи, так и механизмом формирования интерференционной картины. В результате, даже при интерференции двух фурье-образов с широкими частотными диапазонами F(ImPerson) и F(ImD), матрица связей запишется только в ограниченном диапазоне частот:

.Этот механизм ограничения частотного диапазона при записи связей

может рассматриваться как особенность восприятия – НС объективно не может запомнить информацию во всем частотном диапазоне.

Соответственно, и восстановится в слое С при предъявлении сети образа ImPerson тоже образ с ограниченным спектром ImDlim.

Дальнейшее поведение сети зависит от вида нелинейной активационной функции С-нейронов. Если в результате нелинейного обращения в слое С фурье-образ Fext1(ImD1) будет иметь более крутой спад спектра амплитуд, чем F(ImDlim), то при записи новой голограммы произойдет сужение частотного диапазона. Если же нелинейная активационная функция С-нейронов порождает более «широкий» спектр Fext1(ImD1), чем F(ImDlim), то частотный диапазон записанной голограммы будет с каждой итерацией расширяться.

При использовании в слое С модели «победитель забирает все», процесс имеет направленность

,

374

а поскольку ,

то с каждой итерацией частотный диапазон матрицы связей (голограммы) будет расширяться.

3. ЗаключениеТаким образом, индуктивное обобщение реализуется в рассмотренной

архитектуре НС со связями, реализуемыми методом голографии Фурье, не по прихоти автора модели, а неизбежно – как закономерное следствие фундаментального свойства ограниченности динамического диапазона среды, в которой записываются веса связей. Эта неизбежность индуктивного обобщения может быть рассмотрена и с противоположных позиций как невозможность (в силу ограниченности динамического диапазона) запоминания при первом восприятии всего богатства воспринимаемой сенсорами информации – запомненная информация обогащается в результате «раздумий».

Для реализации индукции в рассмотренной архитектуре НС (рис.1) необходимы два условия:

- двунаправленные связи, позволяющие реализовать итерационную процедуру – не единичный интеллектуальный акт, а процедуру раздумий;

- нелинейная активационная функция нейронов в слое С, позволяющая свести паттерн к дельта-функции.

Индуктивный вывод может рассматриваться также как трансформация сенсорного образа в понятие посредством разрушения внутренней коррелированности сенсорного образа (его целостности, разрешения гештальта) при переходе к дельта-коррелированности - абстрагирование от несущественных для понятия признаков. При этом паттерн - дельта-функция в слое С может рассматриваться как понятие абсолютное, поскольку перекрывает весь возможный диапазон [сенсорный образ – вербальный образ] (белый спектр в Фурье пространстве).

Строго говоря, по условиям задачи, применительно к рассматриваемой реализации (рис.1) требуется не переход к δ-функции, а переход в Фурье пространстве к постоянной спектральной плотности. Именно постоянная спектральная плотность обеспечивает общность понятия, его применимость к любому субпаттерну из совокупности, составляющей паттерн персоны. Но необходимость сведения паттерна в слое С к дельта-функции имеет также и не обсужденную здесь в деталях сугубо физическую причину - невозможность формирования матрицы связей, имеющей четырехмерную область определения. Соответственно, при восстановлении реальной матрицы связей (голограммы) не дельта-функцией, а определенным на плоскости паттерном, в слое R будет восстанавливаться не

375

ассоциированный паттерн, а картина, образованная суммой наложенных и смещенных друг относительно друга паттернов.

Отметим, что введенное здесь понятие ImDExt , характеризующееся дельта-коррелированностью, оказывается более общим, более понятием, чем введенное на этапе первоначального обучения сети «скорее понятие» ImD , поскольку коррелирует как с сенсорными (высокочастотными) образами ImInd, так и с вербальными (низкочастотными) ImH . В этом смысле оно всеобще. Постоянная спектральная плотность, в свою очередь, через теорему Винера-Хинчина обуславливает дельта-коррелированность, вне зависимости от конкретного вида паттерна в слое С – это может быть как единичная δ-функция, так и δ-коррелированный паттерн.

Вместе с тем, переход в слое С от произвольного паттерна ImDInd именно к единичной δ-функции физически обусловлен и тем, что размерность области определения матрицы связей нейронных слоев равна сумме размерностей областей определения ассоциируемых паттернов и, в случае двух изображений, определенных на плоскости, матрица связей должна иметь 4-х мерную область определения, что физически нереализуемо. В случае же единственной δ-функции в слое С, матрица связей определена на плоскости, т.е. физически реализуема в виде тонкой голограммы Фурье.

Благодарности. Автор считает приятным долгом выразить благодарность проф. О.П.Кузнецову и проф. И.Б.Фоминых за дискуссии, способствовавшие формированию данного подхода. Работа выполнена при финансовой поддержке РФФИ (проект № 09-01-00165-а).

Список литературы[Вагин и др., 2008] Вагин В.Н., Головина Е.Ю., Загорянская А.А., Фомина М.В.

Достоверный и правдоподобный вывод в интеллектуальных системах, второе изд. – М.: ФИЗМАТЛИТ, 2008.

[Валькман и др., 2009] Валькман Ю.Р., Тарасов В.Б. Круглый стол «Образ и понятие».// V-я Межд. научно-практическая конференция «Интегрированные модели и мягкие вычисления в искусственном интеллекте». Коломна, 28-30 мая 2009.

[Кузнецов, 1998] Кузнецов О.П. Быстрые процессы мозга и обработка образов.// Новости искусственного интеллекта. 1998, №2.

[Павлов, 2010] Павлов А.В. Реализация правдоподобных выводов на нейросетях со связями по схеме голографии Фурье. // Искусственный интеллект и принятие решений. 2010, №1.

[Фоминых, 2002] Фоминых И.Б. О технологии решения творческих задач // В сб. трудов VIII Национальной конференции по искусственному интеллекту “КИИ-2002”, Т.1, М.: Физматлит. 2002.

376

УДК 007:535.417

ВИЗУАЛИЗАЦИЯ ПРОСТРАНСТВЕННЫХОТНОШЕНИЙ

А.В. Заболеева-Зотова ([email protected])

А.А. Столяров ([email protected]) ВолгГТУ, Волгоград

В работе описывается модель построения визуального представления текстового описания пространственных отношений. Приведено описание используемых операций нечеткой литерной логики.

ВведениеВ повседневной жизни люди постоянно используют пространственную

информацию в разных целях, главной из которых является ориентирование в пространстве. Наиболее естественным способом коммуникации для человека является общение на естественном языке, однако в некоторых случаях, например в ситуациях с ограничениями возможностей восприятия естественно-языкового текста, возникает необходимость создания зрительно воспринимаемой интерпретации вербального описания пространственной картинки. В связи с этим возникает задача визуализация пространственной информации, описанной на естественном языке. Одной из частных задач извлечения пространственной информации из текста (семантического анализа) является проблема выявления и визуализации пространственных отношений. До недавнего времени на пути решения данной задачи возникал ряд проблем, связанных с автоматизацией представления пространственных данных, недостаточностью теоретических исследований в области автоматизации семантического анализа естественного языка и распознаванием речевого потока (на русском языке). За последнее десятилетие мощности компьютеров достаточно увеличились. Так же за это время произошло бурное развитие сетевых технологий и геоинформационных систем. Все эти факторы вместе взятые сделали возможным хранение и обработку (в том числе и визуализацию) пространственных данных.

Модель синтеза визуального представления пространственных отношений

377

Проведенный анализ существующих подходов к визуализации текстового описания пространственных отношений показал необходимость их модернизации. В частности, наиболее близкий аналог «Анализ пространственной лексики» не предоставляет возможность автоматического определения объектов ситуации.

Сравнительный анализ существующих классификаций пространственных отношений показал, что для случая статической ситуации и неподвижного наблюдателя они являются эквивалентными. Однако классификация Гака В.Г. предлагает наиболее формализованную и полную модель пространственного отношения, что и определило ее использование в данной работе.

В. Г. Гак определяет пространственное отношение в чистом виде формулой

<S, V, R, L>,где:S — локализуемый объект,V — глагол,R — конкретный тип локализации, выражаемый, например, предлогом,L — локализатор, то есть двухмерное или трехмерное пространство, в

котором способен помещаться локализуемый объект [Гак, 2000].В задачи алгоритма синтеза визуального представления ситуации

входит:44. выявление пространственных отношений;45. построение графического представления.Требования к входному тексту: описание пространственной ситуации должно быть конечно; текст должен описывать статическую ситуацию с точки зрения

неподвижного наблюдателя; описание пространственной ситуации должно быть не

противоречивым.Грамматика входного языка:< Текст>→<S><V><R><L>.<Текст> < Текст>→<R><L><V><S>.<Текст>< Текст>→<S><R><L>.<Текст>< Текст>→<R><L><S>.<Текст>< Текст>→ε<S>→<PS><существительное><PS>→<PS><прилагательное><PS>→ε<S>→<местоимение-существительное><S>→<местоименное прилагательное><PS><существительное><R>→<AR><отношение>

378

<AR>→<наречие><AR><AR>→ε<V>→<глагол><L>→<PL><существительное><PL>→<PL><прилагательное><PL>→εПоставленные задачи предполагают, что алгоритм должен

транслировать данные в модель пространственных отношений Гака, вследствие чего было принято решение использовать автомат для разбора входного языка как наиболее эффективный метод решения данной задачи.

В качестве метода хранения данных была выбрана семантическая сеть, как наиболее удобный вариант хранения описания ситуации.

Геометрическая модель строится при помощи рассуждений по прецедентам, так как эта модель рассуждений наиболее близкая к решению данной задачи человеком.

Модель синтеза визуального представления текстового описания пространственных отношений представлена на рисунке 1 в виде DFD диаграммы.

Блок «Выявление морфологических признаков» использует морфологический словарь ДИАЛИНГ. Его основные характеристики [Диалинг, 2008].

На выходе формируется таблица лексем, количество строк которой равно количеству слов и точек в наборе символов.

Блок «Выявление пространственных отношений» получает на вход данную таблицу лексем. Задачей блока является выявление пространственных отношений соответственно модели Гака, что делается с помощью автомата. На рисунке 2 изображен граф переходов. На выходе блока таблица пространственных отношений.

Тип лексемы: С1 – сущ. им. С2 – сущ. не им. П1 – прил. им. П2 – прил. не им. Г – глагол Н – наречие П – предлог ТЧК – знак «точка»

Рис. 1. Потоковая диаграмма алгоритма визуализации описания ситуации

379

Рис. 2. Граф переходов автомата выявления пространственных отношений КСЛ – конец списка лексемДействия: S` – записать лексему как локализуемый объект V` – записать лексему как глагол V* – задать глагол по умолчанию R` – записать лексему как пространственное отношение L` – записать лексему как локализатор AS` – добавить лексему в список атрибутов л-объекта AL` – добавить лексему в список атрибутов локализатора AR` – добавить лексему в список атрибутов отношения ADD – добавить пространственное отношение в таблицуЗадачей блока 3 является построение семантической сети,

описывающую ситуацию в виде таблицы концептов и таблицы дуг.Семантическая сеть из набора пространственных отношений строится

по следующим правилам:46. множеству концептов семантической сети соответствует

множество объектов ситуации (локализуемые объекты и локализаторы);

47. множеству дуг семантической сети соответствует множество пространственных отношений;

48. дуга семантической сети направляется от локализуемого объекта к локализатору.

380

Для выявления объектов ситуации используется матрица попарных сравнений, каждый элемент которой вычисляется по формуле:

jkoAa

itoAa

ji

ji

oaoa

jiooSLO

jkit )()(,

:;

Для визуализации каждого пространственного отношения используется рассуждение по прецедентам:

Описание случая (проблемы):

Модель пространственного отношения<S,V,R,L>

Описание решения проблемы:

<X,Angle,Ms,Ml>где:X — координаты локализуемого

обьекта в локальной системе координат локализатора

Angle — углы поворота модели локализуемого объекта

Ms — ссылка на модель локализуемого объекта в БД моделей

Ml — ссылка на модель локализатора в БД моделей

Для оценки близости пространственного отношения <S,V,R,L> и i-того случая из БД прецедентов используется мера f:

3/,,,, **********

)(

*

)(

*

)(

*

iiii

lLAa

kRAa

tSAa

VVSSLLRRiLRVSf

LaL

RaR

SaS

l

k

t

ai,j и f построены на основе нечеткой литерной логики (НЛЛ), описанной в [Прохоров, 2007], используемые операции НЛЛ приведены ниже.

При построении графического представления ситуации происходит геометрическая оптимизация полученной модели – ищется минимум критерия с:

jiOoo

jiPp

ijii

oodprXc,,

),()()(

381

где:X – множество положений объектов сцены,P – множество пространственных отношений сцены,r(pi) – расстояние между текущим положением локализуемого объекта pi

пространственного отношения и заданным в решении O – множество объектов сцены,d(oi ,oj ) – штрафная функция, зависящая от близости i-того и j-того

объекта сцены.Прототип системы был реализован с использованием графической

библиотеки «IRRLicht».Пример работы.На вход подается описание ситуации «лампа стоит на столе. слева от

стола стоит кресло. справа от стола стул. человек стоит за столом.».Построенная семантическая сеть изображена на рисунке 3.Результат работы программы приведен на рисунке 4.

Рис. 3. Семантическая сеть, описывающая ситуацию

382

Рис. 4. Визуальное представление ситуации

Переменная нечеткой литерной логики характеризуется двойкой XU , ,

где U – многомерное позиционное множество символов;X – нечеткое многомерное подмножество множества U, представляющее

собой нечеткое ограничение на значение переменных — степени значимости символов.

В рамках НЛЛ к переменным могут применяться следующие операции: – конъюнкция; – дизъюнкция; – отрицание.При осуществлении логического вывода операции применяются слева

направо, согласно приоритету:отрицание; конъюнкция; дизъюнкция.Вывод инициируется операцией сравнения «=», которая не является

частью логической системы и имеет самый низший приоритет. Перед ее выполнением осуществляется подготовка необходимых данных путем последовательного применения операций НЛЛ присутствующих в выражении.

Рассмотрим подробно используемые операции.Операции дизъюнкции.Дизъюнкция в выражениях НЛЛ используется для связывания

разнородных синонимических групп при описании баз знаний.Входом операции является:

ji ww , – переменные НЛЛ, хранящие разнородные понятия.

383

Выходом операции является: — переменная НЛЛ, описывающая объединенное понятие.Выполнение операции дизъюнкции осуществляется по алгоритму,

приведенному на рисунке 5.

Рис. 5. НЛЛ, операция дизъюнкции

Операция сравнения.Входом операции является: – переменные НЛЛ, хранящие

сравниваемые понятия.Выходом операции является: – степень соответствия понятий.Выполнение операции дизъюнкции осуществляется по алгоритму,

представленному на рисунке 6.

384

Рис. 6. НЛЛ, операция сравнения

Благодарности. Работа выполнена при финансовой поддержке РФФИ (проект № 10-01-00165-а).

Список литературы[Гак, 2000] Гак В.Г. Пространство вне пространства // Логический анализ языка.

Языки пространств. – 2000. – №5. [Диалинг, 2008] Русский морфологический словарь Диалинг

–http://aot.ru/docs/rusmorph.html .[Прохоров, 2007] Прохоров И.В. Критерии выявления слов иноязычного

происхождения / Прохоров И.В., Заболеева-Зотова А.В. //Информационные технологии в науке, образовании, телекоммуникации и бизнесе (IT + S&E`07): Тез. докл. XXXIV междунар. конф., 20-30 мая 2007.

385

УДК 004.81

МОДЕЛИРОВАНИЕ ЭМОЦИЙ ПРИ ПРИНЯТИИ РЕШЕНИЙ НА ОСНОВЕ ГИБРИДНЫХ

ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ

С.А. Каунов ([email protected]) Национальный Исследовательский Ядерный Университет

«МИФИ», Москва

А.Н. Аверкин ([email protected]) Вычислительный центр РАН, Москва

В работе показывается целесообразность проведения исследований по моделированию эмоций для развития когнитивной экономики. Представлен обзор основополагающих трудов по использованию механизмов эмоций в искусственном интеллекте. Приведены западные примеры проектов сходной тематики.

Растущее количество междисциплинарных исследований на стыке когнитивных и экономических наук, а часто и с привлечением других областей знаний, привело к оформлению перспективного направления – когнитивной экономики. Предметами изучения для когнитивной экономики являются процессы выбора, оценки и принятия решений человеком в экономической деятельности, а также объяснение явлений эволюции организаций и социальных институтов в условиях структурной неопределенности. Когнитивная экономика опирается на исследование познавательной деятельности человека, и её модели разрабатываются с привязкой к психологии, нейробиологии и философии. Когнитивная экономика в широком смысле, описанная в [Абдикеев и др., 2010], представляет собой объединение интеллектуальных систем, управления знаниями и когнитивной экономики в узком смысле. В этой области уже несколько лет ведутся нейропсихологические эксперименты под руководством Т. Инуи и Н. Абдикеева в рамках сотрудничества Киотского университета и кафедры Когнитивной экономики РЭА им. Г.В. Плеханова, направленные на построение математических моделей выбора в определённых ситуациях [Tarasenko et al., 2008]. Разработка и применение теории аффективных процессов на пересечении указанных областей позволит продвинуться дальше в создании теорий и приложений, позволяющих учитывать убеждения и ожидания людей при принятии

386

решений и другие подобные влияния когнитивных и антропологических факторов на рациональные процессы и модели, описываемые классической экономикой. В экономике знаний, изучающей инновационные процессы и управление ими, в настоящий момент с разных сторон изучается влияние эмоций на креативность, в том числе в приложении к информационным системам. [Kathy McGrath, 2006]

Современные теоретические основы для всех систем, работающих с эмоциями, в той или иной степени заложены в трудах исследователей искусственного интеллекта М. Минского, Р. Пикард и А. Сломана. Минский рассматривает аффективные механизмы как своеобразные переключатели способов размышления [Minsky, 2007], реализуемых в соответствии с изложенной им ранее концепцией «Общество разума». Предлагаемый подход, по мнению Минского, позволит создать системы, рассуждающие с помощью здравого смысла. В архитектуре, которую Сломан совершенствует и претворяет в жизнь уже много лет, он активно использует эмоциональные процессы, но в то же время является противником использования понятия «эмоции» в искусственном интеллекте. Сломан в своих публикациях не устаёт обращать внимание на слишком большую расплывчатость и аморфность слова «эмоции», поэтому он призывает как можно раньше и точнее выбирать термин для вводимого объекта аффективного рода. [Sloman, 2007] Исследования Розалинды Пикард направлены больше на распознавание и синтез эмоций и аффективных признаков и проявлений. Пикард и её исследовательская группа изначально занималась компьютерным зрением и машинным обучением, что во многом объясняет методы и подходы, разработанные этой командой. Основное внимание уделяется физиологическим и нейрологическим параметрам [Picard, 2007], вокруг которых и построена данная теория аффективных вычислений.

В частности, в MIT группой Пикард сейчас разрабатываются проекты, направленные на применение теории аффективных вычислений в маркетинге, подобные исследования относятся к когнитивному маркетингу, области, возникшей на пересечении управления знаниями в экономике и когнитивной экономики. Например, по видео картинке лица покупателя система распознавания позволяет предугадать или оценить его реакцию на предложенный товар. Метод построен на статистическом анализе для поиска шаблонов среди выделенных информативных признаков в мимике и движениях головы объекта. Система работает как в реальном времени, так и с записями, что предоставляет широкие возможности практического применения таких методов. Также ведётся работа по внедрению аффективных моделей в системы принятия решений, что, по мнению исследователей, позволит сделать шаги сразу в нескольких направлениях: ускорить процесс принятия решения за счёт моделирования

387

рассуждений здравого смысла, усовершенствовать человеко-машинные интерфейсы и адаптировать систему к лицу, принимающему решение. [Ahn et al., 2009] Вообще, роль когнитивных, в том числе аффективных и эмоциональных, факторов в управлении знаниями была отмечена в [Нонака и др., 2003].

В Университете Аризоны лаборатория Алана Санфея, занимающаяся нейроэкономикой, ведёт исследовательский проект, направленный сугубо на изучение с точки зрения нейронауки эмоций и познания в процессах принятия решений. [Sanfey, 2009] Для исследований используется функциональная МРТ, с помощью которой и проводятся эксперименты, служащие основой для усовершенствования экономических моделей. Г. Лёвинштейн подходит к этой проблеме с другой стороны, как профессор экономики и психологии, в [Vohs et al., 2007] он рассматривает влияние эмоций на процесс принятия экономических решений. В основу положены нейрологические модели принятия решений, существующие в когнитивной экономике и данные исследований аффективной деятельности человека, полученные нейрофизиологами, в результате предлагается более реалистичная модель человека, работающего в экономической сфере.

В ВЦ РАН и РЭА им. Г.В. Плеханова была разработана архитектура гибридной интеллектуальной системы (ИС), описанная в [Аверкин и др., 2006]. Суть предложенной архитектуры заключается в обеспечении работы двух компонентов: более строгого, воплощаемого нечёткой иерархической моделью, и более мягкого, воплощаемого нечёткой когнитивной картой. Поочерёдная работа компонентов как единого целого предоставляет поддержку принятия решений. Основываясь на предлагаемой М. Минским концепции эмоций как путей мышления, предлагается расширить данную архитектуру так, чтобы она позволяла учитывать знания о влиянии эмоциональных факторов на рассуждения эксперта. Узлы когнитивной карты обозначим si, i 1, ∈ n. Они образуют некоторые устойчивые классы внутри ментальной модели (рис. 1).

Рис.1. Аффективное расширение архитектуры гибридных ИС.

388

То есть, на основе информации, полученной от эксперта выделяются множества Aj, j 1, ∈ m, такие что каждый узел входит ровно в одно из множеств. Каждое множество характеризуется параметром, оказывающим влияние на связи между факторами, связи между факторами, входящими в одно множество поощряются, связи между множествами штрафуются. Таким образом, различные попытки перехода между образованными классами вызывают отрицательные «эмоции», обеспечивающие перемежающуюся ограниченную рациональность.

В целом, одной из задач когнитивной экономики является совершенствование теорий ортодоксальной экономики, предполагающей, что все решения «homo economicus» принимает из чисто рациональных предположений [Абдикеев и др., 2010]. Построение математических моделей принятия решений и других указанных областей, учитывающих аффективные процессы, позволит усовершенствовать существующие экономические методы. Также целесообразно использование описанных достижений в когнитивной экономике в широком смысле, например в управлении знаниями.

Список литературы[Абдикеев и др., 2010] Абдикеев Н.М., Аверкин А.Н., Ефремова Н.А.. Когнитивная

экономика в эпоху инноваций // Вестник РЭА. – М.: . 2010. №1 (31).[Аверкин и др., 2006] Аверкин А.Н., Кузнецов О.П., Кулинич А.А., Титова Н.В.

Поддержка принятия решений в слабоструктурированных предметных областях: анализ ситуаций и оценка альтернатив // Известия РАН. 2006.

[Нонака и др., 2003] Нонака И., Такеучи Х.. Компания – создатель знания. Зарождение и развитие инноваций в японских фирмах. М.: ЗАО «Олимп-Бизнес», 2003.

[Ahn et al., 2009] Ahn H.I., Picard R.W., Affective Cognitive Learning and Decision Making: The Role of Emotions. http://affect.media.mit.edu.

[Kathy McGrath, 2006] Kathy McGrath Affection not affliction: The role of emotions in information systems and organizational change // Information and Organization. Uxbridge, Middlesex, UK: Elsevier. 2006. №16.

[Minsky, 2007] Marvin Minsky The Emotion Machine: Commonsense Thinking, Artificial Intelligence, and the Future of the Human Mind. Simon & Schuster, 2007.

[Picard, 2007] Picard R. W. Toward Machines with Emotional Intelligence. Oxford, UK: Oxford University Press, 2007.

[Sanfey, 2009] Sanfey A.G., Neural Decision Science Laboratory. http://research.sbs.arizona.edu[Sloman, 2007] Aaron Sloman Research Roadmap. Munich, 2007.[Tarasenko et al., 2008] Tarasenko S., Inui T., Abdikeev N. Sub-functions of human

Learning process during a sequential task // CogSci 2008 - The 30th Annual Conference of the Cognitive Science Society. 2008.

[Vohs et al., 2007] Kathleen D. Vohs, Roy F. Baumeister, George Loewenstein Do emotions help or hurt decision making?: a hedgefoxian perspective. Russell Sage Foundation, 2007.

389

УДК 004.81

ФОРМАЛЬНОЕ ОПИСАНИЕ КОГНИТИВНЫХ ОБРАЗОВ НА ОСНОВЕ МОДИФИЦИРОВАННОГО

ОНТОЛОГИЧЕСКОГО ПОДХОДА

Ю.В. Новоселов ([email protected]) Московский Энергетический Институт (Технический

Университет) МЭИ (ТУ), Москва

В статье раскрыты такие понятия как: когнитивная графика, когнитивный образ, абстракция, онтология. Приведена классификация когнитивных образов. Рассматривается модификация онтологической модели представления знаний, на основе которой предложен формат формального описания когнитивных образов.

ВведениеКак известно, наукой называется особый вид человеческой

познавательной деятельности, направленный на выработку объективных, системно организованных и обоснованных знаний об окружающем мире. Основой этой деятельности является сбор фактов, их систематизация, критический анализ и на этой базе синтез новых знаний, которые не только описывают наблюдаемые природные или общественные явления, но и позволяют построить причинно-следственные связи для прогнозирования. Одним из методов систематизации, обобщения и получения новых знаний является образное представление информации о той предметной области, в рамках которой проводится исследование.

Методология образного представления знаний основана на использовании графического изображения и набора правил контекстного пояснения, задающих взаимно-однозначное соответствие между параметрами решаемой задачи и фрагментами выбранного графического изображения, а также правил, описывающих процесс однозначной интерпретации выбранного графического изображения. Совокупность графического изображения и набора правил контекстного пояснения называют когнитивным образом, а раздел науки, изучающий принципы создания таких образов, – когнитивной графикой. К основным задачам когнитивной графики относятся: создание когнитивных образов для решения задач в различных предметных областях; разработка формальных

390

http://ru.wikipedia.org/wiki/%D0%A1%D0%B8%D0%BD%D1%82%D0%B5%D0%B7

http://ru.wikipedia.org/wiki/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7

http://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%BA%D1%82

http://ru.wikipedia.org/wiki/%D0%97%D0%BD%D0%B0%D0%BD%D0%B8%D0%B5

http://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%8A%D0%B5%D0%BA%D1%82%D0%B8%D0%B2%D0%BD%D0%B0%D1%8F_%D1%80%D0%B5%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D1%8C

http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B7%D0%BD%D0%B0%D0%BD%D0%B8%D0%B5_(%D1%84%D0%B8%D0%BB%D0%BE%D1%81%D0%BE%D1%84%D0%B8%D1%8F)

http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%B7%D0%BD%D0%B0%D0%BD%D0%B8%D0%B5_(%D1%84%D0%B8%D0%BB%D0%BE%D1%81%D0%BE%D1%84%D0%B8%D1%8F)

механизмов описания когнитивных образов, ориентированных на компьютерное представление; разработка сред построения когнитивных образов.

3. Когнитивные образыОпределение понятия когнитивный образ формулируется в следующем

виде: когнитивный образ — это совокупность приемов и методов образного представления условий задачи, которое позволяет либо сразу увидеть решение, либо получить подсказку для его нахождения.

Выделяют две разновидности когнитивных образов: когнитивные образы на основе произвольных графических изображении, т.е. когнитивные образы, графические изображения которых имеют произвольную структуру; когнитивные образы на основе графических изображений с сетевой структурой, называемые когнитивными картами, т.е. когнитивные образы, использующие в качестве графических образов изображения графов.

Задачи, для решения которых предназначены когнитивные образы, классифицируются по двум направлениям. К первому направлению относятся задачи, в которых требуется непосредственно получить новое знание. Задачи второго направления, для решения которых используются когнитивные образы, характеризуются большим объёмом информации и необходимостью её анализа за ограниченный временной интервал.

Когнитивные образы (КО), с помощью которых решаются задачи в различных предметных областях, можно разделить на четыре класса: статические КО, статические анимационные КО, динамические КО, динамические анимационные КО.

Статические когнитивные образы предусматривают отображение набора параметров решаемой задачи с постоянными значениями на когнитивном образе с помощью статического изображения. Примерами таких когнитивных образов могут служить «логические круги» Леонардо Эйлера, с помощью которых в наглядной форме представляются все основные операции над множествами и классами для визуализации силлогистики Аристотеля. Также к классу статических когнитивных образов относятся когнитивные карты.

Статические анимационные когнитивные образы предусматривают отображение набора параметров решаемой задачи с постоянными значениями на когнитивном образе с помощью анимированного изображения. К таким когнитивным образам можно отнести визуализированное описание процесса копирования файлов, которое представляется анимированным перемещением бумажного листа из одной папки в другую, или европейские знаки пешеходных переходов, на которых изображён анимированный идущий человек.

391

http://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%B4%D0%B0%D1%87%D0%B0

Динамические когнитивные образы позволяют сопоставлять разнообразные статические изображения различным наборам значений параметров решаемой задачи, то есть динамическим параметрам решаемой задачи. Динамическими параметрами являются значения всех измеряемых параметров решаемой задачи, например, измеряемых с помощью различных датчиков. К данному классу когнитивных образов относятся лица Чернова.

Динамические анимационные когнитивные образы позволяют сопоставлять различным наборам значений параметров решаемой задачи (динамическим параметрам) разнообразные анимированные изображения. Например, к данному классу КО относится образ глобуса в браузере, который начинает вращаться при попытке установить соединение, и останавливается в случае успешного соединения. Еще одним примером КО данного класса может служить образ вращающегося глобуса, изменяющего форму и скорость вращения при изменении состояния реактора атомной станции. Одновременно с этим данный когнитивный образ может отображать состояние подсистем реактора за счёт изменения окраски квадратов, образованных пересечениями параллелей и меридианов глобуса.

Следует отметить, что выбор графического изображения при формировании когнитивного образа необходимо осуществлять не только на основе анализа различных графических изображений, но и на основе анализа разных уровней детализации одного и того же графического шаблона. Это означает, что применение определенного графического изображения при формировании когнитивного образа может быть затруднительным до тех пор, пока данное графическое изображение не будет представлено более детально, т.е. будет представлено на другом уровне детализации.

Каждый уровень детализации описывается в виде отдельного слоя абстракции для удобства формального описания когнитивного образа. Слой абстракции верхнего уровня позволяет описать графический образ как единый фрагмент изображения. Следующий слой абстракции описывает графический образ как совокупность фрагментов изображения, на которые можно разбить данный графический образ. Слой абстракции более низкого уровня описывает набор подфрагментов изображения, на которые разбиваются фрагменты, описанные на предыдущем уровне (на более высоком слое абстракции). Графическое изображение должно представляться с разной степенью детализации (на разных уровнях абстракции) для того, чтобы можно было подобрать наиболее подходящий вид или ракурс графического изображения для отображения параметров решаемой задачи.

Как правило, для отображения параметров решаемой задачи используется самый нижний слой абстракции (уровень детализации)

392

описания когнитивного образа, позволяющий задать соответствие между параметрами решаемой задачи и элементарными фрагментами изображения, которые нельзя или не нужно разделять на подфрагменты. Формально задать степень детализации рассмотрения графического изображения, входящего в состав когнитивного образа, позволяет использование оператора абстракции.

Формально оператор абстракции представляется в следующем виде. Пусть задано Y – множество сущностей, X – множество свойств, Ai

t – сущность, которая принадлежит Y, Pi

t – свойство сущности (i=1, 2, …), принадлежащее множеству свойств X, и Ai

t (Pi,1t, Pi,2

t, …, Pi,nt) – сущность Ai

t, принадлежащая множеству сущностей Y, обладающая кортежем свойств Pi,1

t, Pi,2t, …, Pi,n

t , (n=1, 2, ...), где t – момент времени, в который к сущности применяется оператор абстракции. Задан набор таких сущностей <A1

t1, A2t2,

… , Amtm>. Тогда оператор абстракции, применённый к заданному набору

сущностей, в общем виде описывается следующим образом:La[A1

t1(P1,1t1,1, P1,2

t1,2, …, P1,nt1,n), A2

t2(P2,1t2,1, P2,2

t2,2, …, P2,nt2,n), … ,

Amtm(Pm,1

tm,1, Pm,2tm,2, …, Pm,n

tm,n)] → Ao1t1(Po1,1

t1,1, Po1,2t1,2, …, Po1,p

t1,p), Ao2t2(Po2,1

t2,1, Po2,2

t2,2, …, Po2,pt2,p), … , Aoq

tq(Poq,1tq,1, Poq,2

tq,2, …, Poq,ptq,p),

где Aoiti – абстрактная сущность,

Poi,jti,j –важное свойство абстрактной сущности,

i>0, j>0, q – количество абстрактных сущностей (1≤q≤m), p – количество оставшихся важных свойств абстрактных сущностей (0≤p<n),ti – момент времени, в который к сущности применяется оператор абстракции.

4. Модификация онтологической модели представления знаний

Одной из важнейших задач, относящихся к процессу формирования когнитивного образа, а именно к процессу создания контекстного описания когнитивного образа, является выбор формата представления информации. Формат контекстного описания когнитивного образа должен позволять без затруднений описывать соответствие фрагментов выбранного графического изображения определённым параметрам решаемой задачи и правила изменения фрагментов изображения в зависимости от изменения значений параметров решаемой задачи, за отображение которых отвечают данные фрагменты изображения. Также формат описания когнитивных образов должен предусматривать возможность описания КО с разной степенью детализации, а именно позволять задавать соответствие параметров решаемой задачи фрагментам изображения, относящихся к разным слоям

393

абстракции, описывающим определенные уровни детализации. В настоящее время не существует общепризнанной формальной модели описания когнитивных образов.

Онтологическая модель наиболее приемлема для того, что бы на её основе базировалось представление формального описания когнитивных образов. Однако в онтологической модели не определены механизмы, позволяющие стандартизировать процесс определения типов концептов (вершин), т.е. тот формат, в котором будут описаны определения предметной области, соответствующие формируемым концептам. Данный факт вынуждает экспертов самостоятельно выбирать формат представления понятий при формировании концептов онтологии. В результате применения онтологического подхода для формального описания КО, описания одних и тех же образов, выполненные различными экспертами могут существенно отличаться в силу субъективных взглядов на данные образы. Полученные описания образов не будут универсальными и их сложно будет сопровождать при использовании в разных программных продуктах. Также указанный недостаток влечёт отсутствие общей методологии описания когнитивных образов и, как следствие, возникновение большого количества ошибок при выполнении такого описания. Для устранения описанных недостатков процесса формирования концептов онтологии возможно применение механизмов регламентирования, заимствованных в объектной модели описания знаний о предметной области. Необходимо заимствование только наиболее важных механизмов, использующихся при создании формата объекта, таких как: инкапсуляция, абстракция, наследование и полиморфизм.

Рассмотрим формальное описание модифицированной онтологической модели. Формально модифицированная онтологическая модель определяется тройкой:

O = (X, R, F),где: X = {Ci |i=1, 2, …, n} – непустое множеств концептов (объектов предметной области), R = {Rj|j=1, 2, …, k} – семейство отношений на множестве X, F – множество функции интерпретации. Каждый концепт С определяется следующим образом:

C= (N, T, SV, P, Ch, A),где: N – имя концепта С, SV – семантическая метка концепта С, P – множество предков концепта С, Р = {Cs|s=1, 2, …, ns }, Ch – множество потомков концепта С, Сh = {Cm|m=1, 2, …, nm }, A – список атрибутов концепта С: A = (A1, A2, …, Au). Каждый атрибут А рассматриваемой модели имеет следующей вид:

Aq = (Nq, Tq, SVq, Kq, Vq),

394

где: Nq – имя атрибута Аq, Tq – тип атрибута Аq, который может являться простым типом или пользовательским, SVq – семантическая метка атрибута Аq, Kq – ключ атрибута, Vq – значение атрибута. T – тип концепта С: T = (NoT, AT, MT, PT), где NoT – имя типа концепта; AT – список типов атрибутов типа концепта AT = (AT

1, AT2, …, AT

j, …, ATn), где отдельный тип атрибута

имеет вид: ATj = (NST

j, TPTj, NaT

j), здесь NSTj – спецификатор области

видимости типа атрибута: NSTj = {public, protected, private}, TPT

j, – формат типа атрибута: TP = {int, double, …, O1, O2, … }, Na – имя типа атрибута;

MT – список методов типа концепта MT = (MT1, MT

2, …, MTj, …, MT

m), где отдельный метод имеет вид: MT

j = (NmTj, TT

j, NTj, VT

j, FTj), здесь NmT

j – имя метода типа концепта; TT

j – тип возвращаемого методом параметра; NTj –

имя возвращаемого параметра; VTj – список параметров, к которым у

метода существует возможность доступа (значение полей экземпляра формат которых определяется типами атрибутов AT, входные параметры метода), FT

j – реализация метода. Здесь список параметров, к которым у метода существует возможность доступа VT

j = (VTj,1, VT

j,2, …, VT

j,j, …, VT

j,y),

где отдельное описание параметра имеет вид: VTj,j = (TPT

j,j, NvT

j,j), где TPT

j,j

– тип параметра, NvTj,j – имя параметра.

Приведенная модификация направлена на стандартизацию процесса построения онтологии, что позволит создавать идентичные по структуре формальные онтологические описания. Например, для создания правил описания конкретного понятия, ставящегося в соответствие формируемому концепту, эксперту предоставляется возможность использования всего набора правил, задающих формат описания схожего по смыслу понятия, и возможность дополнить заимствованный набор правил новыми правилами, задающими уникальные особенности описываемого понятия. Согласно рассматриваемому формату модифицированной онтологии был построен тип концепта динамический анимационный когнитивный образ, который может быть использован в качестве формата формального описания различных разновидностей когнитивных образов, т.к. любой произвольный когнитивный образ является частным случаем динамического анимационного когнитивного образа. Подробно рассмотрим данный формат.

3. Формальное описание когнитивных образовНа первом этапе создания формального описания когнитивного образа

необходимо явно выделить параметры решаемой задачи: O = <P1, … , Pn , Pn+1 , … ,Pn+m , Pn+m+1 , … , PQ>, где O – решаемая задача, Pi – параметры решаемой задачи, Q – количество параметров решаемой задачи, параметрам P1, … , Pn соответствуют значения параметров n входных переменных формального описания задачи, параметрам Pn+1, … , Pn+m – значения

395

параметров m внутренних текущих переменных, параметрам Pn+m+1, … , PQ

– значения k выходных переменных. Далее представлен тип концепта – динамический анимационный

когнитивный образ, определяющий формат формального описания динамического анимационного когнитивного образа: CI = < { Xi }i[1, K] > , где CI – тип концепта – динамический анимационный когнитивный образ; Xi – тип концепта – слайд (кадр когнитивного образа), 1≤i≤K; K – кол-во полей типа концепт – слайд (кол-во кадров, необходимых для отображения динамического анимационного когнитивного образа).

Каждый концепт – слайд (кадр) когнитивного образа имеет вид: Xi = < {Xj

i}j[1, N], Sh0i, T0

i>, где Xji – тип концепта – характеристика, экземпляр данного типа отвечает за отображение j-го параметра решаемой задачи на i-ом кадре, 1≤j≤N, 1≤i≤K; N – количество полей типа концепт – характеристик (количество характеристик содержащихся в i-ом кадре); Sh0

i

– тип концепта – шаблон (хранит фрагмент изображения слайда, которому не сопоставлены параметры решаемой задачи); T0

i – тип концепта – временной интервал (время визуальной доступности пользователю i-го кадра).

Каждая характеристика Xji имеет вид: Xj

i = <Fji(Pj

i1, Pji2,…, Pj

im, tji), Vj

i, Shj

i, Posji>, где (1≤j≤N, 1≤i≤K, 1≤im≤Q), F – прототип функции

интерпретации с набором параметров решаемой задачи Pji1, Pj

i2,…, Pjim,

(функция интерпретации предназначена для задания соответствия параметров решаемой задачи фрагменту графического изображения) ,результатом работы функции интерпретации является фрагмент изображения когнитивного образа; im – количество отображаемых параметров решаемой задачи (1≤im≤Q); tj

i – период времени, в течение которого данный фрагмент визуально доступен лицу, принимающему решения; Vj

i – тип концепта – представление (задает набор свойств изображения, которые могут изменяться характеристикой); Shj

i – тип концепта – шаблон (хранит фрагмент изображения слайда, которому сопоставлены параметры решаемой задачи); Posj

i – тип концепта – позиция шаблона изображения; Posj

i = <PosXji , PosYj

i , PosZji>, где PosXj

i – тип концепта – позиция по горизонтальной оси, PosYj

i – тип концепта – позиция по вертикальной оси, PosZj

i – тип концепта – позиция по оси глубины, (1≤j≤N, 1≤i≤K).

Поскольку существуют различные варианты отображения изменения значений параметров решаемой задачи, то тип концепта – представления Vj

i определяется следующим образом: Vji = {Lj

i, Csji, Tsj

i, Tpji}, где (1≤j≤N,

1≤i≤K) Lji – тип концепта – дефрагментации, (экземпляр концепта-

дефрагментации описывает представление характеристики в виде совокупности из R характеристик, путем разбиения шаблона изображения

396

характеристики на R подфрагментов: Lji=<{Xj,r

i}r[1, R] >, где R – количество подфрагментов, на которое разбивается шаблон изображения рассматриваемой характеристики.

Csji – тип концепта – цвет фрагмента изображения имеет три

составляющие цвета: красный, зеленый, синий и определяется следующей тройкой: Csj

i=<Rji, Gj

i, Bji>, где: 0 ≤ Rj

i ≤255 – тип концепта – красная составляющая цвета фрагмента когнитивного образа, 0≤Gj

i≤255 – тип концепта – зелёная составляющая цвета фрагмента когнитивного образа, 0≤Bj

i≤255 – тип концепта – синяя составляющая цвета фрагмента когнитивного образа, (1≤ j ≤ N, 1 ≤ i ≤ K). Tsj

i – тип концепта – изменение формы фрагмента изображения. Данный параметр определяется следующим образом: Tsj

i = <Tsxji, Tsyj

i, Tszji>, где: -100≤Tsxj

i≤100 – тип концепта – процентное соотношение сжатия или растяжения образа по горизонтальной оси; -100≤Tsyj

i≤100 – тип концепта – процентное соотношение сжатия или растяжения образа по вертикальной оси; -100≤Tszj

i≤100 – тип концепта – процентное соотношение сжатия или растяжения образа по оси глубины, (1 ≤ j ≤ N, 1 ≤ i ≤ K). Tpj

i – тип концепта – изменение местоположения фрагмента изображения. Параметр имеет вид: Tpj

i = <Tpxji, Tpyj

i, Tpzji>, где: Tpxj

i – тип концепта – смещение фрагмента когнитивного образа по горизонтальной оси; Tpyj

i – тип концепта – смещение фрагмента когнитивного образа по вертикальной оси; Tpzj

i – тип концепта – смещение фрагмента когнитивного образа по оси глубины, (1≤ j≤ N, 1≤ i≤K).

Рис. 1. Графическое представление формата формального описания когнитивных образов


397

В результате проведённых исследований было показано, что образное графическое представление информации о решаемой задаче является наиболее эффективным по выразительности и по времени восприятия лицом, принимающим решение. Это преимущество важно для контроля и управления сложными и критическими по времени процессами. Представленный формат формального описания когнитивных образов, сформированный на основе модифицированного онтологического подхода, позволяет выполнять формальное описание когнитивных образов любых разновидностей и выполнять восстановление когнитивного образа по его формальному описанию в процессе его интеграции в состав различных программных средств независимо от того с помощью каких технологий они были разработаны.

Список литературы[Вагин, 2008] Вагин В.Н. Новоселов Ю.В. Когнитивная графика в системе

поддержки принятия решений для диагностики атомного реактора, Труды XXXV юбилейной международной конференции. VI международной конференции молодых ученых. Информационные технологии в науке, образовании, телекоммуникации и бизнесе. – М.: ГУРЗУФ, 2008.

[Новоселов, 1984] Новоселов Ю.В. Формальная модель представления когнитивного образа для системы поддержки принятия решений в задаче диагностики объекта. Вестник МЭИ, Издательство МЭИ, 2009.

[Поспелов и др., 1981] Поспелов Д.А. Логико-лингвистические модели в системах управления и искусственного интеллекта. – М.: Наука. Гл. ред. Физ.-мат. Лит., 1981.

[Поспелов, 1992] Поспелов Д.А. Когнитивная графика " окно в новый мир. // Программные продукты и системы. 1992. ""2."

[Рассел и др., 2006] Рассел, Стюарт, Норвиг, Питер. Искусственный интеллект: современный подход, 2-е изд. Пер. с англ. – М.: Издательский дом “Вильямс”, 2006.

398