Автоматическая обработка естественного языка
DESCRIPTION
Автоматическая обработка естественного языка. I. Обработка письменного текста. XML — язык разметки (лингвистических) данных. а также XSL — язык для преобразования данных. Что такое XML?. В Интернете всё написано! http://w3schools.com http://en.wikipedia.org/wiki/Xml - PowerPoint PPT PresentationTRANSCRIPT
Автоматическая Автоматическая обработка обработка
естественного языкаестественного языка
I. I. Обработка Обработка письменного текстаписьменного текста
XML XML — язык разметки — язык разметки (лингвистических) (лингвистических)
данныхданных
а также а также XSLXSL — язык для — язык для преобразования данныхпреобразования данных
Что такое Что такое XML?XML?
В Интернете всё В Интернете всё написано!написано!
http://w3schools.comhttp://w3schools.com http://en.wikipedia.org/wiki/Xmlhttp://en.wikipedia.org/wiki/Xml http://www.w3.org/XML/http://www.w3.org/XML/ ……
Что такое Что такое XML?XML?
eeXXtensible tensible MMarkup arkup LLanguageanguage– ExtensibleExtensible — расширяемый. — расширяемый. Каждый Каждый
пользователь приспосабливает его для пользователь приспосабливает его для своей задачи.своей задачи.
XML XML внешне похож на внешне похож на HTMLHTML..– Это тоже Это тоже язык разметкиязык разметки..
(HyperText Markup Language)(HyperText Markup Language)– Синтаксис обоих Синтаксис обоих происходит от происходит от SGMLSGML
(Standard Generalized Markup Language)(Standard Generalized Markup Language)
Пример Пример HTMLHTML
<html> <html> <head> <head>
<title>Title of page</title><title>Title of page</title></head></head><body> <body>
<p>This is my first homepage.<br><p>This is my first homepage.<br><b>This text is bold</b> <b>This text is bold</b>
</p></p></body> </body>
</html> </html>
...Вот что из этого получается:...Вот что из этого получается:
1page.htm1page.htm
Пример Пример XMLXML<?xml version="1.0" encoding="ISO-8859-1"?><?xml version="1.0" encoding="ISO-8859-1"?><CHESSBOARD> <CHESSBOARD> <WHITEPIECES> <WHITEPIECES>
<KING><POSITION COLUMN="G" ROW="1"/></KING><KING><POSITION COLUMN="G" ROW="1"/></KING><BISHOP><POSITION COLUMN="D" ROW="6"/></BISHOP><BISHOP><POSITION COLUMN="D" ROW="6"/></BISHOP><ROOK><POSITION COLUMN="E" ROW="1"/></ROOK><ROOK><POSITION COLUMN="E" ROW="1"/></ROOK><PAWN><POSITION COLUMN="A" ROW="4"/></PAWN><PAWN><POSITION COLUMN="A" ROW="4"/></PAWN><PAWN><POSITION COLUMN="B" ROW="3"/></PAWN><PAWN><POSITION COLUMN="B" ROW="3"/></PAWN>
……</WHITEPIECES></WHITEPIECES><BLACKPIECES><BLACKPIECES>
<KING><POSITION COLUMN="B" ROW="6"/></KING><KING><POSITION COLUMN="B" ROW="6"/></KING><QUEEN><POSITION COLUMN="A" ROW="7"/></QUEEN><QUEEN><POSITION COLUMN="A" ROW="7"/></QUEEN><PAWN><POSITION COLUMN="A" ROW="5"/></PAWN><PAWN><POSITION COLUMN="A" ROW="5"/></PAWN><PAWN><POSITION COLUMN="D" ROW="4"/></PAWN><PAWN><POSITION COLUMN="D" ROW="4"/></PAWN>
</BLACKPIECES></BLACKPIECES></CHESSBOARD> </CHESSBOARD>
...Вот что он описывает:...Вот что он описывает:
Чем Чем XML XML отличается от отличается от HTML?HTML?
Почти всем.Почти всем. Главное — назначениемГлавное — назначением
– HTML HTML используется для отображения используется для отображения данных в браузере. В нем смешаны данных в браузере. В нем смешаны элементы элементы содержаниясодержания и и оформленияоформления..
– XML XML используется для хранения используется для хранения данных и описания их структуры. Он данных и описания их структуры. Он задаёт только задаёт только содержаниесодержание документа.документа.
Чем Чем XML XML отличается от отличается от HTML?HTML?
ГибкостьюГибкостью– Тэги Тэги HTML HTML и их значение жёстко и их значение жёстко
заданы в спецификации.заданы в спецификации.– В спецификации В спецификации XML XML фиксирован фиксирован
только синтаксис. Тэги только синтаксис. Тэги XML XML и их и их значение задаются пользователем.значение задаются пользователем.
– Фактически, Фактически, XMLXML — это не один язык, — это не один язык, а а семейство языковсемейство языков, потому что , потому что каждый пользователь, придумывая каждый пользователь, придумывая свои тэги, задаёт свой язык.свои тэги, задаёт свой язык.
Чем Чем XML XML отличается от отличается от HTML?HTML?
Немного — синтаксисом (см. Немного — синтаксисом (см. далее)далее)
Основные понятия:Основные понятия:– документ (документ (≈ файл)≈ файл)– элементэлемент
<KING><POSITION COLUMN="G" ROW="1"/></KING><KING><POSITION COLUMN="G" ROW="1"/></KING>
– атрибутатрибутCOLUMN="G"COLUMN="G"
Синтаксис Синтаксис XMLXML
Каждый документ должен иметь Каждый документ должен иметь ровно один корневой элементровно один корневой элемент
У каждого открывающего тэга У каждого открывающего тэга должен быть закрывающийдолжен быть закрывающий
Тэги должны быть правильно Тэги должны быть правильно вложены друг в другавложены друг в друга
Значения атрибутов обязательно Значения атрибутов обязательно берутся в кавычкиберутся в кавычки
Регистр символов в именах важен!Регистр символов в именах важен!
Преобразования Преобразования XML-XML-данныхданных
Продолжение — на Продолжение — на w3schools.com w3schools.com (и не только)(и не только)
Примеры использования Примеры использования XML XML в жизнив жизни
Тест на основные понятияТест на основные понятияhttp://w3schools.com/xml/xml_quiz.asphttp://w3schools.com/xml/xml_quiz.asp
Учебники по Учебники по XMLXML и другим и другим технологиям технологиям (XPath, XSLT (XPath, XSLT и др.)и др.)
а такжеа также Зачем нужен Зачем нужен XML XML лингвистам?лингвистам?