автоматическая обработка текста

9
Автоматическая обработка текста

Upload: ehidnat

Post on 05-Jul-2015

125 views

Category:

Education


6 download

TRANSCRIPT

Page 1: автоматическая обработка текста

Автоматическая обработка текста

Page 2: автоматическая обработка текста

Автоматическая обработка текста —преобразование

текста на искусственном или естественном языке с

помощью ЭВМ.

Прикладные системы и теория А. о. т. начали

создаваться в конце 50-х гг. 20 в. (США, СССР, Франция,

ФРГ и др.) и развивались в нескольких различных

приложениях: в системном программировании,

издательском деле и в вычислительной лингвистике.

Page 3: автоматическая обработка текста

• Преобразование текста – внесение в текст исправлений и

добавлений

• Форматирование текста – выделение заголовков,

формировании строк и страниц нужного формата и т.д.

• Автоматический набор и верстка текста

• Лексиграфическая обработка - текст преобразуется в

лексикографическое представление

• Автоматический лигвистический анализ

• Автоматический синтез

Page 4: автоматическая обработка текста

Наиболее полно функции А. о. т. развиты в системах

автоматического перевода и системах человеко-

машинного общения, где основным является

синтаксический, а в системах общения с ЭВМ —

семантический анализ. Эти наиболее сложные формы А.

о. т. целиком опираются на формальный аппарат,

развитый в рамках математической лингвистики и

вычислительной лингвистики.

Page 5: автоматическая обработка текста

В составе лингвистического обеспечения

автоматизированных информационных систем

различают три группы функций А. о. т.:

автоматическое индексирование входных

документов, автоматическое составление

поисковых предписаний по тексту запросов и

автоматизированное ведение словарей системы.

Page 6: автоматическая обработка текста

С 70-х гг. наблюдается тенденция к

интеграции всех подходов к

конструированию систем А. о. т. в

рамках искусственного интеллекта

— направления в информатике

(computer science), связанного с

созданием сложных человеко-

машинных и робототехнических

систем, моделирующих человеческую

деятельность в различных сферах и

предметных областях.

Page 7: автоматическая обработка текста

Здесь функции редактирования

всё больше сливаются с

функциями содержательной

обработки, образуя единый

аппарат понимания текста. Это

открывает возможности для

автоматизации наиболее

сложных областей человеческой

деятельности, требующих

затрат прежде всего

интеллектуального труда, таких,

как редакционно-издательские

процессы, извлечение информации

из текстов и т.д.

Page 8: автоматическая обработка текста

Однако в таких массовых, «промышленных» применениях А.

о. т. должна опираться на мощную информационную

поддержку в виде автоматизированных словарных

картотек, автоматических словарей, грамматик и других

форм представления лингвистических данных в ЭВМ

Page 9: автоматическая обработка текста

Результатом А. о. т. являются частотные словари,

конкордансы (словоуказатели с контекстами),

автоматические моно- и многоязычные словари,

размещаемые в базах данных и используемые

программами лексикографических систем в качестве

справочного при обработке новых данных. Поэтому

такие системы являются развивающимися системами.

Автоматические словари используются в системах

автоматического перевода, а также в информационных

системах и системах общения с ЭВМ на естественном

языке в качестве справочников при подготовке и

расширении словарей и уточнении грамматик этих

систем.