автоматическая обработка текста
TRANSCRIPT
![Page 1: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/1.jpg)
Автоматическая обработка текста
![Page 2: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/2.jpg)
Автоматическая обработка текста —преобразование
текста на искусственном или естественном языке с
помощью ЭВМ.
Прикладные системы и теория А. о. т. начали
создаваться в конце 50-х гг. 20 в. (США, СССР, Франция,
ФРГ и др.) и развивались в нескольких различных
приложениях: в системном программировании,
издательском деле и в вычислительной лингвистике.
![Page 3: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/3.jpg)
• Преобразование текста – внесение в текст исправлений и
добавлений
• Форматирование текста – выделение заголовков,
формировании строк и страниц нужного формата и т.д.
• Автоматический набор и верстка текста
• Лексиграфическая обработка - текст преобразуется в
лексикографическое представление
• Автоматический лигвистический анализ
• Автоматический синтез
![Page 4: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/4.jpg)
Наиболее полно функции А. о. т. развиты в системах
автоматического перевода и системах человеко-
машинного общения, где основным является
синтаксический, а в системах общения с ЭВМ —
семантический анализ. Эти наиболее сложные формы А.
о. т. целиком опираются на формальный аппарат,
развитый в рамках математической лингвистики и
вычислительной лингвистики.
![Page 5: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/5.jpg)
В составе лингвистического обеспечения
автоматизированных информационных систем
различают три группы функций А. о. т.:
автоматическое индексирование входных
документов, автоматическое составление
поисковых предписаний по тексту запросов и
автоматизированное ведение словарей системы.
![Page 6: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/6.jpg)
С 70-х гг. наблюдается тенденция к
интеграции всех подходов к
конструированию систем А. о. т. в
рамках искусственного интеллекта
— направления в информатике
(computer science), связанного с
созданием сложных человеко-
машинных и робототехнических
систем, моделирующих человеческую
деятельность в различных сферах и
предметных областях.
![Page 7: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/7.jpg)
Здесь функции редактирования
всё больше сливаются с
функциями содержательной
обработки, образуя единый
аппарат понимания текста. Это
открывает возможности для
автоматизации наиболее
сложных областей человеческой
деятельности, требующих
затрат прежде всего
интеллектуального труда, таких,
как редакционно-издательские
процессы, извлечение информации
из текстов и т.д.
![Page 8: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/8.jpg)
Однако в таких массовых, «промышленных» применениях А.
о. т. должна опираться на мощную информационную
поддержку в виде автоматизированных словарных
картотек, автоматических словарей, грамматик и других
форм представления лингвистических данных в ЭВМ
![Page 9: автоматическая обработка текста](https://reader036.vdocuments.net/reader036/viewer/2022073010/5598cbb01a28ab731a8b45b0/html5/thumbnails/9.jpg)
Результатом А. о. т. являются частотные словари,
конкордансы (словоуказатели с контекстами),
автоматические моно- и многоязычные словари,
размещаемые в базах данных и используемые
программами лексикографических систем в качестве
справочного при обработке новых данных. Поэтому
такие системы являются развивающимися системами.
Автоматические словари используются в системах
автоматического перевода, а также в информационных
системах и системах общения с ЭВМ на естественном
языке в качестве справочников при подготовке и
расширении словарей и уточнении грамматик этих
систем.