Низкомолекулярное проектирование: структурированные...
TRANSCRIPT
НИЗКОМОЛЕКУЛЯРНОЕ ПРОЕКТИРОВАНИЕ
W I A D 2 0 1 7
1 8 Ф Е В Р А Л Я
С Т Р У К Т У Р И Р О В А Н Н Ы Е Д А Н Н Ы Е И U X
Л А Р А С И М О Н О В А
1. Информационная архитектура• Общее определение и области применения• Основная область применения ИА — разработка цифровых продуктов• Взаимоотношения ИА и остальных процессов разработки продкутов• ИА и структурированные данные
2. Подход к структурированию данных• Исследование предметной области• Выделение основных ее сущностей• Моделирование содержания• Выбор схемы данных• Структурирование и наполнение словарей
3. Структура данных и ее влияние на продукт• Разработка: удобное проектирование баз данных, бэкенда, логики фронтенда• Дизайн: UI-kit и масштабируемость• UX: понятные интерфейсы, чистые данные, умные рекомендательные системы, machine learning
ПЛАН
ОПРЕДЕЛЕНИЕ Информационня архитектура — совокупность практик, обеспечивающих:
• Сбор и анализ информации;
• Ее структурирование, описание внутренних связей;
• Разработка форматов ее хранения;
• И способов передачи для дальнейего использования
в разных контекстах
1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
КОНТЕКСТЫ ПРИМЕНЕНИЯ 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
d i g i t a l a n a l o g
КОНТЕКСТЫ ПРИМЕНЕНИЯ 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
d i g i t a l a n a l o g
Инструменты и сервисы• Логика фронт-энда и бэк-энда
• Пользовательские сценарии
• Контент-стратегии
КОНТЕКСТЫ ПРИМЕНЕНИЯ 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
d i g i t a l a n a l o g
Инструменты и сервисы• Логика фронт-энда и бэк-энда
• Пользовательские сценарии
• Контент-стратегии
Базы данных• Структура сущностей в справочниках
• Структура содержания словарных статей
• Правила наполнения справочников и словарей
КОНТЕКСТЫ ПРИМЕНЕНИЯ 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
d i g i t a l a n a l o g
Инструменты и сервисы• Логика фронт-энда и бэк-энда
• Пользовательские сценарии
• Контент-стратегии
Процессы• Бизнес-аналитика
• Методологии обучения
• Методологии управления
Базы данных• Структура сущностей в справочниках
• Структура содержания словарных статей
• Правила наполнения справочников и словарей
КОНТЕКСТЫ ПРИМЕНЕНИЯ 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
d i g i t a l a n a l o g
Инструменты и сервисы• Логика фронт-энда и бэк-энда
• Пользовательские сценарии
• Контент-стратегии
Процессы• Бизнес-аналитика
• Методологии обучения
• Методологии управления
Базы данных• Структура сущностей в справочниках
• Структура содержания словарных статей
• Правила наполнения справочников и словарей
Физические объекты• Библиотеки
• Счета
• Инструменты на верстаке
КОНТЕКСТЫ ПРИМЕНЕНИЯ 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
d i g i t a l
Д И з А й Н ц И ф Р О В Ы х п Р О Д У К Т О В
a n a l o g
Инструменты и сервисы• Логика фронт-энда и бэк-энда
• Пользовательские сценарии
• Контент-стратегии
Процессы• Бизнес-аналитика
• Методологии обучения
• Методологии управления
Базы данных• Структура сущностей в справочниках
• Структура содержания словарных статей
• Правила наполнения справочников и словарей
Физические объекты• Библиотеки
• Счета
• Инструменты на верстаке
ПРОДАКТ-ДИЗАЙН 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
С У б С Т Р А Т = О б Л А С Т ь
• Основные понятия• Их взаимосвязи• Терминология
ПРОДАКТ-ДИЗАЙН 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
С У б С Т Р А Т = О б Л А С Т ь
п О Л ь з О В А Т Е Л И
• Основные понятия• Их взаимосвязи• Терминология
• Спектр возможных взаимодействий с элементами области
• Базовые привычки и сценарии
ПРОДАКТ-ДИЗАЙН 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
С У б С Т Р А Т = О б Л А С Т ь
п О Л ь з О В А Т Е Л И
И Н С Т Р У М Е Н Т Ы
• Основные понятия• Их взаимосвязи• Терминология
• Спектр возможных взаимодействий с элементами области
• Базовые привычки и сценарии
• Облегчение взаимодействий
• Расширение возможностей пользователя
ПРОДАКТ-ДИЗАЙН 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
С У б С Т Р А Т = О б Л А С Т ь
п О Л ь з О В А Т Е Л И
И Н С Т Р У М Е Н Т Ы
• Основные понятия• Их взаимосвязи• Терминология
• Спектр возможных взаимодействий с элементами области
• Базовые привычки и сценарии
• Облегчение взаимодействий
• Расширение возможностей пользователя
=> Н О В Ы й п Р О Д У К Т
ПРОДАКТ-ДИЗАЙН 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
С У б С Т Р А Т = О б Л А С Т ь
п О Л ь з О В А Т Е Л И
И Н С Т Р У М Е Н Т Ы
Исследования и анализ
• Основные понятия• Их взаимосвязи• Терминология
• Спектр возможных взаимодействий с элементами области
• Базовые привычки и сценарии
• Облегчение взаимодействий
• Расширение возможностей пользователя
IA
PM
IA
PM
ПРОДАКТ-ДИЗАЙН 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
С У б С Т Р А Т = О б Л А С Т ь
п О Л ь з О В А Т Е Л И
И Н С Т Р У М Е Н Т Ы
п Р О Д У К Т О В А я С Т Р А Т Е Г И яп О Л ь з О В А Т Е Л ь С К А я Л О Г И К А
п О Д Р О б Н А я Р А б О Т А С Д А Н Н Ы М Иф О Р М А Л ь Н А я Л О Г И К А
Исследования и анализ
• Основные понятия• Их взаимосвязи• Терминология
• Спектр возможных взаимодействий с элементами области
• Базовые привычки и сценарии
• Облегчение взаимодействий
• Расширение возможностей пользователя
IA
PM
IA
PM
ПРОДАКТ-ДИЗАЙН и ИА 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
Исследования и анализ• Опросы • Брифы
ПРОДАКТ-ДИЗАЙН и ИА 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
Исследования и анализ
Оптимизация и формализация
• Опросы • Брифы
• Схемы• Таблицы• Майндмэпы• Спецификации• Вайрфреймы
ПРОДАКТ-ДИЗАЙН и ИА 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
Исследования и анализ
Оптимизация и формализация
Имплементация
• Опросы • Брифы
• Поддержка дизайна• Поддержка разработки
• Схемы• Таблицы• Майндмэпы• Спецификации• Вайрфреймы
ПРОДАКТ-ДИЗАЙН и ИА 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
Исследования и анализ
Оптимизация и формализация
Имплементация
Тестирование
• Опросы • Брифы
• Поддержка дизайна• Поддержка разработки
• Схемы• Таблицы• Майндмэпы• Спецификации• Вайрфреймы
ПРОДАКТ-ДИЗАЙН и ИА 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
Исследования и анализ
Оптимизация и формализация
Имплементация
Тестирование
• Опросы • Брифы
• Поддержка дизайна• Поддержка разработки
• Схемы• Таблицы• Майндмэпы• Спецификации• Вайрфреймы
ПРОДАКТ-ДИЗАЙН и ИА 1 . И Н ф О Р М А ц И О Н Н А я А Р х И Т Е К Т У Р А
Исследования и анализ
Оптимизация и формализация
Имплементация
Тестирование
• Опросы • Брифы
• Поддержка дизайна• Поддержка разработки
• Схемы• Таблицы• Майндмэпы• Спецификации• Вайрфреймы
С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
КОНТЕКСТДва типа задач про стурктурирование у ИА:
1. Формализация логики предметной области• С какими сущностями мы работаем?
• Как они связаны?
• Какие их свойства релевантны?
• Какие термины используются для описания свойств?
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
КОНТЕКСТДва типа задач про стурктурирование у ИА:
1. Формализация логики предметной области• С какими сущностями мы работаем?
• Как они связаны?
• Какие их свойства релевантны?
• Какие термины используются для описания свойств?
2. Структурирование информации полученной информации под ее «потребителя»
• Кому мы хотим передать информацию? Разработчик, дизайнер, пользователь
• Под какие задачи?
• В каком виде она будет наиболее понятна? Вайрфреймы, схемы, таблицы, текст
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
КОНТЕКСТДва типа задач про стурктурирование у ИА:
1. Формализация логики предметной области• С какими сущностями мы работаем?
• Как они связаны?
• Какие их свойства релевантны?
• Какие термины используются для описания свойств?
2. Структурирование информации полученной информации под ее «потребителя»
• Кому мы хотим передать информацию? Разработчик, дизайнер, пользователь
• Под какие задачи?
• В каком виде она будет наиболее понятна? Вайрфреймы, схемы, таблицы, текст
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
И А п Р О И з В О Д С Т В Е Н Н Ы х п Р О ц Е С С О В ( С п Е ц И ф И К А ц И И )
ПРЕДМЕТНАЯ ОБЛАСТЬВдумчивое ее моделирование позволяет повысить эффективность создания продукта и принимать взвешенные решения на разных уровнях
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
ПРЕДМЕТНАЯ ОБЛАСТЬВдумчивое ее моделирование позволяет повысить эффективность создания продукта и принимать взвешенные решения на разных уровнях
1. Бизнес: процессы, логистика, финансы
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
ПРЕДМЕТНАЯ ОБЛАСТЬВдумчивое ее моделирование позволяет повысить эффективность создания продукта и принимать взвешенные решения на разных уровнях
1. Бизнес: процессы, логистика, финансы
2. Разработка: базы данных, фронтэнд, бекэнд
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
ПРЕДМЕТНАЯ ОБЛАСТЬВдумчивое ее моделирование позволяет повысить эффективность создания продукта и принимать взвешенные решения на разных уровнях
1. Бизнес: процессы, логистика, финансы
2. Разработка: базы данных, фронтэнд, бекэнд
3. Графический дизайн: UI-кит
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
ПРЕДМЕТНАЯ ОБЛАСТЬВдумчивое ее моделирование позволяет повысить эффективность создания продукта и принимать взвешенные решения на разных уровнях
1. Бизнес: процессы, логистика, финансы
2. Разработка: базы данных, фронтэнд, бекэнд
3. Графический дизайн: UI-кит
4. UX и продакт дизайн: сценарии, ML, масштабирование
2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
ПРЕДМЕТНАЯ ОБЛАСТЬ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
Сущности / Concepts
Свойства / Properties
Агенты / Agents
Термины / Terms
Связи / Realtionships
В з А И М О Д Е й С Т В И я
ПРЕДМЕТНАЯ ОБЛАСТЬ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
Сущности / Concepts
Свойства / Properties
Агенты / Agents
Термины / Terms
Связи / Realtionships
В з А И М О Д Е й С Т В И я
М О Д Е Л ь Д А Н Н Ы х
Модель данных это совокупность терминов и принципов, описывающих определенную
предметную область
ОБЩЕЕ ОПРЕДЕЛЕНИЕ 2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
МОДЕЛИРОВАНИЕ ДАННЫХ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
Чтобы построить любую модель, нужно определить границы вселенной, которую она должна описывать, и сформулировать задачи
и области где информация, входящая в ее состав будет использоваться
Определить источники, которые содержат информацию об области, ее сущностях, процессах, агентах
1. Базы данных
2. Сайты организаций / людей
3. Инструменты
4. Существующие модели
ИСТОЧНИКИ2 . 1 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / И з У ч Е Н И Е О б Л А С Т И
Изучение области
1
Моделирование областиключевые сущности и их взаимосвязи
2
МОДЕЛИРОВАНИЕ ДАННЫХ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
Вселенная может состоять, например, из
отобранных согласно определенному набору принципов
ОБЪЕКТОВ
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
И набораВселенная может состоять,
например, из
отобранных согласно определенному набору принципов
ОБЪЕКТОВ СВЯЗАННЫХ СУЩНОСТЕЙ
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
ЛЮД И
создатели, владельцы, пользователи
И набораВселенная может состоять,
например из
отобранных согласно определенному набору принципов
ОБЪЕКТОВ СВЯЗАННЫХ СУЩНОСТЕЙ
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
ОРГА НИзА ц ИИ
музеи, склады, бренды, контрагенты
ЛЮД И
создатели, владельцы, пользователи
И набораВселенная может состоять,
например из
отобранных согласно определенному набору принципов
ОБЪЕКТОВ СВЯЗАННЫХ СУЩНОСТЕЙ
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
СОбЫТИя
продажи, выставки, концерты, исследования
ОРГА НИзА ц ИИ
музеи, склады, бренды, контрагенты
ЛЮД И
создатели, владельцы, пользователи
И набораВселенная может состоять,
например из
отобранных согласно определенному набору принципов
ОБЪЕКТОВ СВЯЗАННЫХ СУЩНОСТЕЙ
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
МЕС ТА
точки продаж, места рождения, событий
СОбЫТИя
продажи, выставки, концерты, исследования
ОРГА НИзА ц ИИ
музеи, склады, бренды, контрагенты
ЛЮД И
создатели, владельцы, пользователи
И набораВселенная может состоять,
например из
отобранных согласно определенному набору принципов
ОБЪЕКТОВ СВЯЗАННЫХ СУЩНОСТЕЙ
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
ИС ТОчНИК И
книги, статьи, сайты
МЕС ТА
точки продаж, места рождения, событий
СОбЫТИя
продажи, выставки, концерты, исследования
ОРГА НИзА ц ИИ
музеи, склады, бренды, контрагенты
ЛЮД И
создатели, владельцы, пользователи
И набора
СВЯЗАННЫХ СУЩНОСТЕЙ
Вселенная может состоять, например из
отобранных согласно определенному набору принципов
ОБЪЕКТОВ
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
Доработка:
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
Доработка:
1. Вынесение наиболее значимых концептов в отдельные сущности и их более подробное описание
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
Доработка:
1. Вынесение наиболее значимых концептов в отдельные сущности и их более подробное описание
Аукционная продажа
Событие
Остальные событиявыставки, исследования, реставрации
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
Доработка:
1. Вынесение наиболее значимых концептов в отдельные сущности и их более подробное описание
2. Разделение сущности на несколько отдельных
Аукционная продажа
Событие
Остальные событиявыставки, исследования, реставрации
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
Доработка:
1. Вынесение наиболее значимых концептов в отдельные сущности и их более подробное описание
2. Разделение сущности на несколько отдельных
Аукционная продажа
Событие
Мес
Адрес
то
Адм. единица
Остальные событиявыставки, исследования, реставрации
названиеадресгород, страна, континент координаты
тип: город, страна, ... названиеродительский термин
+
ВСЕЛЕННАЯ 2 . 2 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е О б Л А С Т И
Моделирование содержаниясвойства ключевых сущностей
4
3
Изучение области
1
МОДЕЛИРОВАНИЕ ДАННЫХ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
Моделирование областиключевые сущности и их взаимосвязи
2
ТРИ ВОПРОСА 2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
А. Как используются данные?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Умные поисковые интерфейсы(автокомплиты, полнотекстовый поиск, фильтрация и сортировка по полям)
А. Как используются данные?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Умные поисковые интерфейсы(автокомплиты, полнотекстовый поиск, фильтрация и сортировка по полям)
Удобство и эффективность контроля качества(автоматическое распознавание отклоняющихся значений, валидация бизнес-правил)
А. Как используются данные?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Умные поисковые интерфейсы(автокомплиты, полнотекстовый поиск, фильтрация и сортировка по полям)
Удобство и эффективность контроля качества(автоматическое распознавание отклоняющихся значений, валидация бизнес-правил)
Тренировка алгоритмов получения данных (автоматическое распознавание нужных текстов, их скрейпинг и парсинг в структурированные поля)
А. Как используются данные?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Умные поисковые интерфейсы(автокомплиты, полнотекстовый поиск, фильтрация и сортировка по полям)
Удобство и эффективность контроля качества(автоматическое распознавание отклоняющихся значений, валидация бизнес-правил)
Обучение алгоритмов получения данных (автоматическое распознавание нужных текстов, их скрейпинг и парсинг в структурированные поля)
Обучение алгоритмов кластеризации (поиск по изображению, рекомендации похожих объектов)
А. Как используются данные?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Умные поисковые интерфейсы(автокомплиты, полнотекстовый поиск, фильтрация и сортировка по полям)
Удобство и эффективность контроля качества(автоматическое распознавание отклоняющихся значений, валидация бизнес-правил)
Обучение алгоритмов получения данных (автоматическое распознавание нужных текстов, их скрейпинг и парсинг в структурированные поля)
Обучение алгоритмов кластеризации (поиск по изображению, рекомендации похожих объектов)
Расчет динамики цен(расчет ценовых индексов, вычисление ценовых коридоров)
А. Как используются данные?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
B. Какие данные нужны?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Определение набора свойств для ключевых сущностей
ОБЪЕКТ
ИСТОЧНИК
СОБЫТИЕ
ЧЕЛОВЕК
МЕСТО
ОРГАНИЗАЦИЯ
автор
длина
тип
название
валюта
имя
материал
роль
куратор
статус
широта
цвет
дата
адрес
цена
редактор
спонсор
ссылка
С В О й С Т В АС У щ Н О С Т И
B. Какие данные нужны?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
С. Как данные получают?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Скрейпинг с сайтов в индустрии(текстовые описания, обычно слабо структурированные, структура отличается от источника к источнику)
С. Как данные получают?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Скрейпинг с сайтов в индустрии(текстовые описания, обычно слабо структурированные, структура отличается от источника к источнику)
Отцифровка аналоговых источников(неструктурированные текстовые описания, полученные методом оптического распознования, с ошибками)
С. Как данные получают?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Скрейпинг с сайтов в индустрии(текстовые описания, обычно слабо структурированные, структура отличается от источника к источнику)
Отцифровка аналоговых источников(неструктурированные текстовые описания, полученные методом оптического распознования, с ошибками)
Подключение к тематическим базам данных (хорошо стркутурированные, общепринятые методы организации и терминология, но небольшие объемы)
С. Как данные получают?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Скрейпинг с сайтов в индустрии(текстовые описания, обычно слабо структурированные, структура отличается от источника к источнику)
Отцифровка аналоговых источников(неструктурированные текстовые описания, полученные методом оптического распознования, с ошибками)
Подключение к тематическим базам данных (хорошо стркутурированные, общепринятые методы организации и терминология, но небольшие объемы)
Ручной ввод(времязатратно и высокая вероятность ошибок)
С. Как данные получают?2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
P 1
P 3
P 7
P 6
P 8
P 9
P 2
V 1.1L 1
V 3.1L 3
V 7.1L 7
V 2.2L 2
V 6.1L 6
V 8.4
V 9.1
L 8.2
L 9 V 9.3
V 6.2
V 8.5
V 9.2
С В О й С Т В А з Н А ч Е Н И я
P 10 V 10.1L 10 V 10.3V 10.2
Л Е й б Л
С У щ Н О С Т ь
ТРИ ВОПРОСА 2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
А. Как данные используются?
В. Какие данные нужны?
С. Как данные получают?
P 1
P 3
P 7
P 6
P 8
P 9
P 2
V 1.1L 1
V 3.1L 3
V 7.1L 7
V 2.2L 2
V 6.1L 6
V 8.4
V 9.1
L 8.2
L 9 V 9.3
V 6.2
V 8.5
V 9.2
С В О й С Т В А з Н А ч Е Н И я
P 10 V 10.1L 10 V 10.3V 10.2
Л Е й б Л
С У щ Н О С Т ь
ТРИ ВОПРОСА 2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
P 1
P 3
P 7
P 6
P 8
P 9
P 2
V 1.1L 1
V 3.1L 3
V 7.1L 7
V 2.2L 2
V 6.1L 6
V 8.4
V 9.1
L 8.2
L 9 V 9.3
V 6.2
V 8.5
V 9.2
С В О й С Т В А з Н А ч Е Н И я
P 10 V 10.1L 10 V 10.3V 10.2
Л Е й б Л
С У щ Н О С Т ь
Отбор в модель релевантных данных высокого качества и реалестичной доступности
А. Как данные используются?
В. Какие данные нужны?
С. Как данные получают?
О Т б О Р В М О Д Е Л ь
Р Е Л Е В А Н Т Н Ы х Д А Н Н Ы хВ Ы С О К О Г О К А ч Е С Т В АР Е А Л И С Т И ч Н О й Д О С Т У п Н О С Т И
=>
СЛЕДСТВИЯ 2 . 4 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / М О Д Е Л И Р О В А Н И Е С О Д Е Р ж А Н И я
Отбор в модель релевантных данных высокого качества и реалестичной доступности требует:
• Определения релевантных свойств для каждой ключевой сущности;
• Скрейпинг и, потенциально, хранения фри-текстовых данных;
• Парсинг фри-текстовых данных в структурированные поля нужного уровня подробности;
• Имплементации контролируемых словарей терминов, использующихся как значения основных свойств.
6
5
Дизайн схемы данныхпринципы организации свойств
Моделирование содержаниясвойства ключевых сущностей
4
3
Изучение области
1
МОДЕЛИРОВАНИЕ ДАННЫХ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
Моделирование областиключевые сущности и их взаимосвязи
2
Полная модель данных состоит из:
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Полная модель данных состоит из: Сущностей представляющих основные концепты(Объект, Событие, Место, Человек, ...)
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Полная модель данных состоит из: Сущностей представляющих основные концепты(Объект, Событие, Место, Человек, ...)
Списка свойств каждой сущности и их структуры(Объект: автор, дата создания, место создания, материал, измерения, ...)
(Измерения: тип, значение, единица измерения, система измерения, ...)
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Полная модель данных состоит из: Сущностей представляющих основные концепты(Объект, Событие, Место, Человек, ...)
Списка свойств каждой сущности и их структуры(Объект: автор, дата создания, место создания, материал, измерения, ...)
(Измерения: тип, значение, единица измерения, система измерения, ...)
Словарей значений (терминов) для каждого из свойств (Единицы измерения: м, метры, футы, feet, mètre, ...)
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Полная модель области состоит из: Сущностей представляющих основные концепты(Объект, Событие, Место, Человек, ...)
Списка свойств каждой сущности и их структуры(Объект: автор, дата создания, место создания, материал, измерения, ...)
(Измерения: тип, значение, единица измерения, система измерения, ...)
Словарей значений (терминов) для каждого из свойств (Единицы измерения: м, метры, футы, feet, mètre, ...)
Взаимосвязей сущностей, свойств и значений (онтологии, сущность-атрибут-значение EAV, etc)
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Они сгруппированы в две конструкции, которые моделируются отдельно:
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Они сгруппированы в две конструкции, которые моделируются отдельно:
Сущности + Свойства + Отношения = Схема
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Они сгруппированы в две конструкции, которые моделируются отдельно:
Сущности + Свойства + Отношения = Схема
Термины + Отношения = Словари
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
МОДЕЛЬ{
ЧТО ТАКОЕ СХЕМА ДАННЫХ?2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Они сгруппированы в две конструкции, которые моделируются отдельно:
Сущности + Свойства + Отношения = Схема
Термины + Отношения = Словари
Какие подходы уже существуют для описания области?
ВЫБОР СХЕМЫ: АНАЛОГИ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Какие подходы уже существуют для описания области?
Онтологические фреймворкиПример: schema.org, dbpedia.org
Принцип: Субъект – Предикат – Объект (RDF)
Плюсы: высокая описательная гибкость
Минусы: свойства не организованы в логические кластеры сложно управлять и разработать единообразные принципы описания
ВЫБОР СХЕМЫ: АНАЛОГИ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
Какие подходы уже существуют для описания области?
Онтологические фреймворкиПример: schema.org, dbpedia.org
Принцип: Субъект – Предикат – Объект (RDF)
Плюсы: высокая описательная гибкость
Минусы: свойства не организованы в логические кластеры сложно управлять и разработать единообразные принципы описания
Категорийные фреймворкиПример: Getty’s Categories for the Description of Works of Art (CDWA)
Принцип: Entity – Attribute – Value (EAV)
Плюсы: свойства сгруппированы в концептуальные блоки описательные принципы четко определены
Минусы: менее гибкая
ВЫБОР СХЕМЫ: АНАЛОГИ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Удобство принципа организации
2. Специфичность для области
3. Признаность сообществом
4. Описание смежных конецптов
5. Проработанная терминология (словари)
ВЫБОР СХЕМЫ: ОРИЕНТИРЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
ОГРАНИЧЕНИЯ СХЕМЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Подробность
2. Полнота описания области
ОГРАНИЧЕНИЯ СХЕМЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Подробность
2. Полнота описания области=>
У пР Ощ ЕНИЕ / УС ЛОж НЕНИЕ С У щ ЕС ТВУ Ющ И х С У щ НОС ТЕй
РАСшИРЕНИЕ Н А б ОРА С У щ НОС ТЕй
Создание тезаврусовсписок терминов, их свойства и связи
78 6
5
Дизайн схемы данныхпринципы организации свойств
Моделирование содержаниясвойства ключевых сущностей
4
3
Изучение области
1
МОДЕЛИРОВАНИЕ ДАННЫХ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
Моделирование областиключевые сущности и их взаимосвязи
2
Список терминовУтверждения об их иерархических взаимосвязяхУтверждения о синонимии (+ переводы)Утверждения о связанных терминах (≠ синонимы)Утверждения о предпочтительности терминовНабор дополнительных свойств (определения, ссылки)
Нестрогий синоним: Словарь
ЧТО ТАКОЕ ТЕЗАВРУС?2 . 8 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / С О з Д А Н И Е Т Е з А В Р У С О В
ТЕЗАУРУСЫ: ОРИЕНТИРЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
ТЕЗАУРУСЫ: ОРИЕНТИРЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Что уже есть? (Примеры: AAT, TGN, ULAN, CONA)
ТЕЗАУРУСЫ: ОРИЕНТИРЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Что уже есть? (Примеры: AAT, TGN, ULAN, CONA)
2. Как организованы статьи и их взаимосвязи?(Синонимы, переводы, иерархии, предпочтительность, мэппинг, определения)
ТЕЗАУРУСЫ: ОРИЕНТИРЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Что уже есть? (Примеры: AAT, TGN, ULAN, CONA)
2. Как организованы статьи и их взаимосвязи?(Синонимы, переводы, иерархии, предпочтительность, мэппинг, определения)
3. Насколько полные?(Краткие/полные словари)
ТЕЗАУРУСЫ: ОРИЕНТИРЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Что уже есть? (Примеры: AAT, TGN, ULAN, CONA)
2. Как организованы статьи и их взаимосвязи?(Синонимы, переводы, иерархии, предпочтительность, мэппинг, определения)
3. Насколько полные?(Краткие/полные словари)
4. Как происходит модерация?(Открытый краудсорс, краудсорс среди специалистов, кураторы)
ТЕЗАУРУСЫ: ОРИЕНТИРЫ2 . 6 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / Д И з А й Н С х Е М Ы Д А Н Н Ы х
1. Что уже есть? (Примеры: AAT, TGN, ULAN, CONA)
2. Как организованы статьи и их взаимосвязи?(Синонимы, переводы, иерархии, предпочтительность, мэппинг, определения)
3. Насколько полные?(Краткие/полные словари)
4. Как происходит модерация?(Открытый краудсорс, краудсорс среди специалистов, кураторы)
5. Откуда еще брать термины?(Несловарные источники: сайты индустрии)
ПРИМЕР СЛОВАРНОЙ СТАТЬИС Л О В А Р И
Единицы измерений
Материалы
Системы счисления
Типы измерений
Техники
Роли
2 . 8 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / С О з Д А Н И Е Т Е з А В Р У С О В
ПРИМЕР СЛОВАРНОЙ СТАТЬИС Л О В А Р И С Л О В А Р ь « Р О Л И »
Единицы измерений
Материалы
Системы счисления
Типы измерений
Техники
Роли
Автор
Водитель
Издатель
Композитор
Космонавт
Художник
Футуролог
Этнограф
2 . 8 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / С О з Д А Н И Е Т Е з А В Р У С О В
ПРИМЕР СЛОВАРНОЙ СТАТЬИС Л О В А Р И С Л О В А Р ь « Р О Л И » С Т А Т ь я « х У Д О ж Н И К »
Единицы измерений
Материалы
Системы счисления
Типы измерений
Техники
Роли
Автор
Водитель
Издатель
Композитор
Космонавт
Художник
Футуролог
Этнограф
ID: [номер термина]
Иерархия: создатель художник акварелист график
Getty ID: [AAT identification number]
Определение: [текстовое описание]
Мэппинг на другие словари
Типы объектов: картины литографии
Области: изящные искусства
Категории искусства: авангард ренессанс
Синонимы и переводы
painter (English, preferred)peintre (French)kunstmaler (German)
2 . 8 С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х / С О з Д А Н И Е Т Е з А В Р У С О В
ФОРМАЛИЗАЦИЯ МОДЕЛИ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
1. Список типов сущностей• Ключевые сущности: объект, человек, организация, событие, источник
• Второстепенные: измерение, премия, заметка (видимые в справочниках и невидимые)
• Словари
ФОРМАЛИЗАЦИЯ МОДЕЛИ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
1. Список типов сущностей• Ключевые сущности: объект, человек, организация, событие, источник
• Второстепенные: измерение, премия, заметка (видимые в справочниках и невидимые)
• Словари
2. Верхнеуровневая схема связей ключевых сущностей
ФОРМАЛИЗАЦИЯ МОДЕЛИ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
1. Список типов сущностей• Ключевые сущности: объект, человек, организация, событие, источник
• Второстепенные: измерение, премия, заметка (видимые в справочниках и невидимые)
• Словари
2. Верхнеуровневая схема для ключевых сущностей
3. Таблицы• Три отдельные для: ключевых сущностей, второстепенных, словарей
• Вкладка = сущность / словарь
• Столбцы сущностей: свойство / тип данных (boolean, string, entity name, vocabulary name, date, url) / тип сущности (entity, voсabulary, data)
• Столбцы словарей: термин / родительский термин / мэппинг на другие словари
ФОРМАЛИЗАЦИЯ МОДЕЛИ2 . С Т Р У К Т У Р И Р О В А Н И Е Д А Н Н Ы х
1. Список типов сущностей• Ключевые сущности: объект, человек, организация, событие, источник
• Второстепенные: измерение, премия, заметка (видимые в справочниках и невидимые)
• Словари
2. Верхнеуровневая схема для ключевых сущностей
3. Таблицы• Три отдельные для: ключевых сущностей, второстепенных, словарей
• Вкладка = сущность / словарь
• Столбцы сущностей: свойство / тип данных (boolean, string, entity name, vocabulary name, date, url) / тип сущности (entity, voсabulary, data)
• Столбцы словарей: термин / родительский термин / мэппинг на другие словари
4. ER (или другие) диаграммы
ВЛИЯНИЕ НА 3 УРОВНЯХ
А. Разработка (удобное проектирование баз данных, бэкенда, логики фронтенда, масштабируемость)
3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т
A. РАЗРАБОТКА3 С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А Т Р Е х У Р О В Н я х
1. Базы данныхКачественно описанные сущности легко кластеризовать по типам, характеризующимся одним набором свойств и связей
= > оптимизация количества и структуры таблиц сущностей и таблиц-связей в базе
A. РАЗРАБОТКА3 С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А Т Р Е х У Р О В Н я х
1. Базы данныхКачественно описанные сущности легко кластеризовать по типам, характеризующимся одним набором свойств и связей
= > оптимизация количества и структуры таблиц сущностей и таблиц-связей в базе
2. Бекэнд и фронтэндНаглядная логика связей между сущностями, логика поведения отдельных их свойств становится более явной
=> унификация кода и алгоритмов
A. РАЗРАБОТКА3 С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А Т Р Е х У Р О В Н я х
1. Базы данныхКачественно описанные сущности легко кластеризовать по типам, характеризующимся одним набором свойств и связей
= > оптимизация количества и структуры таблиц сущностей и таблиц-связей в базе
2. Бекэнд и фронтэндНаглядная логика связей между сущностями, логика поведения отдельных их свойств становится более явной
=> унификация кода и алгоритмов
3. МасштабируемостьНаглядно описанная область дает возможность, во-первых, приоритизировать внедрение тех или иных сущностей, во-вторых, легко добавлять новые сущности, используя уже реализованные типовые шаблоны
ВЛИЯНИЕ НА 3 УРОВНЯХ
А. Разработка (удобное проектирование баз данных, бэкенда, логики фронтенда, масштабируемость)
B. Графический дизайн(UI-kit и масштабируемость)
3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т
1. Стилистическая логика страниц• Стилистическая унификация страниц одного типа сущностей: «выставка» и «концерт» будут
выглядеть похоже, так как оба — «событие»;
• Стилистическая унификация страниц, выполняющих одну функцию: редактирование, создание, просмотр;
• Стилистические различия страниц разных типов сущностей: страницы типа «объект», отличные от страниц типа «событие».
B. ГРАФИЧЕСКИЙ ДИЗАЙН3 С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А Т Р Е х У Р О В Н я х
1. Стилистическая логика страниц• Стилистическая унификация страниц одного типа сущностей: «выставка» и «концерт» будут
выглядеть похоже, так как оба — «событие»;
• Стилистическая унификация страниц, выполняющих одну функцию: редактирование, создание, просмотр;
• Стилистические различия страниц разных типов сущностей: страницы типа «объект», отличные от страниц типа «событие».
2. МодульностьЧетко описанные сущности позволяют создать сиситему шаблонов их отображения с возможностью их использования в разных контекстах: страница, виджет в контексте другой старницы, модальности.
B. ГРАФИЧЕСКИЙ ДИЗАЙН3 С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А Т Р Е х У Р О В Н я х
1. Стилистическая логика страниц• Стилистическая унификация страниц одного типа сущностей: «выставка» и «концерт» будут
выглядеть похоже, так как оба — «событие»;
• Стилистическая унификация страниц, выполняющих одну функцию: редактирование, создание, просмотр;
• Стилистические различия страниц разных типов сущностей: страницы типа «объект», отличные от страниц типа «событие».
2. МодульностьЧетко описанные сущности позволяют создать сиситему шаблонов их отображения с возможностью их использования в разных контекстах: страница, виджет в контексте другой старницы, модальности.
3. Унификация UI элементовПодробно продуманные свойства, для которых понятен тип данных, количество значений, влияние на значения других свойств, позволяют сгруппировать их по аналогии и использовать в каждом случае один тип UI элементов.
B. ГРАФИЧЕСКИЙ ДИЗАЙН3 С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А Т Р Е х У Р О В Н я х
ВЛИЯНИЕ НА 3 УРОВНЯХ
А. Разработка (удобное проектирование баз данных, бэкенда, логики фронтенда, масштабируемость)
B. Графический дизайн(UI-kit и масштабируемость)
C. UX и продакт дизайн(понятные интерфейсы, чистые пользовательские данные, умные рекомендательные системы, machine learning)
3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т
Умные поисковые интерфейсы(автокомплиты, полнотекстовый поиск, фильтрация и сортировка по полям)
Удобство и эффективность контроля качества(автоматическое распознавание отклоняющихся значений, валидация бизнес-правил)
Обучение алгоритмов получения данных (автоматическое распознавание нужных текстов, их скрейпинг и парсинг в структурированные поля)
Обучение алгоритмов кластеризации (поиск по изображению, рекомендации похожих объектов)
Рассчет динамики цен(рассчет ценовых индексов, вычисление ценовых коридоров)
C. UX И ПРОДАКТ ДИЗАЙН3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А Т Р Е х У Р О В Н я х
К А К И С п О Л ь з У Ю Т С я Д А Н Н Ы Е ?
А. Умный поиск3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
The British Museum: структура данных
А. Умный поиск3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
The British Museum: структура данных =>• полнотекстовый поиск
• фильтрация и сортировка по полям
• автокомплит
А. Умный поиск3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
McMaster-Carr: структура данных =>• фильтрация и сортировка по полям
А. Умный поиск3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
Carto Builder: структура данных =>• фильтрация и отображение
В. Контроль качества3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
Collectrium, примеры из стока: структура данных =>• автоматическое распознавание отклоняющихся значений
• контроль вводимых данных
• валидация бизнес-правил
С. Алгоритмы скрейпинга3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
Channelkit, Clara: структура данных =>• автоматическое распознавание нужных текстов
• их скрейпинг и парсинг в структурированные поля
D. Алгоритмы кластеризации3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
Amazon, Google image search: структура данных =>• рекомендации похожих или комплиментарных объектов
• поиск по изображению
D. Предсказание цен3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т / В Л И я Н И Е Н А 3 У Р О В Н я х / U X И п Р О Д А К Т Д И з А й Н
Artprice, Airhint: структура данных =>• рассчет ценовых индексов
• вычисление ценовых коридоров
СТРУКТУРА ДАННЫХ
1. Дизайн и разработка осознаннее
2. Базовый функционал удобнее
3. Пользовательские данные чище
4. Масштабируемость
5. «Магия»: ML надстройки (предсказания, рекомендации)
=>
3 . С Т Р У К Т У Р А Д А Н Н Ы х И п Р О Д У К Т
ССЫЛКИ1. LS / WIAD 2017(ссылки на источники, упомянутые в презентации и релевантные статьи)
2. IA Miscellaneous(подборка разной информации про информационную архитектуру: книги, статьи, люди, события)
3. LS / Notes(подборка моих около информационно-архитектурных заметок)
ЛАРА СИМОНОВАПроекты
• Patrn (таск-менеджер для анимационной студии)
• Campus (образовательный проект рамках «Мастерской» Димы Барбанеля при поддержке Яндекс)
• Textr (текстовый конструктор для издательства)
• Почта России (подписное агентство, почта id, портал, электронные заказные письма)
• Channelkit (инструмент для организации знаний)
• Collectrium, the Christie’s Company (отдел анализа данных аукционного дома)
Контакты• Facebook: Lara Simonova
• Upwork / Behance / Linkedin
• E-mail: [email protected]