Наумова В.В., Дальневосточный геологический институт...

19
Использование Использование web web -метрики для -метрики для исследования информационного исследования информационного пространства пространства Дальневосточного отделения Дальневосточного отделения РАН РАН Наумова В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток Владивосток, 2011 г.

Upload: miron

Post on 20-Mar-2016

89 views

Category:

Documents


1 download

DESCRIPTION

Использование web -метрики для исследования информационного пространства Дальневосточного отделения РАН. Наумова В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток. Владивосток, 2011 г. Научные сайты. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Использование Использование webweb-метрики -метрики для исследования для исследования информационного информационного

пространства пространства Дальневосточного отделения Дальневосточного отделения

РАНРАН Наумова В.В., Дальневосточный геологический

институт ДВО РАН, г.ВладивостокВладивосток, 2011 г.

Page 2: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Научные сайтыНаучные сайты

Наряду с традиционными источниками информации для ученых представляют интерес web -сайты научной тематики. Поиск по этим сайтам открывает перед учеными возможность получения оперативных сведений о научных исследованиях институтов, университетов, научных лабораторий, групп и отдельных ученых.

Классификация научных сайтов:• Официальные сайты институтов, университетов и научных

организаций, научных лабораторий, групп и отдельных ученых;• Научные электронные библиотеки, в том числе и сайты научных

журналов;• Центры хранения данных, научные информационные системы,

ГИС-порталы;• Научные тематические ресурсы;• Научно-популярные ресурсы;• Каталоги научных ресурсов.

Page 3: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Доступ к научной информации в Доступ к научной информации в глобальной сети Интернетглобальной сети Интернет

Доступ к информации глобальной сети Интернет для пользователей осуществляется, в основном, с помощью поисковых систем. Наличие высоких рейтинговых оценок для сайта очень важно с точки зрения его более высокой доступности широкой аудитории пользователей Интернет, поскольку рейтинговые оценки используют практически все поисковые системы. Наличие рейтинговых систем для сайтов, разрабатываемых и применяемых крупными поисковиками: Google, Yandex и др. при выдаче результатов поиска пользователям Интернет позволяет пользователям всего мира быстрее находить наиболее качественную и отвечающую запросу информацию. Результаты запросов пользователей сортируются поисковыми машинами и предоставляются пользователям в порядке уменьшения их рейтингов. Таким образом, наличие высоких рейтингов ставит сайт в лучшее положение по отношению к другим сайтам.

Одной из важнейших задач Дальневосточного отделения РАН на сегодняшнем этапе является разработка и развитие высоко рейтинговых научных Интернет-ресурсов. Этими исследованиями мы намереваемся дать дополнительный стимул для значительно более профессионального научного присутствия Дальневосточного отделения РАН в Интернет.

Page 4: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

WEBWEB-метрика-метрика• Работа выполнялась методами web-метрики — раздела

информатики, в котором исследуются количественные аспекты конструирования и использования информационных ресурсов, структур и технологий применительно к World Wide Web.

• Современную web-метрическую методологию исследований сайтов научных организаций мира представляют результаты Киберметрической лаборатории Центра научной информации и документации Национального исследовательского совета Испании.

Ranking Web of World Research Centers. http://research.webometrics.info

• В этой же методологии с незначительными изменениями проводится регулярный анализ сайтов Сибирского отделения РАН.

Шокин Ю.И., Клименко О.А., Рычкова Е.В., Шабальников И.В. Рейтинг сайтов научных организаций СО РАН // Вычислительные технологии. 2008. Т. 13. № 3. С. 128-135

• Также можно отметить Вебометрические исследования Web-сайтов университетов России

Печников А.А. Вебометрические исследования Web-сайтов университетов России//Информационные технологии, 2008, №11

Page 5: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Подходы и методики Cybermetrics LabПодходы и методики Cybermetrics Lab Для построения алгоритмов ранжирования сайтов задаются следующие 4

индикатора: • количество уникальных гипертекстовых ссылок с других ресурсов (V –

visibility, цитируемость), • общее количество страниц сайта (S – size, размер), • количество полнотекстовых файлов, под которыми понимаются файлы с

расширениями pdf, ps, doc, xls, ppt и rtf (R - "rich files" ), • количество статей, размещенных на сайте и их цитирований (Sc – scholar,

«научность сайта»).

Индикатор S измеряется с использованием поисковых машин Google, Yahoo, Live Search and Exalead, индикатор V - Yahoo Search, Live Search и Exalead, индикатор R – Google, а индикатор Sc - Google Scholar. Результирующие значения для S и V определяются как сумма результатов замеров, причем в первом случае минимальное и максимальное значение отбрасываются. Затем по каждому из критериев сайты ранжируются по убыванию соответствующего параметра. По каждому индикатору производится ранжирование сайтов по убыванию значений соответствующих индикаторов. Для обозначения ранга по заданному индикатору используются обозначения RankV, RankS, RankR и RankSc, соответственно (наивысший ранг равен 1). Интегральный показатель, называемый «вебометрическим рангом» (WR - Webometrics Rank), получается в результате ранжирования суммы рангов, умноженных на коэффициенты:

Webometrics Rank (position) = 4*RankV+2*RankS+1*RankR+1*RankSc.

Исходя из значений коэффициентов, можно сделать вывод о том, что наибольшая значимость придается размещенным на сайте полнотекстовым файлам, статьям и их цитированию другими сайтами, что соответствует принципам Открытого доступа, когда интернет рассматривается в первую очередь как средство функционального объединения глобальной базы научных знаний [4]. Следующим по значимости является число страниц на сайте, а затем - количество гипертекстовых ссылок на сайт с других ресурсов, позволяющее, по мысли испанских коллег, оценить актуальность и значимость сайта для профессионального сообщества.

Page 6: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Основные задачи Основные задачи проведенного анализапроведенного анализа

1. Определение ресурсов, на которых расположены сайты ДВО РАН?2. Определение web-активности по научным центрам Отделения .3. Определение web-активности по основным научным направлениям.4. Анализ временной устойчивости сайтов ДВО РАН.5. Ранжирование сайтов ДВО РАН на разных множествах:

– мировых научных сайтов, – научных сайтах РФ, – сайтах РАН, – сайтах ДВО РАН.

6. Определение свойств и характеристик научных сайтов ДВО РАН, которые определяют их рейтинги в Интернет?

7. Анализ временной динамики сайтов ДВО РАН.

Page 7: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Целевое множество анализаЦелевое множество анализа

• В анализе Информационного пространства ДВО РАН участвовали все сайты, которые были найдены с использованием трех Каталогов ресурсов ДВО РАН, размещенных официальном сайте Президиума ДВО РАН http://www.febras.ru и на двух других ресурсах: Базовой сети ДВО РАН (ИАПУ ДВО РАН) http://www.dvo.ru и Информационном сервере Дальневосточного геологического института ДВО РАН http://www.fegi.ru.

• В Целевое множество аналиа включены: все сайты, расположенные на доменах второго и третьего уровня, за исключением доменов второго уровня, на которых осуществляется хостинг посторонних для данной организации сайтов: http://www.febras.ru и http://www.dvo.ru

Page 8: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Единица анализаЕдиница анализаCybermetrics Lab отмечает серьезные проблемы с точным определением того,

что понимать под «единицей анализа». Например, многие учреждения поддерживают несколько различных доменных областей. Таким образом, их реальное присутствие в Сети на самом деле должно определяться множеством адресов. Кроме того, различные подразделения одной организации могут иметь собственные Интернет-ресурсы с адресами, не ассоциируемыми поисковыми машинами с адресом основного сайта.

Если говорить об Интернет-ресурсах институтов РАН в целом, то они представляют собой сложный информационный комплекс. Как правило, в этом комплексе имеется официальный сайт института, а также независимые сайты лабораторий, научных журналов, электронных библиотек, страницы научных сотрудников, информационные системы, ГИС-порталы, сайты конференций, семинаров, тематические ресурсы и т.д.

В описываемом исследовании «единицей анализа» является вся совокупность web-ресурсов института/организации. Нами предложен метод, позволяющий объединять в анализе ресурсы одной организации.

Объединением множеств A и B называется множество элементов, принадлежащих по крайней мере одному из данных множеств (т. е. либо A, либо B, либо одновременно и A и B).

Page 9: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Результаты проведенного анализаРезультаты проведенного анализа В данном докладе представлены результаты анализа сайтов Дальневосточного отделения РАН, проведенные автором в 2009 г. и в августе 20011 г.

Результаты исследования 2009 года представлены в статье:Ханчук А.И, Наумова В.В. Информационное пространство Дальневосточного отделения РАН//Вестник ДВО РАН, 2009, №4, стр. 122-130

Page 10: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

IPIP-хостинг сайтов ДВО РАН-хостинг сайтов ДВО РАН

0

5

10

15

20

25

30

35

Кол-

во с

айто

в

ИПМТ ИГИП Внешниепровайдеры

ИАПУ

IP-хостинг

Результаты анализа 2009 г. По оси Х-владельцы IP-хостинга для сайтов Дальневосточного отделения РАН, по оси Y-количество

сайтов.

Page 11: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

WebWeb-активност-активностьь по научным центрам по научным центрам ОтделенияОтделения

0

0,5

1

1,5

2

2,5

Норм

иров

анно

е ко

личе

ство

сай

тов

АмурНЦ СахНЦ ХНЦ СВНЦ КНЦ ПримНЦ

Научные центры ДВО РАН

Результаты анализа 2009 г. По оси X – научный центр, по оси Y – кол-во сайтов в научном центре, нормированное на количество

институтов в научном центре.

Page 12: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

WebWeb-активност-активностьь по по основным основным научнымнаучным направлениямнаправлениям

0

5

10

15

20

25

30

35

обществ

енные н

ауки

химия и

науки

о мат

ериа

лах

историко

-филологи

ческ

ие нау

ки

управ

ление

информац

ионны

е тех

нологии

техн

ическ

ие нау

ки

физ-м

ат.нау

ки

биологи

чески

е нау

ки

науки

о земле

Результаты анализа 2009 г. По оси X- научные направления, по оси Y-кол-во сайтов.

Page 13: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Анализ временной устойчивости сайтов Анализ временной устойчивости сайтов ДВО РАНДВО РАН

0

2

4

6

8

10

12

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82

Результаты анализа 2009 г. Продолжительность «жизни» сайтов ДВО РАН. По оси X-номера отсортированных по возрасту сайтов. По оcи Y- возраст

сайтов. В Отделении 6 долгоживущих сайтов. Продолжительность их присутствия в Интернет более 10 лет. Это официальный сайт Президиума http://www.febras.ru; два сайта ДВГИ: Информационный сервер ДВГИ http://www.fegi.ru, Региональный портал «Приморский край России» http://www.fegi.ru/primorye,; три ТОИ: Официальный сайт ТОИ http://www.poi.dvo.ru, ИС «Океанография и состояние морской среды Дальневосточного региона России» ТОИ http://www.pacificinfo.ru, Архив электронных научных публикаций InfoNet ТОИ http://infonet.dvo.ru .

Page 14: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Ранжирование, проведенное автором, на Ранжирование, проведенное автором, на множестве научных сайтов ДВО РАНмножестве научных сайтов ДВО РАН

Место в рейтинге Дальневосточного отделения РАН, 2009 г.

1. Дальневосточный геологический институт http://www.fegi.ru 2. Базовая сеть ДВО РАН http://www.dvo.ru 3. Официальный сайт Президиума http://www.febras.ru 4. Институт экономических исследований http://www.ecrin.ru 5. Камчатский филиал Тихоокеанского института географии

http://www.terrakamchatka.org 6. Биолого-почвенный институт http://www.biosol.ru 7. Амурская научная сеть http://www.ascnet.ru 8. Камчатский научный центр http://www.kscnet.ru 9. Институт морской геологии и геофизики http://www.imgg.ru 10.Институт машиноведения и металлургии http://www.imim.ru 11.Институт комплексного анализа региональных проблем http://www.ikarp.ru 12.Институт космофизических исследований и распространения радиоволн

http://www.ikir.ru 13.Уссурийская астрофизическая обсерватория http://www.uafo.ru 14.Ботанический сад-институт http://www.botsad.ru

Ранжирование сайтов ДВО РАН, 2011 г. находится на стадии счета. Результаты ранжирования будут доступны в статье по итогам этой Конференции

Page 15: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Ранжирование мировых научных сайтовРанжирование мировых научных сайтовКатегория «Категория «НАУЧНЫЕ САЙТЫ РФНАУЧНЫЕ САЙТЫ РФ»

по информации по информации Cybermetrics Lab. ИCybermetrics Lab. Июль 2011 г.юль 2011 г.

WORLD RANK (место в мировом рейтинге)

54 Russian Academy of Sciences Siberian Branch 102 Russian Academy of Sciences 197 Joint Institute for Nuclear Research 241 State Institute of Information Technologies and Telecommunications 331 Space Research Institute RAS …1569 Russian Academy of Sciences Far Eastern Branch …1979 Institute for Automation and Control Processes RAS…

For each country only the research centers ranked below the 2,500th position are included

В рейтинг входят 4000 мировых научных сайтов

Page 16: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Ранжирование мировых научных сайтовРанжирование мировых научных сайтов Категория « Категория « САЙТЫ РАНСАЙТЫ РАН»

по информации по информации Cybermetrics LabCybermetrics Lab на июль 2011 г. на июль 2011 г.RANKING (место в рейтинге РАН)1 Russian Academy of Sciences Siberian Branch …29 Russian Academy of Sciences Far Eastern Branch 33 Institute for Automation and Control Processes RAS 46 Far East Geological Institute RAS 66 Pacific Oceanology Institute RAS 74 Institute of Biology and Soil Sciences RAS 78 Institute of Cosmophysical Researches and Radio Wave Propagation RAS 92 Institute of Marine Biology AV Zhirmunskogo RAS93 Institute of Marine Geology and Geophysics RAS 94 Central Scientific Library Far Eastern Branch of the Russian Academy

of Sciences98 Economic Research Institute RAS 99 Institute of Marine Technology Problems RAS 104 Pacific Institute of Geography RAS 108 Institute of Applied Mathematics RAS 118 Institute of History, Archeology and Ethnography RAS119 International Scientific Center Arktika RAS121 Gornotaezhnaya Research Station RAS

В категорию входят 124 института и организации РАН, в том числе 16 сайтов ДВО РАН

Page 17: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Проведенный анализ Информационного пространства Проведенный анализ Информационного пространства Дальневосточного отделения РАН позволяет Дальневосточного отделения РАН позволяет

сформулировать некоторые предложения для его сформулировать некоторые предложения для его дальнейшего развитиядальнейшего развития

i. Создание централизованного сегмента Дальневосточного отделения РАН в Интернет

Официальный сайт Президиума ДВО РАН http://www.febras.ru не несет в себе роли централизованного коммуникатора научных ресурсов Отделения в Интернет.

На наш взгляд, необходимо создание по крайней мере двух централизованных ресурсов в Дальневосточном отделении РАН: Научного информационного портала ДВО РАН и Электронной библиотеки ДВО РАН, которые помимо своих информационных функций взяли бы на себя роль www-коммуникаторов Отделения.

ii.Проведение работ по увеличению рейтинговых оценок сайтов ДВО РАН в Интернет

Наличие домена второго уровня для сайта - необходимое условие для его продвижения в Интернет. Многие исследователи Интернет также утверждают, что наличие в имени домена ключевого слова резко повышает шансы на рост рейтинговых оценок.

Временная устойчивость сайта (длительное время жизни, неизменность имени и адреса сайта) – также важное условие для достижения популярности сайта в Интернет в Интернет.

Наличие большого количества уникальных научных материалов – необходимая характеристика научного сайта.

Page 18: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

Проведенный анализ Информационного пространства Проведенный анализ Информационного пространства Дальневосточного отделения РАН позволяет Дальневосточного отделения РАН позволяет

сформулировать некоторые предложения для его сформулировать некоторые предложения для его дальнейшего развитиядальнейшего развития

Здесь же необходимо отметить еще одну характеристику: периодичность обновления информации сайта. Именно она является тем условием, которое привлекает на сайт постоянных посетителей, тем самым, способствуя увеличению рейтинговых оценок сайта в поисковых системах. Статичные сайты быстро теряют свою популярность.

Высокая степень рекламы сайта в Интернет – еще одно важное

условие для увеличения Интернет - популярности сайтов. Причем важно обозначить свое присутствие не только в глобальных Каталогах и в БД поисковых машин, но и в научных каталогах, на сайтах близких по направлениям научных организаций, и др., что дает большое количество ссылок, в том числе и с высоко рейтинговых сайтов

Необходимость проведения работ по увеличению количества

проиндексированных страниц. Непрерывность и безотказность работы сервера в Интернет и

высокая скорость ответа сервера на запросы пользователей- очевидная характеристика любого Интернет-сайта.

Page 19: Наумова  В.В., Дальневосточный геологический институт ДВО РАН, г.Владивосток

СПАСИБО ЗА ВНИМАНИЕ!СПАСИБО ЗА ВНИМАНИЕ!