Владимир Владимирович Писляков
DESCRIPTION
РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТР ИЧЕСКИЕ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке. Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва - PowerPoint PPT PresentationTRANSCRIPT
РАСПРЕДЕЛЕНИЕ РАСПРЕДЕЛЕНИЕ БРЭДФОРДАБРЭДФОРДА
И И ПОДОБНЫЕ ПОДОБНЫЕ ЕМУЕМУ
ИНФОМЕТРИНФОМЕТРИЧЕСКИЕ ИЧЕСКИЕ ЗАКОНЫЗАКОНЫ
на примере статистики использованияэлектронных ресурсов в университетской библиотеке
Владимир Владимирович Писляков
нач. отдела информационных системи электронных ресурсов библиотеки ГУ-ВШЭ, Москва
http://[email protected]
SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005
Academic Search PremierBusiness Source PremierHealthSourceMasterFILE PremierNewspaper Source
ABI/INFORM GlobalAcademic Research LibraryProQuest ComputingProQuest Education CompleteProQuest Psychology JournalsSocial Science Plus
Arts & Sciences IArts & Sciences IIBusiness CollectionLanguage & Literature Collection
EBSCOEBSCOhosthost::
ProQuest:ProQuest:
JSTOR:JSTOR:
Ресурсы, включенные в статистику использования-2004
ScienceDirect:ScienceDirect:Business, Management and AccountingEconomics, Econometrics and FinanceSocial Sciences
Электронные журналы:статистика использования в ГУ-ВШЭ, 2004 г.
число полнотекстовых
изданий
изданий, к полным текстам которых были обращения
доля востребованных
изданий
EBSCO 11000 1105 10%
JSTOR 410 306 75%
ProQuest 3700 1452 39%
ScienceDirect 310 236 76%
всего 13400 2592 19%
Электронные журналы:статистика использования в ГУ-ВШЭ, 2004 г.
открыто полнотекстовых
статей
EBSCO 6374
JSTOR 17534
ProQuest 10333
ScienceDirect 7719
всего 41960
Статистика использования эл. журналов: представление
Закон Брэдфорда: формулировка
Bradford S. C. Sources of information on specific subjects // Engineering. 1934. Vol. 137. P. 85–86.
Bradford S. C. Documentation. London: Crosley Lockwood, 1948 (Washington: Public Affairs Press, 1950).
429 статейв 9 журналах
499 статейв 59 журналах
404 статьив 258 журналах
Law
ani S
. M. B
radford’s Law
and the Literature of
agriculture // International Library R
eview. 1973. V
ol. 5. P
. 341–350.
26 журналов — 13987 статей
139 журналов — 13975 статей
2427 журналов — 13998 статей
139 : 26 = 5,3
2427 : 139 = 17,5
3,5 33 журнала в «ядре»
Закон Брэдфорда: проверка на статистике ГУ-ВШЭ
Закон Брэдфорда: проверка на статистике ГУ-ВШЭ
y = –159x3 + 2081x2 – 1461x + 2332
y'' = – 954x + 4162
y'' = 0 при x = 4,36
4,36 78 журналов в «ядре»
Ядро из 78-ми журналов: анализ по базам данных
число полнотекстовых
изданий
изданий из ядраГУ-ВШЭ
изданий из ядра, читаемых только из
данного ресурса
EBSCO 11000 48 2
JSTOR 410 46 2
ProQuest 3700 46 2
ScienceDirect 310 17 17
Закон Леймкулера: формулировка
Leimkuhler F. F. The Bradford Distribution // Journal of Documentation. 1967. Vol. 23. P. 197–207.
Y = A ln(1 + BN)
Y — число статей в N наиболее продуктивных журналах;A и B — некоторые коэффициенты
Для нормированных величин:
Y = ln(1 + βx) / ln(1 + β)
Y — доля от общего числа статей в доле x наиболее продуктивных журналов;β — «коэффициент концентрации»
2500
42000
0 журналы
статьи
1
1
0 доляжурналов
долястатей
кривая Леймкулера:
Используем нелинейную регрессию и пытаемся, подбирая коэффициент β, приблизить наш график кривой, которая подчиняется закону Леймкулера.
Закон Леймкулера: проверка на статистике ГУ-ВШЭ
нелинейная регрессияисходные данные
β 5860
Найдем площадь под кривой Леймкулера:
S = Y(x) dx =
= [ln(1 + βx) / ln(1 + β)] dx =
= 1 + 1/β – 1/ln(β+1)
S(β) возрастающая функция и S(β0) 0,5 S(β) 1
Для нашего случаяS(5860) = 0,885.
Закон Лотки: формулировка
Lotka A. J. The Frequency Distribution of Scientific Productivity // Journal of the Washington Academy of Sciences. 1926. Vol. 16. P. 317–323.
n = A / x , 2
n — количество учёных, опубликовавших x статей;A — некоторый коэффициент
В логарифмическом виде:ln n = – ln x + K
статьи
ученые
ln (статьи)
ln (ученые)
Приложение закона к статистике использования электронных ресурсов: Найдем, из скольких журналов n было прочитано пользователями ровно x статей.
Закон Лотки: проверка на статистике ГУ-ВШЭ
нескорректированные данные скорректированные данные
ln (журналов)
ln (статей)
Закон Лотки выполняется, причем
= 1,7
n = A / x = A / x
1,7
Закон Ципфа: формулировка
Zipf G. K. The Psycho-biology of Language. Boston: Houghton, 1935.
Zipf G. K. Human Behaviour and the Principle of Least Effort. Reading: Addison-Wesley, 1949.
r x f = const
r — порядковый номер слова (в порядке убывания частоты);f — количество употреблений слова
В обобщенном виде: ln r + ln f = const, 1
(обычно закон Ципфа плохо выполняется для верхних позиций рейтинга слов)
Приложение закона к статистике использования электронных ресурсов: Найдем зависимость между рангом журнала в упорядоченном списке востребованности изданий и количеством прочитанных из него статей.
Закон Ципфа: проверка на статистике ГУ-ВШЭ
Закон Ципфа выполняется
удовлетворительно и
= 1,3
f x r 1,3 = const
ln (статей)
ln (место в рейтинге)
Pareto V. Cours d’Économie Politique. Vol. 2. Lausanne: 1 Université de Lausanne, 1897.
Lorenz M. O. Methods of measuring the concentration of wealth // Publications of the American Statisical Association. 1905. Vol. 9. P. 209–219«Plot along one axis cumulated percents of the population from poorest to richest, and along the other the percent of the total wealth held by these percents» (p. 217)
Gini C. Variabilità e mutabilità // Memori di Metodologia Statistica. Vol. 1. Rome, 1912. P. 211–382.
— беднейшие 20% населения получают 7% общего национального дохода
— беднейшие 40% населения получают 18% общего национального дохода
— беднейшие 60% населения получают 32% общего национального дохода
— беднейшие 80% населения получают 52% общего национального дохода
— беднейшие 100% населения (т.е. всё население) получают 100% общего национального дохода (весь доход)
Принцип Парето, кривая Лоренца, индекс Джини
Кривая Лоренца–Леймкулера
Приложение закона к статистике использования электронных ресурсов: на 20% электронных журналов приходится 80% всех загрузок полнотекстовых статей
Принцип Парето: проверка на статистике ГУ-ВШЭ
процент журналов, содержащих 80% загруженных статей
EBSCO 28%JSTOR 18%
ProQuest 31%ScienceDirect 25%
EBSCO + ProQuest 27%EBSCO + ProQuest + ScienceDirect 22%
все ресурсы совокупно 14,7%
Кривая Лоренца-Леймкулера и индекс Джинипо статистике ГУ-ВШЭ
% журналов
% прочитанныхстатей
SобщSобщ = 0,902 G= (Sобщ – 0,5) : 0,5
= 0,8
Bookstein A. Informetric Distributions, part I: Unified Overview // Journal of the American Society for Information Science. 1990. Vol. 41. P. 368–375.
Garfield E. Bradford’s Law and Realted Statistical Patterns // Current Contents. 1980. No. 19, 12 May.
Egghe L. Type/Token-Taken Informetrics // Journal of the American Society for Information Science and Technology. 2003. Vol. 54. P. 603–610.
Egghe L., Rousseau R. A proposal to define a core of a scientific subject: A definition using concentration and fuzzy sets // Scientometrics. 2002. Vol. 54. No. 1. P. 51–62.
Burrell Q. Defining a core: Theoretical observations on the Egghe-Rousseau proposal // Scientometrics. 2003. Vol. 57. No. 1. P. 75–92.
Библиография
РАСПРЕДЕЛЕНИЕ РАСПРЕДЕЛЕНИЕ БРЭДФОРДАБРЭДФОРДА
И И ПОДОБНЫЕ ПОДОБНЫЕ ЕМУЕМУ
ИНФОМЕТРИНФОМЕТРИЧЕСКИЕ ИЧЕСКИЕ ЗАКОНЫЗАКОНЫ
на примере статистики использованияэлектронных ресурсов в университетской библиотеке
Владимир Владимирович Писляков
нач. отдела информационных системи электронных ресурсов библиотеки ГУ-ВШЭ, Москва
http://[email protected]
SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005