Наукометричні показники

Проблемою оцінки науковців займається наукометрія - область наукознавства, що займається статистичними дослідженнями структури і динаміки наукової інформації.

Наукове співтовариство дозволяє позиціюнувати вчених, дослідницькі центри (наприклад, лабораторії, кафедри, тимчасові творчі колективи та ін), наукові організації (ВНЗ, НДІ) в локальній та світовій наукових системах. Наукометричний аналіз цих об'єктів дає можливість оцінювати внесок дослідників як виробників інформації в світовий інформаційний масив, вивчати взаємозв'язки між окремими спільнотами.

Аналіз наукових знань дозволяє виявляти області, що швидко розвиваються, віддалені перспективи технологічних проривів, отримувати деякі уявлення про внутрішню структуру наукових досліджень, виявляти ті що зароджуються та перспективні напрямки і ухвалювати рішення для підтримки даних напрямків.

Часто наукометричні показники групують наступним чином: кількісні показники активності наукової діяльності (НД), якісні показники впливу публікацій на інформаційний масив і комплексні показники, що враховують кількісні та якісні критерії оцінки НД.

Ключовими показниками результатів НД для визначення рейтингу наукових установ і рейтингу вчених є:

Загальна кількість публікацій

Загальна кількість публікацій або кількість проіндексованих робіт (аналог списку наукових праць) - найбільш узагальнений показник, який отримується з бібліографічних баз систем цитування. Представляє суму публікацій автора, які були проіндексовані базою.

Індекс цитування (індекс цитованості) публікацій

Кількісні дані про цитування публікацій відображають їхню корисність для інших учених. Самі по собі ці дані не вимірюють якість публікації, тому їх варто розглядати як індикатори, що показують, що дана робота з тим або іншим ступенем імовірності може виявитися досить значимою. Підрахунок цитування розширює можливості бібліометричних оцінок разом й у сукупності з іншими показниками.

Індекс цитування наукових статей (ІЦ) - реферативна база тих наукових публікацій, що індексує посилання, вказані в пристатейних списках цих публікацій і що надає кількісні показники цих посилань (такі як сумарний об'єм цитування, індекс Хирша та ін.)

ІЦ науковця є основним показником, що позначає повну кількість посилань на роботи, де даний дослідник фігурує як автор або співавтор, в інших джерелах, розподілене по роках. Індекс цитування – широко прийнятий у науковому світі показник «значимості» праць конкретного вченого, а саме:

  1. індекс характеризує ступінь актуальності й важливості проведених досліджень для тих областей знань, у яких працюють конкретні вчені або наукові колективи;
  2. високий індекс цитування деякою мірою служить офіційним визнанням конкретного вченого науковим співтовариством і підтвердженням його пріоритету;
  3. наявність у науково-освітній організації учених, що мають високий індекс цитування, говорить про високу ефективність і результативність діяльності організації в цілому.

Перший індекс цитування був пов'язаний з юридичними посиланнями і датується 1873 р. (Shepard's Citations). У 1960 інститут наукової інформації (ISI), заснований Євгенієм Гарфилдом, ввів перший індекс цитування для статей, опублікованих в наукових журналах, поклавши початок такому ІЦ, як "Science Citation Index (англ.) ", і потім включивши в нього індекси цитування по громадських науках ("Social Sciences Citation Index", SSCI) і мистецтвах ("Arts and Humanities Citation Index", AHCI). Починаючи з 2006 р. з'явилися і інші джерела подібних даних, наприклад Google Scholar.

Кумулятивний індекс цитування - загальна кількість посилань на усі роботи автора за весь час його діяльності. Індексом активно працюючого ученого за кордоном вважається більше 100 посилань на роботи за останні 7 років.

Індекс Хірша

Індекс Хірша h-індекс, або індекс Хірша - наукометричний показник, запропонований у 2005 році американським фізиком Хорхе Хірш з університету Сан-Дієго, Каліфорнія. Індекс Хірша є кількісною характеристикою продуктивності вченого, заснованої на кількості його публікацій і кількості цитувань цих публікацій. Індекс обчислюється на основі розподілу цитувань робіт даного дослідника. Хірш пише:

Вчений має індекс h, якщо h з його Np статей цитуються як мінімум h раз кожна, в той час як решта (Np - h) статей цитуються не більше, ніж h раз кожна.

Іншими словами, вчений з індексом h опублікував h статей, на кожну з яких послалися як мінімум h разів. Так, якщо у даного дослідника опубліковано 100 статей, на кожну з яких є лише одне посилання, його h-індекс дорівнює 1. Аналогічним буде h-індекс дослідника, який опублікував одну статтю, на яку посилалися 100 разів. У той же час (більш реалістичний випадок), якщо у дослідника є 1 стаття з 9 цитуваннями, 2 статті з 8 цитуваннями, 3 статті з 7 цитуваннями, ..., 9 статей з 1 цитуванням кожної з них, то його h-індекс дорівнює 5 .

Зазвичай розподіл кількості публікацій N (q) залежно від кількості їхніх цитувань q в дуже грубому наближенні відповідає гіперболі: N (q) ≈ const × q-1. Координата точки перетину цієї кривої з прямою N (q) = q і буде дорівнювати індексу Хірша. Індекс Хірша був розроблений, щоб отримати більш адекватну оцінку наукової продуктивності дослідника, ніж можуть дати такі прості характеристики, як загальна кількість публікацій / загальна кількість цитувань.

Індекс Хірша може обчислюватися з використанням як безкоштовних баз даних в інтернеті (Google Scholar, ADS NASA), так і баз з платною підпискою (Scopus або ISI Web of Science). H-індекс, підрахований для однієї людини з використанням різних БД буде різний - як і інші наукометричних характеристики, так як він залежить від області охоплення обраної БД.

Крім того, h-індекс може обчислюватися на певний період часу; з урахуванням і без урахування самоцитування.

Індекс добре працює лише при порівнянні вчених, що працюють в одній галузі досліджень, оскільки традиції, пов'язані з цитуванням, відрізняються в різних галузях науки (наприклад, в біології та медицині h-індекс набагато вищий, ніж у фізиці). У нормі h-індекс фізика приблизно дорівнює тривалості його наукової кар'єри в роках, тоді як у видатного фізика він удвічі вищий. Хірш вважає, що у фізиці (і в реаліях США) h-індекс, рівний 10-12, може служити одним з визначальних факторів для рішення про надання досліднику постійної позиції у великому дослідному університеті; рівень дослідника з h-індексом рівним 15-20 , відповідає членству в Американському фізичному товаристві; індекс 45 і вище може означати членство в Національній академії наук США. 

До переваг індексу Хірша відносять те, що він буде однаково низьким як для автора однієї надпопулярної статті, так і для автора великої кількості слабкоцитованих робіт. Цей показник буде високим лише для тих, у кого досить публікацій, і принаймні багато з них є досить затребуваними, тобто часто цитуються іншими дослідниками. Таким чином, індекс Хірша був розроблений, щоб одержати більш адекватну оцінку наукової продуктивності дослідника, ніж можуть дати такі прості характеристики, як загальне число публікацій або загальне число цитувань.

Індекс Хірша не ідеальний. Не важко представити ситуацію, коли h-індекс дає абсолютно невірну оцінку значимості дослідника. Зокрема, коротка кар'єра вченого призводить до недооцінки значущості його робіт. Так, h-індекс Еваріста Галуа дорівнює 2 і залишиться таким назавжди. Якщо б Альберт Ейнштейн помер на початку 1906 р., його h-індекс зупинився б на 4 або 5, незважаючи на надзвичайно високу значимість статей, опублікованих ним у 1905.

Імпакт-фактор

Універсальні показники дозволяють оцінювати діяльність різних об'єктів, спрямовану на створення нової інформації. До таких показників відносяться широко відомий у світовому співтоваристві імпакт-фактор і розроблений Системний Показник Публікаційної Активності (СППА (S, U)).

Що вважається цитуванням. Почнемо з визначення: (1) Стаття А цитує статтю Б, якщо хоч би один раз в тексті А є посилання на Б і Б, таким чином, винесена в А в пристатейний список літератури або фігурірує в посторінковій виносці. (2) Журнал M цитує журнал N так - скільки статей з M цитують статті з N. Таким чином, якщо в тексті однієї статті інша публікація згадується кілька разів, це вважається одним цитуванням і в ситуації, що надано на мал. 1.

ris1

Журнал N отримав тільки 5 цитувань з журналу M. Не дивлячись на те, що в принципі можна порахувати, скільки один журнал цитує інший взагалі, тобто упродовж усієї історії існування обох видань, на практиці завжди вибираються фіксованні проміжи часу як для цитуючих статей, так і для статей цитованих. Ці два проміжки можуть не співпадати (і, як правило, - при підрахунку основних показників - дійсно не співпадають).

Введемо також позначення різних величин, які використовуватимуться надалі:

  • CNTM (X, Y) - сумарне число цитувань, отриманих в році X тими статтями журналу M, які вийшли в ньому в році Y (X ≥ Y). Наприклад, CNTM (2009, 2008) - сумарне число статей, що вийшли в 2009 р., які посилалися на роботи, опубліковані в M у 2008 р.

    Cлід зауважити, що неможливо підрахувати усі існуючі у світі статті, які посилалися на публікації журналу M, що вийшли впродовж певного періоду. Тому кожна база даних, кожен індекс цитування обмежуються деяким фіксованим масивом журналів, з яких враховують посилання на інші публікації. У випадку Citation Indexes ISI це " журнали, що розписуються ISI", у разі Scopus'а - це "журнали, включені в базу даних Scopus". Для Google це база Google … Для України це наукові роботи, які входять у Систему наукометричного моніторингу суб’єктів наукової діяльності України.

    Таким чином, в процесі дослідження цитованості заздалегідь вводяться два типи обмеження : по даті виходу цитованих і цитуючих статей і по набору журналів, включених в дослідження.

  • CNTM N (X) - число посилань, отриманих журналом N з журналу M в році X (тобто із статей журналу M, що вийшли в році X).
  • PUBM (X) - сумарне число публікацій, що вийшли в журналі M в році X.

"Класичний" (синхронний, Гарфильдівський) імпакт-фактор

Класичний імпакт-фактор, тобто те, що розуміють під ним за замовчуванням, - це, в строгому визначенні, "синхронний дворічний імпакт-фактор, без урахування поточного року". Саме він обчислюється Інститутом наукової інформації ISI і щорічно публікується в базі даних Journal Citation Reports. Саме він в наш час фігурує при порівнянні рівня журналів. Класичний імпакт-фактор журналу M в році Y задається вираженням:

[CNTM (Y, Y - 1) + CNTM (Y, Y - 2)] / [PUBM (Y - 1) + PUBM (Y - 2)],

тобто відношенням числа журналів, що з'явилися в усьому масиві, за рік Y посилань на статті журналу M, що вийшли в роках Y - 1 та Y - 2, до сумарного числа статей, що вийшли в M за той же період, роках Y - 1 і Y - 2. Схематично це пояснюється на мал. 2. "Фізичний сенс" цієї величини такий: імпакт-фактор журналу - це середнє число цитувань, яке отримують в даному році статті, опубліковані в журналі впродовж двох попередніх років.

Ris2

Мал. 2. Обчислення класичного (синхронного) імпакт-фактора за 2009 р.

Декілька зауважень. Насправді ISI в знаменнику рахує не повне число публікацій, що вийшли у світ, а число тих з них, які можуть бути процитовані (citable items). У них ISI включає лише дослідницькі статті і наукові огляди, залишаючи за дужками редакційні замітки, листи в редакцію, новини, звіти про конференції та ін. "Поточний" рік не включений ISI в розрахунок цього показника - посилання року Y на статті, опубліковані в тому ж році, не враховуються. Самоцитуваня журналу, тобто посилання в матеріалах, опублікованих в M, на статті, що вийшли в тому ж виданні, враховується при підрахунку класичного імпакт-фактора.

"Діахроний" імпакт-фактор Діахроний імпакт-фактор журналу M в році Y обчислюється по формулі: [CNTM (Y+2, Y) + CNTM (Y+1, Y)] / PUBM (Y), тобто задається відношенням числа посилань з журналів за рокиY+2 і Y+1 на статті журналу M, що вийшли в році Y, до сумарного числа статей, що вийшли в M в році Y. Схематично це пояснюється на малюнку

ris3

Значення цієї величини таке: дворічний діахроний імпакт-фактор журналу - це середнє число цитувань, яке опублікована в журналі стаття отримує впродовж наступних двох років. На відміну від синхронного імпакт-фактора, діахроний показник враховує цитування, яке отримують статті журналу, що вийшли у фіксованому році. З цієї причини такий показник, як вважають багато дослідників, є прийнятнішим. В той же час недоліком діахроного імпакт-фактора є неможливість його підрахунку для поточних двох років випуску журналу : наприклад, щоб вичислити імпакт за 2007 р., необхідно чекати, коли закінчиться 2009 р. При створенні РИНЦ синхронний імпакт-фактор для журналів можна розрахувати, маючи повні дані по цитуванню на масиві усіх журналів всього за один рік, тоді як для знаходження діахроного показника потрібна інформація мінімум за два повні роки. Зважаючи на те що у разі синхронного імпакт-фактора фіксується рік цитування і досліджується, які статті процитовані з минулих років, а у разі діахроного - фіксується рік публікації і підраховуються майбутні цитування опублікованих в цьому році робіт, синхронний підхід ще називають ретроспективним, а діахроний - перспективним 

Висновки

Індекс цитування визнається як одинз найефективніших світових систем наукової інформації. Структура індексу цитування дозволяє йому виконувати досить широкий спектр функцій, головними з яких є:

  1. інформаційний пошук для обслуговування індивідуальних дослідників і наукових організацій;
  2. використання зв'язків між публікаціями для виявлення структури областей знання, спостереження і прогнозування їх розвитку (картирування науки і виявлення дослідницьких фронтів);
  3. оцінка якості публікацій і їх авторів науковим співтовариством.

Комплексна оцінка індексу цитування дозволяє оцінювати наукові підрозділи по науковцям що до них входять. Вона широко застосовується для оцінки журналів, наукових товариств, редакційних колегій та іншого.

Зміст індексу цитування, у свою чергу, є об'єктом інтенсивних досліджень фахівців з соціології науки, наукометрії і наукознавству. Періодичні дискусії виникають з приводу адекватності оцінок окремих публікацій і їх авторів за допомогою методів, заснованих на даних про цитування.

Література

  1. Harnad Stevan. Open Access Scientometrics and the UK Research Assessment Exercise. Preprint of In-vited Keynote Address to 11th Annual Meeting of the International Society for Scientometrics and Infor-metrics. Madrid, Spain, 25-27 June, 2007. http://eprints.ecs.soton.ac.uk/13804/03/oa-scientometrics.pdf 
  2. Shadbolt, N., Brody, T., Carr, L. and Harnad, S. The Open Research Web: A Preview of the Optimal and the Inevitable. - 2006. http://eprints.ecs.soton.ac.uk/ 1245 
  3. М.Р. Когаловский С.И. Паринов Информационные ресурсы, наукометрические показатели и показатели качества метаданных системы Соционет http://www.cemi.rssi.ru/mei/articles/koga-pari07-1.pdf

Якщо ви помітили помилку, виділіть слово, що містить цю помилку та натисніть Ctrl+Enter. Дякуємо за вашу допомогу.

Scholarly Lite is a free theme, contributed to the Drupal Community by More than Themes.

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.