Яндекс.Метрика
Руководитель: к.т.н. Н.А. Мазов
Сроки исполнения: 2016 - 2017 гг.

​​​​Публикации: http://elibrary.ru/author_profile.asp?id=98887 

Тел.: +7(383)363-80-26​​


​​​Работа проводится с 2013 года, а с 2016 года исследования поддержаны Российским фондом фундаментальных исследований в рамках проекта № 16-07-00652. Разработка моделей определения плагиата с использованием библиометрических методов проводится коллективом из пяти исследователей на базе Государственной публичной научно-технической библиотеки Сибирского отделения Российской академии наук и Института нефтегазовой геологии и геофизики им. А.А. Трофимука СО РАН.

Актуальность исследований вызвана ростом числа случаев плагиата, основанного на переводах зарубежных научных публикаций. Выявление такого плагиата в настоящее время требует привлечения большого числа эрудированных компетентных экспертов, знакомых с разработками зарубежных коллег. Таким образом, анализ работ на предмет заимствований ограничен, дорог и трудозатратен, он не используется для проверки тысяч небольших научных статей, не применяется при проверке отчетов, которые пишутся в рамках грантов и государственных программ, не задействуется при проверке на оригинальность кандидатских и докторских диссертаций. Системы же обычного выявления плагиата, основанные на сличении текстов, в данном случае не дают положительного результата. Значительная для российской науки и ее рейтинга в мире проблема заключается в том, что в настоящих условиях недобросовестные ученые чувствуют себя в безопасности и зачастую отказываются от проведения самостоятельной и финансируемой государством работы в пользу менее трудоемкого перевода чужих публикаций. Соответственно, количество оригинальных разработок, способных улучшить профиль российской науки, растет медленнее, чем могло бы.

Автоматизация сличения текстов способна решить данную проблему. Наш опыт одновременной работы в сфере научной библиографии и научного перевода позволил нам сделать наблюдение, что после перевода зарубежных публикаций авторы в своих статьях сохраняют всю или значительную долю ссылок, также заимствованных из оригинальной статьи, и их последовательность. На основе этого можно с большой вероятностью определить источник заимствования, сгенерировав запрос в профильную или международную библио​графическую базу данных, где содержится информация из пристатейных ссылок. В настоящий момент аналогичной разработкой занимается лишь один зарубежный коллектив под руководством Б. Гиппа из Констанцкого университета в Германии, пришедший к тем же выводам, что и мы (см. раздел Рекомендуемая литература).

Разработка и промышленный запуск подобной системы позволили бы, на наш взгляд, значительно снизить объемы заимствований и, возможно, способствовать росту числа оригинальных отечественных исследований.

К настоящему моменту нами решены следующие задачи:

— сформирована тематическая выборка проверяемых публикаций на базе нескольких журналов по наукам о Земле и подготовлены метаданные для последующего библиографического анализа;

— разработаны алгоритмы выявления моделей цитирования в подозрительном тексте на основе имеющегося достоверного материала в нескольких научных областях;

— разработаны и экспериментально опробованы модели формирования запросов в библиографические базы данных Web of Science и Scopus для поиска публикаций со списками цитирований, схожими с пристатейной литературой анализируемой подозрительной публикации;

— ​обоснован метод кластеризации по коцитированиям;

— протестирована работоспособность метода в базах данных Web of Science и Scopus на следующих видах документов: диссертация, научная статья, отчет о НИР, монография.

По результатам дальнейших исследований предполагается добавление графических визуализированных результатов, автоматизация запросов в библиографические базы данных и их обработки, а также онлайн-аналитика. 


Участники научного коллектива

Гуреев Вадим Николаевич​, кандидат педагогических наук, старший научный сотрудник информационно-аналитического центра Института нефтегазовой геологии и геофизики им. А.А. Трофимука СО РАН. Специалист в области библиометрии и библиотечного дела. Член редакционного совета журнала The Electronic Library. Публикации: http://elibrary.ru/author_profile.asp?id=663665

Косяков Денис Викторович, заместитель директора по информационным технологиям Государственной публичной научно-технической библиотеки СО РАН. Публикации: http://elibrary.ru/author_profile.asp?id=612459

Гуськов Андрей Евгеньевич, кандидат технических наук, директор Государственной публичной научно-технической библиотеки СО РАН.
Публикации: http://elibrary.ru/author_profile.asp?id=143993
E-mail: guskov@spsl.nsc.ru
Тел.: +7(383)266-18-60​

Селиванова Ирина Вячеславовна, младший научный сотрудник сектора информационных систем и электронных ресурсов Государственной публичной научно-технической библиотеки СО РАН.
​Публикации: http://elibrary.ru/author_profile.asp?id=889398​
E-mail: selivanova@ict.sbras.ru​


Список публикаций

1. Мазов Н.А., Гуреев В.Н., Косяков Д.В.О разработке модели определения плагиата на основе анализа цитирований с использованием библиографических баз данных // Научно-техническая информация. Серия 1: Организация и методика информационной работы. – 2016. – № 11. – С. 9–14. ​

2. Гуреев В.Н., Мазов Н.А. Анализ цитирования как основа для разработки дополнительного модуля в системах антиплагиата // Научно-техническая информация. Серия 1: Организация и методика информационной работы. – 2013. – № 12. – С. 12–15. 

3. Gureev V.N., Mazov N.A.​Citation Analysis as a Basis for the Development of an Additional Module in Antiplagiarism Systems // Scientific and Technical Information Processing. – 2013. – V. 40. – No 4. – P. 264–267. ​

4. Мазов Н.А., Гуреев В.Н., Косяков Д.В.​ Проблемы автоматизации процессов выявления плагиата на основе анализа цитирования  // Межрегиональная научно-практическая конференция «Библиотека традиционная и электронная: Смыслы и ценности» (4–6 октября 2016 г., Новосибирск). – Новосибирск: ГПНТБ СО РАН, 2016. – CD-ROM.

5. Мазов Н.А., Гуреев В.Н. К вопросу о разработке моделей выявления плагиата на основе цитирования с использованием наукометрических баз данных // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса: Труды 23-й Международной конференции «Крым-2016» (4–12 июня 2016 г., Судак). – М.: Изд-во ГПНТБ России, 2016. – С. 1–4. – CD-ROM. ​

6. Мазов Н.А.Гуреев В.Н. Выявление плагиата на основе анализа цитирования: проблемы и решения // Библиотека традиционная и электронная: смыслы и ценности. Труды ГПНТБ СО РАН; Вып. 12, Т. 1. – 2017. – С. 355-362

7. Мазов Н.А.Гуреев В.Н. Результаты исследований по выявлению переводного плагиата с использованием библиометрических баз данных // Научные и технические библиотеки. – 2017. – № 12. – С. 87-96

8. Мазов Н.А.Гуреев В.Н. Возможности и ограничения анализа цитирования в определении плагиата (результаты четырех лет исследований) // Распределенные информационные и вычислительные ресурсы. Наука - цифровой экономике: Труды XVI всероссийской конференции "DICR-2017" (4-7 декабря 2017 г., Новосибирск). – 2017. – С. 456-459

9. Гуреев В.Н.Мазов Н.А. Результаты исследований по обнаружению заимствований с использованием анализа цитирований // Международная научно-практическая конференция "Обнаружение заимствований - 2017", (26-27 октября 2017 г., Липецк). – 2017.

10. Гуреев В.Н.Мазов Н.А. Результаты исследований по обнаружению заимствований с использованием анализа цитирований // Электронные библиотеки. – 2017. – Т. 20. – № 5. – С. 322-331

Рекомендуемая литература

1. Абрамова Н.Ю. Проблема плагиата в научных работах // Научная периодика: проблемы и решения. – 2011. – T. 2 (2). – C. 25–28.

2. Авдеева Н.В., Блинова Т.А., Груздев И.А., Ледовская В.М., Лобанова Г.А., Сусь И.В. Обнаружение заимствований в научных документах на опыте Российской государственной библиотеки // Электронные библиотеки. – 2017. – Т. 20. – № 5. – С. 285-297.

3. Авдеева Н.В., Никулина О.В., Сологубов А.М. Система «Антиплагиат.РГБ» и недобросовестные авторы диссертаций: кто победит? // Научная периодика: проблемы и решения. – 2012. – T. 5 (11). – C. 11–16.

4. Кедрова Г., Чехович Ю. Plagium vulgaris: как предотвратить плагиат в науке // Юрист ВУЗа. 2011. № 4. С. 40-48.

5. Котляров И.Д. Самоплагиат в научных публикациях // Научная периодика: проблемы и решения. – 2011. – T. 4 (4). – C. 6–12.

6. Никитов А.В., Орчаков О.А., Чехович Ю.В. Плагиат в работах студентов и аспирантов: проблема и методы противодействия // Университетское управление: практика и анализ. – 2012. – № 5 (81). – С. 61–68.

7. Осипов Г.С., Смирнов И.В., Тихомиров И.А., Соченков И.В., Зубарев Д.В., Исаков В.А. Технологии семантического поиска заимствований в научных текстах // Труды 23-й Международной конференции «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса» (4–12 июня 2016 г., г. Судак). – М.: ГПНТБ России, 2016. – C. 1–3.

​8. Чехович Ю.В. Об обнаружении заимствований при экспертизе научных статей // Научная периодика: проблемы и решения. – 2013. – № 4 (16). – С. 22–25.

9. Чехович Ю.В. Плагиат в статьях и диссертациях: трудности обнаружения перевода // 5-я Международная конференция НЭИКОН «Электронные научные и образовательные ресурсы: создание, продвижение и использование» (24 сентября – 1 октября 2017 г., Лидо ди Езоло, Италия). М.: НЭИКОН, 2017. http://conf.neicon.ru/materials/29-Overseas2017/20170926-10-Chekhovich.pdf

10. Gipp B. Citation-based plagiarism detection: Detecting disguised and cross-language plagiarism using citation pattern analysis. Springer Vieweg: Wiesbaden, 2014. – 350 p. DOI: 10.1007/978-3-658-06394-8

11. Gipp B., Meuschke N. Citation Pattern Matching Algorithms for Citation-based Plagiarism Detection: Greedy Citation Tiling, Citation Chunking and Longest Common Citation Sequence // Proceedings of the 11th ACM symposium on Document engineering (DocEng ’11). – Mountain, View, CA, USA: ACM, 2011. – P. 1–10. DOI: 10.1145/2034691.2034741

12. Gipp B., Meuschke N., Beel J. Comparative Evaluation of Text- and Citation-based Plagiarism Detection Approaches using GuttenPlag // Proceedings of the 11th annual international ACM/IEEE joint conference on Digital libraries. – Ottawa, 2011. – P. 255–258. DOI: 10.1145/1998076.1998124

13. Gipp B., Meuschke N., Breitinger C. Citation-based plagiarism detection: Practicability on a large-scale scientific corpus // Journal of the Association for Information Science and Technology. - 2014. – V. 65 (8). – P. 1527–1540. DOI: 10.1002/asi.23228

14. Gipp B., Meuschke N., Breitinger C., Lipinski M., Nürnberger A. Demonstration of citation pattern analysis for plagiarism detection // 36th International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 2013. – Dublin, 2013. – P. 1119–1120. DOI: 10.1145/2484028.2484214

15. Gipp B., Meuschke N., Breitinger C., Pitman J., Nürnberger A. Web-based demonstration of semantic similarity detection using citation pattern visualization for a cross language plagiarism case // ICEIS 2014 - Proceedings of the 16th International Conference on Enterprise Information Systems. – V. 2. – 2014. – P. 677–683. DOI: 10.5220/0004985406770683

16. Meuschke N., Gipp B. Reducing computational effort for plagiarism detection by using citation characteristics to limit retrieval space // Proceedings of the ACM/IEEE Joint Conference on Digital Libraries. – 2014. – P. 197–200. DOI: 10.1109/JCDL.2014.6970168

17. Meuschke N., Gipp B., Breitinger C. CitePlag: A Citation-based Plagiarism Detection System Prototype // Proceedings of the 5th International Plagiarism Conference. – Newcastle upon Tyne, UK, 2012. – P. 1–10.

18. Meuschke N., Siebeck N., Schubotz M., Gipp B. Analyzing Semantic Concept Patterns to Detect Academic Plagiarism // Proceedings of the 6th International Workshop on Mining Scientific Publications (WOSP) held in conjunction with the ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL). -- Toronto, Canada, 2017.

19. Sochenkov I., Zubarev D., Tikhomirov I., Smirnov I., Shelmanov A., Suvorov R., Osipov G.  Exactus Like: Plagiarism Detection in Scientific Texts // Advances in Information Retrieval: 38th European Conference on IR Research, ECIR 2016 (March 20–23, 2016, Padua, Italy). – Cham: Springer International Publishing, 2016. – P. 837–840. DOI: 10.1007/978-3-319-30671-1_76​