Поиск научных материалов, сохраненных в Интернет-архиве
Posted: Thu Jul 10, 2025 4:04 am
Ищете научную работу, но не можете найти её в каталоге вашей библиотеки или популярных поисковых системах? Попробуйте Internet Archive Scholar ! Возможно, в нашем веб-архиве есть PDF-файл от «исчезнувшего» издательства с открытым доступом, рукопись автора, подготовленная к публикации, с архивной страницы данные электронной почты или оцифрованная микрофильмированная версия старой публикации.
Мы надеемся, что Internet Archive Scholar поможет исследователям и библиотекарям, которые ищут конкретные статьи в открытом доступе, которые могут быть им недоступны. Джудит ван Стегерен ( @jd7g в Твиттере), аспирантка из Нидерландов, недавно столкнулась именно с такой ситуацией, когда делилась докладом о процедурной генерации в компьютерных играх: «На пути к качественной процедурной генерации» Марка Р. Джонсона, первоначально представленным на семинаре Computational Creativity & Games Workshop в 2016 году. Доклады этого конкретного года семинара не индексируются в обычных библиографических каталогах, а исходный сайт семинара, размещавший документы открытого доступа, больше не доступен. К счастью, копии всех докладов семинара 2016 года были сохранены в Wayback Machine и теперь их можно найти, выполнив поиск в IA Scholar по названию или названию конференции .
Другой пример: десятки статей из Open Journal of Hematology больше не доступны по DOI. Как упоминалось в предыдущей записи блога , сайт издательства исчез и был заменён нерелевантной рекламой. Но до этого статьи были загружены в Wayback Machine, проиндексированы в нашем каталоге и теперь доступны для полного поиска:
Результаты поиска IA Scholar
IA Scholar — это простой, ориентированный на доступ интерфейс к контенту, найденному в нескольких коллекциях Интернет-архива, включая веб-архивы, файлы archive.org и оцифрованные печатные материалы. Полные тексты статей доступны для поиска пользователями, ищущими определённые фразы или ключевые слова. Это дополняет наш существующий индекс полнотекстового поиска, включающий миллионы оцифрованных книг и других документов на archive.org.
Сервис основан на Fatcat — открытом каталоге, разработанном нами для выявления находящихся под угрозой и опубликованных в интернете открытых научных работ, которым может быть полезно долгосрочное сохранение, добавление дополнительных метаданных и бессрочный доступ. Fatcat включает ресурсы, которые могут быть полезны библиотекарям и архивистам, такие как массивы метаданных, API для чтения/записи, утилита командной строки и архивные метаданные на уровне файлов. Если вы заинтересованы в сотрудничестве с нами или являетесь исследователем, интересующимся приложениями для анализа текста, у нас есть общедоступный чат или вы можете связаться с нами по электронной почте [email protected].
Проект IA Scholar знаменует собой важную веху в нашей работе, начатой в 2018 году, по использованию автоматизации и масштабирования веб-ресурсов и API-сбора данных для создания открытой инфраструктуры для сохранения и постоянного доступа к научным материалам из общедоступного интернета. Мы хотим выразить особую благодарность Фонду Меллона за первоначальную и постоянную поддержку этой работы, нашим многочисленным нынешним партнёрам, а также другим соавторам, участникам и волонтёрам.
Все это стало возможным благодаря невероятной экосистеме открытых исследований, созданной и совместно поддерживаемой сторонниками открытого доступа. Благодарим DOAJ и другие группы за помощь в каталогизации журналов открытого доступа, что способствовало сохранению. Благодарим Библиотеку наследия биоразнообразия и ее сторонников за оцифровку печатной журнальной литературы. И спасибо многим другим организациям, с которыми мы работали, интегрировали или чьими услугами мы пользовались, включая открытые веб-индексы ( Unpaywall , CORE , CiteseerX , Microsoft Academic , Semantic Scholar ), каталоги открытых журналов ( DOAJ , ROAD SHERPA/ROMEO , JURN , Wikidata ) и открытые библиографические каталоги ( Crossref , Datacite , J-STAGE , Pubmed , dblp ).
Мы надеемся, что Internet Archive Scholar поможет исследователям и библиотекарям, которые ищут конкретные статьи в открытом доступе, которые могут быть им недоступны. Джудит ван Стегерен ( @jd7g в Твиттере), аспирантка из Нидерландов, недавно столкнулась именно с такой ситуацией, когда делилась докладом о процедурной генерации в компьютерных играх: «На пути к качественной процедурной генерации» Марка Р. Джонсона, первоначально представленным на семинаре Computational Creativity & Games Workshop в 2016 году. Доклады этого конкретного года семинара не индексируются в обычных библиографических каталогах, а исходный сайт семинара, размещавший документы открытого доступа, больше не доступен. К счастью, копии всех докладов семинара 2016 года были сохранены в Wayback Machine и теперь их можно найти, выполнив поиск в IA Scholar по названию или названию конференции .
Другой пример: десятки статей из Open Journal of Hematology больше не доступны по DOI. Как упоминалось в предыдущей записи блога , сайт издательства исчез и был заменён нерелевантной рекламой. Но до этого статьи были загружены в Wayback Machine, проиндексированы в нашем каталоге и теперь доступны для полного поиска:
Результаты поиска IA Scholar
IA Scholar — это простой, ориентированный на доступ интерфейс к контенту, найденному в нескольких коллекциях Интернет-архива, включая веб-архивы, файлы archive.org и оцифрованные печатные материалы. Полные тексты статей доступны для поиска пользователями, ищущими определённые фразы или ключевые слова. Это дополняет наш существующий индекс полнотекстового поиска, включающий миллионы оцифрованных книг и других документов на archive.org.
Сервис основан на Fatcat — открытом каталоге, разработанном нами для выявления находящихся под угрозой и опубликованных в интернете открытых научных работ, которым может быть полезно долгосрочное сохранение, добавление дополнительных метаданных и бессрочный доступ. Fatcat включает ресурсы, которые могут быть полезны библиотекарям и архивистам, такие как массивы метаданных, API для чтения/записи, утилита командной строки и архивные метаданные на уровне файлов. Если вы заинтересованы в сотрудничестве с нами или являетесь исследователем, интересующимся приложениями для анализа текста, у нас есть общедоступный чат или вы можете связаться с нами по электронной почте [email protected].
Проект IA Scholar знаменует собой важную веху в нашей работе, начатой в 2018 году, по использованию автоматизации и масштабирования веб-ресурсов и API-сбора данных для создания открытой инфраструктуры для сохранения и постоянного доступа к научным материалам из общедоступного интернета. Мы хотим выразить особую благодарность Фонду Меллона за первоначальную и постоянную поддержку этой работы, нашим многочисленным нынешним партнёрам, а также другим соавторам, участникам и волонтёрам.
Все это стало возможным благодаря невероятной экосистеме открытых исследований, созданной и совместно поддерживаемой сторонниками открытого доступа. Благодарим DOAJ и другие группы за помощь в каталогизации журналов открытого доступа, что способствовало сохранению. Благодарим Библиотеку наследия биоразнообразия и ее сторонников за оцифровку печатной журнальной литературы. И спасибо многим другим организациям, с которыми мы работали, интегрировали или чьими услугами мы пользовались, включая открытые веб-индексы ( Unpaywall , CORE , CiteseerX , Microsoft Academic , Semantic Scholar ), каталоги открытых журналов ( DOAJ , ROAD SHERPA/ROMEO , JURN , Wikidata ) и открытые библиографические каталоги ( Crossref , Datacite , J-STAGE , Pubmed , dblp ).