Witam,
od jakiegoś czasu zmagam się z problemem znalezienia odpowiednich słów w zeskanowanych dokumentach (głównie o gazety mi chodzi - ale nie tylko), które coraz liczniej są udostępniane w bibliotekach cyfrowych.
Jeśli wiem w jakiej gazecie ukazała się dana wiadomość (notatka prasowa, nekrolog) i w którym numerze - to nie ma problemu. Zeskanowany dokument ma swoją wyszukiwarkę, która znajdzie i podkreśli szukane słowa. Ale co jeśli nie wiemy w jakiej gazecie mogła ukazać się notka ? ani kiedy ?
Wiem o wyszukiwarce nazwisk w bibliotekach cyfrowych:
http://www.genealogyindexer.org/
ale obejmuje ona głównie książki adresowe, czy spisy urzędników lub też oficerów.
A co z resztą, co ze zwykłymi gazetami ? (no i niekoniecznie wyszukiwanie nazwisk, bo czasem to za mało)
Czy w innych krajach są takie wyszukiwarki z bibliotek cyfrowych i zeskanowanych tam dokumentów i gazet (np. USA) ?
Wyszukiwarka googla jakoś tego nie indeksuje... a może ja nie umiem z niej korzystać ?
Poradźcie
UWAGA: Od kwietnia 2018 roku Forgen.pl zawiesił swoją działalność. Na poniższej stronie znajduje się archiwum serwisu. Możliwość logowania i rejestracji nowych kont została zablokowana. W celu uzyskania porad genealogicznych zapraszamy na inne fora o tej tematyce: genealodzy.pl, Wielkopolskie Towarzystwo Genealogiczne Gniazdo
Wyszukiwarki w bibiotekach cyfrowych
Moderator: Moderatorzy
-
- Posty: 137
- Rejestracja: wt kwie 15, 2008 10:59 pm
- Lokalizacja: Częstochowa
- Podziękował/a: 1 raz
- Podziękowano: 22 razy
Re: Wyszukiwarki w bibiotekach cyfrowych
Witam !
Też się kiedyś nad tym zastanawiałem i postanowiłem w tej sprawie zapytać u źródła, czyli w bibliotece cyfrowej uniwersytetu warszawskiego. Oto co mi odpisano:
Odpowiadając na Pańskie pytanie w sprawie wyszukiwania informacji w Kurierze Warszawskim, informuję, że istnieje możliwość przeszukiwania pełnotekstowego w całym zasobie biblioteki cyfrowej. Należy wybrać w "Zakresie" opcje "Tekst publikacji". Jednak ze względu na duże problemy techniczne, które mieliśmy kilka miesięcy temu, nie odzyskaliśmy wszystkich indeksów i z tego względu zalecam przeszukiwanie w każdym numerze oddzielnie. Proszę jednak pamiętać, że przeszukiwanie pełnotekstowe nie da nigdy 100% wyników, gdyż OCR w przypadku zasobów e-bUW jest robiony z automatu, a co za tym idzie nie jest kontrolowany. Jednocześnie informuję, że nie ma możliwości przechodzenia od numeru do numeru w sposób płynny. Jedyna propozycje jaką mogę zasugerować, to otwieranie numerów w nowym oknie, bądź nowej zakładce (metoda, która zapewne jest Panu znana).
Tę informację otrzymałem 14 maja 2012 r. Zauważyłem od tego czasu, że gdy wpisuję w wyszukiwarkę jakąś frazę czy nazwisko to raz jest więcej, a raz mniej wyników. Nie wiem od czego to zależy. Czy odzyskali już te indeksy? Ale należy próbować wpisywać to czego poszukujemy wielokrotnie w mniejszych, bądź większych odstępach czasu (na przykład co kilka dni i tygodni). No i nie należy też zapominać o tym, co mi napisano, że 100% wyników może dać jedynie kwerenda numer po numerze. Niestety jak wiadomo niezwykle czasochłonna i żmudna, zwłaszcza w odniesieniu do dzienników.
Też się kiedyś nad tym zastanawiałem i postanowiłem w tej sprawie zapytać u źródła, czyli w bibliotece cyfrowej uniwersytetu warszawskiego. Oto co mi odpisano:
Odpowiadając na Pańskie pytanie w sprawie wyszukiwania informacji w Kurierze Warszawskim, informuję, że istnieje możliwość przeszukiwania pełnotekstowego w całym zasobie biblioteki cyfrowej. Należy wybrać w "Zakresie" opcje "Tekst publikacji". Jednak ze względu na duże problemy techniczne, które mieliśmy kilka miesięcy temu, nie odzyskaliśmy wszystkich indeksów i z tego względu zalecam przeszukiwanie w każdym numerze oddzielnie. Proszę jednak pamiętać, że przeszukiwanie pełnotekstowe nie da nigdy 100% wyników, gdyż OCR w przypadku zasobów e-bUW jest robiony z automatu, a co za tym idzie nie jest kontrolowany. Jednocześnie informuję, że nie ma możliwości przechodzenia od numeru do numeru w sposób płynny. Jedyna propozycje jaką mogę zasugerować, to otwieranie numerów w nowym oknie, bądź nowej zakładce (metoda, która zapewne jest Panu znana).
Tę informację otrzymałem 14 maja 2012 r. Zauważyłem od tego czasu, że gdy wpisuję w wyszukiwarkę jakąś frazę czy nazwisko to raz jest więcej, a raz mniej wyników. Nie wiem od czego to zależy. Czy odzyskali już te indeksy? Ale należy próbować wpisywać to czego poszukujemy wielokrotnie w mniejszych, bądź większych odstępach czasu (na przykład co kilka dni i tygodni). No i nie należy też zapominać o tym, co mi napisano, że 100% wyników może dać jedynie kwerenda numer po numerze. Niestety jak wiadomo niezwykle czasochłonna i żmudna, zwłaszcza w odniesieniu do dzienników.
Krzysztof
Poszukiwane nazwisko: Turski - okolice Częstochowy, Jędrzejowa i Włoszczowy.
Poszukiwane nazwisko: Turski - okolice Częstochowy, Jędrzejowa i Włoszczowy.
-
AUTOR TEMATU - Posty: 907
- Rejestracja: ndz paź 18, 2009 2:51 pm
- Podziękował/a: 199 razy
- Podziękowano: 183 razy
Re: Wyszukiwarki w bibiotekach cyfrowych
Szczerze mówić to ja nie widzę "w zakresie" - bo rozumiem, że piszesz u wyszukiwaniu z całego zasobu, a nie z pojedynczego egz. Możesz dać linka i napisać kilka słów komentarza ?
Natomiast ... chodziło mi o wyszukiwarkę, która korzystałaby z kilku bibliotek cyfrowych, bo przecież w każdej jest coś ciekawego:
Kurjer Warszawski: http://ebuw.uw.edu.pl/dlibra/publication?id=24121
Krakowski Kurier Wieczorny: http://jbc.bj.uj.edu.pl/dlibra/publicat ... 1&lp=1&QI=
Gazeta Szamotulska: http://www.wbc.poznan.pl/dlibra/publica ... 1291&tab=3
Stolica: http://www.djvu.com.pl/Warszawa/Stolica/ITStolica.php
Gazeta Olsztyńska: http://mbc.cyfrowemazowsze.pl/dlibra/pu ... 9987&tab=3
Stołeczny Kurier Wieczorny: http://ebuw.uw.edu.pl/dlibra/publication?id=11666&tab=3
Ilustrowany Kuryer Codzienny: http://mbc.malopolska.pl/dlibra/publication?id=33326
Nie wierze, że coś takiego nie da się zrobić, bo skoro istnieje wyszukiwarka nazwisk, to znaczy, że się da. Być może nawet za pomocą dostępnych wyszukiwarek dobrze skonfigurowanych...
Natomiast ... chodziło mi o wyszukiwarkę, która korzystałaby z kilku bibliotek cyfrowych, bo przecież w każdej jest coś ciekawego:
Kurjer Warszawski: http://ebuw.uw.edu.pl/dlibra/publication?id=24121
Krakowski Kurier Wieczorny: http://jbc.bj.uj.edu.pl/dlibra/publicat ... 1&lp=1&QI=
Gazeta Szamotulska: http://www.wbc.poznan.pl/dlibra/publica ... 1291&tab=3
Stolica: http://www.djvu.com.pl/Warszawa/Stolica/ITStolica.php
Gazeta Olsztyńska: http://mbc.cyfrowemazowsze.pl/dlibra/pu ... 9987&tab=3
Stołeczny Kurier Wieczorny: http://ebuw.uw.edu.pl/dlibra/publication?id=11666&tab=3
Ilustrowany Kuryer Codzienny: http://mbc.malopolska.pl/dlibra/publication?id=33326
Nie wierze, że coś takiego nie da się zrobić, bo skoro istnieje wyszukiwarka nazwisk, to znaczy, że się da. Być może nawet za pomocą dostępnych wyszukiwarek dobrze skonfigurowanych...
Beata