Οι αναξιοποίητες φωτογραφίες 600
εκατομμυρίων σελίδων από παλαιά βιβλία που έχει ψηφιοποιήσει ο μη
κερδοσκοπικός οργανισμός Internet Archive ανεβαίνουν σταδιακά στο
Flickr, με την συμβολή του ακαδημαϊκού Kalev Leetaru. Υπολογίζεται ότι
το σάιτ φιλοξενίας φωτογραφιών της Yahoo θα πλημμυρίσει από 12
εκατομμύρια ιστορικές φωτογραφίες από το 1500 έως το 1922 που έχουν
περάσει στο public domain και θεωρούνται κοινό κτήμα, χωρίς περιορισμούς
στην χρήση τους.
Οι φωτογραφίες προέρχονται από βιβλία δημόσιων βιβλιοθηκών τα οποία επί χρόνια ψηφιοποιούνται από το Internet Archive, εντούτοις καταλήγουν σε μορφή αρχείου PDF ή απλού κειμένου χωρίς δυνατότητα αναζήτησης των φωτογραφιών.
Το λογισμικό του Kalev Leetaru σε αντίθεση με το λογισμικό οπτικής αναγνώρισης χαρακτήρων δεν παρακάμπτει τις φωτογραφίες. Αξιοποιεί μάλιστα την αδυναμία του OCR, υποθέτοντας πως ότι παρακάμπτει είναι φωτογραφία και το αποθηκεύει σε μορφή αρχείου εικόνας Jpeg. Επιπλέον, επιχειρεί να συνοδεύσει τα αρχεία εικόνας με επεξηγηματικό κείμενο υπό μορφή λεζάντας, επιλέγοντας το κείμενο που διάβασε το OCR πριν και μετά την φωτογραφία της σκαναρισμένης σελίδας.
Φιλοδοξία του καθηγητή Leetaru είναι να αξιοποιηθούν οι φωτογραφίες αυτές -2,6 εκατομμύρια από τις οποίες έχουν ήδη γίνει upload στο Flick- από τους συντάκτες της Wikipedia για να εμπλουτίσουν το περιεχόμενό της, ιδιαίτερα όταν το λήμμα αφορά σε ιστορικά γεγονότα. Eμφανίζεται δε πρόθυμος να διαθέσει τον κώδικά του σε βιβλιοθήκες ανά τον κόσμο για να εξάγουν και τις φωτογραφίες από τα βιβλία που επιχειρούν να μετατρέψουν σε ψηφιακή μορφή, μεταφέρει το BBC.
Πάντως, οι χρήστες του Flickr παραπονιούνται ότι από τον Ιούλιο οπότε το Internet Archive έγινε μέλος της υπηρεσίας, οι φωτογραφίες του πλημμύρισαν το σάιτ και εμφανίζονται πολύ συχνά στα αποτελέσματα χωρίς δυνατότητα εξαίρεσης χρήστη.
Οι φωτογραφίες προέρχονται από βιβλία δημόσιων βιβλιοθηκών τα οποία επί χρόνια ψηφιοποιούνται από το Internet Archive, εντούτοις καταλήγουν σε μορφή αρχείου PDF ή απλού κειμένου χωρίς δυνατότητα αναζήτησης των φωτογραφιών.
Το λογισμικό του Kalev Leetaru σε αντίθεση με το λογισμικό οπτικής αναγνώρισης χαρακτήρων δεν παρακάμπτει τις φωτογραφίες. Αξιοποιεί μάλιστα την αδυναμία του OCR, υποθέτοντας πως ότι παρακάμπτει είναι φωτογραφία και το αποθηκεύει σε μορφή αρχείου εικόνας Jpeg. Επιπλέον, επιχειρεί να συνοδεύσει τα αρχεία εικόνας με επεξηγηματικό κείμενο υπό μορφή λεζάντας, επιλέγοντας το κείμενο που διάβασε το OCR πριν και μετά την φωτογραφία της σκαναρισμένης σελίδας.
Φιλοδοξία του καθηγητή Leetaru είναι να αξιοποιηθούν οι φωτογραφίες αυτές -2,6 εκατομμύρια από τις οποίες έχουν ήδη γίνει upload στο Flick- από τους συντάκτες της Wikipedia για να εμπλουτίσουν το περιεχόμενό της, ιδιαίτερα όταν το λήμμα αφορά σε ιστορικά γεγονότα. Eμφανίζεται δε πρόθυμος να διαθέσει τον κώδικά του σε βιβλιοθήκες ανά τον κόσμο για να εξάγουν και τις φωτογραφίες από τα βιβλία που επιχειρούν να μετατρέψουν σε ψηφιακή μορφή, μεταφέρει το BBC.
Πάντως, οι χρήστες του Flickr παραπονιούνται ότι από τον Ιούλιο οπότε το Internet Archive έγινε μέλος της υπηρεσίας, οι φωτογραφίες του πλημμύρισαν το σάιτ και εμφανίζονται πολύ συχνά στα αποτελέσματα χωρίς δυνατότητα εξαίρεσης χρήστη.
κάνε κλίκ εδώ για τις φωτογραφίες :
https://www.flickr.com/photos/internetarchivebookimages
Σημείωση :
Για παλιές φωτογραφίες από Ελλάδα κάντε κλίκ εδώ:
(έχει φωτογραφίες της περιοχή μας από 1939-1940)
https://www.flickr.com/photos/89241972@N00/sets/72157617945380328
Σημείωση :
Για παλιές φωτογραφίες από Ελλάδα κάντε κλίκ εδώ:
(έχει φωτογραφίες της περιοχή μας από 1939-1940)
https://www.flickr.com/photos/89241972@N00/sets/72157617945380328
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου