Πέμπτη, Νοέμβριος 28, 2024
Follow Us
Τετάρτη, 20 Νοεμβρίου 2013 22:19

«Μπλογκ για πάντα»: Το ευρωπαϊκό έργο με ελληνικό συντονισμό

Η ανάκτηση, η διαφύλαξη, η ανάλυση και η επαναχρησιμοποίηση των δεδομένων των συνήθως εφήμερων ιστολογίων (blogs) αποτέλεσε το αντικείμενο του ευρωπαϊκού ερευνητικού έργου BlogForever («Μπλογκ για πάντα»), που είχε ως συντονιστή το Τμήμα Πληροφορικής του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης και ολοκληρώθηκε με επιτυχία.

Το έργο περιλάμβανε, σύμφωνα με το Εθνικό Κέντρο Τεκμηρίωσης (ΕΚΤ), εφαρμοσμένη έρευνα στον τομέα της αρχειοθέτησης του παγκόσμιου ιστού (web archiving), με στόχο την καλύτερη εκμετάλλευση του περιεχομένου των ιστολογίων για ερευνητικούς και εκπαιδευτικούς σκοπούς.

Αρχειοθέτηση του παγκόσμιου ιστού (web archiving) ονομάζεται η διαδικασία συλλογής και αποθήκευσης ιστοσελίδων με σκοπό τη διαφύλαξή τους σε ένα ψηφιακό αρχείο, προσβάσιμο για το κοινό και τους ερευνητές. Η αρχειοθέτηση θεωρείται ζήτημα ύψιστης προτεραιότητας, καθώς η μέση διάρκεια ζωής των ιστοσελίδων είναι λιγότερη από 100 ημέρες, με συνέπεια καθημερινά να εξαφανίζονται από τον παγκόσμιο Ιστό εκατομμύρια ιστοσελίδες, που παύουν να λειτουργούν για διάφορους λόγους και έτσι συνεχώς χάνονται πολύτιμες πληροφορίες.

Τα ιστολόγια (blogs) αποτελούν μια κατηγορία ιστοσελίδων που έχει γίνει ιδιαίτερα δημοφιλής τα τελευταία χρόνια. Ένα βασικό χαρακτηριστικό των blogs είναι οι συσχετίσεις που αναπτύσσονται μεταξύ τους, δημιουργώντας έτσι δίκτυα πληροφοριών ιδιαίτερης αξίας.

To έργο BlogForever υλοποίησε μια πρωτοποριακή μέθοδο ανάκτησης δεδομένων, που λαμβάνει υπόψη το υπερκείμενο, τα μεταδεδομένα και όλα τα διασυνδεδεμένα αρχεία, όπως εικόνες, πολυμέσα, κ.ά., που φιλοξενούνται στα blogs. Σε αντίθεση με τις παραδοσιακές μεθόδους αρχειοθέτησης (web archiving) που αποθηκεύουν απλώς τις ιστοσελίδες, το BlogForever προχωράει παραπέρα, αναλύοντας τα δεδομένα και δομώντας τα σύμφωνα με ένα πρότυπο μοντέλο δεδομένων που αναπτύχθηκε στο πλαίσιο του έργου.

Με αυτό τον τρόπο, γίνεται δυνατός ο εντοπισμός -με πολύ μεγάλη ακρίβεια- στο περιεχόμενο των blogs διαφόρων «οντοτήτων» (συγγραφείς, θέματα, tags, κατηγορίες, σχόλια) και άλλων στοιχείων, τα οποία αποθηκεύονται ως δομημένη πληροφορία στο ψηφιακό αποθετήριο που υλοποίησε το BlogForever με βάση την πλατφόρμα Invenio του CERN.

Αυτή η πλατφόρμα του BlogForever δίνει τη δυνατότητα διαφύλαξης, προβολής, ευρετηρίασης και επαναχρησιμοποίησης του περιεχομένου των blogs με νέους τρόπους, υποστηρίζοντας έτσι τη διεξαγωγή της επιστημονικής έρευνας και τη δημιουργία πρωτοποριακών εφαρμογών στο μέλλον.

Στο BlogForever συνεργάστηκαν επί 30 μήνες δώδεκα ευρωπαϊκοί οργανισμοί από έξι χώρες, με συντονιστή το Τμήμα Πληροφορικής του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης. Οι υπόλοιποι οργανισμοί ήταν: CERN (Ελβετία), CyberWatcher (Νορβηγία), Τεχνικό Πανεπιστήμιο Βερολίνου και εταιρία Mokono GmbH (Γερμανία), Πανεπιστήμια Γλασκόβης, Γουόργουικ και Λονδίνου (Ηνωμένο Βασίλειο), SRDC (Τουρκία), εταιρίες ALTEC S.A., Phaistos Networks και Tero S.A. (Ελλάδα).