בניית מטא-דאטא

שלבי בניית המטא-דאטא:

שליפת המידע:

שליפת המידע הורכבה מהתהליכים הבאים:

שליפת נתונים (Linked-data) מDBpedia ע"י שאילתות SPARQL באתר WikiData השליפה נעשתה לפני ז'אנרים וכללה את המידע הבא: שם הספר, שם הסופר, שנת הלידה של הסופר, המיקום בו כתב את הספר, השנה בה כתב את הספר, שם הספר באנגלית והמדינה בה נכתב.

לאחר מכן, כתבנו תכנית Python שהשתמשה בספריית requests. התכנית עברה על רשימת הספרים שהתקבלה מהשאילתות לפי הז'אנרים. עבור כל ספר, התכנית ניגשה לViaf והוציאה משם את המידע על השפות בהן קיים הספר.

הוצאת המידע נעשתה ע"י בניית כתובת URL התואמת לשם הספר, כפי שנשלף ממאגר הנתונים של Wikidata. מכתובת זו קיבלנו קובץ JSON המכיל את פרטי הספר וע"י ניווט בקובץ הJSON הוצאנו את המידע הרלוונטי לגבי שפות אליהן תורגם הספר.

מיזגנו את הנתונים שהתקבלו ויצרנו DataBase המכיל מעל ל15,000 ספרים.

עיבדנו את המידע ע"י קוד Python כך שנוכל להציג את המידע על מפות. העיבוד כלל שינוי של דרך ההצגה של נקודות הציון, עריכת נקודות הציון על מנת למנוע חפיפה של סימונים על המפה.

בניית המפות נעשתה ע"י הממשק Google Map Engine.

בניית DataBase המאפשר חיפוש מורחב. הבנייה נעשתה באתר Caspio ולבסוף סינכרנו את הנתונים באתר שלנו.

...ספרים ועוד

Books and More

בניית מטא-דאטא