חזרה לעמוד הקודם

ויקימדיה מתקדמת לויקינתונים 

ויקיפדיה השיקה לאחרונה את ויקינתונים (או WikiData) – מאגר נתונים ענק בפורמט קריא על ידי מכונות הנערך על ידי בני אדם.  במה מדובר ומה אפשר לעשות עם זה?

מה זה?

ויקינתונים הינו פרויקט חדש של קרן ויקימדיה העולמית. עובדה זאת בעצמה צריכה לעורר התרגשות היות ומדובר בפרויקט הראשון מזה 7 שנים של הארגון הוותיק.

המטרה העיקרית של ויקינתונים היא ליצור מאגר ידע חופשי המרכז עובדות מספריות ומשמש את שירותי הויקי השונים. בעבר קמו להם מספר יוזמות שונות שניסו להשתמש בהררי הנתונים הפזורים ברחבי ויקיפדיה כדי ליצור מאגר נתונים מובנה (למשל DBpedia) אך ויקינתונים מביא עמו שני חידושים מרכזיים.

החידוש הראשון הינו כי המאגר אינו מושך בצורה פאסיווית נתונים מתוך ויקיפדיה אלא מהווה מאגר נתונים הפתוח לעריכה. כחלק ממשפחת ויקימדיה אתר ויקימדיה נשען על פתיחות ועורכים אנושיים המעדכנים את הנתונים ודואגים לסידור המבנה.  בנוסף, הנתונים בפרויקט פתוחים לשימוש תחת רישיון קריאטיב קומונס ולשימוש בעזרת API (אף שזה לא עוצב סופית ועתיד להשתנות).

החידוש השני הוא חידוש באופן המשיכה של הנתונים – המאגר מאז השקתו אינו מושך נתונים מאתרי ויקיפדיה השונים אלא מספק אותם. בדומה לדרך בה שירותי ויקי נשענים על ויקישיתוף כשירות לאכסון קבצי מדיה כך נועד ויקינתונים להוות מאגר מרוכז לנתונים. בהקשר של ויקיפדיה, אתר ויקינתנונים מאפשר לרכז במקום אחד נתונים סטטיסטיים המשמשים ערכים על אותו נושא בשפות שונות (בויקיפדיה 286 שפות), כך שעדכון של נתון יביא לעידכון כלל הערכים המפנים אליו.

מה אפשר לעשות עם זה?

השימוש המרכזי של ויקינתונים הוא לאתרי ויקי (לא רק ויקיפדיה). כפי שנכתב מעלה אלו יוכלו לקשר אובייקטים מתוך ערכים למאגר ולדעת שהנתון בערך יתעדכן בעצמו במידת הצורך. האפשרות להתממשק לשירות אינו מוגבל לאתרי ויקי ובאתר ויקינתונים ישנם כלים והסברים כיצד לנצל את האתר באתרי ויקי חיצוניים.

כפי שאפשר לצפות מקהילות הידע והקוד הפתוח ככל שיעבור הזמן נראה יותר ויותר כלים העושים שימוש במאגר הנתונים המובנה כדי להציג בפנינו מידע סטטיסטי רלוונטי. בינתיים ריכזנו עבורכם כמה כלים ראשונים המדגימים את האפשרויות הגלומות במאגר:

Conditions –  כלי המאפשר  לבחון את התפלגות הערכים של מאפיינים במאגר. לדוגמה ניתן לבצע חיפוש של סדרות טלוויזיה והתפלגותן לפי ז'אנר ולייצר מהן טבלה אינטראקטיבית.

צילום מסך מתוך הכלי המציג דיאגרמת פאיי של התפלגות  סוגי הז'אנר בערכי הספרים

GeneaWiki – כלי המייצר אילן יוחסין מערכים בויקיפדיה. בכלי ניתן להזין שם של אדם ובמידה ויש עליו ועל קרובי משפחה שלו ערכים בויקינתונים הכלי ייצור אילן יוחסין. הנה דוגמה המבוססת על אילן היוחסין של יוהאן סבסטיאן באך.

צילום מסך מתוך הכלי המציג את דיאגרמת הקשרים המשפחתיים של יוהאן סבסטיאן באך

 

Reasonator – כלי זה נועד להציג את כל הנתונים המרוכזים באתר ויקינתונים. במועד זה הכלי פעיל רק לנתונים המרוכזים סביב אדם יחיד. כמו בכלי הקודם גם כלי זה יישים בעיקר לאנשים בעלי הכרה עולמית עליהם נמצא מידע רב במערכת הויקי. דוגמה טובה לכלי הינם הנתונים המרוכזים אודות נשיא ארה"ב, ברק אובאמה.

WikiPeriod  – הינו כלי הבונה את הטבלה המחזורית מתוך מאגר הנתונים של ויקינתונים. לחיצה על היסודות השונים מפנה לעמוד בויקי נתונים המציג את המאפיינים והנתונים השונים המרוכזים על יסוד זה.

חשוב לציין כי למרות ההשקה המוצלחת ויישומי הרשת שהצגנו פה, פרוייקט ויקינתונים מתריע כי ה-API עדיין לא סופי וצפוי להשתנות. נראה שייקח קצת זמן בטרם נראה אפליקציות שונות המשתמשות בנתונים הפומביים.