הנגישו את המידע (פתיחות טכנית)

:מונח:,מידע פתוח’ צריך להיות פתוח הן טכנית והן מבחינה חוקית. באופן ספציפי, המידע צריך להיות זמין ברובו בפורמט דיגיטלי.

Available
המידע צריך להיות מתומחר במחיר סביר בלבד של אחזורו, עדיף בצורה שניתנת להורדה חופשית באינטרנט. מודל התמחור הוא כזה, משום שהגוף בו אתם עובדים צריך לפעול ללא כוונת רווח, כשהוא מנגיש מידע.
In bulk
המידע צריך להינתן כמערך מלא. אם יש לכם מידע רשמי שנאסף בהוראת חוק, כל המידע צריך להיות נגיש להורדה. API או שירות דומה מאוד יעילים, אבל אינם משמשים תחליף לגישה המונית לחומר.
In an open, machine-readable format
שימוש חוזר במידע שמוחזק על-ידי גוף ציבורי, אסור לו להיות מוגבל במגבלות של פטנט. חשוב מכך,שמירה על פורמט קריא על-ידי מחשב מאפשרת שימוש חוזר רב יותר של המידע. לצורך הדגמה, חישבו על מידע סטטיסטי, שמפורסם בפורמט PDF, שניתן להדפיסו באיכות גבוהה. בעוד שמסמכים כאלה נקראים על-ידי בני אדם, קשה מאוד לעשות בזה שימוש ממוחשב. הדבר מגביל מאוד שימוש חוזר של מידע שכזה.

להלן כמה עקרונות שיהוו רווח משמעותי:

  • שמרו על פשטות
  • פעלו במהירות
  • היו תכליתיים

במיוחד עדיף לתת מידע לא מעובד כעת, מאשר לתת אותו בצורה מושלמת בעוד חצי שנה.

יש הרבה יותר מדרך אחת, לתת מידע לאחרים. הדבר הטבעי ביותר כיום, זה לתת אותו באינטרנט. יש צורות רבות לכך - באופן בסיסי, גופים מוסרים מידע דרך אתרי האינטרנט שלהם, וקטלוג מרכזי מפנה את המבקרים למקור המתאים. גם לכך דרכים חלופיות.

כאשר ה:מונח:‘קישוריות’ מוגבלת, או גודל המידע גדול באופן קיצוני, ניתן לאשר הפצה בפורמטים אחרים. חלק זה ידון גם בדרכים חלופיות, שיכולות לאפשר שמירה על מחירים נמוכים.

שיטות מקוונות

דרך אתר האינטרנט שלכם

השיטה המוכרת ביותר לאנשי התוכן שלכם, תהיה לאפשר הורדת קבצים דרך האינטרנט. בדיוק כפי שאתם מאפשרים כיום גישה למסמכי דיון, כך קבצי מידע ניתנים להורדה באותה דרך.

קושי אחד בגישה זו, הוא שקשה מאוד למישהו מבחוץ למצוא מידע עדכני בתוך האתר. אפשרות זו מטילה אחריות על מי שמפתח כלים לשימוש במידע שלכם.

באמצעות אתרי צד שלישי

אתרי מידע רבים הפכו למרכזי ידע בתחומים ספציפיים. לדוגמה, pachube.com מיועד לחבר אנשים עם חיישנים, לאלה המחפשים גישה למידע שלהם. Infochimps.com ו- Talis.com מאפשרים לגופים ציבוריים לאחסן כמויות גדולות של מידע בחינם.

אתרי צד שלישי יכולים להיות מאוד יעילים. הסיבה העיקרית לכך היא, שיש להם כבר קהילת מתעניינים, ומערכים שונים של מידע. כאשר המידע שלכם הופך להיות חלק מהפלטפורמות האלה, נוצרת התעניינות צירופית חיובית.

פלטפורמות אחסון מידע כבר מספקות את התשתית, שיכולה לענות על הדרישה. לרוב הן מספקות מידע סטטיסטי ושימושי. לגופים בסקטור הציבורי הדברים נעשה לרוב ללא תמורה.

יכולים להיות שני מחירים לפלטפורמות אלה: הראשונה היא עצמאות. הגוף בו אתם עובדים צריך להיות מסוגל למסור שליטה לאחרים. לרוב, זה דבר קשה פוליטית או תפעולית. המחיר השני הוא פתיחות. וודאו שפלטפורמת המידע שלכם “עיוורת” לגבי מי שיכול לגשת למידע. מפתחי תוכנה ומדענים משתמשים במערכות הפעלה רבות, מטלפונים חכמים למחשבי על. לכולם צריכה להיות גישה למידע.

דרך שרתי FTP

שיטה פחות עכשווית למתן גישה למידע, היא באמצעות שרתי FTP. הצורה הזו מתאימה לקהל יעד טכני, כמו מפתחי תוכנה ומדענים. מערכת ה- FTP מחליפה את ממשק ה- HTTP, אבל היא מיועדת להעברת קבצים.

שירות FTP עדיף פחות. במקום להיכנס לאתר אינטרנט, אתר FTP דומה מאוד לתיקיות במחשב. לכן, למרות שזו שיטה מתאימה לשימוש, יש מעט מאוד דרישה ממפתחי ווב להקים אתרים כאלה.

כטורנטים

:מונח:’BitTorrent’ היא מערכת מוכרת למקבלי ההחלטות, משום הקישור בינה ובין הפרת זכויות. מערכת זו עושה שימוש בקבצים הנקראים טורנטים (Torrents), שמחולקים בין כל מי שמנסה לגשת אליהם. במקום להעמיס על שרתים, ההיצע מתגבר כשהביקוש גובר. זו הסיבה, שמערכת זו כה מצליחה לשיתוף סרטים. זו דרך יעילה בצורה נפלאה להפצת כמויות גדולות של מידע.

כ- API

מידע יכול להיות מופץ באמצעות API (‘Application Programming Interface’). ממשקים אלה הפכו פופולריים מאוד. הם מאפשרים למתכנתים לבחור בכמויות מסוימות של מידע, במקום לספק את כל המידע כקובץ גדול. ממשקי API קשורים במיוחד לבסיסי מידע שמתעדכנים בזמן אמת. המשמעות היא, שמסירת מידע באמצעות API יכולה להבטיח שהמידע עדכני.

מסירת מידע לא מעובד בכמויות גדולות היא הדאגה הגדולה של יזמי מידע פתוח באשר הם. יש כמה עלויות למסירת מידע באמצעות API:

  1. המחיר. נדרש זמן פיתוח ואחזקה ארוך יותר, מאשר מסירת קבצי מידע.
  2. הציפיות. כדי לטפח קהילת משתמשים במידע, חשוב לספק יציבות. כאשר דברים משתבשים, יצפו מכם לתקן אותם ללא עלות.

גישה לכמויות גדולות של מידע מבטיחה:

  1. אין כל תלות בספק המקורי של המידע, כלומר, אם המידע משתנה או שינויים תקציביים משנים את המצב, המידע עדיין זמין.
  2. כל אחד אחר יכול להשיג עותק ולהפיץ אותו לשימוש חוזר. זה מפחית את עלות ההפצה החוזרת ממפיץ המידע המקורי, ומבטיח שאין נקודת כשל יחידה.
  3. אחרים יכולים לפתח שירותים משלהם, בהתבסס על המידע, משום שהם יהיו בטוחים שמידע הזה לא ילקח מהם.

מתן מידע בכמות גדולה מאפשר לאחרים להשתמש במידע, מעבר למטרותיו המקוריות. לדוגמה, ניתן להמיר אותו לפורמט חדש, לקשר אותו למקורות אחרים, או לתת לו גרסאות ולשמור אותו במקומות שונים. בעוד שהגרסה העדכנית של המידע צריכה להימסר באמצעות API, מידע לא מעובד יכול להימסר בכמויות גדולות, בזמנים קבועים.

לדוגמה, לשירות הסטטיסטי של הרכבת האירופית יש אתר הורדות ,המכיל יותר מ- 400 קבצים. השירות מעודכן פעמיים ביום ומציע קבצים בפורמט TSV (Tab-separated values). הוא כולל מסמכים על האתר עצמו, כמו גם על קבצי המידע.

דוגמה נוספת, היא קטלוג המידע של מחוז קולומביה, שמאפשר להוריד את המידע בפורמט CSV או אקסל, בנוסף לפיד חי של המידע.