פרופ’ יגאל ברונר – “איך הפכתי להומניסט דיגיטלי?”

פרופ’ יגאל ברונר מהאוניברסיטה העברית בירושלים היה בין המציגים במפגש מאגרי מידע ככלי מחקר במדעי הרוח. בהרצאה הוא מספר איך התחיל לחשוב על הקמת מאגר מידע, מה רצה להשיג מפרויקט זה, מה התגלה לו בדרך, איך קיבל תיאבון לעוד, איך הוא מקווה להגדיל את המאגר לכדי מרכז ידע עולמי מקיף בתחום מחקרו ואיך הוא רוצה שיתנהל בעתיד.

מוטמעים חלקים מהרצאתו וכן מצגת ההרצאה. תמליל נגישות בתחתית הדף.

וידאו

חלק ראשון:

חלק שני:

מצגת

קישור לצפייה במצגת בגוגל ולהורדה:
פרופ’ יגאל ברונר – מדעי הרוח הדיגיטליים – “איך הפכתי להומניסט דיגיטלי”?

קישור לאתר המוצג במצגת:
PanditProject.org

תמליל נגישות

תמליל נגישות של ההרצאה בשמיעה חופשית ובפורמליזציה חלקית מאוד.

[סרטון ראשון]
אספר לכם איך זה קרה בכלל שנהייתי הומניסט דיגיטלי, שבכלל לא ידעתי שזה מה שזה שהולך לקרות. והיום יש הרבה ימים שאני מתחרט על זה לפעמים (אבל לא בכל הימים…). זה היה תהליך מחשבתי תודעתי מאוד מעניין. אני קצת אספר לכם על התהליך הזה.
התהליך הוא שלפני כמה שנים פניתי ל- ISF (הקהילה הישראלית למדעים) בבקשה לקבל מענק מחקר לעסוק באיש הזה שעומד שמה משמאל, מעניק ספר לנכד של אחיו, תלמידו כזה, שמו אפאיה דיקשיטה. הוא חי במאה ה-16 בדרום הודו (לא תשמעו ממני הרצאה עליו, אל תדאגו), אבל יכולתי לתת לכם כמה הרצאות עליו. הוא היה איש אשכולות מרתק שחי במאה ה-16. כתב בסנסקריט, כתב כמעט בכל המסורות האינטלקטואליות הרבות של הודו בסנסקריט, היה מחדש גדול בכל אחת מהן. אני כבר הרבה שנים מתעניין בו וחשבתי לעשות עליו איזשהו מחקר (שבאמת אני עושה אותו) ומשום מה הייתה לי גחמה לחשוב שחלק מהמחקר הזה יהיה גם מאגר מידע. לא ידעתי מה זה אומר, אני חשבתי היות שהאיש הזה כתב מאה ספרים וחסרה לנו המון אינפורמציה עליו. הוא אומר “כתבתי מאה ספרים”, הוא מספר את זה על עצמו, זאת אומרת זאת עובדה, אני עוד לא אומר שזאת עובדה נכונה אבל זה מה שהוא אומר. אין לי אפילו את הרשימה של מהם מאה הספרים. יש לי רשימה חלקית ביותר, יש לי כמה עשרות ולא מאה. חשבתי נעשה איזה מן מאגר מידע, לא חשבתי על זה יותר מידי לעומק אבל חשבתי, “קודם כל נסדר קצת את האינפורמציה, ננסה להשלים את האינפורמציה”.
ואחר כך גם חסרה לנו הרבה מאוד אינפורמציה – נאמר שהיא סוציולוגיה של המדע: מי היו התלמידים שלו, מי היו המורים שלו, מי היו ההשפעות שלו, עם מי בדיוק הוא מתווכח. הוא היה בנאדם שהכיל בתוכו מסורת רציפה של כאלפיים שנה של מלומדות, הוא הכיר המון, המון טקסטים, הוא באמת היה ככה גאון הדור במאה ה-16, ידע באמת את כל מה שהיה לפניו. הוא גם עורר סערה עצומה במאות ה-17 וה-18. כולם קראו את הטקסטים שלו, בכל רחבי הודו, למרות שהוא היה מאיזה חור בדרום. איך אנחנו עושים משהו, קרי: למפות קצת את ההקשרים האלה. אבל חשבתי על מה שהיום אני חושב עליו בדיעבד כנישה – מאגר מידע, איזשהו תחום מאוד, מאוד תחום של אינפורמציה. האיש הזה, מהם היצירות שלו, עם מי הוא התכתב ומי התכתב איתו.
אני לא מדבר על לקחת את היצירות האלה עצמן ולעשות להן דיגיטציה, זה גם דבר חשוב שהיה נחמד לעשות אותו אבל זאת לא הייתה המטרה שלי. יש בתחום שלי שלי אנשים שעושים את זה, זה נורא קשה, זה נורא מסובך, חלק מהבעיות את תיארת אותן [תיארה קודם ד”ר יעל נצר בהרצאתה]. מה גם שהאינפורמציה שלנו ברובה לא נמצאת בטקסטים מודפסים אלא במנוסקריפטים שכתובים על עלי דקל מיובשים… מאוד, מאוד מסובך להעביר את האינפורמציה הזאת לדיגיטציה. יש המון שאלות של מטא-מידע ו-TEI וכל מיני דברים כאלה. אני בכלל לא חשבתי להיכנס לתחום הזה וזה לא מה שהתכוונתי. אני התכוונתי ליצור איזו כרטיסיה של מאה יצירות של האיש הזה ולאן הן מתכתבות ורטיקאלית (למעלה ולמטה), הוריזונטלית, וחשבתי שזה פרויקט תחום ונחמד.
אבל היה לי דבר אחד מאוד חשוב שיצא מהפרויקט הזה והוא שאני לא אשים דברים שאני כבר יודע בצנצנות חדשות אלא שאני אלמד מזה משהו חדש. המטרה: רציתי לדעת משהו שלא ידעתי קודם. אז הנה באמת יצרנו אתר שנקרא בהתחלה “אפאיה דיקשיטה” שהיה אמור להיות ליצירות של אדם אחד. ואני אסביר לכם עכשיו קצת על הרעיון שעמד, אני אומר יצרנו כי בניתי את זה בעזרתו של אמיר סימנטוב שיושב פה, על בסיס דרופל שאני לא אסביר לכם את זה כי אני בעצמי לא כל כך מבין את זה.. אבל זה טוב…

[סרטון שני]
אז התברר לנו, עולה לפחות, שיצרתי מפלצת… קודם כול, מצד אחד המערכת שיצרנו עם דרופל “מתבזבזת” מהיצירות. יש בה מאה יצירות – זה לא ביג דאטה בכלל. יש פה מקום ל.. (אני מניח שכולכם ידעתם את זה אבל אני לא ידעתי את זה), זה יש פה מידע בלתי מוגבל וגמישות בלתי מוגבלת. אני יכול “לדחוף” לשם הרבה יותר אינפורמציה, והרבה יותר אנשים והרבה יותר קשרים, והרבה יותר מניפולציות על הידע הזה. אני יכול להפיק הרבה יותר מהכלי הזה.
מצד שני התברר שהדאטה היא הרבה יותר גדולה ממה שחשבתי. כי אם יושב לי במאה ה-16 בנאדם שמתכתב עם כל מי שבא לפניו אלפיים שנה רציפות, אם לא יותר (בעצם – יותר), לפעמים שלושת אלפים שנה, לפעמים קצת יותר… זאת מסורת רצופה תרבותית וטריטוריאלית. זה משהו נדיר בהיסטוריה העולמית, יש אולי עוד דוגמה אחת-שתיים, סינים, התרבות המוסלמית, משהו רציף באותו מקום כל הזמן, וגם הספרייה הגדולה ביותר בעולם העתיק.
אז יש לנו באמת הרבה מיליונים של טקסטים בהרבה מאוד שפות. הוא מתייחס לספרייה הענקית הזאת לפניו, וכל מי שבא **אחריו** מתייחס **אליו**. אז ברגע שאני לוקח ברצינות את המנדט המקורי שלי, הדאטה היא בעצם לא נישה אלא היא ענקית. היא ענקית! אני צריך להכניס בכל אחת מהדיסציפלינות שהאיש כתב בהם את כל מי שבא לפניו ואת כל מי שבא אחריו, ואז המפלצת שיצרתי מתאימה לחיה הענקית הזאת שנמצאת בחוץ. רק מה, איך שדמיינתי את זה בהתחלה – שאני אפנה לחברים שלי ואגיד לכל אחד: “תקליד כמה…”. ככה אנחנו לא נוכל לעשות את זה. זאת אומרת, לעשות את זה אחד אחד – piecemeal, כמו שנקרא – שכל אחד בשעתו החופשית… ויש פה המון בעיות שלא חשבתי עליהן לעומק, המון, על שום דבר לא חשבתי מראש.
אחת הבעיות עליה לא חשבתי, היא שאנשים חיים בעולם אקדמי אכזרי, הם צריכים לפרסם. אף אחד לא נותן להם קרדיט אם יגאל ברונר יבקש מהם לשבת שעות ולמלא דאטה באתר שלו… זה לא עובד ככה. הם צריכים לפרסם ספרים ומאמרים וזה סוג של עבודה שאולי כולנו נלמד ממנה כקהילה המון אבל המערכת האקדמית שבה אנחנו נמצאים לא בנויה כדי לתגמל אותנו. גם אם זה מאוד אכזרי כמו שאנחנו יודעים אז זה בעיה. אז התחלנו לחשוב מחדש, בכלל לא העלינו את האתר הזה לאוויר (שהוא היה רק בצורה של פיילוט) והתחלנו לחשוב שמה אנחנו צריכים לעשות זה לא להתחיל עם עבודות של אנשים בודדים, אלא להתחיל עם עבודה של databases שכבר קיימים ולנסות להעלות אינפורמציה בצורה יותר מאסיבית. כלומר, אין דאטה-בייסים כאלה בדיוק אבל יש המון דאטה-בייסים, אנשים יושבים, חוקרים יושבים, הקדישו את כל הקריירה שלהם לאגור במגירות שלהם ובמחשבים שלהם ובקטלוגים שלהם, אם זה ספריות וכולי. כל מיני סוגים שהם דאטה-בייסים והם כמובן נמצאים בכל מיני פורמטים מיושנים, אבל עדיין יש לנו הרבה מאוד דאטה שאם נמצא דרכים לייבא אותה לתוך המבנה הזה, שהתחלנו לפתח אותו, בצורה סיטונאית ולא בצורה קמעונאית אז נוכל להתקדם יותר מהר.
אז חזרנו לשולחן השרטוטים. והלכנו ל.. עכשיו אני קצת סותר את עצמי, אמרתי שאין לי שום רקע בנושא של דאטה בייס, האמת ששכחתי את זה. אבל לפני כ 15 שנה הייתי שותף להקמה של איזשהו דאטה בייס. אז לא היה דרופאל ולא היו דברים כאלה ועבדנו עם תוכנה שנקראת FileMaker Pro שאז זה נראה מאוד מתקדם אבל היום זה… אנשים הכניסו דאטה והדאטה בייס הזה הומר כמה פעמים, עבר דירה כמה פעמים בסוף הוא די מת, לאף אחד לא הייתה יותר גישה. מי שניהל אותו זה המנחה שלי לשעבר. אמרנו – [הוא ואני – ] – “בוא נציל את הדאטה, נשפוך אותה לתוך הכלים”. הוא אמר: “סבבה”. ועשינו ייבוא של כל הדאטה הזה שזה התברר כתהליך מאוד מסובך. כי ברגע שבאים לדאטה בייס שהוא כבר קיים, מסתבר שיש לו מבנה אחר מהדאטה בייס שאתה רוצה להכיל בו. יש שם שדות שלך אין, ו-**לך** יש שדות ש-**להם** אין, והם התעניינו בדברים **אחרים** ממה שאתה ולך יש איזה מנדט אחר. אז פתאום התחלנו לחשוב על כל המבנה מחדש ואם אתה זוכרים את המבנה הזה שהתחלנו איתו, עם שלושה סוגי תוכן, ומספר לא גדול כל כך של קישורים (אבל זה נראה קצת מרשים) , עברנו לדבר כזה [מציג תרשים] שיש בו סוגי תוכן חדשים. בנוסף לסוגי התוכן Work, Person ו-Site הוספנו Manuscript שזה הכתב-יד עצמו שיש לנו מיליונים ומיליונים ומיליונים שלהם. Print, כלומר, כל אינפורמציה שנמצאת בבית-דפוס, ספרים, מאמרים, מהדורות, וגם כולל מהדורות דיגיטליות וכולי, מקורות מכל מיני מוסדות שקשורים בעולם המחקר שלנו, מקדשים, חצרות מלאכים וכל “השטויות” שלהם, אוניברסיטות קדומות וכולי.
עכשיו באמת עשינו את זה, העברנו, זה לקח המון עבודה אבל הצלחנו להעביר את כל הדאטה בייס הזה לתוך הדאטה המקורית. עכשיו [שלב 04, בפיתוח] עברנו לדאטה בייס הבא שלנו, קיבלנו תיאבון, גדול החוקרים של הפילוסופיה ההודית, Karl Potter, כתב במשך שנים – יש לו אינציקלופדיה שנקראת “אינציקלופדיה של הפילוסופיה ההודית”. יש לו כבר שנים דאטה בייס – אפשר להגיד און-ליין דאטה בייס, ביבליוגרפיה, שכל מה ש-“נחשב”. הוא עדכן את זה להערכתנו עד שנת 201, משהו כזה. במשך כמה עשורים. כל חוקר יושב על קן של דאטה – **הוא** בנה **הר** של דאטה, את כל הספרות המשנית על הפילוסופיה, מה ש-**הוא** קורה פילוסופיה בהודו, בסנסקריט ובכל השפות של הודו. אנחנו נמצאים עכשיו בשלבים מתקדמים של בניית היערכות ל.. שוב, קיבלנו את רשותו בשמחה [של קארל פוטר, בעל מאגר הנתונים]. אנשים, הרבה פעמים, שמחים לתת את הדאטה, כי הדאטה הזאת… אם תיכנסו לאתר שלו – תראו שזה לא נגיש. אין קישור בין נתוני המידע, אי אפשר לקפוץ מדבר לדבר. זה לא דבר חי כמו הדבר שאני רוצה לבנות, זה מן מאובן דאטה – טקסט חופשי, פשוט טקסט חופשי. כן, אי אפשר, אני לא יכול להקליד על יצירה אחת וזה יקפיץ אותי למחבר שלה ושאני אראה מה הוא עוד עשה, זה לא עובד ככה. זה סמטוחה שלמה.
אז אנחנו ביקשנו ממנו רשות, הוא שמח לתת לנו את האפשרות לקחת את כל הדאטה, אבל זה שוב דרש איזושהי היערכות שלא הערכנו כמה היא מסובך, ובינתיים.. הנה תראו איך זה בנוי אצלנו. יש לו אינדקסים שמתחלקים כך: מהמאה החמישית עד למאה התשיעית, מהמאה העשירית עד למאה הארבע עשרה, מהמאה החמש עשרה עד לזה, לפני הזה שוב לפני המאה הרביעית CE , אחר כך טקסטים, אחר כך לפי אסכולות, זה כאילו… בלגן אחד שלם! אנחנו מנסים לעשות איזושהי האחדה – “לשתות” את כל האינפורמציה: מהאנשים אצלו לאנשים אצלנו, מטקסטים אצלו לטקסטים אצלנו, מספרות משנית אצלו לספרות משנית אצלנו, כאשר הכל מסתדר עם הקישורים. ואפשר לעשות את זה – זה רק דורש הרבה עבודה (שזה יש לנו…), והרבה כסף (שזה בינתיים אין לנו…) – אבל אפשר לעשות את זה. וכבר עומדים בתור עוד מאגרים של דאטה שמוכנים, שמחים (או “משחקים אותה קשים להשגה”…) שנבוא לקחת אותם אלינו ואני חושב שאחרי שנעשה כמה סיבובים כאלה (שכל אחד יותר קשה מהקודם מסיבות שאני יכול להסביר אם תרצו), אז יהיה לנו כבר הרבה דאטה. וכשיש הרבה דאטה איכותית, האיכות של הדאטה בייס בשלמותו היא איכות גבוהה. רק אחרי שיהיה לנו הרבה דאטה נוכל לפנות לאנשים ולגשת לגישה של אחד אחד (piecemeal) הזאת של לעבות את זה ולערוך את זה; יש פה פרויקט גדול, בעצם. ועכשיו הפרויקט הגדול הזה נקרא Pandit, הוא לא נקרא יותר “אפאיה דיקשיטה” [על שם המלומד הראשון, היחיד, בשלב הראשוני של הפרויקט]. “פנדיט” זה גם השם של מלומד הודי קלאסי, אחד שיש לו השכלה מלאה. אנגלים כותבים את זה עם האות האנגלית U וזה גם ראשי תיבות. זה פרויקט מאוד שאפתני. הרעיון הוא שיהיה לנו דאטה בייס פרוסופוגרפי, כלומר, לקשר בין האנשים לאנשים וכן בין העבודות לבין האנשים, ובין עבודות לעבודות אחרות, וכיוצא באלה. על כל הודו הפרה-מודרנית, שזה, כמו שאמרתי – הספרייה הגדולה ביותר בעולם הטרום מודרני. זה פרויקט שדורש כבר מימון בסדר גודל גדול יותר, עם עורך קבוע וועדה עורכת שיש בה אנשים שאחראים על כל מיני תחומי ידע, בכל מיני שפות ובכל מיני דיסיפלינות. כל האינפורמציה שנכנסת בתחום מסוים מופנית אליהם, הם מאשרים אותה ופרוטוקול שלם של אישורים. אבל אפשר לעשות את זה. אני עצמי לא רוצה להיות זה שכל החיים יעבוד בזה. אני רוצה לחזור להיות האיש שמורטי צוחק עליו שקורא טקסטים בקורס קריאה קרובה… אבל אני חושב שברגע שהדבר הזה יהיה חי ועצמאי, וימצא לו איזה מסגרת ואיזה “אבא” חדש ש-“ישחרר” אותי ממנה, אז זה יהיה כלי שיכול להיות כלי שלא יהיה חוקר מהקהילה שלי שלא יפתח את הבוקר בלי לפתוח את מאגר הנתונים ולראות איזה גרף חדש הוא יכול לקבל ממנו, איזה.. מה שאנחנו קוראים “פאראמפה” בהודו, איזושהי שושלת של מורה-תלמיד (ושאני נוסף אליה), איזושהי מפה של תפוצה של טקסטים. האפשרויות פה הן אדירות ומרגשות אותי וכך יצא שאני תינוק שנשבה בעולם [הדיגיטלי]. וכמובן יש לנו צוות שהאיש החשוב ביותר זה אמיר סימנטוב והוא עובד בשבילי (אבל בעצם, לרוב, מה שיוצא שאני “עובד בשבילו”) ויש דוקטורנט שלי, עומר קסלר, שהוא עושה הרבה עבודה בשבילנו, ואנדרו אולט – דוקטורנט לשעבר מאוניברסיטת קולומביה (שנמצא פה במקרה בביקור בארץ) ומעצב גרפי ואני. וזה הכול. תודה רבה.