קטגוריה: ארועים

כנסים, מפגשים, קולות קוראים ועוד

מהפכת המידע במדעי הרוח:   סדנה לרכישת כלים דיגיטליים למחקר

 עם עיצום תהליך הדיגיטציה של כלל התיעוד הקיים, ניתן לרכז, לשמור ולעבד במהירות נפחי מידע חסרי תקדים. אפשרויות אלה הופכות את דרכי המחקר הדיגיטליות החדשות רלוונטיות לחוקרים במדעי הרוח. אם בעבר נדרשה הכשרה מקיפה לניצול אפשרויות חדשות אלו, הרי שבשנים האחרונות פותחו תוכנות שמאפשרות יישום נוח שאינו דורש ידע קודם.

מטרת הסדנה ליצור הכרות עם דרכי החקירה החדשות ועם טכניקות וכלים שפותחו ליישומם, ולהכשיר חוקרים לשימוש בכלים אלה. הסדנה תקנה כלים דיגיטליים שהם גם אוניברסליים וגם שימושיים למדעי הרוח.

הסדנה תכלול מבואות וארגזי כלים מחקריים בשני תחומים עיקריים:

  • ניתוח רשתות חברתיות (SNA)
  • מערכות מידע גיאוגרפי (GIS)

ד”ר זף סגל ופרופ’ מנחם בלונדהיים

ינחו שישה מפגשים החל ב-31.3.2016 ועד סוף סמסטר ב

בימי חמישי בשעות 12:00-10:30 בבניין מנדל

השיעור יתקיים בבניין מנדל, חדר 521 (קומה 5)

הסדנה פתוחה לתלמידי מחקר, פוסט דוקטורנטים ומרצים מבי”ס מנדל, מרכז המחקר דעת המקום וגם מחוץ להם. השתתפות סדירה בסדנה תקנה תעודת סיום.

יש צורך בהרשמה מוקדמת והתחייבות להשתתף בכל המפגשים. הכתובת להרשמה: msas@savion.huji.ac.il

על המשתתפים להביא לפגישות מחשב אישי

Screen Shot 2016-03-22 at 8.15.27

חקר רשתות היסטוריות: מפגש באוניברסיטת תל אביב

ביה״ס להיסטוריה באוניברסיטת תל אביב מארח אותנו שוב!  

חציו הראשון של המפגש יוקדש להצגת מקרי מחקר של חוקרים/ות במדעי הרוח, החוקרים/ות רשתות היסטוריות בכלים דיגיטליים. חלקו השני של המפגש יהיה סדנה הנוגעת לתהליך עיבוד הנתונים –  מטקסט, לדאטה ולרשת. החלק הראשון פתוח לכל המעוניין; מי שמעוניין להשתתף בסדנה מתבקש להירשם דרך הקישור הזה.

המיקום: חדר 133 בבניין גילמן באוניברסיטת תל אביב

הזמן: 29/03 בין 14:30-19:00.

התכנית:

  • מחקרים לדוגמה :
  • הראל חורב (אונ׳ תל אביב)
  • ג׳ני פוליאקוב (אונ׳ תל אביב)
  • פלורנס הודוס (האונ׳ העברית, תציג בשפה האנגלית)
  • גילה פריבור ומעיין ז׳יטומירסקי גפת (אונ׳ בר אילן): ״בניית רשת חברתית של חז”ל: המקרה של המשנה והתנאים״.
    פרטים נוספים ימולאו כאן בקרוב.
    הפסקה
  • סדנה (לרשומים בלבד): מטקסט לדאטה –  סיני רוסינק (בר אילן והאונ׳ העברית)

Social_Network_Analysis_Visualization

ביום שלישי, 19.1.2015 בספריה הלאומית: אירוע הסיום של ׳הכיתה02׳

הכיתה 02 היא תכנית ייחודית, פרי שיתוף פעולה ייחודי בין הסדנא לידע ציבורי​ והספרייה הלאומית, להכשרת מתכנתים לפיתוח Web Applications בקוד פתוח, להנגשה וחשיפה של מידע ציבורי ואוצרות מורשת תרבותית.Screen Shot 2016-01-13 at 4.37.00 PM

עם סיום התכנית, ולאחר מאות שעות של למידה ועבודה, אנו גאים לחלוק עמכם את תוצרי התכנית, באירוע מיוחד בו נשיק שמונה פרוייקטים שונים החושפים לציבור הרחב את המאגרים והאוספים העשירים של הספרייה הלאומית בדרכים חדשות ומקוריות.

האירוע יתקיים בספרייה הלאומית, גבעת רם (ירושלים), ביום ג’, 19.1.2015 בשעה 18:00.

לוח זמנים לאירוע

18:00-18:30 התכנסות
18:30-19:00 EXPO  –  תערוכת הפרויקטים שפותחו ב”הכיתה 02″
19:00-19:15 ברכות מפי בכירים בספרייה הלאומית והסדנא לידע ציבורי
19:15-20:00 זרקור על פרויקטים נבחרים
20:00 סיכום

הכניסה לאירוע חופשית, אך מותנית בהרשמה מראש.

להרשמה

הזמנה להשקה: דיקטה!

חברים שלום,

אני שמח להזמין אתכם להשקה של דיקטה, מכון מחקר חדש שמטרתו להנגיש את הכלים החדשים של בלשנות חישובית לחקר הספרות העברית/היהודית לדורותיה, מהתנ״ך ועד היום.

בין הפרוייקטים:
-איסוף קורפוס שלם ככל האפשר עם אנוטציה מלאה מרמת הספר ועד לרמת המילה.
-ייחוס ספרים וקטעים שמחברם לא ידוע או שנוי במחלוקת וניתוח מקורות של ספרים מורכבים.
-זיהוי אוטומטי של הפניות בין ספרים ושל טקסטים מקבילים והשוואתם, וזיהוי של hubs ו-authorities בכל נושא.
-שחזור ur-text על בסיס השוואת עדי נוסח.

הצעות לפרוייקטים נוספים תתקבלנה בברכה (ובמקרים מסוימים גם תמומנו).

המפגש יתקיים ביום שלישי 10.11 במשרדי פורום קהלת, רח׳ עם ועולמו 8, גבעת שאול, ירושלים.

בתוכנית:
17:15  התכנסות וכיבוד בשרי (אופציה צמחונית)
17:45  הצגת החזון וכלים ראשונים שפותחו (משה קופל ועדן ארז)
18:15  הצגת כלים בשלבי פיתוח (יעל נצר, מני אדלר, אבי שמידמן)
19:00  דיון פתוח — מה כדאי לעשות

כדי להקל על תכנון האירוע, המשתתפים מתבקשים להירשם מראש.
להרשמה: 📝

בברכה,
משה קופל

מושבים במדעי הרוח הדיגיטליים – EVA / Minerva 2015

במסגרת כנס אווה/מינרבה 2015 שיתקיים ב-8 וב-9 בנובמבר במכון ון ליר בירושלים יתקיימו, במקביל, שתי סדרות מושבים מקבילות: האחת תוקדש לפרוייקטים דיגיטליים במדעי היהדות והשניה לארכאולוגיה דיגיטלית. שתיהן תתקימנה ביום ב׳, היום השני של הכנס.

המושבים יתקיימו חלקם בעברית וחלקם באנגלית.

לתכנית (המלאה) באנגלית

לתכנית (המלאה)בעברית

להרשמה

Screen Shot 2015-10-24 at 3.50.23 PM

Screen Shot 2015-10-24 at 3.50.40 PM

Screen Shot 2015-10-24 at 3.50.54 PM

 

פרופ’ יגאל ברונר – “איך הפכתי להומניסט דיגיטלי?”

פרופ’ יגאל ברונר מהאוניברסיטה העברית בירושלים היה בין המציגים במפגש מאגרי מידע ככלי מחקר במדעי הרוח. בהרצאה הוא מספר איך התחיל לחשוב על הקמת מאגר מידע, מה רצה להשיג מפרויקט זה, מה התגלה לו בדרך, איך קיבל תיאבון לעוד, איך הוא מקווה להגדיל את המאגר לכדי מרכז ידע עולמי מקיף בתחום מחקרו ואיך הוא רוצה שיתנהל בעתיד.

מוטמעים חלקים מהרצאתו וכן מצגת ההרצאה. תמליל נגישות בתחתית הדף.

וידאו

חלק ראשון:

חלק שני:

מצגת

קישור לצפייה במצגת בגוגל ולהורדה:
פרופ’ יגאל ברונר – מדעי הרוח הדיגיטליים – “איך הפכתי להומניסט דיגיטלי”?

קישור לאתר המוצג במצגת:
PanditProject.org

תמליל נגישות

תמליל נגישות של ההרצאה בשמיעה חופשית ובפורמליזציה חלקית מאוד.

[סרטון ראשון]
אספר לכם איך זה קרה בכלל שנהייתי הומניסט דיגיטלי, שבכלל לא ידעתי שזה מה שזה שהולך לקרות. והיום יש הרבה ימים שאני מתחרט על זה לפעמים (אבל לא בכל הימים…). זה היה תהליך מחשבתי תודעתי מאוד מעניין. אני קצת אספר לכם על התהליך הזה.
התהליך הוא שלפני כמה שנים פניתי ל- ISF (הקהילה הישראלית למדעים) בבקשה לקבל מענק מחקר לעסוק באיש הזה שעומד שמה משמאל, מעניק ספר לנכד של אחיו, תלמידו כזה, שמו אפאיה דיקשיטה. הוא חי במאה ה-16 בדרום הודו (לא תשמעו ממני הרצאה עליו, אל תדאגו), אבל יכולתי לתת לכם כמה הרצאות עליו. הוא היה איש אשכולות מרתק שחי במאה ה-16. כתב בסנסקריט, כתב כמעט בכל המסורות האינטלקטואליות הרבות של הודו בסנסקריט, היה מחדש גדול בכל אחת מהן. אני כבר הרבה שנים מתעניין בו וחשבתי לעשות עליו איזשהו מחקר (שבאמת אני עושה אותו) ומשום מה הייתה לי גחמה לחשוב שחלק מהמחקר הזה יהיה גם מאגר מידע. לא ידעתי מה זה אומר, אני חשבתי היות שהאיש הזה כתב מאה ספרים וחסרה לנו המון אינפורמציה עליו. הוא אומר “כתבתי מאה ספרים”, הוא מספר את זה על עצמו, זאת אומרת זאת עובדה, אני עוד לא אומר שזאת עובדה נכונה אבל זה מה שהוא אומר. אין לי אפילו את הרשימה של מהם מאה הספרים. יש לי רשימה חלקית ביותר, יש לי כמה עשרות ולא מאה. חשבתי נעשה איזה מן מאגר מידע, לא חשבתי על זה יותר מידי לעומק אבל חשבתי, “קודם כל נסדר קצת את האינפורמציה, ננסה להשלים את האינפורמציה”.
ואחר כך גם חסרה לנו הרבה מאוד אינפורמציה – נאמר שהיא סוציולוגיה של המדע: מי היו התלמידים שלו, מי היו המורים שלו, מי היו ההשפעות שלו, עם מי בדיוק הוא מתווכח. הוא היה בנאדם שהכיל בתוכו מסורת רציפה של כאלפיים שנה של מלומדות, הוא הכיר המון, המון טקסטים, הוא באמת היה ככה גאון הדור במאה ה-16, ידע באמת את כל מה שהיה לפניו. הוא גם עורר סערה עצומה במאות ה-17 וה-18. כולם קראו את הטקסטים שלו, בכל רחבי הודו, למרות שהוא היה מאיזה חור בדרום. איך אנחנו עושים משהו, קרי: למפות קצת את ההקשרים האלה. אבל חשבתי על מה שהיום אני חושב עליו בדיעבד כנישה – מאגר מידע, איזשהו תחום מאוד, מאוד תחום של אינפורמציה. האיש הזה, מהם היצירות שלו, עם מי הוא התכתב ומי התכתב איתו.
אני לא מדבר על לקחת את היצירות האלה עצמן ולעשות להן דיגיטציה, זה גם דבר חשוב שהיה נחמד לעשות אותו אבל זאת לא הייתה המטרה שלי. יש בתחום שלי שלי אנשים שעושים את זה, זה נורא קשה, זה נורא מסובך, חלק מהבעיות את תיארת אותן [תיארה קודם ד”ר יעל נצר בהרצאתה]. מה גם שהאינפורמציה שלנו ברובה לא נמצאת בטקסטים מודפסים אלא במנוסקריפטים שכתובים על עלי דקל מיובשים… מאוד, מאוד מסובך להעביר את האינפורמציה הזאת לדיגיטציה. יש המון שאלות של מטא-מידע ו-TEI וכל מיני דברים כאלה. אני בכלל לא חשבתי להיכנס לתחום הזה וזה לא מה שהתכוונתי. אני התכוונתי ליצור איזו כרטיסיה של מאה יצירות של האיש הזה ולאן הן מתכתבות ורטיקאלית (למעלה ולמטה), הוריזונטלית, וחשבתי שזה פרויקט תחום ונחמד.
אבל היה לי דבר אחד מאוד חשוב שיצא מהפרויקט הזה והוא שאני לא אשים דברים שאני כבר יודע בצנצנות חדשות אלא שאני אלמד מזה משהו חדש. המטרה: רציתי לדעת משהו שלא ידעתי קודם. אז הנה באמת יצרנו אתר שנקרא בהתחלה “אפאיה דיקשיטה” שהיה אמור להיות ליצירות של אדם אחד. ואני אסביר לכם עכשיו קצת על הרעיון שעמד, אני אומר יצרנו כי בניתי את זה בעזרתו של אמיר סימנטוב שיושב פה, על בסיס דרופל שאני לא אסביר לכם את זה כי אני בעצמי לא כל כך מבין את זה.. אבל זה טוב…

[סרטון שני]
אז התברר לנו, עולה לפחות, שיצרתי מפלצת… קודם כול, מצד אחד המערכת שיצרנו עם דרופל “מתבזבזת” מהיצירות. יש בה מאה יצירות – זה לא ביג דאטה בכלל. יש פה מקום ל.. (אני מניח שכולכם ידעתם את זה אבל אני לא ידעתי את זה), זה יש פה מידע בלתי מוגבל וגמישות בלתי מוגבלת. אני יכול “לדחוף” לשם הרבה יותר אינפורמציה, והרבה יותר אנשים והרבה יותר קשרים, והרבה יותר מניפולציות על הידע הזה. אני יכול להפיק הרבה יותר מהכלי הזה.
מצד שני התברר שהדאטה היא הרבה יותר גדולה ממה שחשבתי. כי אם יושב לי במאה ה-16 בנאדם שמתכתב עם כל מי שבא לפניו אלפיים שנה רציפות, אם לא יותר (בעצם – יותר), לפעמים שלושת אלפים שנה, לפעמים קצת יותר… זאת מסורת רצופה תרבותית וטריטוריאלית. זה משהו נדיר בהיסטוריה העולמית, יש אולי עוד דוגמה אחת-שתיים, סינים, התרבות המוסלמית, משהו רציף באותו מקום כל הזמן, וגם הספרייה הגדולה ביותר בעולם העתיק.
אז יש לנו באמת הרבה מיליונים של טקסטים בהרבה מאוד שפות. הוא מתייחס לספרייה הענקית הזאת לפניו, וכל מי שבא **אחריו** מתייחס **אליו**. אז ברגע שאני לוקח ברצינות את המנדט המקורי שלי, הדאטה היא בעצם לא נישה אלא היא ענקית. היא ענקית! אני צריך להכניס בכל אחת מהדיסציפלינות שהאיש כתב בהם את כל מי שבא לפניו ואת כל מי שבא אחריו, ואז המפלצת שיצרתי מתאימה לחיה הענקית הזאת שנמצאת בחוץ. רק מה, איך שדמיינתי את זה בהתחלה – שאני אפנה לחברים שלי ואגיד לכל אחד: “תקליד כמה…”. ככה אנחנו לא נוכל לעשות את זה. זאת אומרת, לעשות את זה אחד אחד – piecemeal, כמו שנקרא – שכל אחד בשעתו החופשית… ויש פה המון בעיות שלא חשבתי עליהן לעומק, המון, על שום דבר לא חשבתי מראש.
אחת הבעיות עליה לא חשבתי, היא שאנשים חיים בעולם אקדמי אכזרי, הם צריכים לפרסם. אף אחד לא נותן להם קרדיט אם יגאל ברונר יבקש מהם לשבת שעות ולמלא דאטה באתר שלו… זה לא עובד ככה. הם צריכים לפרסם ספרים ומאמרים וזה סוג של עבודה שאולי כולנו נלמד ממנה כקהילה המון אבל המערכת האקדמית שבה אנחנו נמצאים לא בנויה כדי לתגמל אותנו. גם אם זה מאוד אכזרי כמו שאנחנו יודעים אז זה בעיה. אז התחלנו לחשוב מחדש, בכלל לא העלינו את האתר הזה לאוויר (שהוא היה רק בצורה של פיילוט) והתחלנו לחשוב שמה אנחנו צריכים לעשות זה לא להתחיל עם עבודות של אנשים בודדים, אלא להתחיל עם עבודה של databases שכבר קיימים ולנסות להעלות אינפורמציה בצורה יותר מאסיבית. כלומר, אין דאטה-בייסים כאלה בדיוק אבל יש המון דאטה-בייסים, אנשים יושבים, חוקרים יושבים, הקדישו את כל הקריירה שלהם לאגור במגירות שלהם ובמחשבים שלהם ובקטלוגים שלהם, אם זה ספריות וכולי. כל מיני סוגים שהם דאטה-בייסים והם כמובן נמצאים בכל מיני פורמטים מיושנים, אבל עדיין יש לנו הרבה מאוד דאטה שאם נמצא דרכים לייבא אותה לתוך המבנה הזה, שהתחלנו לפתח אותו, בצורה סיטונאית ולא בצורה קמעונאית אז נוכל להתקדם יותר מהר.
אז חזרנו לשולחן השרטוטים. והלכנו ל.. עכשיו אני קצת סותר את עצמי, אמרתי שאין לי שום רקע בנושא של דאטה בייס, האמת ששכחתי את זה. אבל לפני כ 15 שנה הייתי שותף להקמה של איזשהו דאטה בייס. אז לא היה דרופאל ולא היו דברים כאלה ועבדנו עם תוכנה שנקראת FileMaker Pro שאז זה נראה מאוד מתקדם אבל היום זה… אנשים הכניסו דאטה והדאטה בייס הזה הומר כמה פעמים, עבר דירה כמה פעמים בסוף הוא די מת, לאף אחד לא הייתה יותר גישה. מי שניהל אותו זה המנחה שלי לשעבר. אמרנו – [הוא ואני – ] – “בוא נציל את הדאטה, נשפוך אותה לתוך הכלים”. הוא אמר: “סבבה”. ועשינו ייבוא של כל הדאטה הזה שזה התברר כתהליך מאוד מסובך. כי ברגע שבאים לדאטה בייס שהוא כבר קיים, מסתבר שיש לו מבנה אחר מהדאטה בייס שאתה רוצה להכיל בו. יש שם שדות שלך אין, ו-**לך** יש שדות ש-**להם** אין, והם התעניינו בדברים **אחרים** ממה שאתה ולך יש איזה מנדט אחר. אז פתאום התחלנו לחשוב על כל המבנה מחדש ואם אתה זוכרים את המבנה הזה שהתחלנו איתו, עם שלושה סוגי תוכן, ומספר לא גדול כל כך של קישורים (אבל זה נראה קצת מרשים) , עברנו לדבר כזה [מציג תרשים] שיש בו סוגי תוכן חדשים. בנוסף לסוגי התוכן Work, Person ו-Site הוספנו Manuscript שזה הכתב-יד עצמו שיש לנו מיליונים ומיליונים ומיליונים שלהם. Print, כלומר, כל אינפורמציה שנמצאת בבית-דפוס, ספרים, מאמרים, מהדורות, וגם כולל מהדורות דיגיטליות וכולי, מקורות מכל מיני מוסדות שקשורים בעולם המחקר שלנו, מקדשים, חצרות מלאכים וכל “השטויות” שלהם, אוניברסיטות קדומות וכולי.
עכשיו באמת עשינו את זה, העברנו, זה לקח המון עבודה אבל הצלחנו להעביר את כל הדאטה בייס הזה לתוך הדאטה המקורית. עכשיו [שלב 04, בפיתוח] עברנו לדאטה בייס הבא שלנו, קיבלנו תיאבון, גדול החוקרים של הפילוסופיה ההודית, Karl Potter, כתב במשך שנים – יש לו אינציקלופדיה שנקראת “אינציקלופדיה של הפילוסופיה ההודית”. יש לו כבר שנים דאטה בייס – אפשר להגיד און-ליין דאטה בייס, ביבליוגרפיה, שכל מה ש-“נחשב”. הוא עדכן את זה להערכתנו עד שנת 201, משהו כזה. במשך כמה עשורים. כל חוקר יושב על קן של דאטה – **הוא** בנה **הר** של דאטה, את כל הספרות המשנית על הפילוסופיה, מה ש-**הוא** קורה פילוסופיה בהודו, בסנסקריט ובכל השפות של הודו. אנחנו נמצאים עכשיו בשלבים מתקדמים של בניית היערכות ל.. שוב, קיבלנו את רשותו בשמחה [של קארל פוטר, בעל מאגר הנתונים]. אנשים, הרבה פעמים, שמחים לתת את הדאטה, כי הדאטה הזאת… אם תיכנסו לאתר שלו – תראו שזה לא נגיש. אין קישור בין נתוני המידע, אי אפשר לקפוץ מדבר לדבר. זה לא דבר חי כמו הדבר שאני רוצה לבנות, זה מן מאובן דאטה – טקסט חופשי, פשוט טקסט חופשי. כן, אי אפשר, אני לא יכול להקליד על יצירה אחת וזה יקפיץ אותי למחבר שלה ושאני אראה מה הוא עוד עשה, זה לא עובד ככה. זה סמטוחה שלמה.
אז אנחנו ביקשנו ממנו רשות, הוא שמח לתת לנו את האפשרות לקחת את כל הדאטה, אבל זה שוב דרש איזושהי היערכות שלא הערכנו כמה היא מסובך, ובינתיים.. הנה תראו איך זה בנוי אצלנו. יש לו אינדקסים שמתחלקים כך: מהמאה החמישית עד למאה התשיעית, מהמאה העשירית עד למאה הארבע עשרה, מהמאה החמש עשרה עד לזה, לפני הזה שוב לפני המאה הרביעית CE , אחר כך טקסטים, אחר כך לפי אסכולות, זה כאילו… בלגן אחד שלם! אנחנו מנסים לעשות איזושהי האחדה – “לשתות” את כל האינפורמציה: מהאנשים אצלו לאנשים אצלנו, מטקסטים אצלו לטקסטים אצלנו, מספרות משנית אצלו לספרות משנית אצלנו, כאשר הכל מסתדר עם הקישורים. ואפשר לעשות את זה – זה רק דורש הרבה עבודה (שזה יש לנו…), והרבה כסף (שזה בינתיים אין לנו…) – אבל אפשר לעשות את זה. וכבר עומדים בתור עוד מאגרים של דאטה שמוכנים, שמחים (או “משחקים אותה קשים להשגה”…) שנבוא לקחת אותם אלינו ואני חושב שאחרי שנעשה כמה סיבובים כאלה (שכל אחד יותר קשה מהקודם מסיבות שאני יכול להסביר אם תרצו), אז יהיה לנו כבר הרבה דאטה. וכשיש הרבה דאטה איכותית, האיכות של הדאטה בייס בשלמותו היא איכות גבוהה. רק אחרי שיהיה לנו הרבה דאטה נוכל לפנות לאנשים ולגשת לגישה של אחד אחד (piecemeal) הזאת של לעבות את זה ולערוך את זה; יש פה פרויקט גדול, בעצם. ועכשיו הפרויקט הגדול הזה נקרא Pandit, הוא לא נקרא יותר “אפאיה דיקשיטה” [על שם המלומד הראשון, היחיד, בשלב הראשוני של הפרויקט]. “פנדיט” זה גם השם של מלומד הודי קלאסי, אחד שיש לו השכלה מלאה. אנגלים כותבים את זה עם האות האנגלית U וזה גם ראשי תיבות. זה פרויקט מאוד שאפתני. הרעיון הוא שיהיה לנו דאטה בייס פרוסופוגרפי, כלומר, לקשר בין האנשים לאנשים וכן בין העבודות לבין האנשים, ובין עבודות לעבודות אחרות, וכיוצא באלה. על כל הודו הפרה-מודרנית, שזה, כמו שאמרתי – הספרייה הגדולה ביותר בעולם הטרום מודרני. זה פרויקט שדורש כבר מימון בסדר גודל גדול יותר, עם עורך קבוע וועדה עורכת שיש בה אנשים שאחראים על כל מיני תחומי ידע, בכל מיני שפות ובכל מיני דיסיפלינות. כל האינפורמציה שנכנסת בתחום מסוים מופנית אליהם, הם מאשרים אותה ופרוטוקול שלם של אישורים. אבל אפשר לעשות את זה. אני עצמי לא רוצה להיות זה שכל החיים יעבוד בזה. אני רוצה לחזור להיות האיש שמורטי צוחק עליו שקורא טקסטים בקורס קריאה קרובה… אבל אני חושב שברגע שהדבר הזה יהיה חי ועצמאי, וימצא לו איזה מסגרת ואיזה “אבא” חדש ש-“ישחרר” אותי ממנה, אז זה יהיה כלי שיכול להיות כלי שלא יהיה חוקר מהקהילה שלי שלא יפתח את הבוקר בלי לפתוח את מאגר הנתונים ולראות איזה גרף חדש הוא יכול לקבל ממנו, איזה.. מה שאנחנו קוראים “פאראמפה” בהודו, איזושהי שושלת של מורה-תלמיד (ושאני נוסף אליה), איזושהי מפה של תפוצה של טקסטים. האפשרויות פה הן אדירות ומרגשות אותי וכך יצא שאני תינוק שנשבה בעולם [הדיגיטלי]. וכמובן יש לנו צוות שהאיש החשוב ביותר זה אמיר סימנטוב והוא עובד בשבילי (אבל בעצם, לרוב, מה שיוצא שאני “עובד בשבילו”) ויש דוקטורנט שלי, עומר קסלר, שהוא עושה הרבה עבודה בשבילנו, ואנדרו אולט – דוקטורנט לשעבר מאוניברסיטת קולומביה (שנמצא פה במקרה בביקור בארץ) ומעצב גרפי ואני. וזה הכול. תודה רבה.

DIGITAL ARCHAEOLOGY: CARING FOR DATA

CALL FOR PAPERS
EVA / MINERVA 2015

The XIIth Annual International Conference on the Digitization of Cultural Heritage will be held at the Van Leer Institute, Jerusalem on the 8-9th of November, 2015. This conference provides the opportunity for the community of professionals working in the digitization of cultural heritage both in Israel and their international colleagues, to come together and share their latest projects, research and perspectives and supply fresh discussions.
This year the conference will host two archaeological sessions organized in collaboration with the Israel Antiquities Authority.

Session title:
DIGITAL ARCHAEOLOGY: CARING FOR DATA
Session organizers:
Sveta Matskevich (The Hebrew University of Jerusalem), Liat Weinblum (Israel Antiquities Authority)
Language: English
Length of the paper: 20 min

Despite the literal name of their profession (“the science of old things”); archaeologists are among the most active producers of digital records of our cultural heritage. This stems from the essential unrepeatability of the archaeological record. In order to get her data, the archaeologist needs to excavate it out, and hence in effect destroy the context in which it was found. All that remains after the process is complete are the records; whether memories in the archaeologist’s mind, or written, drawn, or photographed records, now increasingly as time goes on we have a range of digital records.
Constantly developing data acquisition methods and complex data formats pose distinct challenges in the preservation of archaeological archives and their presentation to the archaeological community and the wider public. We, the archaeological communities in different parts of the world, need to join our efforts together in the management of our digital cultural heritage.
Session themes:
This session is intended to bring together innovative practices in collection, preservation and dissemination of archaeological data. We welcome papers that discuss various facets of digital archaeology with the emphasis on data management in the field of:
– Field recording
– Spatial data
– Scientific datasets
– Dissemination via Web, Linked Data
– Digital archives
– 3D and Visualisation
The call for papers close on August 15, 2015. Please submit your abstracts (up to 250 words) to Sveta Matskevich (s.matskev@gmail.com)
All presenters whose papers have been accepted, need to register for the conference online with a code that will be provided to you. This will allow you to register for the conference free of charge

Key dates: . Please note that no on-site registrations will be possible.
20 June, 2015 – call for papers opens
15 August, 2015 – call for papers closes
1 September 2015 – notification of acceptance
8 – 9 November 2015 – conference
For more information about EVA / Minerva 2015 see: http://www.digital-heritage.org.il/

פתיחת ‘מאגרים’ למחקר

מפגש מיוחד של רוח דיגיטלית באקדמיה ללשון העברית

בשנת תשס”ו (2006) פרסמה האקדמיה ללשון העברית באתר מאגרים את כל החומר הטקסטואלי של הספרות העתיקה שנאסף במפעל המילון ההיסטורי כפי שהוכן לצורכי המפעל. הארכיון האמור של מפעל המילון אינו ארכיון של מילים בלבד אלא גם ארכיון של טקסטים – מועתקים על פי כתבי היד הטובים ביותר, מנותחים ומעובדים על פי עקרונות מדעיים מובהקים. חוקרים, תלמידים מתקדמים והציבור הרחב משתמשים יותר ויותר באוצרות הגנוזים שעכשיו אפשר להגיע אליהם בלא טורח. זו מהפכה במחקר הטקסטים של היהדות הקדומה. פרסומם המתוכנן של הטקסטים העבריים מראשית ימי ההשכלה ועד אמצע המאה העשרים באתר האקדמיה יפתח פתח למהפכה דומה במחקר הספרות העברית החדשה ולשונה.

בסדנה, שתתקיים בחודש פברואר באקדמיה ללשון העברית (ראו מפה),  נבחן אפשרות לפתיחת גישה ישירה יותר של החוקר/ת אל ‘מאגרים’, מעבר לחיפוש דרך מנשק המשתמש הקיים. להרשמה:

 

The Parting of the Ways?: Computing Semantic Change between the Testaments; Thursday, Nov.20

אנו שמחים להזמינכם להרצאה בהאב הפתוח, ביום חמישי 20 לנובמבר, כ”ז בחשוון, 19:00

מתיו מנסון מאוניברסיטת לייפציג יציג את עבודתו. לפרטים:

Capture

November 20, 19:00 Matthew Munson @ the Open Hub

The New Testament is often considered, especially by Christians, to be a huge theological leap beyond the Old Testament. This belief is even reflected in their names: the New replaces the Old. But is this truly the case? How much of the ‘leap’ that Christians see was simply a change in focus the same theological system? This paper will demonstrate how the author is using computational methods to help answer these questions. By tracking how much and in which direction every word changes in meaning between the Septuagint (the Greek translation of the Bible) and the Greek New Testament, the author will be able to map more precisely the movement from the Jewish to the Christian Testament and to tell a more complete story of how a first century Jewish sect came to understand its place both within and outside of Judaism.
This paper will consist of a short introduction to the computational methods being used, with the going towards a more detailed analysis of what we learn about a few important words. It will conclude with a summary of the advantages and limitations of these methods with some ideas for expansion of both the questions to be asked and the corpora under investigation.

לפרטים נוספים, ראו את תקציר ההצגה של מנסון מהכנס למדעי הרוח הדיגיטליים 2014: http://dharchive.org/paper/DH2014/Paper-394.xml

מדעי היהדות הדיגיטליים – שני מושבים מיוחדים במסגרת הכנס לדיגיטציה של התרבות

יום שני (הקרוב!), 10 לנובמבר, י”ז בחשוון

אנחנו שמחים לפתוח את השנה (באיחור מסוים) בשני מושבים מיוחדים מטעם האיגוד העולמי של לימודי יהדות: מושב על כיוונים דיגיטליים בלימודי יהדות, ומושב על פתיחות ופתיחה של משאבים בעברית. למרות התקצירים שלעיל – ההצגות יהיו בשפה העברית. הרשמה לכנס לתלמידי מחקר היא ללא תשלום (אנא פנו למילי חזן לקבלת קוד הרשמה וכתבו שהגעתם דרך סיני).

נשמח לראותכם!

יעקב דויטש (האיגוד העולמי למדעי היהדות) וסיני רוסינק (אקדמית פולונסקי במכון ון ליר, רוח דיגיטלית)

קישור לתכנית באתר הכנס

First session:

14:00-15:30 – Upper Hall

Kabbalah Research: Toward New Digital Perspectives
Yoed Kadary, Ben Gurion University

 The research of Kabbalah, i.e. Jewish Mysticism is a developing and popular field of study, nevertheless it is still relatively new, and many of its primary sources are still in manuscripts. Coming from the consumers’ side of the map and not from the one of the developers of digital means, my presentation is merely a “shopping list” of digital tools to promote Kabbalah research. In a more serious note, my aim in this paper is to characterize the research needs, to portray an initial technological vision, and to invite collaborations. I will discuss the need for two types of tools: one for analyzing the preliminary sources and the manuscripts of the Kabbalah research field, and one that will promote the efficiency of currently used research materials. Furthermore, I will discuss the lack of attention given by scholars to the potential of technological tools and the way new technologies can shape anew our basic research questions. In addition, I will emphasize the need for providing accessibility, friendly interfaces and implementation by the developers’ side of the map.

Creating a Corpus of Early Christian Law:
The Hidden – Law Database
Dr. Yifat Monnickendam, The Hebrew University of Jerusalem

An official ruling does not necessarily determine the practice, just as legislation does
not always become the custom. In the gap between them lies a key to understanding
processes of influence and rejection, of polemic and discourse, and of power and
authority. This project seeks to reveal the gap between imperial law and Christian
customs and practices in the late-antique Eastern Roman Empire. Deciphering this
gap will serve as a lens to viewing trends, ties and mutual influences among
Christians, Romans and Jews, to observing similar, yet unrelated and independent,
developments in these communities, to discussing different attitudes to law and
authority and to addressing the larger question of the evolvement of Christian law.
Early Christian legal thought and practice was influenced by Roman and Greek
law, by Jewish law, and by Christian legal traditions. While Roman, Greek and
Jewish legal sources are readily accessible in various databases and studies, sources of
the emerging Christian law are limited, with only few legal compositions being
available. Nevertheless, as I have recently shown, indirect evidence of Christian legal
thought and practice are preserved in non-legal Christian literature. Such evidence is
important not only because it fills the gap created by the lack of legal literature, but
particularly because of its indirect nature: Indirect evidence mined from non-legal
literature may reflect practice and behavior – rather than the official law and norms –
and hence preserve legal traditions rejected from formal legal corpora.
Studying the development of Christian law starts, therefore, by collecting and
cataloging this indirect evidence, and organizing the information in a way which will
not only support current research but will also inspire new questions and new
research. For this task I planned a database of tagged paragraphs from compositions
of five late-antique communities: Christian, Roman, Jewish, Greek (Papyri) and
Sectarian (Qumran). Each community includes a list of compositions, on which the
following metadata is given: author, date of composition, place, and bibliographical
information. Once a paragraph is catalogued, information about it draws either from
this metadata, or from specific data on the specific paragraph (e.g. a third century
exegetical text by Origen which is preserved in a sixth century catenae, will be
catalogued as a text by Origen).

The first texts to be catalogued in this project are Christian compositions in
Greek and Syriac, surveyed first in translation and then by using terminological
searches in digitized texts of the original languages. Relevant paragraphs are copied to
the database and tagged according to the legal issues they refer to. These tags,
together with the metadata detailed above, are the basis for the search results and their
display. The results are displayed in four formats: 1) word-clouds of the different tags
of one search. The words’ size is according to their frequency, thus allowing the
researcher to see what legal topics are connected to others, especially when they were
not intuitively related and were not the tags of the original search. 2) Maps (GIS)
which show where certain legal topics were discussed. 3) Timelines which highlight
specific periods in which certain issues were discussed. 4) Lists of texts and their
metadata which allows for an in-depth study, rather than show trends and tendencies,
and form the basis for a future expansion of this project to creating tools of natural
language processing.

This project enjoys collaborations with several similar projects, including the
BYU-Oxford Syriac Corpus (http://cpart.maxwellinstitute.byu.edu/home/sec/), the
Syriac Gazetteer (Syriaca.org), and the new database, “Greek Contracts in Context.”

Digital tools for improving the Editions of Cryptic Scrolls from Qumran
Dr. Jonathan Ben-Dov, University of Haifa

A small corpus within the Dead Sea Scrolls contains parchments and papyri written in code, sometimes called ‘crytic script A’. The papyri are in an extremely bad state of preservation, and the parchments have fared only slightly better. This code was first deciphered y J.T. Milik, who has generally identified the contents of each of the scrolls. Further work by Stephen Pfann in the 1990s made an enormous contribution to the decipherment of these fragments. Most of the scrolls have been published in the ‘official’ series Discoveries in the Judaean Desert and are available to the public also in other preliminary editions. Yet, some of the scrolls are only partially available, and some remain without an official edition. Even those that have been published still raise unanswered questions and thus gain inferior status in Scrolls’ research. The cryptic corpus is a microcosmos of many material problems pertaining to reconstruction of scrolls, to a high degree of complexity. Altogether the cryptic corpus includes over 400 papyrus fragments and several hundred more parchment fragments.

My project is carried out with the following partners: Nachum Derschowitz and Lior Wolff (Tel-Aviv University), Daniel Stoekl Ben-Ezra (EPHE, Paris), and the graduate student Asaf Gayer (Haifa). We make extensive use of the new images made available by the Israel Antiquities Authority: http://www.deadseascrolls.org.il, and of the new multispectral imaging technology employed in that project. The new photos enable an unprecedented work of enhanced algorithmic methods in order to map the material features of the fragments, record them in computer databases, and then run a computerized analysis of the fragments ascertaining their classification into discrete scrolls and their placement in the manuscript. We plan to map the fiber pattern of each fragment and search for similar patterns in adjoining fragments. This is unprecedented in scrolls research and we hope to use it for shedding light on our particularly difficult corpus. Finally, we hope to make this project a pioneer of digital editions of the DSS, since as per today all transcriptions of the scrolls are protected under copyright, a status we deem unproductive for future research.

Dr. Nahum Dershowitz, Tel Aviv University
Comments and discussion

*    *         

Second session

15.30 – 17.30 – Upper Hall

How to open a digital text

 Sinai Rusinek, Polonsky Academy & DHIsrael

This year saw some promising beginnings in the field of Digital Jewish studies. This statement may sound odd: some may say that digital Jewish studies have been here for a long time; starting already in the early 1960, pioneering Israeli projects such as the Historical Dictionary of the Academy for Hebrew Language and Responsa put computers to use in the creation of resources for the humanities. More recently, large digitization projects such as the Friedberg Genizah Project, the Dead Sea Scrolls Digital Library and Digitalization projects at the National Library and abroad provided unprecedented access to sources, whereas other endeavors such as the Ben Yehuda project, Historical Jewish Press, the Mamre Institute and wiki-text were dedicated to make available texts in a digital form.

However, while all of these were and are pioneering digital projects for the humanities, a new generation of endeavors, which we could categorize as computation in the humanities, or as it named elsewhere “Digital Humanities 2.0”, presents an inherently different approach. This approach, as I would argue, promises more growth and sustainability to Jewish studies, and the Humanities in general. The difference lies in principles of openness, where “open” means much more than just free access. In my talk I will explore these new developments and directions and try to explain how this new approach reflects on Jewish studies scholars and scholarship.

The Sefaria Project:
An Online and Open-Source Library for the Jewish Canon
Lev Israel & Ephraim Damboritz, Sefaria

The Sefaria project is an actively developed open-source software project bringing the Jewish canon online and into the public domain.  It is remarkable both for its technological developments and for offering its users unrestricted rights to all of the information that it stewards.    It currently houses nearly 25 million words of interlinked text, including close to a million words of original user-created translation.  It is being used by educators in classrooms, by individual users for their own study, and for some initial forays into visualization.  Its open API is being used by third parties to develop their own applications, and it has potential to be used in scholarly algorithmic analysis of the contained texts.

We will present the current status of the project and our plans for development, and suggest ways that it can be used by scholars of Jewish texts and repurposed for other collections of interconnected texts.

How can Open Data contribute to digital heritage?
“Open Press” as a case study
Noam Castel & Ido Ivri, the Public Knowledge Workshop

The talk will discuss the Open Press Archive, a collaboration between HaSadna (www.hasadna.org.il) – the Public Knowledge Workshop, and the National Library of Israel, to transform the historic Jewish Press website (http://jpress.org.il), which contains some 1,500,000 pages of searchable newspaper pages, into an open repository, discoverable by search engines and accessible programmatically. We will discuss what was done so far, what the plans are for the near future, and what opportunities will arise because of this collaboration.