תשתיות למחקר במדעי הרוח: סדרת הרצאות פתוחה לקהל

סדרת הרצאות אורח, פתוחה לקהל, מתקיימת במסגרת הסמינר 33303 Digital Humanities שמתקיים בבית הספר להגות ודתות בפקולטה למדעי הרוח. המפגשים יתקיימו בימי ד’ בשעה 18:30 בחדר 2506 בבניין מדעי הרוח, קמפוס הר הצופים. הקהל מוזמן, ונודה לכם אם  תודיעו על כוונתכם להשתתף לדב וינר, מרכז הסמינר, בכתובת

dov.winer@mail.huji.ac.il

humanities

הרצאה ראשונה בסדרה:

 יום רביעי, א’ באייר, 10 באפריל 2013 

פרופאלון איתי, המחלקה למדעי המחשב, הטכניון

ראש מיל”ה: מרכז ידע לעיבוד השפה העברית

http://www.cs.technion.ac.il/~itai /

כלים לעיבוד העברית כתשתית מחקרית במדעי הרוח – לא רק לבלשנים

 כלים לעיבוד שפה משחקים תפקיד מרכזי בכל ניסיון חשוב להפעיל כלים מתוקשבים במחקר במדעי הרוח (לדוגמה, Digital Perseus, Manuscripts to Europeana, Tapor , Bamboo, TextGrid TGE/Adonis, CLARIN . ראו גם הפרקים על Textual Analysis ו – Stylistics Analysis בספר A Companion to Digital Humanities ).

הרצאתו של פרופ’ איתי תעסוק בכלים לעיבוד העברית שפותחו ב”מילה”, מרכז-ידע לעיבוד השפה העברית שהוא עומד בראשו:

http://www.mila.cs.technion.ac.il/heb/about.html

דוגמאות:

http://www.mila.cs.technion.ac.il/heb/resources_lexicons_wordnet.html
http://www.mila.cs.technion.ac.il/heb/tools_analysis.html

תכנת זיהוי שמות (named entity recognition, NER) מזהה שמות פרטיים ומסווגת אותם לשמות ארגונים, אנשים, מקומות גיאוגרפיים, תאריכים, מספרים וכו’. משימה זו היא נדבך מרכזי  בחיפוש, תרגום ושיווק בעברית. בעיית הזיהוי היא קשה במיוחד כיון שבניגוד לשפות אירופיות, בעברית אין משתמשים באותיות ראשיות .

http://www.mila.cs.technion.ac.il/heb/tools_external_named.html
http://www.mila.cs.technion.ac.il/heb/tools_external.html

HUJI lecture series