Big Data והחלטות בית המשפט העליון / קרן וינשל

רשומה זו מתארת את הליך פיתוחו ותוכנו של מאגר מידע Big Data הכולל קידוד ממוחשב וידני לכל החלטות הרכבי בית המשפט העליון מאז 2010 (16,109 תיקים ו-48,635 החלטות). המאגר נועד לשמש כתשתית מחקר לטובת הקהילה המדעית, לאפשר למקבלי החלטות ומנהלי מערכת המשפט להתוות מדיניות מבוססת עובדות, ולספק לציבור המתעניין בבית המשפט נתונים מדויקים על מגמות בקבלת החלטות השופטים.

את המאגר פיתחתי יחד עם פרופ' לי אפשטיין (מאוניברסיטת שיקאגו וושינגטון) ואנדי וורמס, והוא מפורסם כבר עתה כאן, באתר אינטרנט פתוח, חינמי ונגיש לכל.

***

השימוש במאגרי Big Data בתחום חקר המשפט החל בארה"ב לפני מספר שנים עם יצירתו של The Supreme Court Database, מאגר המשמש היום כלי מרכזי במחקרים ובדיון הציבורי על בית המשפט הפדרלי העליון האמריקאי. מאגרים אלו מתפשטים עתה לחקר קבלת החלטות בבתי משפט עליונים במדינות כגון קנדה, אנגליה, נורבגיה ובית המשפט החוקתי בגרמניה. בחודש שעבר (דצמבר 2018) חנכנו את מאגר החלטות בית המשפט העליון הישראלי – The Israeli Supreme Court Database, הכולל מידע על כל ההחלטות שהתקבלו בהרכב שופטי בית המשפט העליון בתיקים שנפתחו משנת 2010 (16,109 תיקים ו-48,635 החלטות). למאגר המבוסס על קידוד אוטומטי יתרון משמעותי במיוחד בישראל, זאת לנוכח ריבוי התיקים בבית המשפט העליון הישראלי לעומת מקבילותיו בחו"ל, הדנים על-פי רוב בסדר גודל של מאות תיקים בשנה (ואף פחות ממאה בארה"ב ובקנדה). כך שאם מחקרים שבוצעו בעבר בישראל מבוססים על בסיס מידע חלקי של מאות או אלפי החלטות, המאגר הנוכחי מאפשר ניתוח הכולל כמעט 50,000 החלטות. מדובר במאגר ההחלטות של בית משפט עליון הגדול ביותר בעולם.

עבור כל תיק, המאגר מכיל יותר מ-70 סוגי נתונים אודות הצדדים לו, ייצוגם המשפטי, הליך הדיון בבית המשפט העליון, הליך הדיון בערכאה דלמטה (במקרה של ערעורים), סיווגו המשפטי והנושאי של התיק, תוצאות התיק והחלטות כל אחד מהשופטים בו. תוצאות העתירות והערעורים כוללות מידע רב, לרבות התייחסות לשאלה אם התיק נסגר בפסק דין, מחיקה, או פשרה (תוך פירוט סוגי מחיקות ופשרות שונים); ואם התביעה/עתירה התקבלה, התקבלה חלקית, הוחזרה לדיון בערכאה דלמטה, נדחתה על הסף או נדחתה לאחר דיון.

תהליך איסוף ועיבוד הנתונים למאגר ארך מעל שנה ונעשה בארבעה שלבים. בשלב הראשון כרינו את כל הנתונים מאתר בית המשפט העליון (Data Mining/Scraping). בשלב השני פיתחנו ועשינו שימוש באלגוריתמים שנועדו לאפשר למחשב ללמוד לקודד באופן אוטומטי את המידע שבהחלטות הטקסטואליות של בית המשפט (Automated Textual Analysis). רוב הנתונים במאגר אכן מקודדים באופן ממוכן, אולם, בשל המבנה הלא אחיד של פסקי דין והשפה המגוונת שבה שופטי בית המשפט העליון מנסחים את הכרעותיהם, נאלצנו לשלב קידוד ידני עבור עיבוד נתוני תוצאות הכרעות הדין. השלב השלישי, אם כן, כלל קידוד ידני מקוצר על-ידי צוות של סטודנטים למשפטים בשנים מתקדמות. גם בשלב זה הסתייענו באמצעים ממוכנים, תוך פיתוח יישום אינטרנט ייחודי המזהה את מסמכי בית המשפט, מדביק עליהם טופס למילוי נתונים, מחלקם באקראיות לסטודנטים-מקודדים, ואז מעביר באופן אוטומטי את הנתונים החדשים למאגר המידע הגדול. בשלב האחרון ערכנו בדיקות מהימנות ממוכנות וידניות לכל הנתונים. כך למשל, 20% מהתיקים קודדו במקביל על-ידי שני סטודנטים לפחות ונמצא כי שיעור העקביות הפנימית בין המקודדים עלה על 90%.

את מאגר המידע החלטנו לפרסם באתר הפתוח לכל, כדי שישמש כתשתית למחקר לטובת הקהילה המדעית. גרסת הרצה זמנית של האתר, הכוללת את מאגר הנתונים במלואו, נמצאת כאן, בכתובת http://iscdbstaging.wustl.edu/. אנו מתכננים להנגיש את מאגר הנתונים באמצעות מנוע חיפוש ייחודי עליו אנו עמלים בימים אלו, זאת כדי לאפשר למקבלי החלטות, לעיתונאים ולציבור המתעניין בבית המשפט למצוא נתונים מדויקים על מגמות בקבלת החלטות השופטים מבלי צורך בידע סטטיסטי מוקדם, או בהורדה וניתוח של מאגר הנתונים המלא. לאחר הוספת פיצ'ר מנוע החיפוש, נעביר את האתר הסופי למעונו הקבוע, בשרתי האוניברסיטה העברית.

מאגר הנתונים כולל כמות עצומה של מידע ומאפשר אינספור ניתוחים – ראו למשל כמה ניתוחים מעניינים שפורסמו בבלוג "כמותית", כאן. שרטטתי להלן מספר תרשימים המדגימים רק במעט את סוג הנתונים האפשריים, וחושפים מגמות מפתיעות בקבלת החלטות השופטים בבית המשפט העליון.

תרשים 1 מתאר את אופן סגירת התיקים בבית המשפט העליון, לפי סוגי ההליכים השונים המתנהלים בבית המשפט. מהתרשים עולה כי בניגוד לתפיסה המקובלת, וכן בניגוד למתרחש בבתי המשפט בערכאות הנמוכות, רוב התיקים בבית המשפט העליון מוכרעים בפסק דין ולא בפשרות (כמחצית מהעתירות והערעורים האזרחיים מסתיימים בפסק דין וכ-85% מהערעורים הפליליים).

תרשים 1: אופן סגירת התיקים לפי סוג הליך

אופן הסגירה של פסק הדין אינו מעיד בהכרח על "ניצחון" של הצד הפונה לבית המשפט (מערער או עותר). כך, במהלך דיון בתיק ולעיתים בעידוד בית המשפט, ייתכן שהמשיב מחליט לשנות את התנהגותו באופן המייתר את העתירה (דוגמה שכיחה היא עתירה נגד הריסת בית, שבמהלך הדיון בה המדינה מודיעה על כוונתה לסגת מהחלטתה להרוס את כל הבית). במקרים כאלו העותר "זכה" בפועל, אם כי התיק מבחינה משפטית "נמחק".

לעומת זאת, עתירה יכולה להימחק גם בעקבות רמיזות השופטים כי היא חסרת סיכוי (תוך "הפסד" למערער/עותר). בהקשר זה, תרשים 2 חושף נתונים אודות שיעור התיקים בהם המדינה "מפסידה" – בין אם בפסק דין ובין אם בפשרה או במחיקה. יודגש כי הכוונה ב"הפסד" היא שהצד המופיע אל מול המדינה, בין אם הוא המערער/עותר ובין אם הוא המשיב, זכה לפחות באופן חלקי בסעד שביקש (למשל, אם הוחלט בעקבות הדיון בבית המשפט לאטום חדר אחד בביתו במקום להרסו כליל).

תרשים 2: שיעור הפסד המדינה בתיקים, לפי סוג הליך ואופן סגירת התיק

מהתרשים עולה כי עמדת המדינה נדחית בחלק לא מבוטל של התיקים: בכשליש מהערעורים הפליליים והאזרחיים (בשים לב שהמדינה היא צד רק בחלק קטן מהערעורים האזרחיים), ביותר משליש מהערעורים המנהליים, ובכ-17% מתיקי בג"ץ. בתיקי בג"ץ רוב רובם של התיקים בהם העותר זוכה לפחות בחלק מהסעד שביקש מסתיימים למעשה בפשרות או במחיקות העתירה ולכן הם בעלי נראות ציבורית נמוכה.

מהמאגר נחשפים גם נתונים מעניינים על תיקים חוקתיים, המוגדרים ככאלה שבהם הנושא המרכזי בתיק קשור לעניין חוקתי (רובם בג"צים, אבל הם כוללים גם ערעורים אזרחיים, מנהליים ודיונים נוספים). תיקים אלו מהווים רק כ-9.2% מתיקי ההרכבים בבית המשפט, אבל מדדים שונים מורים על כך שמידת ההשקעה בהם רבה: 73% מהם מסתיימים בפסק דין (בהשוואה ל-54% מכלל התיקים), כאשר מדובר בפסקי דין ארוכים יחסית (5,208 מילים בממוצע ביחס ל-3,973 ביתר התיקים); תיקים חוקתיים מהוויים 50% מתיקי ההרכבים המורחבים (בהשוואה ל 0.003% מיתר התיקים), וב-29% מהם ישנה לפחות דעת מיעוט אחת.

יחד עם זאת, למרות ההשקעה הרבה בתיקים אלו, תוצאותיהם מורות על מדיניות הנחשבת בציבור כמרוסנת (ריסון או שמרנות שיפוטית): בכ-12% מהתיקים החוקתיים שהסתיימו בפסק דין הוחלט באופן מלא או חלקי על הפיכת החלטות הממשלה וב-18.6% מכל התיקים החוקתיים (על כל צורות הסגירה) החלטת הממשלה השתנתה בעקבות הפנייה לבית המשפט (בהשוואה לנתונים המובאים בתרשים 2).

דוגמאות לניתוחים נוספים שמאגר הנתונים מאפשר כוללים דפוסי החלטות בקרב שופטים שונים, לרבות בהתאם למאפיינים שונים כגון הניסיון המקצועי הקודם של השופטים, הוותק השיפוטי שלהם או מגדרם; אורך פסקי הדין לפי זהות הכותב המרכזי של פסק הדין ובהתאם לסוג התיקים או זהות הזוכים בתיק; השוואה בין נתוני ייצוג והצלחה של עורכי דין שונים; השוואת שיעור הפיכת החלטות בתי משפט שונים, ועוד. אנו מזמינים אתכם/ן לסייר לאתר, להוריד את מאגר הנתונים למחשבכם/ן האישי, ולנתח בעצמכם/ן את קבלת החלטות השופטים בבית המשפט העליון.

ד"ר קרן וינשל היא מרצה בכירה בפקולטה למשפטים שבאוניברסיטה העברית וחברה באקדמיה הצעירה למדעים ואמניות

ציטוט מוצע: קרן וינשל " Big Data והחלטות בית המשפט העליון" ICON-S-IL Blog (23.1.2019).

Big Data והחלטות בית המשפט העליון / קרן וינשל

כתיבת תגובה לבטל

תגיות

ארכיון

פוסטים אחרונים

לעקוב אחרי הבלוג באימייל

ICON-S-IL Facebook

עקוב אחרי ב-Twitter