רקע ומטרות המחקר
בחודש אוקטובר 2021 הקים שר המשפטים את הוועדה להתאמת המשפט לאתגרי החדשנות והאצת הטכנולוגיה, במטרה לגבש אמצעים וצעדים שונים לצמצום הפער ההולך וגדל בין ההתפתחויות הטכנולוגיות לבין ההסדרים הרגולטוריים והמשפטיים בישראל. ביום 14.3.2022, פרסמה הוועדה קול קורא להתייחסות הציבור בתחום הפרסומים הפוגעניים במרחב הדיגיטלי, לרבות לגבי הדרכים שבהם תכנים פוגעניים במרחב הדיגיטלי עלולים לפגוע במשתמשים ובציבור והאופן בו המשפט והרגולציה יכולים לספק מענה לאתגרי התוכן השונים ברשתות החברתיות ופלטפורמות מקוונות. במענה לקול הקורא, הוגשו התייחסויות 16 התייחסויות מגורמים שונים, כגון חברות הטכנולוגיה המפעילות את הפלטפורמות הדומיננטיות בישראל, ארגוני חברה אזרחית וגורמים מסחריים אחרים.
על בסיס מכלול ההתייחסויות הציבוריות שהוגשו במענה לקול הקורא, איגוד האינטרנט הישראלי והמעבדה למדעי הרוח הדיגיטליים באוניברסיטה העברית ביצעו מחקר חישובי המאפשר למפות ולנתח את התוכן ששחקנים שונים בזירה הציבורית יוצקים לבעיה הרגולטרית של "פרסומים פוגעניים רשתות חברתיות", וזיהוי הנושאים בהם צריכה האסדרה הישראלית להתרכז.
מתודולוגיה
לקול הקורא שפרסם משרד המשפטים הוגשו 16 התייחסויות, מטעם סוגים שונים של גופים מסחריים וארגוני חברה אזרחית:
מגזר פרטי: חברות הטכנולוגיה הגלובליות (מפוקחות פוטנציאליות) ובעלי עניין נוספים
Meta (7645 מילים); TikTok (5685 מילים); Google (5556); Twitter (אנגלית, 2168 מילים); U.S Chamber of Commerce (אנגלית, 1214); שידורי הערוצים המסחריים קשת ורשת (3846 מילים); משרד עורכי דין עמית, פולק מטלון (982 מילים); זיר"ה (951 מילים).
ארגוני חברה אזרחית
איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה (7509 מילים); תכלית – המכון למדיניות ישראלית (6871 מילים); המועצה הלאומית לשלום הילד (5324 מילים); איגוד מרכזי הסיוע לנפגעי תקיפה מינית (2411 מילים) עמותת מגן לנפגעי טרור (1911 מילים); אעלאם – המרכז הערבי לחירות המדיה, פיתוח ומחקר (1175 מילים); יסוד – עמותה לקידום זכויות יסוד (937 מילים); ארגון העיתונאים והעיתונאיות (814 מילים).
לצורך ניתוח קורפוס ההתייחסויות, פיתחנו גישה חישובית של קריאה בקנה מידה גדול, המבוססת על אלגוריתם מידול נושאי (topic modeling). מידול נושאי הינו אלגוריתם למידת מכונה המאפשר לזהות את הנושאים מהם מורכב קורפוס טקסט מסוים, במקרה שלנו התייחסויות שהוגשו לועדת דוידי, כאשר ״נושא״ הוא קבוצת מילים אשר מבחינה סטטיסטית נוטה להופיע יחד במסמכים עליהם התאמן המודל.
יתרון מרכזי במידול נושאי הוא סדר הפעולה של המודל: ראשית המכונה מזהה את הנושאים המרכיבים את הטקסטים בקורפוס – וזאת מבלי שהחוקרים מגדירים עבור המכונה את הקטגוריות הרצויות מראש (אלא רק את מספר הנושאים המבוקש) ורק לאחר שמודל למידת המכונה זיהה את הנושאים המרכיבים את הקורפוס, החוקרים יכולים לפרש את הנושאים ולהציג את התוצאות בהקשרן. מסיבה זאת, מידול נושאי מתאים במיוחד לניתוח נרטיבים מורכבים, דוגמת ההתייחסויות שהגישו הגופים השונים: האלגוריתם מאפשר לסווג מספר רב של נתונים, תוך התערבות אנושית מזערית, ובעיקר ללא רדוקציה של הטקסט לצרכי קידודו. באופן זה, המודל החישובי אינו מבוסס על הטיות מחקריות מוקדמות לגבי מה הנושאים שמרכיבים את הטקסטים ״אמורים להיות״.
גישת הקריאה בקנה מידה גדול מאפשרת לנו אם כן לעבד ולשפוך אור על כמות עצומה של נתונים טקסטואליים מורכבים מבלי להזדקק לניתוח פרטני של כל אחד מהטקסטים. המודל בו אנו משתמשים מחבר בין גישות הומניסטיות מוכרות של קריאה קרובה, איכותנית עם קריאה חישובית מרחוק של מכלול הקורפוס.
-
בשלב ראשון, נזהה את הנושאים העיקריים העולים ממאגר הטקסטים, באופן שיספק לנו סקירה שיטתית של הנושאים בהם עסקו ההתייחסויות שהונחו בפני הוועדה. לאחר תהליך הרצה לפי מספר משתנה של נושאים, קבענו את מספר הנושאים שהמודל יוציא כפלט על שמונה נושאים.
-
בשלב שני, נעבור מרמת הקורפוס לרמת הנושא, ונזהה עבור כל נושא את קבוצת הדוברים המזוהה ביותר עם אותו נושא. מטרת השלב השני היא לקדם את הבנתנו מי מתייחס לכל אירוע.
בשלב השלישי, נשווה בין ההתייחסויות השונות על יסוד ההרכב הנושאי של כל אחת, כך שנוכל להצביע על קווי דמיון ושוני בין עמדות הגופים השונים. לצורך כך, חישבנו את מידת הדמיון בין ההתפלגויות בעזרת מדד Kullback-Leibler divergence שמודד את ההפרש שבין שתי התפלגויות.
ממצאים ומסקנות: מה הנושאים שמרכיבים את שיח האסדרה בישראל?
הניתוח החישובי שלנו זיהה את 8 הנושאים הבולטים ביותר בהתייחסויות שהוגשו לקול הקורא על ידי המגזר הציבורי, הפרטי וארגוני החברה האזרחית:
- הגודל והגלובליות של מפעילות פלטפורמות ושירותים מקוונים כבסיס לרגולציה ( להלן ״גודל וגלובליות״). מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה: שוק פלטפורמה רגולציה מפעיל ענק גוגל יצירה גדל גלובלי שרות.
- שקיפות כמרכיב של האינטרס הציבורי בעיצוב המלצות הוועדה (להלן ״שקיפות״). מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה: שקיפות אינטרס מודל רגולציה אסדר עמדה ועדה שקל משפט.
- עבירות הפצה של תכנים מיניים ומנגנוני האכיפה והאסדרה של הפלטפורמות כנגדן (להלן ״עבירות מין״). מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה: תכן פרסום מיני מין הפצה הסרה סרטון בצע עברה יוטיוב
- מאפייני המרחב המקוון עבור ילדים ונוער בסביבה המקוונת כבסיס לעיצוב המלצות הוועדה (להלן ״צרכי ילדים ונוער״). מילות מפתח שזוהו לנושא זה: ילד מקוון מרחב נער רשת כלפי דיגיטלי המלצה יעודי סביבה.
- הצורך בהגנה על ילדים מפני אלימות ופגיעות ברשת (להלן ״פגיעה בילדים״). מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה: משתתף פגיעה מוגן רשת ילד מענה בקרב דגש אלימות צרך.
- צרכים ייחודיים של הזירה הישראלית: מלחמה בתוכן טרוריסטי ואתגרי שפה (להלן ״צרכים ישראליים״). מילות מפתח שזוהו על ידי המודל כמרכיבות את נושא זה:ערבי מרכז מיחד ישראלי פיסבוק טרור שפה הנה אודות קבוצה.
- ערוצים משפטיים לאסדרה מחייבת של הרשתות חברתיות (להלן ״ערוצים משפטיים״). מילות מפתח שזוהו לנושא זה: ראי משפט חקי דיאסאיי תוכן להלן צו פרסום דין.
- תועלות חברתיות של רשתות חברתיות כגון אינסטגרם ופייסבוק: חיבוריות בין אנשים ויצירה (להלן ״תועלות חברתיות״). מילות מפתח שזוהו לנושא זה: עברה הודעה משל פוגעני מין משמעות צרוף התנהגות לא ליק.
ממצאים ומסקנות: משקל הנושאים השונים במכלול השיח ובין ההתייחסויות
הטבלה הבאה מציגה את ממצאי הניתוח החישובי על ההתפלגות של הנושאים השונים בין הדוברים השונים, באופן המאפשר לבחון עבור כל אחד מבעלי העניין שהשתתפו בשימוע הציבורי מהם הנושאים הבולטים ביותר בהתייחסות שהוגשה מטעמו:

מקרא: דירוג שכיחות ההתייחסות לנושא מהקטנה לגדולה – אפור, ירוק, כחול, צהוב, אדום
מחקרנו חשף כי ישנם נושאים שזכו להתייחסות מוגברת ובולטת יותר במסמכים השונים מאשר נושאים אחרים. לדוגמא, נושא השקיפות מופיע בצורה הדומיננטית ביותר במספר הרב ביותר של התייחסויות כלים משפטיים וצרכי ילדים ונוער אף הם זכו להתייחסות רבה גם כן, אך קצת פחות. מנגד, הנושא של תועלות חברתיות עלה הכי מעט בהתייחסויות שנבדקו. סקירת הנושאים המצורפת להלן, מדורגת לפי ממוצע ההתייחסות לנושא בהתייחסויות בסדר יורד מהממוצע הגבוה ביותר לנמוך ביותר.
- שקיפות הוא הנושא הדומיננטי ביותר בהתייחסויות לקול הקורא של ועדת דוידי, וקיבל משקל רב במיוחד במסמכים מטעם חברת גוגל, המרכז הערבי לחינוך מדיה, המועצה לשלום הילד, לשכת המסחר האמריקאית וחברת טוויטר. על אף שאלו הגורמים אשר הנושא היה הכי בולט בעמדותיהם, ניתן לראות כי כלל ההתייחסויות עסקו בנושא באופן נרחב.
לעומת זאת, הנושא קיבל משקל נמוך יחסית בהתייחסויות של הערוצים המסחריים, עמותת מגן לנפגעי טרור, ומרכזי הסיוע לנפגעי תקיפה מינית , בהשוואה ליתר ההתייחסויות. - ערוצים משפטיים הוא הנושא השני הכי בולט בהתייחסויות שנבדקו, וקיבל משקל רב במיוחד בהתייחסויות של Meta, הערוצים המסחריים, לשכת המסחר האמריקאית ועמותת מגן לנפגעי טרור.
לעומת זאת, הנושא קיבל משקל נמוך יחסית בהתייחסות של איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה, בהשוואה ליתר ההתייחסויות. - פגיעה בילדים הוא הנושא השלישי הכי דומיננטי בהתייחסויות שנבדקו, וקיבל משקל במיוחד בהתייחסויות של איגוד האינטרנט והמכון הישראלי לדמוקרטיה, מכון תכלית וטיקטוק. לעומת זאת, הנושא קיבל משקל נמוך במספר לא מועט של התייחסויות.
- צרכים ישראליים הוא הנושא הרביעי הכי דומיננטי בהתייחסויות שנבדקו, וקיבל משקל רב בהתייחסויות של עמותת יסוד לקידום זכויות יסוד ובהתייחסות של משרד עורכי דין עמית פולק מטלון. לעומת זאת, הנושא קיבל משקל נמוך יחסית בהתייחסויות של איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה והמועצה לשלום הילד, בהשוואה ליתר ההתייחסויות.
- צרכי ילדים ונוער הוא הנושא החמישי הכי בולט בהתייחסויות שנבדקו, וקיבל משקל רב יותר בהתייחסויות של איגוד האינטרנט והמכון הישראלי לדמוקרטיה, מכון תכלית, איגוד מרכזי הסיוע לנפגעי תקיפה מינית וארגון העיתונאים והעיתונאיות, ביחס ליתר ההתייחסויות.
- הגודל וגלובליות הוא הנושא השישי הכי דומיננטי בהתייחסויות שנבדקו, וקיבל משקל רב יותר בהתייחסויות של חברת Meta ועמותת מגן לנפגעי טרור. מרבית התגובות נתנו לנושא זה משקל נמוך.
- עבירות מין הינו הנושא השביעי הכי בולט בהתייחסויות שנבדקו, וקיבל משקל רב יותר בהתייחסויות של איגוד מרכזי הסיוע לנפגעי תקיפה מינית והערוצים המסחריים לעומת יתר התגובות
- תועלות חברתיות הינו הנושא הכי פחות דומיננטי בהתייחסויות שנבדקו. נושא זה מופיע בצורה מסוימת בהתייחסויות של חברת טוויטר, חברת טיקטוק ומכון תכלית.
ממצאים ומסקנות: מידת הדמיון והשוני בין ההתייחסויות של הגופים השונים
בשלב השלישי, השוונו את מידת הדימיון בין ההתייחסויות השונות באמצעות מדד KL divergence שמשווה בין זוגות של התייחסויות. ככל שהתוצאה קרובה יותר ל-0, כך זוג ההתייחסויות דומה יותר מבחינת התפלגות הנושאים שלו וככל שהתוצאה קרובה יותר ל-1, כך ההתייחסויות שונות זו מזו. יוער כי בהתאם למדד KL divergence, תוצאת ההשוואה בין זוגות מסמכים אינה חייבת להיות זהה.

מקרא: רמת הדמיון בין ההתייחסויות מהנמוכה לגבוהה: אפור, ירוק, צהוב, אדום, סגול
הדמיון הרב ביותר בין שתי התייחסויות מבחינת הנושאים בהם עסקו נרשם בין ההתייחסות של משרד עורכי דין עמית פולק מטלון וההתייחסות של עמותת יסוד לקידום זכויות יסוד. מדובר בתוצאה מפתיעה מכיוון שמשרד עורכי הדין ככה"נ כתב את ההתייחסות עבור גורם שלא רצה להיחשף ולכן מעניין שהטענות שהועלו בהתייחסות זו, דומות לאלה שהעלתה עמותת יסוד. כפי שאפשר לראות בטבלה הקודמת, שתי התייחסויות אלה עסקו במיוחד בנושא אותו הגדרנו לצורך מחקר זה כ"צרכים ישראליים".
דמיון רב מאוד נמדד גם בין הנושאים בהם עסקו ההתייחסויות של חברת גוגל ושל המרכז הערבי לחינוך מדיה. גם במקרה זה, מדובר בדמיון מפתיע עקב האינטרסים השונים לכאורה ותחום הפעילות השונה של שני הגורמים. דמיון מפתיע נמצא גם בין ההתייחסויות של חברת Meta ועמדת עמותת מגן לנפגעי טרור.
חוסר הדמיון הרב ביותר נמדד בין ההתייחסויות של משרד עורכי דין עמית פולק מטלון וההתייחסות של איגוד האינטרנט הישראלי והמכון הישראלי לדמוקרטיה.חוסר דמיון זה אינו מפתיע מכיוון שמשרד עורכי הדין מייצג כנראה גורם מסחרי, ולכן הגיוני התייחסות זו תהיה שונה מההתייחסות של שני ארגוני חברה אזרחית.
חוסר דמיון רב נמדד גם בין ההתייחסות של איגוד האינטרנט וההתייחסות של עמותת יסוד לקידום זכויות יסוד. חוסר דמיון זה אינו צפוי מכיוון שבשני המקרים מדובר בגורמי חברה אזרחית אשר עסקו רבות בזכויות אשר יש להתחשב בהן. ההתייחסות של איגוד האינטרנט והמכון הישראלי לדמוקרטיה רשמה גם חוסר דמיון רב להתייחסות של עמותת מגן לנפגעי טרור.
מחקרי המשך
בחודש אוקטובר 2021, מינה שר התקשורת ועדה לבחינת אסדרת פעילותן של רשתות חברתיות בראשות מנכ"לית המשרד, במטרה לבחון את תפקידן של רשתות חברתיות בשיח הציבורי ואת הרגולציה הקיימת עליהן, על רקע התבססותן בשנים האחרונות כאמצעי תקשורת והפצת מידע דומיננטיים בישראל. צוות הוועדה התבקש בעת מינויו לתת המלצות בדבר החלת רגולציה על פלטפורמות תוכן דיגיטליות ולגבש עקרונות לרגולציה אפקטיבית תוך בחינה השוואתית למגמות הקיימות במדינות שונות בעולם. באופן ספציפי יותר, הוועדה התבקשה לספק המלצות בדבר אסדרת שאלת האחריות והשקיפות של פלטפורמות דיגיטליות, לרבות ביחס למדיניות ולמנגנונים האלגוריתמיים של הפלטפורמות בתחומי העריכה והבקרה על התוכן. בנוסף, התבקשה הוועדה לבחון את סוגית השקיפות בקידום, סינון והסרת מנויים ו/או תכנים המופצים על ידי הפלטפורמות. ביום 14.12.2022, פרסמה הוועדה את המלצותיה.
בהמלצותיה, הציגה הוועדה את הנחות היסוד שלה אשר כוללות את ההנחות שמפעילי הפלטפורמות החברתיות המשמעותיות מנהלים את התכנים המופצים על גבי הפלטפורמות, וכיוצא מכך ניתן לדון באחריותם לתוכן ושיש לראות בפלטפורמות החברתיות גופים קרובים לגופים דו-מהותיים. לאחר הנחות היסוד, הצביעה הוועדה על דרכי התמודדות עם תכנים פוגעניים, והמליצה על אסדרת יחסי הפלטפורמה והמשתמשים, קביעת חובות שקיפות, קביעת חובת ניהול סיכונים והקמת רגולטור ייעודי.
בעתיד, נמשיך את את המחקר החישבוי על השיח הסובב את אסדרת הרשתות החברתיות בישראל באמצעות ההתייחסויות למסמך זה. מוזמנים לעקוב באמצעות רישום לעדכונים, כאן: https://www.isoc.org.il/newsletter-updates
ד"ר אסף וינר הוא סמנכ"ל מחקר ומדיניות ציבורית באיגוד האינטרנט הישראלי, ועמית מחקר בכיר במרכז הנשיא שמגר למשפט דיגיטלי וחדשנות באוניברסיטת תל אביב.
ד"ר רננה קידר היא מרצה בכירה למשפטים ומדעי הרוח הדיגיטליים באוניברסיטה העברית בירושלים.
המחברים מודים ליהונתן אלקובי על הסיוע בעריכת המחקר החישובי ולעדו אילי על הסיוע במחקר המדיניות וריכוז הפרוייקט.
מערכי הנתונים הגולמיים והעתקי ההתייחסויות המאוזכרות במאמר זה, זמינים כאן.