ביטויים ארוכים בד"ש ומיקומם

עבור לחלק ב'

מיקומם של ביטויים ארוכים בדילוג שווה בטקסט
של התורה

 ניסוי בגישה הגלובלית

נחום בומבך

(חלק א')

 

הקדמה:

הניסוי שיתואר להלן עוסק בביטויים המופיעים בתורה בדילוג שווה (ד"ש). ביטוי, לענייננו הוא רצף של 2 מילים או יותר. רצף מילים היוצר מבנה תחבירי תקין, הוא ביטוי שיש לו משמעות כלשהי, (גם אם זו אינה הגיונית), רצף כזה ייקרא: "ביטוי" וזאת בתנאי שהוא מקיים את כללי הלשון.  ניתן להבחין בין ביטוי תקני לביטוי שאיננו תקני, באמצעות שימוש בכללי לשון מוגדרים.
בעבר נצפו מקרים אשר בהם ביטויים ארוכים בד"ש מופיעים בתורה בסמיכות לפסוקים שיש להם קשר מושגי לביטוי. בניסוי שלהלן אנו מציעים שיטה הבודקת את ההנחה שלפנינו תופעה שאיננה אקראית. המדידה הניבה תוצאה בעלת מובהקות גבוהה.
בחירת הביטויים בניסוי שלנו:

הגדרות:

זוג מילים: 2 מילים המופיעות זו אחר זו ברצף.
ביטוי: זוג מילים שיש להם משמעות כלשהי ובתנאי שמתקיימים כללי הלשון.
המילים: המילים מהם מורכבים הביטויים.
לקסיקון: המקור הטקסטואלי מממנו נלקחו המילים.
הטקסט: הטקסט עליו נערך הניסוי.

זוג מילים בד"ש: זוג מילים המופיע בטקסט בד"ש.
ביטוי בד"ש: ביטוי המופיע בטקסט בד"ש.

בניסוי שלנו:
הלקסיקון: חמשה חומשי התורה.
המילים: כל המילים מהלקסיקון שארכן 5 אותיות או יותר.
ד"ש: דילוג שווה באינטרוול +2 עד 1000 +
הטקסט: חמשה חומשי תורה .

מספר זוגות המילים בד"ש הוא 6,060 .

הניסוי:

בצורתו האידיאלית אמור הניסוי להתבצע לפי השלבים הבאים:
הרכבת הרשימה:


1 . נמצא את כל הביטויים בד"ש.

2. לגבי כל אחד מהביטויים שמצאנו, נחפש בכל הטקסט פסוק או פסוקים שיש בינם לבין הביטוי בד"ש                  קשר מושגי כלשהו.

3. נערוך רשימה של זוגות, כשכל זוג כולל את הביטוי בד"ש והפסוק/פסוקים השייכ/ים לו.

הניסוי:

4 . לגבי כל זוג נמדוד קירבה של הפסוק/פסוקים, לביטוי בד"ש.

5 . נסכם את התוצאות ונמדוד מובהקות תחת השערת אפס של אקראיות והשערה אלטרנטיבית של נטייה לקרבה בין הפסוק/פסוקים לביטוי.

שני קשיים עיקריים מתגלים כאשר באים לערוך ניסוי במתווה זה:

1. "קשר מושגי כלשהו" הוא מושג רחב שאיננו מוגדר היטב. קיימים הבדלים בפרשנות שאנשים שונים מיחסים למושגים שאינם מוגדרים היטב. המרחב הגדול של שיקול דעת סובייקטיבי בעריכת מדגמים, הוא אחד מנקודות התורפה של ניסויים  שנעשו בעבר. המטרה כאן הייתה למצוא שיטה פשוטה שתצמצם עד למינימום הכרחי את הצורך בשיקול דעת אנושי שכנראה תמיד יידרש במידה זו או אחרת. בכל מקום בו נדרשת הכרעה על פי שיקול דעת או הגיון, חשוב שההכרעה תהיה אחידה ככל שניתן, כאשר היא מתבצעת על ידי אנשים שונים.

2. השלבים באיתור יעיל של "קשרים" בין ביטויים לפסוקים אמורים להיות כדלהלן: א. מציאת כל הביטויים התקניים מתוך סך 6,060 זוגות המילים בד"ש. ב. בדיקת כל אחד מהביטויים שהתקבלו מול כל אחד מפסוקי התורה (סה"כ כ – 6000 פסוקים) והערכה בדבר קיומו או אי קיומו של קשר בין הפסוק לביטוי. אם נניח שרק 2,000 ביטויים הם תקניים, אזי יש לבצע כ – 12,000,000 הערכות כאלה!!! דבר שכמובן איננו מעשי.

בהצעה שתובא כאן לעריכת הרשימה, לא קיימים החסרונות הנ"ל. יודגש כי השיטה המוצעת אינה באה לשלול שיטות אחרות, בכל מקרה נדרוש שהשיטה תהיה כזו, שיישומה על ידי אנשים שונים יביא לתוצאות זהות, או דומות ככל האפשר.
יתרון נוסף של ההצעה המתוארת כאן נעוץ בעובדה ששיקול הדעת האנושי הנדרש , אינו מצריך מיומנויות נדירות. לא נדרש ידע מקצועי כלשהו, ולמעשה שכל ישר, ידע שטחי בתורה והכרת השפה  ברמה ממוצעת, די בהם כדי להרכיב את הרשימה, או לבקר את ההחלטות שהתקבלו לצורך הרכבת הרשימה ששימשה בסיס לניסוי שלנו.

השלבים בהרכבת הרשימה ששימשה בסיס לניסוי:

1. עבור כל אחד מ – 6,060 זוגות המילים בד"ש שברשימה שקיבלנו לעיל, נחפש בכל הטקסט פסוק או פסוקים שיש בהם ובביטוי יסודות לשוניים משותפים, (יוגדר להלן), זוהי הדרישה לקשר ברמה הטכנית. נערוך רשימה של זוגות כשכל זוג מורכב מביטוי בד"ש ופסוק, כשיש בהם (בביטוי ובפסוק), יסודות לשוניים משותפים.

2. מתוך הרשימה שקיבלנו בסעיף 1, נרכיב רשימה חדשה הכוללת רק אותם זוגות שבהם קיים דמיון בין משמעות הביטוי לבין משמעות הפסוק או אחד או יותר מחלקיו .

שלב מס' 1 : נועד לצמצם את מספר הבדיקות ביחס לכל ביטוי בד"ש, הנדרשות על מנת לאתר פסוקים שיש ביניהם לבין הביטוי קשר מושגי. ביטויים או משפטים שיש ביניהם קשר מושגי, ובפרט כאלה שיש להם משמעות דומה, מקיימים במקרים רבים (אם כי לא תמיד), גם קשר לשוני כגון שימוש באותם מילים, או במילים הנגזרות מאותו שורש. נוכל לצמצם את מספר הבדיקות הנדרשות ביחס לכל ביטוי בד"ש (קושי מס' 2 לעיל) אם נחליט שבדיקת הדמיון לא תיערך ביחס לכל אחד מפסוקי התורה, אלא אך ורק ביחס לפסוקים שיש בהם ובביטוי יסודות לשוניים משותפים כפי שיוגדר להלן. ואכן, מתוך סך הביטויים בד"ש (מספרם כאמור 6,060) קיימים זוגות שכל אחד מהם מכיל ביטוי בד"ש ופסוק החולק עמו יסודות לשוניים משותפים (שלב 1) . יש לציין כי כ – 700 זוגות מכילים ביטויים תקניים, דהיינו ביטויים העונים על כללי תחביר, בשאר המקרים, הביטויים אינם יותר מאשר צירוף של שתי מילים שאינן יוצרות ביטוי בעל משמעות. אנו נדרשים כעת להכנת הרשימה (שלב 2 ) שתשמש בסיס לביצוע הניסוי. זה ייעשה באמצעות סקירת 700 זוגות, כשלגבי כל אחד מהם יש צורך להעריך האם קיים דמיון בין משמעות הביטוי לבין משמעות הפסוק או אחד או יותר מחלקיו. כפי שנראה, משימה זו היא קלה יחסית לביצוע . כזכור, הניסוי בצורה שהוגדרה לעיל דרש 12,000,000 החלטות.

שלב מס' 2: מגדיר את סוג הקשר המושגי שנבדק בניסוי, זהו קשר של משמעות. כפי שיובהר להלן. החלטה בדבר קיום או העדר של "קשר מושגי" שאינו "קשר של משמעות", קשה הרבה יותר.

קשר טכני, קשר מושגי וקשר של משמעות:


התיזה שבבסיסו של ניסוי זה היא כאמור, שקיימת קירבה בין מיקומו של ביטוי בד"ש בתורה לבין מיקומו של פסוק או פסוקים שיש לו\להם קשר מושגי כלשהו עם הביטוי. נבחין בין סוגי הקשרים הבאים:

קשר טכני בין פסוק לביטוי: מתקיים כאשר הפסוק והביטוי חולקים ביניהם יסודות לשוניים משותפים, למשל: מילים זהות או מילים הנגזרות משורש משותף. קשר טכני יכול להיות מאובחן בקלות באופן אוטומטי באמצעות מחשב, בתנאי שמהות הקשר תוגדר במדויק.

קשר מושגי בין פסוק לביטוי: מתקיים כאשר קיים קשר כלשהו בין הפסוק לביטוי הקשור לתוכן של הפסוק והביטוי. קשר מושגי הוא מונח רחב מאד ונתון לפרשנות סובייקטיבית ולחופש דמיון אסוציאטיבי.

קשר של משמעות בין פסוק לביטוי: זהו סוג של קשר מושגי, והוא מתקיים כאשר קיים דמיון בין משמעות הביטוי לבין משמעות הפסוק או חלק ממנו. קשר של משמעות (דמיון במשמעות) הוא מושג שבמהותו קשור לתבונה אנושית, אלא שברוב המקרים, ההחלטה בדבר קיומו או אי קיומו של דמיון כזה, קלה למדי, ובמרבית המקרים תהיה משותפת לבני אדם שונים.

להמחשת מושגים אלה נשתמש בדוגמא הבאה: אחד הביטויים בד"ש בניסוי שלנו, הוא הביטוי:

"מבניו המשיח"


דוגמא מס' 1 :
קיים קשר טכני:
נתבונן בפסוק הבא:
" אם הכהן המשיח יחטא לאשמת העם והקריב על חטאתו אשר חטא פר בן בקר תמים לה' לחטאת" (ויקרא ד' ג').
לפסוק זה יסודות לשוניים משותפים עם הביטוי מבניו המשיח.

א. המילה המשיח מופיעה גם בפסוק וגם בביטוי.

ב. בביטוי מופיעה המילה מבניו ובפסוק מופיעה המילה בן. שתי מילים אלה נגזרות משורש משותף. ולכן קיים קשר טכני בין הפסוק לביטוי.
האם קיים קשר מושגי בין הפסוק לביטוי?. כמובן שלא. עניינו של הביטוי מבניו המשיח , הוא , פחות או יותר, אודות מישהו שאחד מבניו יהיה, או הנו, המשיח. משמעות הפסוק לעומת זאת היא כמובן שונה לחלוטין.
דוגמא מס' 2:
קיימים קשר טכני וקשר של משמעות כאחד:
הפסוק:
"והכהן המשיח תחתיו מבניו יעשה אתה חק עולם לה' כליל תקטר" (ויקרא ו' ט"ו)
מלבד שיש בו יסודות לשוניים משותפים עם הביטוי מבניו המשיח, שכן שתי המילים שבביטוי מופיעות בפסוק, גם משמעותו דומה למשמעות הביטוי. הפסוק מדבר על אהרן הכהן שמישהו מבניו הוא המשיח. המסקנה היא שבין הפסוק לבין הביטוי קיים קשר טכני וגם קשר של משמעות. כאמור, קשר של משמעות (דמיון במשמעות) הוא מקרה פרטי של קשר מושגי.
דוגמא מס' 3 :
קיים קשר מושגי שאיננו קשר של משמעות:
נתבונן שוב בביטוי מבניו המשיח הפעם מול הפסוק:
"ויהי כמשיב ידו והנה יצא אחיו ותאמר מה פרצת עליך פרץ ויקרא שמו פרץ" (בראשית ל"ח כ"ט).
הפסוק הנ"ל אינו חולק במשותף יסודות לשוניים עם הביטוי, אין גם דמיון במשמעות בין הפסוק לביטוי. לעומת זאת קיים קשר מושגי בין הביטוי לפסוק. שהרי  פרץ הוא אבי השושלת שמממנה נולד    "דוד המלך "  משיח ה'. קשר מושגי הוא כאמור מושג רחב מאד והחלטה על קיומו או היעדרו, נתונה להשפעה סובייקטיבית חזקה.
הניסוי המתואר במאמר שלפנינו עוסק בשאלת קירבה בין ביטויים בד"ש לפסוקים כאשר קיים קשר של משמעות בין פסוק לביטוי. האוכלוסייה, לגביה מתבצעת הבדיקה, מורכבת מזוגות של פסוקים וביטויים המקיימים ביניהם קשר טכני. האילוץ לצמצם את הבדיקה לאוכלוסיה זו, נעשה מטעמים פרקטיים (700 בדיקות במקום 12,000,000 ). המדגם שלנו יהיה מורכב אפוא מזוגות של פסוקים וביטויים שמתקיים ביניהם קשר טכני ושל משמעות כאחד מהסוג שבדוגמא מס 2 .
הניסוי עוסק במקרים בהם קיים "קשר של משמעות", שהוא כאמור סוג של "קשר מושגי". קשה לבצע ניסוי אובייקטיבי המבוסס על מקרים בהם קיים "קשר מושגי" במובנו הרחב, דהיינו גם במקרה שאינו של משמעות גרידא (דוגמא 3 ), וזאת משום שכאמור מושג זה רחב מדי ונתון במידה רבה לשיפוט סובייקטיבי. מדוגמאות שהובאו בחלק ב' למאמר זה, ניתן להתרשם שקיימת קירבה מעבר לצפוי בין ביטויים בד"ש לבין פסוקים שיש ביניהם קשר מושגי כלשהו, לאו דווקא של משמעות, אלא שדבר זה לא נבדק בניסוי שלפנינו.
יסודות לשוניים משותפים (קשר טכני) ודמיון במשמעות (קשר של משמעות) בניסוי שלנו:
יסודות לשוניים משותפים:
הדבר הראשון העולה על הדעת הוא לבדוק לגבי כל ביטוי תקני, האם קיים פסוק או פסוקים אשר בהם מופיעות שתי המילים המרכיבות את הביטוי, כפי שהן. הדבר נעשה אך התקבל מספר קטן מאד של מקרים העונים על תנאי זה (כ – 10).
נערכה בדיקה נוספת. הפעם במקום לבדוק מול כל ביטוי תקני מהם הפסוק/פסוקים בתורה המכילים את 2 המילים כפי שהם, אותרו לגבי כל ביטוי תקני הפסוקים אשר בהם מופיעים מילים הנגזרות מאותו שורש דקדוקי שמהם נגזרות המילים שבביטוי. הפעם אותרו אלפי מקרים כאלה. סקירה מדגמית של מקרים אלה הראתה כי כמעט תמיד לא ניתן להצביע על דמיון במשמעות (קשר של משמעות) בין הביטוי לאחד מחלקי הפסוק המתאים לו. בשל המספר הרב של המקרים בהם יש "לטפל" נדחתה הגדרה זו.
ההגדרה שנבחרה בסופו של דבר היא: " קיימים יסודות לשוניים משותפים לפסוק ולביטוי (קשר טכני) אם לפחות מילה אחת המרכיבה את הביטוי, מופיעה בפסוק כפי שהיא, ומילה נוספת המופיעה בפסוק, נגזרת מאותו השורש של המילה השנייה המרכיבה את הביטוי". המילה בפסוק הזהה לאחת המילים בביטוי, והמילה הנוספת הנגזרת מאותו שורש שממנו נגזרת המילה השנייה שבביטוי, ייקראו להלן: "המילים הרלוונטיות שבפסוק".
מתוך כל הביטויים (תקניים ושאינם תקניים) אותרו 1698 מקרים לגביהם קיימים יסודות לשוניים משותפים לפסוק ולביטוי (קשר טכני). ביטויים אלה מוצגים בטבלה מס' 1

הרשימה:

 לגבי כל אחד מהביטויים התקניים אשר לגביהם נמצאו פסוקים שיש בהם יסודות לשוניים משותפים עם הביטוי (קשר טכני), התבצעה בדיקה האם מתקיים דמיון במשמעות (קשר של משמעות) בין הפסוק לביטוי. ב – 113 מקרים מצאנו שקיים דמיון כזה. מקרים אלה מוצגים בטבלה מס' 2. נשים לב כי מס' ביטויים מופיעים יותר מפעם אחת,  כלומר ישנם ביטויים לגביהם נמצא יותר מפסוק אחד אשר לגביו ניתן לומר כי קיים דמיון במשמעות. כדי למנוע עיוות תוצאות המדידה בשל תלות אפשרית בין זוגות החולקים במשותף ביטוי זהה נכללו במדגם 74 זוגות שבהם ביטויים שונים. בכל זוג מופיע פסוק אחד או יותר המקיימים קשר של משמעות עם הביטוי.

המדידה:


פרטי המדידה דורשים דיון מקיף במסגרת נפרדת. כאן יינתן תיאור כללי בלבד.
המרחק: לגבי כל אחד מהביטויים בד"ש אשר לגביהם נמצא/ו פסוק/ים בעלי משמעות דומה, (כאמור: 74 ביטויים ), נמדד המרחק שבין הביטוי לבין כל המילים הרלוונטיות שבפסוק/ים. המרחק שנמדד הוא הערך של "אומגה" כפי שהוגדר במאמר של ויצטום ריפס ורוזנברג ב
Statistical Science 1994, Vol. 9, No. 3, 429-438 .
ערכי אומגה "נורמלו" באופן הבא: לגבי כל זוג   נמדדו 9,999 ערכי אומגה שהתקבלו בשיטת
ERPS        (ELS Random Placemens and Skips  . הרנדומיזציה של המיקום וגובה הדילוג, נעשתה רק ביחס לביטוי בד"ש ולא ביחס למילים בפסוק שנשארו במקומם בטקסט. הרנדומיזציה של גובה הדילוג נעשתה בטווח של 1000 – 2.
הקירבה בין פסוק לביטוי ביחס לכל זוג נמדדת באמצעות הערך c : ערכי אומגה שהתקבלו ביחס לכל זוג מוינו בסדר עולה. מיקומו של ערך אומגה המתייחס לזוג המקורי, מחולק ב – 10,000 הוא הקירבה ביחס לזוג בודד. נמדדו 74 ערכים המתייחסים לרשימת הזוגות. הערך c הוא למעשה ערך "מנורמל" של אומגה, והוא משמש לנו למדידת המרחק שבין הביטוי בד"ש לבין הפסוק או הפסוקים.
ההסתברות הכוללת: בתנאים של אקראיות צפויים ערכי c של הרשימה להתפלג באופן אחיד באינטרוול  1 – 0 , (התפלגות יוניפורמית), ולכן יש מקום להשתמש בסטטיסטיקה P1 ו – P2 שהשתמשו WRR במאמרם הנ"ל. (התוצאה ביחס ל – P2 היא בערך 1/30,000,000).
התוצאות: ביחס לרשימה של 74 זוגות :
p1=3.24*E10^-7 p2=3.26*E10^-8


התפלגות ערכי c של המדגם

אמינות הניסוי ושלילת כל טענה אפשרית בדבר ביצוע מניפולציה בבחירות :


טענתם העיקרית של "מתנגדי הקודים" מתייחסת לחופש הרב הקיים לדעתם ביחס למרכיבי וכללי הניסוי או המדגם. בניסוי שלנו נעשו בחירות ביחס למרכיבים שונים. למשל: מספר המילים בביטוי (בחרנו 2 )., מספר האותיות בכל מילה (בחרנו: לפחות 5 ), טווח הדילוג (בחרנו +2 עד +1000 ), הנושא הנבדק (בחרנו: מרחק בין ביטוי לפסוק כאשר מתקיימים קשר טכני ושל משמעות בין הפסוק לביטוי) וכו', אלא, שבניסוי שלנו לא ניתן להעלות את הטענה שהתוצאות הושפעו "ממשחק בבחירות" וזאת משום שהניסוי מתבצע בשיטה הגלובלית.  באמצעות הבחירות אנו גוזרים מתוך האוכלוסייה אוכלוסיית משנה (האוכלוסייה הנבדקת) ואילו ביחס לפריטי המדגם לא מתבצעות בחירות או שהבחירות הן פשוטות ודורשות החלטות טריוויאליות המשותפות בדרך כלל לרוב בני האדם.
נסביר זאת ותחילה נגדיר:
מילה: מילה בעברית בעלת אורך כלשהו
זוג מילים: 2 מילים המופיעות זו אחר זו ברצף

ביטוי: זוג מילים שיש להם משמעות כלשהי ובתנאי שמתקיימים כללי הלשון.
ביטוי בד"ש: ביטוי המופיע בתורה בדילוג שווה. אין הגבלה ביחס לטווח הדילוג.
האוכלוסייה: כל הזוגות האפשריים, כשכל זוג מורכב מפסוק בתורה, ומביטוי בד"ש.
התפלגות המרחקים באוכלוסיה: התפלגות המרחקים באוכלוסיה , בין כל פסוק שבכל אחד מהזוגות לבין הביטוי שבזוג.

נתון טריוויאלי: התפלגות המרחקים באוכלוסיה היא רנדומלית. כלומר ערכי c מתפלגים יוניפורמית בטווח 1…0.

האוכלוסייה הנבדקת: כל הזוגות באוכלוסיה שבהם מתקיים: כל ביטוי הוא בן 2 מילים, כל מילה בת 5 אותיות טווח הדילוגים הוא +2 עד +1000 וקיים קשר טכני מהסוג המתואר לעיל, בין כל פסוק שבכל אחד מהזוגות לבין הביטוי שבזוג. האוכלוסיה הנבדקת היא למעשה אוכלוסיית משנה באוכלוסיה.

השערת האפס: התפלגות המרחקים באוכלוסיה הנבדקת (אוכלוסית המשנה) היא רנדומלית. כלומר ערכי c מתפלגים יוניפורמית בטווח 1…0. לא קיים שוני בין האוכלוסיה לאוכלוסיה הנבדקת.

השערה אלטרנטיבית: התפלגות המרחקים כנ"ל, איננה אחידה, קיימת נטייה, מעבר לצפוי, לקרבה בין ביטויים בד"ש לפסוקים.

בדיקה מראה כי אין לדחות את השערת האפס. אוכלוסיית המשנה מתנהגת כמו האוכלוסיה.

 

בדיקת השערות בניסוי:

המדגם: כל הזוגות באוכלוסיה הנבדקת שבהם מתקיים: קיים קשר של משמעות בין בין כל פסוק שבכל אחד מהזוגות לבין הביטוי שבזוג.

השערת האפס: התפלגות המרחקים במדגם, בין כל פסוק שבכל אחד מהזוגות לבין הביטוי שבזוג, היא אחידה, .כלומר ערכי c מתפלגים יוניפורמית בטווח 1…0.
השערה אלטרנטיבית: התפלגות המרחקים כנ"ל, איננה אחידה, קיימת נטייה, מעבר לצפוי, לקרבה בין ביטויים בד"ש לפסוקים.

בעקבות הניסוי נדחית השערת האפס ברמת מובהקות גבוהה מאד.

סיכום:
שיטת המדידה: מדידת המרחקים בין פסוק לביטוי מתבצעת באמצעות פונקציה המתפלגת בתנאים אקראיים התפלגות אחידה (יוניפורמית) בטווח שבין 0 ו – 1 .
האוכלוסייה הנבדקת נגזרת מהאוכלוסייה והיא מורכבת מזוגות מתוך האוכלוסייה , כאשר מתקיים: כל זוג מורכב מביטוי בד"ש ומפסוק כשהביטוי והפסוק חולקים ביניהם יסודות לשוניים משותפים (קשר טכני). לגבי הביטויים בד"ש מתקיימים הפרמטרים דלעיל: דהיינו: כל ביטוי הוא בן 2 מילים, כל מילה בת 5 אותיות וטווח הדילוגים הוא +2 עד +1000 . כאמור, ישנם 1,698 זוגות של ביטויים/פסוקים, שבהם הפסוק כולל אחת המילים שבביטוי , ומילה נוספת הנגזרת מאותו שורש שממנו נגזרת המילה השנייה שבביטוי. לגבי חלק מהביטויים נמצא יותר מפסוק אחד המקיים את התנאי הנ"ל. בסה"כ מדובר בזוגות הכוללים 797 ביטויים שונים, כאשר לגבי כל אחד מהם נמדד המרחק בינו לבין הפסוקים הרלוונטיים.
המדגם נגזר מהאוכלוסייה הנבדקת, והוא מורכב מזוגות מתוך האוכלוסייה הנבדקת אשר בהם בנוסף לקשר טכני המתקיים בין הביטוי בכל זוג לפסוק, קיים גם קשר של משמעות (דמיון במשמעות). המדגם כולל 74 זוגות.
לפני שניגש לבדיקת ההשערות באמצעות המדגם נבצע בדיקה מקדימה . נבדוק התפלגות המרחקים שבין הפסוקים לביטויים בד"ש שבזוגות המרכיבים את האוכלוסייה הנבדקת . ניתן לראות כי ההתפלגות היא אחידה, כפי שהדבר קיים באוכלוסיה , ומכאן יש להסיק כי בשלב זה אין בפרמטרים שנבחרו כדי להטות את תוצאות הניסוי המתבצע באמצעות המדגם. כפי שנאמר, העובדה שהבחירות הן ביחס לאוכלוסיה הנבדקת, ולא ביחס לפרטי המדגם , מבטלת את הטענה בדבר מניפולציה.
כל זה כמובן תקף בתנאי שבחירת הזוגות שמהם הורכב המדגם (טבלה מס' 2 ), כלומר, ההחלטה על קיום או העדר קשר של משמעות, מתבצעת על בסיס אובייקטיבי. ואמנם מתברר כי אנשים שונים אשר לא ראו את טבלה מס' 2 מרכיבים (על בסיס טבלה מס' 1 ) , רשימות דומות, גם אם אינן זהות לחלוטין, לרשימה שהוצגה כאן. בכל אופן, התוצאות הסטטיסטיות המתקבלות בניסויים בהם נעשה שימוש ברשימות אלה, בדרך כלל אינן שונות בהרבה מהתוצאה שהוצגה כאן.

המחקר עליו מתבסס מאמר זה הוצג בשנת 2006 ביחד עם הארולד גנץ בהונג קונג במסגרת הועידה ה-18 של האגודה הבינלאומית לזיהוי תבניות

ראה גם מפגשים בין ביטויים ארוכים המופיעים בתורה בדילוג שווה של אותיות ופסוקים הקשורים אליהם .
עבור לחלק ב

תגובה אחת על ביטויים ארוכים בד"ש ומיקומם

  1. אתר יוצא דופן לפרסם. אני הולך לבדוק את הסימנייה הרבה יותר קרובות. אני ממש אוהב את התבנית באתר

כתיבת תגובה

האימייל לא יוצג באתר. (*) שדות חובה מסומנים

תגי HTML מותרים: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>