יש שתי בעיות עם טביעות אצבעות, false negative וfalse positive.
- false negative (שלילי שגוי) : כאשר בהנתן דוגמא של טביעת אצבע, אנחנו לא מוצאים התאמה במאגר למרות שהמאגר מכיל התאמה.
- false positive (חיובי שגוי) : כאשר בהינתן דוגמא של טביעת אצבע, אנחנו מתאימים אותה לטביעת אצבע לא מתאימה במאגר.
אם ניקח שתי טביעות אצבע של אותה אצבע, אחת אחרי השניה – הן לא תהינה זהות, זווית הלחיצה תהיה שונה, עוצמת הלחיצה, שטח הלחיצה וכו.
כדי לזהות טביעת אצבע, לא מחפשים התאמה מושלמת, כי אז אפילו שתי טביעות עוקבות לא יתאימו.
אז מה כן?
מחפשים ממצאים מסויימים, בשתי טביעות האצבע, ומתאימים אותם.
מכיוון שלא כל הממצאים יופיעו בכל טביעה (טביעה חלקית, זווית לחיצה וכו') וגם אם יופיעו כולם, הם לא יהיו במרחקים שווים אחד מהשני, משתמשים בהתאמה מקורבת, בגבולות threshold מסויים.
התאוריה הרווחת היא שאין שני אנשים עם טביעות אצבע זהות (למרות שאף אחד לא באמת בדק את כל אוכלוסית העולם). גם אם אנחנו מקבלים את התאוריה, היא עדיין לא אומרת שאלגוריתם הבדיקה לא יכריז על שתי טביעות ממקורות שונים כזהות כי הן דומות מספיק.|
יש תיעוד של כמה מקרים של זיהוי חיובי שגוי, שהצליחו לקלקל לכמה אזרחים תמימים את הבוקר, או את השבוע, או את העשור. (וניתן להניח שיש גם כמה טעויות שלא התגלו ודפקו לאנשים את החיים).
אז שגיאות קורות, אבל אולי הן נדירות מאוד?
נניח לשם השעשוע שבהינתן שתי טביעת אצבע מאנשים שונים, הסבירות ששתיהן יזוהו כשיכות לאותו אדם היא אחד למליון, נשמע טוב?
עכשיו, נניח שבונים מאגר ביומטרי של כל אזרחי המדינה (קצת יותר משבע מליון איש נכון לסוף 2008):
עם סבירות של אחד למליון, בהינתן טביעת אצבע, יהיו לה בממוצע שבע התאמות חיוביות שגויות במאגר.
אם המאגר מכיל רק טביעות אצבע של פושעים מוכרים, אז הבעיה הזו הרבה פחות משמעותית, כי רוב האזרחים הם לא פושעים ולכן המאגר קטן בהרבה (אני מנחש שגודלו הוא כמה עשרות אלפים).
פרופסור עדי שמיר, קריפטוגרף חתן פרס נובל זוכה פרס טורינג ואחד משלושת המפתחים של אלגוריתם ההצפנה RSA, הציע לנוון את הקשר בין הזהות שלכם לבין טביעת האצבע שלכם ששמורה במאגר על ידי יצירת התאמה של אחד לK בין הזהות לבין טביעות האצבע.
הצורה הפשוטה ביותר לנוון את הקשר, הוא לחלק בצורה אקראית לחלוטין את כל אזרחי המדינה לקבוצות קטנות יחסית (לצורך הדיון, נניח שגודל כל קבוצה הוא כ-100, אם כי ניתן לבחור במספרים אחרים).
גם אוסף כל טביעות האצבע יחולק לקבוצות תואמות באותו גודל. המאגר הביומטרי יכיל אך ורק את "הקשר הסודי" (שכדי להשיגו יהיה צורך להשתמש במפתחות הצפנה), בין כל קבוצת זהויות בחלק הראשון של מאגר המידע, לכל קבוצת טביעות אצבע בחלק השני של מאגר המידע.
מומלץ לקרוא את כל הכתבה בYNET.
אין ספק שזה שיפור על פני המצב המוצע כיום, אבל האם הוא אכן עונה על הדרישות?
איך נמנע זיוף זהות?
אחת המטרות המרכזיות של הקמת המאגר היא למנוע זיוף של תעודות זהות – כלומר הנפקה של שתי תעודות שונות על אותו מספר זהות וגניבת זהותו של אדם.
במשרד הפנים קוראים לזאת "הרכשה כפולה". פרופ' שמיר מתייחס גם לעניין הזה, ומדגים במכתבו איך הצעתו תמנע את הזיוף:"אם אני ניגש בפעם הראשונה למשרד הפנים, מזדהה כראובן, מקבל תעודת זהות רשמית, וטביעת האצבעות שלי נרשמת באיכות גבוהה במאגר, אך לא בהכרח כטביעת האצבע של ראובן.
נניח שלאחר מכן, אני ניגש פעם נוספת למשרד הפנים, ומבקש לקבל תעודת זהות כשמעון (אני טוען למשל, שעדיין לא קיבלתי תעודת זהות ביומטרית, או מפני שאני טוען שקיבלתי כזו בעבר אך היא אבדה או נגנבה).
בדיקת טביעת האצבעות שלי במאגר הביומטרי, תגלה ברמת וודאות גבוהה שכבר הונפקה לי תעודת זהות בעבר, אך עקב הגנת הפרטיות שאני מציע להוסיף, תצביע רק על כמאה זהויות אקראיות אפשריות שקשורות לאותה טביעת אצבע.
האם זה מספיק?
אם אנחנו מקבלים את הנחת האחד למליון שלי, אז מה שיקרה ברגע שאדם יבוא להפיק תעודת זהות זה הדבר הבא:
הפקיד יבדוק את טביעת האצבע שלו, וגלה שהיא מופיע בכשבע קבוצות שונות, מה שאומר שאולי אותו אדם כבר הפיק תעודת זהות בעבר.
אחרי בדיקה של כ700 איש, הפקיד יכריז שהכל בסדר, ויפיק את תעודת הזהות.
בבן אדם העשירי שבא להפיק תעודת זהות, הפקיד כבר יגיע למסקנה שזה הכל בולשיט, ותמיד המערכת מתלוננת ומבזבזבת לו חצי יום של בדיקות, ופשוט ידלג על הבדיקה.
מאותו רגע כל מי שרוצה להפיק תעודת זהות נוספת יוכל לעשות את זה בלי בעיה.
ועל זה נאמר:
זאב! זאב!
אז, לא – לדעתי זה לא מספיק.
אני חושב ששטרית חופר לנו בור עמוק מאוד עם המאגר הזה, והבור הזה מלא בזאבים.
רק תיקון אחד קצת סטטיסטי, המערכת בודקת שתי טביעות אצבע וצילום פנים; בהנחה שתתקבל ההצעה של עדי שמיר, והקשר בין טביעות האצבע לצילום הפנים ינוון, תדרש התאמה גם לאצבעות וגם לפנים. אם היחס הוא 1:1,000,000 על האצבעות (אני מעריך שיותר לכיוון 1:10,000,000) אז בצירוף של הפנים (בהנחה של 99.9% דיוק) אנחנו מדברים על 1:1,000,000,000, מה שאמור להיות טוב מספיק לכדור הארץ.
אבל, אני נוטה יותר לחשוב שהמדינה לא מספיק חכמה.
יהונתן, המערכת בודקת את מה שיש.
אם יש לך רק טביעת אצבע (הרבה יותר סביר שתמצא כזו בזירת פשע כי רוב הפושעים לא משאירים תמונה ) :), אז תוכל לבדוק רק טביעת אצבע.
אתה מדבר על המקרה של אותו פקיד שהמערכת תצעק לו זאב זאב?
תיקון עריכה: עדי שמיר לא קיבל פרס נובל, גם משום שאין פרס נובל במתימטיקה.
תודה אבים, תוקן.
אגב, יש כאן מישהו שנמנע מלבקר בארה"ב בגלל הדרישה של ארה"ב לספק טביעת אצבע בכניסה למדינה? אם לא הכרתם את הדרישה הנ"ל, עכשיו שאתם מכירים, האם עכשיו תמנעו מביקור שם?
גיל, אני לא נמנעתי.
אחרי טיסה של 11-18 שעות, הדבר האחרון שאתה רוצה לעשות זה להסתכן שישלחו אותך בחזרה.
אני לא שמח שעשיתי את זה, אבל אני פרגמטי.
האמריקאים (וגם אנחנו) מוותרים מאוד בקלות על הזכויות של התיירים והמבקרים שלהם, בינתיים אנחנו הטפשים שעומדים לוותר גם על הזכויות של האזרחים עצמם.
נכון, חשבתי במובן של take it or leave it, אבל כאן אלה *אנחנו* שמחליטים *לעצמנו*.
בכל אופן, עדיין לא גיבשתי דעה. החסרונות קיימים, אך כך גם היתרונות (פענוח פשעים).
מה דעתך על רישות המרחב הציבורי במצלמות אבטחה? אני שכל מרכז העיר בירושלים מרושת.
אני מתנגד כמובן, למעשה – אני חושב לכתוב פוסט המשך על זה.