הכותרות שעניינו הכי הרבה גולשים בדף זה
16/07/24 16:17
6.02% מהצפיות
מאת גיקטיים
מאת: עו"ד כרמל סחף בימים האחרונים יש התפעלות גדולה מאקזיט אפשרי ענקי של חברה ישראלית. לצד ההישג המרשים של הסטארטאפ ניישן יש הרבה מאוד מהלכים שיש לתת עליהם את הדעת כבר בשלב שרוקמים את חלום האקזיט המיוחל. אומנם קודם כל צריך יצירתיות, יוזמה, תעוזה ונכונות לעבודה קשה אבל לפני שיוצאים לדרך חשוב ביותר לוודא מראש […]
16/07/24 21:41
6.02% מהצפיות
מאת TGspot
לפי החברה מדובר בטלפון ה-5G הראשון שמוצע עם גוף מתכתי - שעשוי כולו מחתיכה אחת של אלומיניום
16/07/24 11:00
5.22% מהצפיות
מאת גיקטיים
אחרי הפריצה הגדולה לענקית התקשורת האמריקאית AT&T, ואחרי הפריצה ל-Live Nation (חברת האם של טיקטמאסטר) וחברת הסטרימינג Roku – עכשיו הגיעה תורה של פריצה נוספת בפרופיל גבוה. והפעם, זהו תורה של דיסני. אלפי ערוצי סלאק חשופים חברת האם של מיקי מאוס, טוני סטארק, אובי וואן קנובי, הפארקים והערוצים השונים – כמרקחה. זה קרה אחרי שהאקרים […]
16/07/24 09:44
4.82% מהצפיות
מאת גיקטיים
מתקשים לדחות סיפוקים? רוצים להיכנס היום למשרד ולהתנשא על חברים איכרים? היום זה היום שלכם: אפל שיחררה הלילה את הבטא הפומבית הראשונה של iOS 18, וכל שאר מערכות ההפעלה למכשירים הפופולריים שלה. אז איך מעדכנים, מה מקבלים ולמה לצפות? היי, זה לא כמו באנדרואיד? iOS 18 הוכרזה כמובן ב-WWDC 2024 עם מה שהיה נראה כמו […]
16/07/24 19:33
4.82% מהצפיות
מאת Gadgety
וואטסאפ (WhatsApp) מכריזה רשמית על פיצ’ר “מועדפים” (Favorites), המאפשר למשתמשים להגדיר שיחות צ’אט רגילות או קבוצות שלמות כמועדפים לגישה נוחה ומהירה יותר באפליקציה ללא צורך בחיפוש ידני, זאת לצד אפשרויות הסינון האחרות הקיימות כיום באפליקציה. אחרי שנחשף בגרסת בטא מוקדמת, וואטסאפ משיקה את פיצ’ר המועדפים, שמגיע למעשה כשדרוג לפיצ’ר “מסנני הצ’אט” שהוצג מוקדם יותר השנה […]
16/07/24 15:16
4.02% מהצפיות
מאת TGspot
הרשויות הפדרליות בארה"ב ממשיכות בחקירת ניסיון ההתנקשות בטראמפ, כשבינתיים הם מנסים לדלות פרטים מהסלולרי של היורה
16/07/24 21:08
4.02% מהצפיות
מאת וואלה!
ונלד טראמפ חזר לבמה הפוליטית בנאום בוועידה הרפובליקנית, אך במקום להתמקד במסריו, הרשת געשה סביב התחבושת שכיסתה את אוזנו הפצועה
16/07/24 11:41
3.61% מהצפיות
מאת אנשים ומחשבים
ארגונים מכירים היטב את אתגר הטיפול בכמויות עצומות של חשבוניות ספקים, הזמנות, תעודות משלוח ומסמכים פיננסיים אחרים, שנשלחים אליהם כקובצי PDF מקוריים או סרוקים.
המעבר לחשבוניות בקובצי PDF צמצם באופן ניכר את השימוש בדפי נייר ואיפשר לארכב ולתייק דיגיטלית את החשבוניות באופן קל ופשוט. אבל, מהצד השני של המטבע, עדיין יש לבצע תהליך קליטה לחשבוניות במערכות הארגון, כגון מודול כספים של מערכות ERP או מערכות רכש אחרות, ותהליך קליטת החשבוניות כרוך בחילוץ שדות הטקסט הרלוונטיים מכל חשבונית (שם ספק, ח.פ, מספר הזמנה, מספר חשבונית, פריטים, מחירים ליחידה, סה"כ מחיר, מע"מ, אחוזי הנחה ועוד), והקלדתם למערכות הארגון.
כל מי שניסו בעבר להעתיק טקסט מקובצי PDF שיש בהם מבנה טבלאי, או מקבצי PDF סרוקים, נתקלו בקשיים רבים ובסופו של דבר, במרבית המקרים, העדיפו לקרוא את הטקסט מכל שדה רלוונטי בחשבונית, ולהקליד אותו באופן ידני למערכת המחשוב.
"שירות חדש מסוגל לקלוט מסמכי PDF מקוריים וסרוקים כאחד, ולחלץ מהם את כל שדות הטקסט הרלוונטיים עבור הארגון. המידע המחולץ מועבר בפורמטים המתאימים לטעינה ישירה למערכות הארגוניות
המצב הנוכחי: אתגרים בניהול מסמכים פיננסיים
ארגונים רבים מקבלים מדי חודש מאות, אלפי ואף עשרות אלפי חשבוניות, תעודות משלוח והזמנות במסמכי PDF, חלקם מקוריים וחלקם מסמכים סרוקים באיכות שונה. בנוסף לשונות באיכות הסריקה ובתצורת החשבוניות, מדובר בקבצים המתווספים לאותו חלק בעייתי של נתונים ארגוניים הנשמר בפורמטים שאינם מובנים, כולל מסמכים סרוקים ותכתובות.
כיום, הדרך המקובלת בארגונים רבים לטיפול בחשבוניות אלה היא באמצעות קליטה ידנית. המשמעות היא שעובדים בארגון מקבלים מיילים, ובאופן ידני מחלצים את הקבצים, ומקלידים את תכולתם לתוך מערכות כספים או מערכות ERP שונות, לאחר מכן חותמים את החשבונית ומצרפים אותה כצרופה לרשומה שיצרו במערכת הארגונית.
אופן הטיפול הנוכחי בנושא זה סובל ממספר חסרונות: זמן עיבוד ארוך מאוד – לעיתים ארגונים מעסיקים מספר קלדנים שמתקשים לסיים טיפול בכל החשבוניות במסגרת כל חודש; העסקת קלדנים וזמן העיבוד הארוך המתלווה מייצרים הוצאה משמעותית; הקלדה ידנית עלולה לכלול טעויות אנוש, שלפעמים לא פשוט לתקן.
חילוץ הנתונים מהן היה כרוך בקשיים. חשבוניות PDF סרוקות. צילום: אילוסטרציה. מקור: ויקימדיה
כיצד נעשה חילוץ טקסט מסורתי ממסמכים סרוקים?
חילוץ טקסט ממסמכי PDF סרוקים ומתמונות נעשה עד לאחרונה באמצעות טכנולוגיית זיהוי תווים אופטי (OCR) בלבד. החיסרון של טכנולוגיה זו, כשהיא פועלת באופן עצמאי, הינו חוסר היכולת שלה "להבין" את הקונטקסט של המסמך ולהתמודד עם מבנים טבלאיים (כמו אלה שיש בחשבוניות), בעיקר כשהם פרוסים על פני מספר עמודים.
בשלב מסוים, נוספו למערכות OCR רבות גם יכולות בינה מלאכותית, שמאפשרות לבצע Document Understanding, כך שהפתרון יכול "להבין" את הקונטקסט של המסמך ולסייע לפענח אותו בצורה נכונה. אך גם במקרה זה, הפתרונות התקשו, ועדיין מתקשים, להתמודד בצורה אמינה וטובה עם מבנים טבלאיים, בעיקר אלה שפרוסים על פני מספר עמודים ומשלבים עברית, אנגלית ומספרים.
כדי להתגבר על חסרונות אלה, נוספו לפתרונות אלה גם יכולות למידת מכונה, שחייבו את הארגונים "לאמן" את הבינה המלאכותית.
למעשה האימון הוא תהליך שנקרא תיוג (Labeling), ומבוצע לכל מבנה חשבונית של כל ספק באופן שתאפשר לבינה המלאכותית "להכיר" את מבנה החשבוניות של כל ספק קיים, ובהמשך של כל ספק עתידי. לעיתים מדובר בארגון עם אלפי ספקים, כולל כאלה שמתחלפים או נוספים מדי פעם, ויש לתייג כל פרט בכל מבנה חשבונית של כל אחד מהם.
התוצאה של תצורה זו הפכה את הפתרונות המוצעים למורכבים, יקרים, מחייבים תחזוקה מתמדת ולבסוף – מספקים תוצאות חלקיות, כשחשבוניות רבות לא טופלו על ידי הפתרונות לאור זיהוי או פיענוח שגויים.
שירותי חילוץ אוטומטיים
לאחרונה התווספו שירותים חדשניים שמבוססים גם הם על טכנולוגיות מתקדמות של עיבוד תמונה ובינה מלאכותית. אלא שבשונה מהפתרונות המסורתיים, שירותים חדשניים אלו כוללים מספר מנגנונים ייחודיים, תוך כדי שימוש במגוון מודלים של בינה מלאכותית ויכולות למידת מכונה, המאפשרים להפוך את התהליך לאוטומטי לחלוטין, ללא צורך באימון המערכת ובאחוזי הצלחה הקרובים לשלמות. בנוסף, השירות מבצע מגוון רחב של בדיקות שפיות שונות, על מנת להבטיח את הדיוק המוחלט בחילוץ הנתונים.
השירות מסוגל לקלוט מסמכי PDF מקוריים וסרוקים כאחד, ולחלץ מהם את כל שדות הטקסט הרלוונטיים עבור הארגון. המידע המחולץ מועבר בפורמטים המתאימים לטעינה ישירה למערכות הארגוניות.
למעשה, שירות זה מייתר את כל המנגנונים מבוססי כוח האדם הפועלים כיום לביצוע משימות אלה, ומציע את היתרונות הבאים: ללא צורך בהעסקת קלדנים; הפחתה משמעותית של טעויות לעומת הקלדה ידנית; עיבוד מהיר וסיום קליטת חשבוניות בתוך זמן קצר; יכולות ניתוח מעצם הפיכת המידע למידע מובנה.
בעזרת שימוש במנגנונים החדשים, שאינם דורשים התאמות, העולם צועד צעד נוסף אל עבר תהליכים דיגיטליים מלאים.
הכותב הוא סמנכ"ל פתרונות אנטרפרייז בגליל סופטוור