ABBYY FlexiCapture SDK
העצימו את אפליקציות המסמכים שלכם עם חילוץ נתונים מהיר ומדויק.
הכלי שמתאים לך, עבור הנתונים שהם צריכים.
מה זה ABBYY FlexiCapture SDK?
ABBYY FlexiCapture SDK מאפשר למפתחי תוכנה ליצור במהירות יישומים המפיקים משמעות ממסמכים. FlexiCapture SDK אידיאלי עבור אינגרטורים למערכות, מפתחים וספקי שירותים שרוצים לשלב יכולות חילוץ נתונים עוצמתיות בפתרונות שלהם. באמצעות שימוש בלמידת מכונה ובבינה המלאכותית של ABBYY, לקוחות קצה יכולים לעבד עסקאות, מהר יותר, בכמות גדולה יותר ועם פחות שגיאות, לשפר את שירות הלקוחות, להפחית עלויות ולקבל החלטות חכמות יותר על תהליכים.
יכולות ויתרונות
FlexiCapture SDK מספק למפתחים ערכת כלים חזקה וגמישה לשילוב של טכנולוגיות חילוץ הנתונים המובילות של ABBYY ביישומים שלהם, בצורה חלקה.
הפקת נתונים באיכות גבוהה
באמצעות טכנולוגיות OCR עטורות פרסים ויכולות מיון מתקדמות וכן למידה אוטומטית מובנית המבוססת על טכנולוגיית למידת מכונה, FlexiCapture SDK מבטיח דיוק נתונים יוצא דופן.
אינטגרציה הדוקה עם אפליקציות
FlexiCapture SDK מאפשר למפתחים לשלב חילוץ נתונים באופן קל וחלק באפליקציות שלהם ולשלוט באופן מלא על עיבוד המסמכים, נתונים שחולצו מהם וניתוב מסמכים.
עיבוד מסמכים חלק ואוטומטי
כדי להשיג יעילות גבוהה, FlexiCapture SDK מספק סט שלם של טכנולוגיות וכלים לעיבוד יעיל של טפסים ומסמכים מֻובְנֶים ובלתי מֻובְנֶים, לרבות אימות נתונים, סיווג מתקדם של מסמכים, למידה על בסיס פידבק וייצוא לעיבוד בשרת עורפי ואִרְכּוּב.
פתחו בסביבות מוכרות
ה-API ל-SDK תואם לתקן COM וניתן להשתמש בו בקלות ב-C/C++, Visual Basic, Java או כל כלי פיתוח אחרים התומכים ברכיבי COM.
תכונות
הטכנולוגיות המובילות בתעשייה
יכולות ה- OCR המובילות בתעשייה ובסיס השפות הרחב בעולם
ABBYY FlexiCapture SDK כולל את הגרסה העדכנית ביותר של טכנולוגיות ה-OCR/ICR של ABBYY. הוא מספק את איכות הזיהוי הטובה ביותר עבור יותר מ-209 שפות OCR, כולל ערבית, סינית, יפנית וקוריאנית. זה מפשט את תהליך הלוקליזציה של פיתוח אפליקציות ומאפשר לענות על צרכי הלקוחות ברחבי העולם ביתר קלות.
דיוק גבוה של חילוץ נתונים
ABBYY FlexiCapture SDK מספק חילוץ נתונים חכם עבור שדות שונים. הטכנולוגיה מחפשת את השדות במסמך ומנתחת את האזורים סביבם. כדי לשפר את התוצאות, מפתחים יכולים להשתמש באימון המובנה לחילוץ שדות, כדי להגדיר בצורה מדויקת יותר את מיקומם של שדות וקבוצות חוזרות על עמוד של מסמך מובנה או מסמך חצי-מובנה. האימון מתחיל ישר כשמשתמש הקצה מתחיל לעבוד עם מסמכים.
למידה באמצעות משוב
FlexiCapture SDK מאפשר למפתחים להטמיע אימון לטכנולוגיית חילוץ ומיון השדות כדי לשפר את דיוקם.
הטכנולוגיה לומדת על סמך משוב שניתן ממשתמשי קצה. משוב זה עשוי להיאסף בכל רכיב של צד שלישי לצורך אימות, להיות מוטמע על ידי המפתח, ולהכיל מידע על אזורי שדות נכונים (כדי לאמן את טכנולוגיית חילוץ השדות) ועל מחלקות תמונה נכונות (כדי להכשיר את טכנולוגיית המיון).
שיפור תמונות ובקרת איכות
כעת מפתחים יכולים לשפר תמונות, כולל תמונות שצולמו על ידי מכשירים ניידים, הן באופן ידני והן באופן אוטומטי. יכולת זו מאפשרת למפתחים לעבוד עם הרקע המורכב של מסמכים כמו תעודות זהות, פוליסות ביטוח וכו'. ניתן להחיל תיקונים לתמונות, לדוגמה:
- תיקון אוטומטי של הרזולוציה
- החלפת רזולוציית התמונה לרזולוציה שצוינה
- תיקון ההטייה של התמונה בהתבסס על קווי הפרדה שחורים, ריבועים שחורים או טקסט
- המרת התמונה לשחור לבן
- סיבוב, היפוך צבעים ושיקוף סביב ציר האמצע של התמונה
- הפחתת רעשי ISO
- הסרת סימני צבע ולכלוך
- חיתוך אוטומטי של התמונה
ניתן גם להחיל פרופיל שיפור מוגדר מראש לתמונות.
סיווג מסמכים מתקדם
סיווג מסמכים מתקדם עוזר למיין מסמכים שנכנסים למערכות הארגון לקטגוריות באמצעות מיון מוגדר מראש הזמין באמצעות API. טכנולוגיות הסיווג הן גמישות ביותר וניתן להשתמש בהן כדי להבחין בין:
- סוגי מסמכים שונים כמו: חשבוניות, דפי בנק, טפסי מס, תביעות וכו'.
- וריאציות של מסמכים בתוך אותו סוג מסמך, כגון: חשבוניות מספקים שונים.
- גבולות מסמכים, למשל: העמוד הראשון והעמודים הנוספים של מסמכים מאותו סוג.
טכנולוגיית הסיווג פועלת בשתי גישות:
- סיווג תמונה המנצל את היתרונות של רשתות נוירונים קונבולוציוניות ומבחין בין מסמכים שונים מבחינה ויזואלית.
- סיווג טקסט מסתמך על ניתוח טקסט סטטיסטי וסמנטי ודורש OCR.
שימוש בשתי הגישות הללו מאפשר את תוצאות הסיווג המהימנות ביותר. FlexiCapture SDK מספק את ה-API לאימון הסיווג מאפס ומשתמש בו בתוך האפליקציה כדי להאיץ את עיבוד המסמכים.
עיבוד ישר מהקופסא עבור קבלות, חשבוניות והזמנות רכש
אוטומציה של עיבוד חשבוניות היא אחד התרחישים הפופולריים ביותר להטמעה במערכות צד שלישי. ABBYY FlexiCapture SDK מספק ממשק API לעיבוד של חשבוניות, וכן הזמנות רכש וקבלות ישר מהקופסא. הוא מחליף משימות הדורשות עבודה רבה לקליטת נתונים בחילוץ נתונים שקוף, ניתן לניהול, יעיל ואוטומטי המבוסס על טכנולוגיות של זיהוי תווים וניתוח חכם למסמכים. הוא כולל הגדרות מוגדרות מראש, כללי אימות ויכולות חיפוש מתקדמות של מסדי נתונים המותאמות במיוחד לעיבוד מסמכים פיננסיים.
הטכנולוגיה יכולה לזהות שדות נתונים ברוב המכריע של החשבוניות, הזמנות הרכש והקבלות, מה שמאפשר למשתמשים להתחיל לעבד מסמכים באופן מיידי. טכנולוגיית למידה-ע"ב-משוב חכמה מחדדת את חילוץ הנתונים ממסמכים עם פריסה לא סטנדרטית.
FlexiCapture SDK מספק פרויקטים מוכנים מראש של חשבוניות, הזמנות וקבלות עבור מדינות רבות. ניתן ליצור פרויקט של חשבונית באמצעות ממשק משתמש גרפי FlexiCapture Developer's Package או ישירות באמצעות API ב- FlexiCapture SDK.
עיבוד שפה טבעית
הגרסה החדשה ביותר של FlexiCapture SDK עם עיבוד שפה טבעית (NLP) מרחיבה כעת את יכולות חילוץ הנתונים שלה כך שתכלול גם מסמכים לא מֻובְנֶים כגון חוזים, חוזי שכירות, מאמרים והסכמים. עם טכנולוגיית NLP, אתם יכולים להפוך תהליכים עסקיים נוספים הדורשים הזנת נתונים ידנית לאוטומטיים, ולהפוך במהירות נתונים חשובים ממסמכים לזמינים ביישומים העסקיים שלכם כדי לחסוך זמן, כסף ועבודה. איכות חילוץ הנתונים משתפרת באופן מתמשך דרך אימונים נוספים של מודלי ה-NLP על ידי משוב המשתמש, ומפחיתה את העלות והזמן המושקע באימות.
זיהוי ברקודים
הגבירו את היעילות של עיבוד מסמכים עם זיהוי ברקודים. ABBYY FlexiCapture SDK ממנף טכנולוגיית זיהוי ברקודים רבת עוצמה שיכולה לקרוא מגוון רחב של ברקודים. כעת, כאשר היא מבוססת על רשתות נוירונים, היא מאפשרת לחלץ ברקודים מסוגים שונים של מסמכים ומסוגלת לזהות אובייקטים בעלי צורות שונות במגוון רחב של יחסי רוחב-גובה.
אינטגרציה חלקה
התקנה מבוססת API
FlexiCapture SDK מספק שתי אפשרויות ליצירת פרויקטים: שימוש בממשק משתמש גרפי ב-FlexiCapture Developer's Package או שימוש ב-API. זה חשוב במיוחד בפיתוח של מערכות ניהול מסמכים, כאשר מפתחים עשויים להידרש לשינוי המטא דאטה, שנשלפת וזמינה עבור כל מסמך ישירות מהפתרון שבנו. ספקי שירות עבור מיקור חוץ של תהליכים עסקיים, שיש להם פרויקטים רבים של FlexiCapture, יכולים לכוונן הגדרות של שדות ספציפיים ספציפי באופן אוטומטי, ללא צורך לעבור על כל פרויקט בנפרד.
אימות
FlexiCapture SDK מספק ממשק API לאימות נתונים, המתבצע על ידי השוואה של תוצאות הזיהוי עם התמונה המקורית של כל חלק במסמך. תוצאות האימות יכולות לשמש ללימוד הטכנולוגיה לשפר את דיוק החילוץ והמיון.
חבילה למפתחים
כדי לפשט את ההגדרה הראשונית של תהליך חילוץ הנתונים עם FlexiCapture 12 SDK, המפתח מקבל את FlexiCapture 12 Developer's Package. החבילה כוללת את FlexiCapture Project Setup Station ואת FlexiLayout Studio. ניתן להשתמש בחבילת המפתחים כדי להגדיר פרויקטים של FlexiCapture לשימוש גם ב-FlexiCapture SDK. כל הפרויקטים של FlexiCapture שנוצרו בחבילת המפתחים של FlexiCapture או שהגיעו עם FlexiCapture SDK עשויים לשמש ב- FlexiCapture SDK ולהיפך.
פתרון רב תכליתי
חילוץ נתונים עבור סוגים שונים של מסמכים
ABBYY FlexiCapture SDK מספק כלים לחילוץ נתונים הן מטפסים קבועים והן ממסמכים חצי מֻובְנֶים או שאינם מֻובְנֶים כלל. ניתן לאתר ולחלץ במהירות את כל שדות הנתונים הנדרשים בפורמט מתאים.
עיבוד מסמכים שנוצרו באופן דיגיטלי
ABBYY FlexiCapture SDK מעבד מסמכים משרדיים בכל הפורמטים הפופולריים. ניתן לעבד את כל המסמכים בשטף ללא צורך להפריד בין פורמטים של תמונה לפורמטים של טקסט. FlexiCapture SDK תומך במסמכי טקסט: DOC, DOCX, RTF, HTML, TXT ו-ODT; טבלאות: XLS, XLSX ו-ODS; ומצגות: PPT, PPTX ו-ODP.
תמיכה בכל סביבה
ABBYY FlexiCapture SDK תומך בכל הסביבות המודרניות כמו מכונות וירטואליות, קונטיינרים (כולל Docker Containers) ושירותי ענן ציבוריים, המאפשרים בניית פתרונות סקיילביליים כגון שירותי אינטרנט מבוססי ענן המופעלים על ידי Contrainer Orchestrators.
אפשרויות ייצוא גמישות
נהלו את הגודל והאיכות של קבצי הפלט כדי להשיג יעילות מרבית במדיניות אחסון הנתונים. אפשרויות הייצוא כוללות את היכולת לשמור את כל הנתונים הרלוונטיים באפליקציות צד שרת ולהמיר את המסמכים שנותחו לקבצי PDF או PDF/A הניתנים לחיפוש למטרת אחסון בארכיון. טכנולוגיות חילוץ נתונים מייצאות נתונים לפורמטים מֻובְנֶים (כמו XML או CSV) או שיטות אחסון אחרות. עבור פורמטים מסוימים, התמונות של המסמכים המקוריים נשמרות גם הן, כדי להקל על איתורן והשוואתן במידת הצורך. מנפו את החיבור המאובטח להעברת קבצים באמצעות שרת SFTP, ושמרו את הנתונים המיוצאים כקובץ JSON.
ספרייה נרחבת לדוגמאות קוד
ספרייה נרחבת לדוגמאות קוד
הדרך המהירה ביותר להתחיל להשתמש ב-FlexiCapture SDK היא לקרוא את קובץ העזרה ולעיין בדוגמאות הקוד שמגיעות עם המוצר. סט נרחב של דוגמאות קוד מסביר כיצד לתכנת עם ה-SDK. לכל חלק של הספריות ישנם קטעי קוד בליווי הוראות, שלב אחר שלב, כיצד לבצע את המשימה המבוקשת. מפתחים יכולים להשתמש בדוגמאות הקוד באפליקציות שלהם כדי לחסוך זמן פיתוח.
דוגמאות קוד מסופקות עבור C#, C++, Visual Basic .NET, Java ושפות סקריפטים ועוזרות למפתחים לזהות כיצד:
- להתחיל להשתמש במוצר: מראה כיצד לבצע חילוץ נתונים באמצעות שורות קוד ספורות. דוגמה זו עוזרת להתחיל בפיתוח. זמין עבור: C++, C#, Visual Basic .NET, Java, JScript, VBScript ו-Perl.
- להשתמש ביכולות סיווג מתקדמות: מראה כיצד לאמן ולהשתמש במסווג המסמכים המובנה המגיע עם ABBYY FlexiCapture SDK. עובד עם שפות תכנות ++C ו-#C.
- לאמן את חילוץ השדות: מראה כיצד לשפר את טכנולוגיית חילוץ השדות על ידי למידה המבוססת על משוב מאימות שמתבצע במערכות צד שלישי. עובד עם שפות תכנות ++C ו-#C.
- להטמיע עיבוד חשבוניות עם למידה אוטומטית: מדגים כיצד ליצור פרויקט חשבוניות FlexiCapture, לאכלס את מסד הנתונים לספקים ולהשתמש בו כדי לזהות חשבוניות ולבצע אימון על סמך משוב מאימות שמתבצע במערכות צד שלישי. עובד עם שפות תכנות ++C ו-#C.