ABBYY FineReader Engine
ה- SDK המקיף ביותר ל-OCR עבור מפתחי תוכנה.
הטמיעו יכולות OCR מבוססות AI באפליקציות שלכם
מה זה ABBYY FineReader Engine?
ערכת הפיתוח ABBYY FineReader Engine מאפשרת למפתחים לבנות תוכנות המחלצות מידע טקסטואלי ממסמכי נייר, תמונות או ישירות מהצג. ה-SDK מופעל על ידי AI ומספק לאפליקציה שלכם פונקציונליות מצוינת של זיהוי טקסט, המרת PDF וחילוץ נתונים. יכולות אלה מאפשרות המרה של מסמכים סרוקים למסמכי PDF, Word או Excel הניתנים לחיפוש, וגישה לנתונים מתמונות או צילומי מסך.
יכולות ויתרונות
זמין עבור Windows, Linux או MacOS. באופן מקומי או בענן
ה-OCR המדויק ביותר
ספקו ללקוחות שלכם את איכות ה-OCR חסרת הפשרות שמגיעה עם ABBYY FineReader. ספקים מובילים של מערכות ECM, פתרונות תמונה וחילוץ ממסמכים, פתרונות RPA, כמו גם יצרני סורקים ו-MFP סומכים על טכנולוגיית ABBYY OCR.
ערך רב יותר
הרחיבו את הפתרונות שלכם. ABBYY FineReader Engine מאפשר לתוכנות שלכם להמיר ספריות TIFF ל-PDF, PDF/A, Word או פורמטים אחרים, ולחלץ במדויק את ערכי השדות. פַּתְּחוּ ב-Windows, Linux או Mac והציעו את התוכנה שלכם בענן או בפלטפורמות VM.
תוצאות בזמן קצר יותר
עקפו את המתחרים שלכם והוציאו פתרונות OCR באיכות גבוהה לשוק במהירות יחד עם ממשקי API רבי עוצמה. הטמיעו בקלות יכולות OCR המובילות בעולם בעזרת כלים שהוגדרו מראש, פרמטרים, דוגמאות קוד ורכיבים נוספים.
אינטליגנציה מלאכותית ולמידת מכונה
אינטליגנציה מלאכותית, למידת מכונה וטכנולוגיות מתקדמות נוספות מספקות זיהוי בדיוק יוצא דופן עבור מסמכים בעלי מספר שפות וממירים אותם למסמכים הניתנים לחיפוש ולעריכה שמשקפים באופן מהימן את המקור שלהם.
תכונות ויתרונות
בין אם אתם ספקי תוכנה, אינטגרטורים למערכות או חברה יזמית המפתחת מערכות IT משלה, ABBYY OCR SDK יעזור לכם לבנות יישומיים מדויקים ביותר לעיבוד טקסט ונתונים.
בנו תוכנות שולחן עבודה או פתרונות שרת עבור Windows, Linux או Mac ופרסו אותם בענן או במכונות וירטואליות. יכולות ה-OCR המגוונות יכולות להוסיף ערך ליישומים בתחומים רבים, כגון DMS, ERP, RPA, ביטוח, בנקאות, בריאות, משפט וראיית מכונה.
תכונות מתקדמות למפתחים הבונים יישומים עבור פלטפורמות Windows, Linux ו-MacOS*
מערכת מקיפה של טכנולוגיות זיהוי
ערכת הפיתוח מציעה יכולת זיהוי עטורת פרסים ומדויקת ביותר של טקסט באותיות דפוס (OCR) וטקסט בכתב ביד (ICR) שיכולה להתבצע כזיהוי ברמת עמוד שלם או ברמת שדה בודד. בנוסף, היא מספקת גם זיהוי של ברקודים (OBR).
כלי עיבוד PDF עוצמתיים
ערכת הפיתוח מציע המרת מסמכים לפורמטים PDF ו-PDF/A הניתנים לחיפוש. בעת ייבוא קבצי PDF, ניתן "להחדיר" את שכבת הטקסט החסרה תוך שמירה על מאפייני ה-PDF. ניתן לחלץ נתוני XML מקבצי PDF/A-3 מיובאים או לחילופין להזין אותם בעת שמירה בפורמט של PDF/A-3.
אינטליגנציה מלאכותית ולמידת מכונה
טכנולוגיות עוצמתיות המבוססות על בינה מלאכותית ולמידת מכונה בשילוב עם ADRT של ABBYY וטכנולוגיות נוספות, מזהות את המבנה הלוגי של מסמך ומזהות את רכיבי העיצוב שלו, כגון תוכן עניינים, כותרות עליונות ותחתונות, גופנים וסגנונות גופנים כדי ליצור מחדש את המסמך המקורי במדויק.
מעבדים מרובי ליבות ועיבוד מקביל
בעת המרת עמודים רבים כגון ארכיוני מסמכים שלמים או ספרים, מפתחים יכולים למנף את הארכיטקטורה הגמישה והניתנת להרחבה של ה-SDK. על ידי שימוש במעבדים מרובי ליבות ועיבוד תמונות במקביל על גבי מספר תתי תהליכים, שלבי ה-OCR מתבצעים מהר יותר באופן משמעותי.
תמיכה בענן ובסביבות וירטואליות
בנוסף לפריסה מקומית, למפתחי תוכנה יש אפשרות לפרוס את היישומים שלהם בסביבות וירטואליות או לארח את היישומים שלהם על גבי פלטפורמות ענן כמו Microsoft Azure או Amazon Web Services.
פונקציות מתקדמות של עיבוד תמונה מקדים
עיבוד תמונה מקדים מגביר את דיוק הזיהוי על ידי אופטימיזציה של התמונה עבור OCR. אפילו תמונות באיכות נמוכה יכולות לספק תוצאות OCR טובות ביותר לאחר ביטול סטיות, סיבוב, תיקוני עיוותים, יישור שורות, פיצול עמודים, בינאריזציה אדפטיבית, הפחתת רעשי ISO ופעולות תיקון נוספות.
פרופילי זיהוי להטמעה מהירה
פרופילי עיבוד מוגדרים מראש מכילים פרמטרים שהותאמו לתוצאות ה-OCR הטובות ביותר במסגרת משימות זיהוי תכופות. ניתן להשתמש בהם במקום כוונון ידני של מערכת הזיהוי ובכך לבצע אינטגרציה מהירה יותר של ה-SDK.
זיהוי מוכן מראש עבור כרטיסי ביקור ושדות MRZ
ממשקי API ספציפיים כגון BCR API ו-MRZ API מציעים זיהוי של כרטיסי ביקור ואזורים לקריאה ממוכנת (Machine Readable Zones – MRZ) במסמכי זהות, דרכונים או ויזות. הם מספקים גישה לערכי שדות נבחרים במינימום מאמץ עבור המפתחים.
סיווג מסמכים באמצעות למידת מכונה
אלגוריתמים מתקדמים לסיווג מסמכים ב-FineReader Engine ממנפים טכנולוגיות למידת מכונה ו-OCR, ומאפשרים ליישומים לסווג מסמכים לקטגוריות שונות אוטומטית.
רכיבי ממשק משתמש
מפתחים יכולים להשתמש ברכיבים החזותיים של ABBYY המבוססים על ActiveX, כדי לשלב בקלות ממשק משתמש במגוון תוכנות כגון מערכות ERP, ECM או DMS, ובכך לספק למשתמשים שלהם את האפשרות לאמת מסמכים, לגשת לתוצאות הזיהוי ולערוך טקסט ישירות בתוכנה.
ספריית דוגמאות קוד
סט מקיף של דוגמאות קוד מספק הוראות כיצד להשתמש ב-OCR SDK, ממחיש טכנולוגיות שונות של FineReader Engine ויכול לשמש עבור פרויקטי פיתוח. כל קטע בספרייה מכיל דוגמאות קוד בליווי הוראות שיטתיות כיצד לבצע את המשימה הרלוונטית.
דוקומנטציה מפורטת ל-SDK ותמיכה
דוקומנטציה מפורטת למוצר עוזרת לייעול האינטגרציה, ומפתחים יכולים לגשת למידע נוסף דרך מאגר הידע ופורום המפתחים של ABBYY. בנוסף למשאבים אלו, התמיכה הטכנית של ABBYY זמינה עבורכם במהלך תקופת הניסיון החינמית שלכם.
פונקציית השוואת מסמכים
היכולת החדשה 'השוואת מסמכים', מאפשרת השוואה בין שתי גרסאות של אותם מסמכים וזיהוי הבדלים בתוכן שלהם. המסמכים יכולים להיות בפורמטים שונים, למשל: Microsoft Word, PDF, TIF, JPEG וכל פורמט קלט אחר שנתמך.
*בהתאם למערכת ההפעלה, עשויים להיות הבדלים קלים בזמינות ובפרטים של תכונות מסוימות. חלק מאותן תכונות חדשות עשוי להיות מיושם במהדורות מאוחרות יותר. אנא קראו את העלונים למטה לקבלת מידע מפורט.
ראו אילו תכונות זמינות עבור מערכת ההפעלה המבוקשת (PDF – אנגלית)
תהליך ה-OCR
תהליך ה-OCR של ABBYY FineReader Engine מורכב ממספר שלבים, המתחיל בייבוא תמונות או מסמכי Office ומסתיים בייצוא תוצאות הזיהוי.
1. ייבוא תמונות
ערכת הפיתוח של ה-OCR יכולה לקבל קלט ממקורות רבים. תמונות שנשמרו כקבצי TIFF, JPEG, PDF או פורמטי תמונה אחרים, כמו גם מסמכי Office שנוצרו דיגיטלית ניתנים לייבוא, בעוד שטקסט מצולם או מסמכי נייר סרוקים ניתנים לעיבוד ישירות מהזיכרון.
2. עיבוד תמונה מקדים
כדי להגביר את דיוק הזיהוי, איכות התמונה משופרת במהלך שלב העיבוד המקדים. ערכת הפיתוח מפעילה מגוון רחב של פונקציות תמונה כגון סיבוב תמונה, בינאריזציה, ביטול סטיות ופונקציות נוספות כדי לייעל את איכות התמונה.
3. ניתוח המסמך
עם אלגוריתמים מבוססי בינה מלאכותית וטכנלוגיית Adaptive Document Recognition Technology (ADRT®) של ABBYY, רכיב ה-OCR מנתח את הפריסה של כל עמוד בנפרד ואת מבנה המסמך בכללותו. תהליך זה מגדיר את האזורים שמיועדים לזיהוי טקסט ומספק מידע על רכיבי פריסה ועיצוב עבור בנייה מחודשת של המסמך הסופי בסוף תהליך ה-OCR.
4. זיהוי
עם רמת הדיוק הגבוהה ביותר, ABBYY FineReader Engine SDK מחלץ טקסט רב-לשוני המודפס בדפוס ובכתב יד (OCR, ICR) וכן סוגי מידע אחרים, כולל סימונים (OMR) וברקודים (OBR). על ידי יצירת מילונים או דפוסי זיהוי לשימושם, המפתחים יכולים להגביר את דיוק הזיהוי של שפות ספציפיות, תווים או גופנים מיוחדים.
5. ייצוא טקסט ובניית המסמך
ערכת הפיתוח ל-OCR מציעה אפשרויות רבות לייצוא תוצאות הזיהוי, ורמות שונות של שחזור פריסת המסמך. ישנם פורמטים רבים לאחסון הזמינים: טקסט, XML, סוגים שונים של פורמטי PDF ו-PDF/A, מסמכי Microsoft® Office הניתנים לעריכה ופורמטי שמירה נוספים.
סרטוני הדרכה עבור התחלה פשוטה
צפו בסרטונים הקצרים הללו כדי ללמוד כיצד להטמיע את ABBYY FineReader Engine באפליקציה שלכם. ראו כיצד פרופילי עיבוד שונים עוזרים לכם לקבל בקלות את תוצאות הזיהוי הטובות ביותר.
אתחלו את FineReader Engine ועָבְּדוּ מסמכים
סרטון זה מנחה אתכם באמצעות דוגמת קוד מקור של ++C. הוא מדגים כיצד לאתחל את FineReader Engine וכיצד לזהות מסמכים עם פרמטרים שונים לעיבוד ולייצוא.
השתמשו ברכיבי ממשק משתמש כדי לבנות ממשק גרפי משלכם ולבדוק פרמטרים של זיהוי
בסרטון זה תלמדו כיצד לבנות את ה-GUI של האפליקציה שלכם באמצעות רכיבי ה-UI הזמינים בספריית דוגמאות הקוד של ה-SDK. בנוסף, תלמדו כיצד להשתמש באפליקציית הדמו לרכיבים ויזואליים כדי למצוא בקלות את פרופילי העיבוד המתאימים למשימות הזיהוי שלכם.
וובינרים טכניים למפתחים
צפו בוובינרים עם דמו חי כדי לקבל ידע מתקדם שישמש אתכם לכם להטמיע במהירות ולייעל את יכולות המסמכים החכמות של ABBYY FineReader Engine ביישומים שלך.
וובינר
התחלה טובה היא חצי מהקרב. למדו על תהליך ההתקנה והכירו את הדוקומנטציה, דוגמאות הקוד, קבצי הדפוסים והשפות, כמו גם אפשרויות רישוי בסיסיות.
וובינר
איך לעבוד עם תמונות ב-ABBYY FineReader Engine
עיבוד תמונה מקדים הוא שלב מכריע בתהליך ה-OCR והמרת המסמכים. למד על הכלים והפרמטרים השונים שבהם תוכל להשתמש כדי להגיע לתוצאות זיהוי מיטביות.
צפו בוובינר
וובינר
אין פתרון אחד שמתאים לכולם בעיבוד מסמכים חכם. למדו כיצד לבחור את הפרמטרים הנכונים לתוצאות מיטביות בתרחיש הספציפי שלכם והשתמשו בפרופילים מוגדרים מראש כדי לחסוך בזמן הפיתוח.
וובינר
טכנולוגיות קונטיינרים מציעות יתרונות רבים עבור הפצת תוכנות. למדו כיצד לפרוס בקלות את ABBYY FineReader Engine בקונטיינר ואיזה סוג רישוי תומך בשיטה זו.
וובינר
גלו כיצד להרחיב את יישומי המסמכים שלך עם כוחות מחשוב ענן כדי להאיץ את הדיגיטציה של ארכיונים, ליישם במהירות תהליכי עבודה גמישים מבוססי מסמכים ולפרוס בקלות פרויקטים שונים התלויים במידע שמופק ממסמכים עסקיים.
וובינר
מהדורה 5 של ABBYY FineReader Engine 12 עבור Windows הוסיפה עדכונים גדולים לערכת פיתוח התוכנה. צפו בוובינר כדי ללמוד עוד על השיפורים הטכנולוגיים הכלולים במהדורה זו, ועל ההשפעה שתהיה להם על הארגון שלכם.