חילוץ נתונים מטפסי ממשלה ישראליים עם OCR: טאבו, רשות המסים, ביטוח לאומי ועוד
ציון אמינות 93/100 (מאומת) · 96+ התקנות · 2 תורמים ב-GitHub · רישיון MIT
טפסים ממשלתיים בישראל עדיין מגיעים בכמות גדולה כסריקות וכ-PDF לא מובנים, עם כתב יד, חותמות ועברית דחוסה. כלי OCR רגילים מתקשים עם עברית בגלל כיוון הכתיבה, תווים דומים וסריקות באיכות ירודה. התוצאה היא הקלדה ידנית שגוזלת שעות ומייצרת שגיאות.
npx skills-il add skills-il/localization@v1.1.0-hebrew-ocr-forms --skill hebrew-ocr-forms -a claude-codeאיך סורקים טופס 106 של מס הכנסה ומחלצים ממנו את הנתונים: שכר, מס שנוכה וניכויים, למבנה JSON?
איך מחלצים נתונים מנסח טאבו סרוק? אני צריך לקבל בעלי הנכס, גוש וחלקה, שעבודים ורישומים.
איך מאמתים שמסמך ממשלתי סרוק (כמו תעודת זהות או רישיון עסק) הוא אותנטי ושהנתונים שחולצו ממנו נכונים?
נוסף סעיף השוואת מנועי OCR (Tesseract, Google Cloud Vision, AWS Textract, Azure Read, Claude Vision) וקישורי עזר. נוסף תוכן מועשר.
14 באפר׳ 2026
מייצרים מסמכים עסקיים מקצועיים בעברית בפורמטים PDF, DOCX ו-PPTX עם תמיכה מלאה ב-RTL וטיפוגרפיה עברית תקינה. השתמשו כשצריך להפיק PDF בעברית, להוציא חשבונית מס, לנסח חוזה, לבנות הצעת מחיר, או להכין מצגת בעברית. מכסה reportlab, WeasyPrint, python-docx ו-pptxgenjs עם תמיכת BiDi. לא מיועד לקריאת מסמכים קיימים או OCR (תשתמשו ב-hebrew-ocr-forms).
מדריך לשימוש במודלי NLP לעברית כולל DictaLM 3.0, DictaBERT, NeoDictaBERT, AlephBERT ו-ivrit.ai. השתמשו כשהמשתמש שואל על עיבוד טקסט בעברית, טוקניזציה, זיהוי ישויות (NER), ניתוח סנטימנט, דיבור-לטקסט בעברית, או כשצריך לעבד טקסט עברי בקוד. מכסה בחירת מודל, עיבוד מקדים ואתגרים ייחודיים לעברית (ניקוד, מורפולוגיה עשירה, אותיות סופיות, חוסר באותיות גדולות). אל תשתמשו ל-NLP בערבית (כלים אחרים) או למשימות NLP כלליות באנגלית.
יוצרים כתוביות SRT מקובצי וידאו או אודיו עם תמיכה בתמלול עברית ואנגלית. השתמשו כשצריך לייצר כתוביות, תמלולים או כתוביות צרובות לרשתות חברתיות ולוואטסאפ. תומך בזיהוי שפה אוטומטי, בתרגום בין עברית לאנגלית ובצריבת כתוביות ישירות לתוך קובצי וידאו.
רוצים לבנות סקיל משלכם? נסו את יוצר הסקילס · הגשת סקיל