נווטו את הנוף המפוצל של מאגרי ML ומודלים בעברית וביידיש: ivrit.ai (יותר מ-22 אלף שעות אודיו עברי, מודלי ASR של whisper-large-v3, מודלי יידיש), Dicta (משפחת DictaLM 3.0, וריאנטים של DictaBERT, HeQ), התכנית הלאומית ל-NLP (HebrewSentiment, HebNLI), AlephBERT, ומליאות הכנסת. עוזר לחוקרים ומהנדסי ML לבחור את הדאטהסט הנכון לפי משימה, רישיון (מסחרי או מחקר), כיסוי רגיסטר עברי, והתאמת דאטהסט למודל. השתמשו כשבוחרים נתוני אימון לפרויקט NLP או ASR עברי, מוודאים תאימות רישיון למוצר מסחרי, מחפשים baseline למשימה עברית, או בודקים משאבי ML ליידיש. אל תשתמשו למאגרי NLP ערבי, חיפוש כללי ב-HuggingFace Hub, או בחירת דאטהסט OCR עברי (hebrew-ocr-forms).
ציון אמינות 87/100 (אמין) · 10+ התקנות · 3 תורמים ב-GitHub · רישיון MIT
קהילת ה-ML הישראלית חזקה לגודלה, אבל המאגרים והמודלים מפוזרים. ivrit.ai מפרסמת קורפוסי דיבור עברי ברמה עולמית בארגון HuggingFace אחד, Dicta מפרסמת מודלי LLM ו-BERT עבריים בארגון אחר, התכנית הלאומית ל-NLP מתחזקת בנצ'מרקים תחת HebArabNlpProject. הרישיונות משתנים מידידותי-מסחרי-מלא עד מחקר-בלבד. חוקר שמנסה לבחור את השילוב הנכון ל-fine-tuning של סיווג סנטימנט על צ'אט תמיכה עברי למוצר מסחרי צריך לחפש בחמישה ארגונים ולקרוא כל dataset card.
npx skills-il add skills-il/developer-tools@v1.0.3-hebrew-ml-datasets-navigator --skill hebrew-ml-datasets-navigator -a claude-codeאני רוצה לאמן מודל סיווג סנטימנט על צ'אט תמיכת לקוחות בעברית למוצר SaaS מסחרי. איזה דאטהסט להשתמש, איזה מודל התחלתי, ומה הרישיון אומר לגבי ייחוס?
אני בונה מוצר תמלול פודקאסטים בעברית. מה ivrit.ai מציעה, איזה מודל ASR להשתמש בפרודקשן עם latency נמוך, ואיך אני מטפל במספר דוברים?
צריך LLM עברי שרץ על חומרת צרכן (לא יותר מ-16GB VRAM) למוצר עברי. מה Dicta מציעה, מה ההבדלים בין הגדלים, ומה הרישיונות של ה-upstream?
אני חוקר יידיש ומחפש דאטהסטים ומודלים לזיהוי דיבור ולעיבוד טקסט. מה זמין ב-2026 ומה הרישיונות?
הוספת HEBREW-MMLU, CulturaX, FineWeb-2, ParaShoot, HeSum, משאבים אקדמיים. הסרת 27 em dashes.
25 באפר׳ 2026
תיקון תוכן: סקריפט find_dataset.py מתאים עכשיו לקטלוג ב-markdown — נוספו דאטהסטים לתרגום (NeuLabs-TedTalks, OPUS-100, MADLAD-400) וקורפוסים נוספים של Dicta.
13 באפר׳ 2026
מדריך למפתחים לאינטגרציית שילוח עם חברות ישראליות (דואר ישראל, צ'יטה, HFD, מהיר לי) ושירותי לוקרים (BOX2GO, שלאגר, Done). הסקיל מכסה בחירת חברה, עיצוב כתובות ישראליות, הפקת תוויות, מעקב חוצה-חברות והתראות ללקוחות. אל תשתמשו לבדיקת סטטוס של חבילה ספציפית (הפנו ל-mypost.israelpost.co.il), משלוחים בינלאומיים מחוץ לישראל או נושאי מכס וייבוא.
מנהלים תמונות, וידאו וקבצי מדיה דרך Cloudinary API, העלאה, טרנספורמציות, מיטוב והגשה מ-CDN.
איך ליצור סרטונים מקוד עם Remotion ב-React, כולל תמיכה מלאה בעברית ו-RTL. כולל אנימציות, קומפוזיציות, סיקוונסים, מעברים, כתוביות עם הדגשת מילים, קריינות AI, תלת-ממד, גרפים, פונטים עבריים, ואנימציות טקסט דו-כיווניות. השתמשו כשאתם עובדים עם Remotion או יוצרים סרטוני סושיאל ותוכן שיווקי בעברית. אל תשתמשו לעריכת וידאו מחוץ ל-Remotion או לפיתוח React כללי.
רוצים לבנות סקיל משלכם? נסו את יוצר הסקילס · הגשת סקיל