בדקו והשוו LLM-ים על משימות עבריות: הבנת הנקרא (HeQ), סנטימנט, Winograd, תרגום, סיכום, ניקוד וטריוויה ישראלית. עוטף את ה-Open Hebrew LLM Leaderboard ואת חבילת ה-DictaLM 3.0 לכדי Harness הערכה חוזר ומניב. מריץ מול Claude, GPT, Gemini, AI21 Jamba, DictaLM, Llama ומודלים מקומיים מ-HuggingFace. מפיק scorecard בפורמט JSON ו-markdown עם פירוט לפי משימה. השתמשו כשצריך לבחור LLM למוצר עברי, לענות על שאלות רכש לגבי ביצועים בעברית, לאמת מודל עברי שעשיתם לו fine-tuning, או לעקוב אחרי רגרסיות עבריות אחרי שדרוג. אל תשתמשו להערכה של NLP ערבי, בנצ'מרק של זיהוי דיבור (ivrit.ai leaderboard), או בנצ'מרקים כלליים באנגלית.
ציון אמינות 84/100 (אמין) · 10+ התקנות · 3 תורמים ב-GitHub · רישיון MIT
צוותי מוצר ישראליים בוחרים LLM-ים בעיוורון. אין בנצ'מרק עברי סטנדרטי שאפשר להריץ בשעתיים כדי להשוות Claude מול GPT מול DictaLM מול AI21 Jamba על מקרה שימוש אמיתי. ה-Open Hebrew LLM Leaderboard של HuggingFace בנוי למודלי בסיס ול-few-shot, לא למודלי צ'אט הסטד. DictaLM מפרסמת תוצאות אבל רק על החבילה שלה. הצוותים מנחשים, בודקים באופן לא פורמלי, או סומכים על הצהרות שיווקיות.
npx skills-il add skills-il/developer-tools@v1.1.0-hebrew-llm-eval-suite --skill hebrew-llm-eval-suite -a claude-codeאנחנו בונים פיצ'ר סיכום חדשות בעברית וצריכים לבחור בין Claude Sonnet, GPT-5, ו-DictaLM-3.0-24B. הרץ בנצ'מרקים רלוונטיים (HeQ, DictaLM Summarization, Winograd) עם 1000 דוגמאות ו-3 ריצות, והמלץ לי על מודל עם הסבר.
Anthropic שחררה גרסה חדשה של claude-sonnet. הרץ את חבילת hebrew-core על הגרסה החדשה והקודמת והגד לי אם הייתה רגרסיה ביותר מ-2 נקודות באיזה בנצ'מרק.
אני בונה צ'אטבוט בעברית ואני מתלבט בין Claude Haiku ל-AI21 Jamba 1.5 Mini. בצע השוואה על HeQ, HebrewSentiment, ו-HebNLI עם 500 דוגמאות ו-3 ריצות, וספק scorecard עם המלצה.
יש לנו מגבלת data residency שמחייבת מודל מקומי. הרץ בנצ'מרקים עבריים על DictaLM-3.0-Nemotron-12B-Instruct והשווה לאיכות Claude Sonnet. כמה איכות אני מאבד בהשוואה?
HEBREW-MMLU, lm-evaluation-harness ו-inspect_ai, אומת DictaLM 2.0/3.0, Aya/Hebrew-Mistral/Hebrew-Gemma, claude-opus-4-7, תיקון שורת טבלה ב-HE, סעיף הוגנות tokenizer.
25 באפר׳ 2026
מדריך למפתחים לאינטגרציית שילוח עם חברות ישראליות (דואר ישראל, צ'יטה, HFD, מהיר לי) ושירותי לוקרים (BOX2GO, שלאגר, Done). הסקיל מכסה בחירת חברה, עיצוב כתובות ישראליות, הפקת תוויות, מעקב חוצה-חברות והתראות ללקוחות. אל תשתמשו לבדיקת סטטוס של חבילה ספציפית (הפנו ל-mypost.israelpost.co.il), משלוחים בינלאומיים מחוץ לישראל או נושאי מכס וייבוא.
מנהלים תמונות, וידאו וקבצי מדיה דרך Cloudinary API, העלאה, טרנספורמציות, מיטוב והגשה מ-CDN.
איך ליצור סרטונים מקוד עם Remotion ב-React, כולל תמיכה מלאה בעברית ו-RTL. כולל אנימציות, קומפוזיציות, סיקוונסים, מעברים, כתוביות עם הדגשת מילים, קריינות AI, תלת-ממד, גרפים, פונטים עבריים, ואנימציות טקסט דו-כיווניות. השתמשו כשאתם עובדים עם Remotion או יוצרים סרטוני סושיאל ותוכן שיווקי בעברית. אל תשתמשו לעריכת וידאו מחוץ ל-Remotion או לפיתוח React כללי.
רוצים לבנות סקיל משלכם? נסו את יוצר הסקילס · הגשת סקיל