אז Meta AI משחררת את מודל ה-Cod Lama 70 מיליארד: מודל השפה הגדול והביצועים הטובים ביותר במשפחת Cod Lama
Meta AI חשפה לאחרונה את התוספת האחרונה שלהם לסדרת הדגמים Cod Lama - דגם Cod Lama 70 מיליארד. המודל החדש הזה הוא מודל השפה הגדול והחזק ביותר במשפחת ה-Cod Lama, ויש לו את היכולת לעלות על gp4 במשימות הקשורות לקידוד. במאמר זה, נחקור את התכונות והיכולות של דגם Cod Lama 70 מיליארד וכיצד הוא משתווה לדגמים אחרים בשוק.
היכרות עם דגם בקלה לאמה 70 מיליארד
דגם ה-Cod Lama 70 מיליארד זמין בשלוש גרסאות שונות. הגרסה הראשונה היא המודל הבסיסי, שניתן לכוונן עוד יותר עבור משימות ספציפיות. יש גם גרסה ייעודית לתכנות Python, כמו גם גרסת הוראות המכווננת להבנת הוראות שפה טבעית.
נבנה על גבי לאמה 2
סדרת הדגמים של Cod Lama איננה ארכיטקטורה חדשה, אלא בנויה על גבי Lama 2. לפי Meta, בבדיקות הבנצ'מרק שלהם, Cod Lama מתעלה על מודלים מתקדמים של שפה זמינה לציבור במשימות הקשורות לקוד, שזה הישג יוצא דופן בהשוואה ל-gp4.
ביצועים מרשימים
לדגם ה-gp4 המקורי, ששוחרר על ידי OpenAI, היה ציון של 67.0 במערך הנתונים של ההתפתחות האנושית - אמת מידה פופולרית לתכנות. לשם השוואה, המודל של Cod Lama 70 מיליארד משיג ציון מבחן של התפתחות אנושית של 77.0, שהוא גבוה משמעותית מכל מודל שפה גדול אחר בקוד פתוח. זה גם גבוה מהציון שדווח על ידי gp4. עם זאת, חשוב לציין שהניקוד הזה הוא עבור הגרסה המקורית של gp4, ואיננו יודעים את ציוני ההתפתחות האנושית עבור הגרסה האחרונה של gp4.
שימוש ורישוי
הדגם Cod Lama 70 מיליארד שוחרר תחת אותו רישיון כמו Lama 2, מה שאומר שניתן להשתמש בו הן למטרות מחקר והן למטרות מסחריות. כדי לגשת למודל מ-Meta, תצטרך למלא טופס גישה לבקשת גישה. לחלופין, הדגם כבר זמין בפורמט ה-pH המחבק, וייתכן שגרסה כמותית תהיה זמינה בקרוב.
תהליך הדרכה
כל הדגמים של Cod Lama מבוססים על ארכיטקטורת Lama 2 והם מאומנים ל-500 מיליארד אסימונים. עבור גרסאות 70 מיליארד הפרמטרים, נעשה שימוש ב-500 מיליארד אסימונים נוספים. גרסת Python משתמשת במערך נתונים של 100 מיליארד אסימונים לכוונון עדין במיוחד. גרסת כוונון ההנחיות, המיועדת לחלון הקשר ארוך יותר של 16,000 אסימונים, משתמשת ב-20 מיליארד אסימונים נוספים. גרסת הבסיס, לעומת זאת, משתמשת רק ב-20 מיליארד אסימונים.
הפעלת דגם בקלה לאמה 70 מיליארד מקומית
כדי להפעיל את דגם ה-Cod Lama 70 מיליארד באופן מקומי, תחילה יהיה עליך להוריד את Olama מהאתר. תהליך ההתקנה משתנה בהתאם למערכת ההפעלה שלך. לאחר ההתקנה, אתה יכול להשתמש בפקודה "הרץ קוד Lama 70 bill" כדי להתחיל להפעיל את הדגם. קיימות גם רמות קוונטיזציה שונות עבור הדגם, המאפשרות לך לבחור את הגרסה הספציפית המתאימה לצרכים שלך.
הפגנה
בהדגמה, המודל של Cod Lama 70 מיליארד התבקש לכתוב פונקציה המפלטת את רצף פיבונאצ'י ולכתוב קוד HTML עבור דף אינטרנט עם כפתור שמשנה את צבע הרקע ומציג בדיחה אקראית כאשר לוחצים עליו. המודל יצר בהצלחה את התפוקות הרצויות, והציג את יכולותיו.
השוואות עתידיות
מגיש הסרטון הביע התרגשות מההתקדמות שנעשתה עם דגם ה-Cod Lama 70 מיליארד והזכיר תוכניות לבצע השוואה מקיפה בין הדגם הזה ל-gp4 בעתיד. השוואה זו תחקור את הביצועים שלהם במשימות הקשורות לקידוד, שכן אומרים שדגם ה-Cod Lama 70 מיליארד עומד בקנה אחד עם gp4.
בסך הכל, שחרורו של דגם ה-Cod Lama 70 מיליארד מסמן אבן דרך משמעותית בתחום דגמי השפה הגדולים. הביצועים והיכולות המרשימים שלו הופכים אותו לכלי בעל ערך עבור מפתחים וחוקרים כאחד. בעוד Meta AI ממשיכה לחדש ולדחוף את הגבולות של טכנולוגיית AI, אנו יכולים לצפות להתקדמות עוד יותר בעתיד.