כשחזרה כאשר הבינה המלאכותית הייתה במגמת עלייה, גירוד AI היה בעיה מאסיבית מכיוון שהם לא היו מורשים ולא ביקש את ההרשאות הנכונות לגשת לנתונים ממקורות באינטרנט, ואותה בעיה היא מההקרן פונה כעת.
העמותה מתלוננת כעת על המקרה הידוע לשמצה של AI גרוטאות באתר האינטרנט שלה שגורם כעת למתח מסיבי על השרתים שלהם.
ויקימדיה מתלוננת על גירוד בוטים של AI, מאמץ את השרתים שלה
קרן ויקימדיהשיתף פוסטהמפרט כיצד פעילות גירוד ה- AI המסיבית משפיעה כעת על פעילותה באתרי האינטרנט השונים שיש להם. לדברי הארגון, בוטים של AI המגרדים נתונים מהפלטפורמות שלהם כבר גרמו למתח משמעותי לשרתים שלהם, ובעוד שמשתמשים אורגניים רבים עדיין פונים לאתרי האינטרנט שלהם, בוטים מהווים את הרוב.
"אך עם עליית ה- AI, הדינמיקה משתנה: אנו מתבוננים בגידול משמעותי בנפח הבקשה, כאשר מרבית התנועה הזו מונעת על ידי גירוד בוטים אוספים נתוני הדרכה למודלים גדולים בשפה (LLMs) ומקרי שימוש אחרים", אמר הקרן.
בסך הכל, ויקימדיה טענה כי מאז ינואר 2024 רוחב הפס שלה להורדת תוכן זינק על ידי 50%. בוטים של AI המגרדים את אתרי האינטרנט שלהם צורכים טרה -בייט של נתונים, על פיARS Technicaו
ההשפעות המסיביות של גירוד AI ללא רישיון
היו חששות מחברות AI שהולכות לפלטפורמות, אתרי אינטרנט ספציפיים ותגובותיהן על מנת לאסוף נתונים ומידע בהם ישתמשו לאימוני הדגמים שלהם. Openai הוא בין הידוע לשמצה ביותר שכן הם התמודדו עם תביעות מאסיביות מתובעים שונים כולל--, חברות טק, ועוד עבור מגרד AI.
עם זאת, סם אלטמן ופתוח הם לא היחידים הנטענים כי גירדו נתונים מהאינטרנט ועשו זאת ללא רישיון או אישור שכן זה היה נוהג ידוע לשמצה מאז החל עידן ה- AI הגנרי.
הפרת זכויות יוצרים היא אחת ההשפעות המשמעותיות ביותר של גירוד AI לא מורשה, אך זו הייתה גם עניין של פרטיות, במיוחד עם פלטפורמות כמו מטא, אשר קצרותלדגמי ה- AI שלהם.
חברות אחרות חיפשו למנף את הנתונים המסיביים שלהן כדי להרוויח ממגרדי AI, תוך שיתוף פעולה עם חברות AI כדי לרישיון הנתונים שלהם כמו מה שהציגה רדיט בשנה שעברה, כאשר גוגל כאחד הלקוחות הגדולים שלה.