ויקיפדיה ו-Wikidata: למה ישות מאומתת מגדילה נראות ב-AI
מנועי תשובה כמו ChatGPT, Perplexity וגוגל AI Overviews נשענים על ישות מאומתת. ככה Wikidata וויקיפדיה משפיעים על נראות העסק שלכם בתשובות AI, ומה עושים עם זה בפועל בישראל.
ויקיפדיה ו-Wikidata: למה ישות מאומתת מגדילה נראות ב-AI
בקצרה: ישות (entity) היא רשומה מובנית שמנועי AI משתמשים בה כדי לזהות בוודאות מי אתם, מה אתם מוכרים ובמה אתם מומחים. כשהעסק שלכם קיים ב-Wikidata ומוזכר בוויקיפדיה, מנועים כמו ChatGPT ו-Perplexity מאמתים אתכם מהר יותר ומצטטים אתכם בתשובות. בלי ישות מאומתת אתם עוד שם ברשת שהמודל לא בטוח בו.
מה זה בכלל ישות, ולמה AI אוהב אותה
כשאתם כותבים "Link AI" בטקסט חופשי, בשביל מנוע חיפוש קלאסי זו פשוט מחרוזת אותיות. בשביל מנוע AI זו שאלה: מדובר בחברה? במוצר? באדם? ישות פותרת את הבלבול. היא רשומה ייחודית עם מזהה קבוע (למשל מזהה Q ב-Wikidata), שמחברת בין השם שלכם לעובדות מאומתות: תחום פעילות, מיקום, אנשים, מוצרים.
המודלים הגדולים אומנו בין השאר על גרפים של ידע. גוגל בנתה את ה-Knowledge Graph שלה על בסיס Freebase ו-Wikidata. כשמודל צריך להחליט אם לצטט מקור, הוא נוטה להעדיף ישויות שהוא כבר מזהה בוודאות, כי הן מורידות לו את הסיכון לטעות. זה לא קסם, זו הפחתת אי-ודאות.
בעברית הבעיה חריפה יותר. שמות עסקים ישראליים נכתבים בכמה צורות: אנגלית, עברית, עם ובלי "בע"מ", עם וריאציות כתיב. המודל צריך לאחד את כולן לישות אחת. בלי רשומה מסודרת, כל וריאציה נראית לו כמו עסק אחר.
האם Wikidata באמת משפיע על נראות ב-AI?
כן, אבל בעקיפין, וכדאי להבין את המנגנון לפני שרצים לפתוח רשומה.
Wikidata הוא מסד נתונים פתוח שמזין את ה-Knowledge Graph של גוגל ומשמש מקור עובדתי במערכות רבות. הוא לא מדרג אתכם ישירות. מה שהוא עושה זה לתת למנוע עוגן מאומת: כשיש לכם רשומה עם מזהה Q, קישורים למקורות חיצוניים ושיוך ברור לתחום, קל יותר לאלגוריתם לקשר בין התוכן שלכם לבין השאלה של המשתמש.
המחקר על נראות ב-AI מצביע בעקביות על אותו כיוון. ניתוח של Ahrefs על כ-75,000 מותגים מצא שאזכורים של המותג ברשת מתואמים ברמה של 0.664 עם נוכחות ב-AI Overviews של גוגל, לעומת 0.218 בלבד עבור קישורים נכנסים. בעברית פשוטה: כמה מדברים עליכם חשוב יותר מכמה מקשרים אליכם. ישות מאומתת היא בדיוק התשתית שהופכת אזכורים מפוזרים לישות אחת מזוהה.
נקודה להגינות: אף מנוע AI גדול לא פרסם נוסחה שאומרת "רשומת Wikidata שווה דירוג גבוה יותר". מה שיש בידינו זה קורלציות חזקות והבנה של איך גרפי ידע עובדים. אל תתייחסו לזה כמתג שמדליק נראות, אלא כתשתית שמורידה חיכוך.
למה אפשר להיות מצוטט ב-AI בלי להיות ראשון בגוגל
זו אחת התובנות שהכי מפתיעות עסקים ישראליים. ניתוחים של ציטוטים ב-AI Overviews מצאו שרק בערך 15 עד 38 אחוז מהמקורות המצוטטים חופפים לעשרת התוצאות האורגניות הראשונות של גוגל. כלומר רוב הציטוטים מגיעים ממקומות שלא בהכרח מדורגים גבוה בחיפוש הרגיל.
המשמעות פרקטית: גם אם אתם לא במקום הראשון על מילת מפתח תחרותית, אתם עדיין יכולים להופיע בתשובה של ChatGPT או Perplexity, אם המנוע מזהה אתכם כישות סמכותית בנושא. כאן ישות מאומתת והופעה במקורות מהימנים שוות יותר מעוד מאמץ לטפס מקום אחד בתוצאות האורגניות.
"Optimizing content with the addition of relevant statistics, quotations, or citations can boost source visibility by up to 40%."
כך כותבים Aggarwal ועמיתיו במאמר "GEO: Generative Engine Optimization" שהוצג בכנס KDD 2024 (arXiv:2311.09735).
אותו מחקר מצא גם את הכיוון ההפוך: דחיסת מילות מפתח לא רק שלא עזרה, היא לרוב הזיקה לנראות. זה הופך את כל המשחק. במקום למלא טקסט במילות מפתח, משתלם להשקיע בעובדתיות, בציטוטים ובזהות ברורה.
מאיפה AI שואב את הציטוטים שלו
אם ישות היא העוגן, מקורות מהימנים הם הדלק. ניתוח של Muck Rack על יותר ממיליון ציטוטים של AI מצא שכ-82 אחוז מהציטוטים מגיעים מ-earned media, כלומר סיקור עיתונאי ואזכורים שהושגו ולא נקנו, וכ-94 אחוז מגיעים ממקורות לא ממומנים.
זה אומר שאסטרטגיית הנראות ב-AI דומה יותר ליחסי ציבור מאשר לפרסום ממומן. כתבה בכלכליסט, אזכור בבלוג מקצועי, ראיון בפודקאסט, רשומה מסודרת ב-Wikidata, ערך בוויקיפדיה אם אתם עומדים בקריטריונים. כל אלה מזינים את המודל בעובדות שהוא סומך עליהן.
| ערוץ | תרומה לנראות ב-AI | מאמץ נדרש | הערה | | --- | --- | --- | --- | | Wikidata | גבוהה כתשתית זיהוי | בינוני | פתוח לכולם, דורש מקורות תומכים | | ויקיפדיה | גבוהה מאוד כמקור מצוטט | גבוה | רק אם עומדים בקריטריוני בולטות | | Earned media | מקור 82% מהציטוטים | גבוה ומתמשך | יחסי ציבור ולא פרסום | | קישורים נכנסים | חלשה יחסית (קורלציה 0.218) | בינוני | עדיין שימושי ל-SEO קלאסי | | llms.txt | לא מוכחת | נמוך | הכנה זולה לעתיד, לא גורם דירוג |
איך בונים ישות מאומתת בפועל בישראל
הסדר חשוב. אין טעם לפתוח רשומת Wikidata אם אין מאחוריה מקורות שמאמתים אתכם.
-
סדרו את הבסיס באתר. הוסיפו schema מסוג Organization עם שדות sameAs שמקשרים לכל הפרופילים שלכם (לינקדאין, פרופיל גוגל לעסק, עמודי רשתות). זה נותן למנועים מפה ברורה של "כל אלה אותו עסק".
-
השיגו אזכורים מאומתים לפני Wikidata. רשומת Wikidata צריכה מקורות. כתבה בעיתון כלכלי, פרופיל ב-Crunchbase, אזכור באתר מקצועי. בלי מקורות חיצוניים הרשומה תיראה ריקה ועלולה להימחק.
-
פתחו רשומת Wikidata. הגדירו את סוג הישות (חברה), הוסיפו תיאור קצר בעברית ובאנגלית, מיקום, תחום, ומלאו את שדות המזהים החיצוניים שמחברים לפרופילים אחרים.
-
שקלו ויקיפדיה רק אם אתם בולטים. ויקיפדיה דורשת בולטות מוכחת לפי מקורות עצמאיים. אל תכתבו ערך על עצמכם אם אין סיקור משמעותי. ערך שנמחק מזיק יותר מהיעדר ערך.
-
שמרו על עקביות בכל מקום. אותו שם, אותו תיאור, אותו תחום, בכל פלטפורמה. סתירות מבלבלות את המודל ומפרקות את הישות שבניתם.
לגבי llms.txt: זה קובץ שמטרתו להנחות מנועי AI לתוכן החשוב באתר. נכון להיום אף מנוע גדול, כולל OpenAI, גוגל, Perplexity ו-Anthropic, לא אישר שהוא משתמש בו לדירוג, וגוגל אמרה במפורש שהיא לא. תתייחסו אליו כהכנה זולה לעתיד, לא כגורם נראות מוכח.
אם בא לכם לראות איך כל החלקים האלה מתחברים לאסטרטגיית GEO ו-AEO שלמה, זה בדיוק מה שאנחנו בונים ללקוחות. ואם אתם מריצים גם פעילות outreach, אפשר לחבר את זה למערכת המיילר כדי שכל אזכור חדש יהפוך לנכס.
מה לא לעשות
הטעות הנפוצה היא לחשוב שישות זה טריק טכני חד פעמי. פתחתם רשומה, סיימתם. בפועל ישות בלי תחזוקה מתפרקת: מקורות מתיישנים, שמות משתנים, פרופילים נסגרים. תחזקו אותה כמו נכס.
טעות שנייה היא לזייף בולטות. רשומות מנופחות, ציטוטים מומצאים, ערכי ויקיפדיה פרסומיים. מנועי AI ומתנדבי ויקיפדיה מזהים את זה, וזה פוגע באמון לאורך זמן. עדיף פרופיל צנוע ואמיתי מניפוח שמתפוצץ.
שאלות נפוצות
מה ההבדל בין Wikidata לוויקיפדיה לצורכי AI? Wikidata הוא מסד נתונים מובנה של עובדות עם מזהים קבועים, פתוח לכל עסק שיש לו מקורות תומכים. ויקיפדיה היא אנציקלופדיה טקסטואלית שדורשת בולטות מוכחת. לזיהוי ישות Wikidata נגיש יותר, ולציטוט בתשובות ערך ויקיפדיה איכותי שווה הרבה אבל קשה יותר להשגה.
כמה זמן לוקח עד שרואים השפעה על נראות ב-AI? אין מספר רשמי. בניית ישות היא תהליך מצטבר שתלוי בקצב שבו מנועים סורקים מחדש ומתאמנים. בפועל מדובר בשבועות עד חודשים ולא בימים. זו עבודת תשתית, לא קמפיין מהיר.
אם אני לא מדורג ראשון בגוגל, יש בכלל טעם? יש, ואפילו במיוחד. ניתוחים מצאו שרק כ-15 עד 38 אחוז מהמקורות המצוטטים ב-AI Overviews חופפים לעשירייה הפותחת בגוגל. ישות מאומתת ומקורות מהימנים יכולים להכניס אתכם לתשובות גם בלי מקום ראשון בחיפוש.
האם llms.txt באמת משפר נראות ב-AI? אין לכך הוכחה. אף מנוע גדול לא אישר שימוש בו לדירוג, וגוגל שללה זאת במפורש. זה זול להוסיף וזה לא מזיק, אז אפשר להתייחס אליו כביטוח לעתיד, אבל לא לבסס עליו אסטרטגיה.
מה הכי משפיע על נראות ב-AI, אזכורים או קישורים? לפי ניתוח Ahrefs על כ-75,000 מותגים, אזכורים של המותג ברשת מתואמים עם נראות ב-AI Overviews ברמה של 0.664, לעומת 0.218 לקישורים נכנסים. אזכורים מנצחים. ישות מאומתת היא מה שמאחד אזכורים מפוזרים לזהות אחת שהמנוע מזהה.
צריך לכתוב תוכן עם הרבה מילות מפתח כדי להופיע ב-AI? לא, ולרוב זה מזיק. מחקר ה-GEO של Aggarwal ועמיתיו מצא שדחיסת מילות מפתח לא שיפרה נראות, בעוד שהוספת נתונים, ציטוטים ומקורות העלתה נראות בעד כ-40 אחוז. תשקיעו בעובדתיות, לא בחזרתיות.
רוצים לראות איך בונים ישות מאומתת ואסטרטגיית נראות ב-AI לעסק שלכם? קראו עוד בבלוג או דברו איתנו.