U3F1ZWV6ZTI5NzA5MjcyODk5X0FjdGl2YXRpb24zMzY1NjUwNzI4MDc=
recent
أخبار ساخنة

الفهرسة و الزحف وأثرها على موقعك


الفهرسة و الزحف وأثرها على موقعك 

يعد تقرير تغطية الأرشفة من Google رائعًا تمامًا لأنه يمنح مُحسنات محركات البحث رؤى أوضح حول قرارات الزحف والفهرسة في Google. منذ طرحها ، نستخدمها يوميًا تقريبًا لتشخيص المشكلات الفنية على نطاق واسع لعملائنا.
ضمن التقرير ، هناك العديد من "الحالات" المختلفة التي تزود مشرفي المواقع بمعلومات حول كيفية تعامل Google مع محتوى موقعهم. بينما توفر العديد من الحالات بعض السياق حول قرارات الزحف والفهرسة من Google ، يظل أحدها غير واضح: "تم الزحف إليه - غير مفهرس حاليًا".

تعريف Google: لنبدأ بالتعريف الرسمي. وفقًا لوثائق Google الرسمية ، فإن هذه الحالة تعني: "تم الزحف إلى الصفحة بواسطة Google ، ولكن لم تتم فهرستها. قد تتم فهرسته أو لا يمكن فهرسته في المستقبل ؛ لا داعي لإعادة إرسال عنوان URL هذا للزحف. "

لذا ، ما نعرفه بشكل أساسي هو: 
1- جوجل قادر على الوصول إلى الصفحة.
2- استغرق Google بعض الوقت للزحف إلى الصفحة.
3- بعد الزحف ، قررت Google عدم تضمينها في الفهرس.
قد يكون هذا أمرًا محبطًا للغاية ، حيث قد لا تعرف سبب عدم فهرسة المحتوى الخاص بك. فيما يلي ، سأذكر بالتفصيل بعض الأسباب الأكثر شيوعًا لذلك :

1. الإيجابيات الكاذبة: خطوتنا الأولى هي دائمًا إجراء بعض عمليات التحقق الموضعية لعناوين URL التي تم الإبلاغ عنها في قسم "تم الزحف إليه - غير مفهرس حاليًا" للفهرسة. ليس من غير المألوف العثور على عناوين URL التي يتم الإبلاغ عنها على أنها مستبعدة ولكن تبين أنها في فهرس Google بعد كل شيء.
ومن أجل التأكد من أن أي صفحة مفهرسة يمكنك القيام بذلك عن طريق إلحاق النص "site:" قبل رابط موقعك من أجل التعرف على جميع الصفحات المفهرسة و مقارنتها وع التقرير .
إذا كنت ترى عناوين URL تم الإبلاغ عنها تحت هذه الحالة ، فإنني أوصي بالبدء باستخدام عامل تشغيل بحث الموقع لتحديد ما إذا كان عنوان URL مفهرسًا أم لا. في بعض الأحيان ، تكون هذه إيجابية كاذبة.

2. روابط تغذية الموقع RSS: هذا أحد أكثر الأمثلة شيوعًا التي نراها. إذا كان موقعك يستخدم موجز RSS ، فقد تجد عناوين URL التي تظهر في تقرير Google "تم الزحف إليه - غير مفهرس حاليًا". في كثير من الأحيان ، سيتم إلحاق سلسلة "/ feed /" بروابط الموقع في النهاية. يمكن أن تظهر في التقرير مثل هذا:

يعثر Google على عناوين URL لخلاصة RSS هذه المرتبطة من الصفحة الأساسية. سيتم ربطهم غالبًا باستخدام عنصر "rel = alternate". يمكن لمكونات WordPress الإضافية مثل Yoast إنشاء عناوين URL هذه تلقائيًا.
من المحتمل أن تختار Google بشكل انتقائي عدم فهرسة عناوين URL هذه ، ولسبب وجيه. إذا انتقلت إلى عنوان URL لخلاصة RSS ، فسترى مستند XML مثل المستند أدناه:
على الرغم من أن مستند XML هذا مفيد لخلاصات RSS ، فليست هناك حاجة إلى Google لإدراجه في الفهرس. سيوفر ذلك تجربة سيئة للغاية لأن المحتوى غير مخصص للمستخدمين.

3. ترقيم الصفحات: هناك سبب آخر شائع للغاية لاستبعاد الزحف أو الفهرسة وهو ترقيم الصفحات. سنرى غالبًا عددًا جيدًا من عناوين URL المرقمة في هذا التقرير. هنا يمكننا أن نرى بعض عناوين URL المرقمة التي تظهر من موقع تجارة إلكترونية كبير جدًا:

ستحتاج Google إلى الزحف من خلال عناوين URL المرقمة للحصول على زحف كامل للموقع. هذا هو طريقه إلى المحتوى مثل صفحات الفئات الأعمق أو صفحات وصف المنتج. ومع ذلك ، بينما تستخدم Google ترقيم الصفحات كمسار للوصول إلى المحتوى ، إلا أنها لا تحتاج بالضرورة إلى فهرسة عناوين URL المرقمة نفسها.
إذا كان هناك أي شيء ، فتأكد من أنك لا تفعل أي شيء للتأثير على زحف ترقيم الصفحات الفردية. تأكد من أن جميع صفحاتك تحتوي على علامة أساسية مرجعية ذاتية وخالية من أي علامات "nofollow". تعمل هذه الحدود الفاصلة للصفحات كوسيلة لجوجل لتتبع ارتباطات الصفحات الرئيسية الأخرى على موقعك ، لذا ستريد بالتأكيد أن يواصل Google الزحف إليه.

4. ضعف المحتوى: في بعض الأحيان نرى عناوين URL مدرجة في هذا التقرير والتي تكون ذات محتوى ضعيف جدا. قد تحتوي هذه الصفحات على جميع العناصر التقنية التي تم إعدادها بشكل صحيح وقد تكون مرتبطة داخليًا بشكل صحيح ، ومع ذلك ، عندما يتعامل Google مع عناوين URL هذه ، فإن المحتوى الفعلي القليل جدًا على الصفحة.
من المحتمل أن تكون هذه الصفحة ذات محتوى ضعيف بحيث لا تعتقد Google أنها مفيدة أو أن هناك القليل من المحتوى الذي يعتبره Google نسخة مكررة من صفحة أخرى. والنتيجة هي إزالة Google للمحتوى من الفهرس.
قد تكون هناك أيضًا صفحات أخرى منخفضة الجودة لا يطبق عليها Google هذا المنطق. يمكنك إجراء بحث عام عن "الموقع:" للعثور على المحتوى المفهرس الذي يلبي نفس المعايير الواردة في الأمثلة أعلاه. إذا وجدت أن عددًا كبيرًا من هذه الصفحات يظهر في الفهرس ، فقد تحتاج إلى التفكير في مبادرات أقوى لضمان إزالة هذه الصفحات من الفهرس مثل علامة "noindex" أو خطأ 404 أو إزالتها من هيكل ربط داخلي بالكامل.

5. المحتوى المكرر: عند تقييم هذا الاستبعاد عبر عدد كبير من العملاء ، هذه هي الأولوية القصوى التي رأيناها. إذا رأى محرك البحث Google المحتوى الخاص بك على أنه مكرر ، فقد يزحف إلى المحتوى ولكنه يختار عدم تضمينه في الفهرس. هذه إحدى الطرق التي تتجنب فيها Google تكرار SERP. من خلال إزالة المحتوى المكرر من الفهرس ، تضمن Google حصول المستخدمين على مجموعة أكبر من الصفحات الفريدة للتفاعل معها. في بعض الأحيان ، سيصف التقرير عناوين URL هذه بالحالة "مكرر" ("مكرر ، اختارت Google أمرًا أساسيًا مختلفًا عن الأساسي"). ومع ذلك ، ليس هذا هو الحال دائمًا.
هذه مسألة ذات أولوية عالية ، خاصة في الكثير من مواقع التجارة الإلكترونية. غالبًا ما تتضمن الصفحات الرئيسية مثل صفحات وصف المنتج أوصاف المنتج نفسها أو ما شابه ذلك مثل العديد من النتائج الأخرى عبر الويب. إذا أدرك Google أنها متشابهة جدًا مع الصفحات الأخرى داخليًا أو خارجيًا ، فقد يستبعدها من الفهرس معًا.
إذا كنت تعتقد أن هذا الموقف ينطبق على موقعك ، فإليك كيفية اختباره:
1- خذ مقتطفًا من النص المكرر المحتمل والصقه في Google.
2- في عنوان URL الخاص بـ SERP ، ألحق السلسلة التالية حتى النهاية: "& num = 100". سيظهر لك هذا أفضل 100 نتيجة.
3- استخدم وظيفة "البحث" في متصفحك لمعرفة ما إذا كانت نتيجتك تظهر في أفضل 100 نتيجة. إذا لم يحدث ذلك ، فربما يتم تصفية النتيجة من الفهرس.
4- ارجع إلى عنوان URL SERP وأضف السلسلة التالية إلى النهاية: "& filter = 0". من المفترض أن يوضح لك هذا نتيجة Google غير المرشحة.
5- استخدم وظيفة "بحث" للبحث عن عنوان URL الخاص بك. إذا رأيت صفحتك تظهر الآن ، فهذا مؤشر جيد على أن المحتوى الخاص بك يتم تصفيته خارج الفهرس.
6- كرر هذه العملية لعدد قليل من عناوين URL التي تحتوي على محتوى مكرر أو مشابه جدًا تشاهده في تقرير "تم الزحف إليه - غير مفهرس حاليًا".
الاسمبريد إلكترونيرسالة