100% 지수가 불가능한 이유는 무엇입니까?

为什么 100% 索引是不可能的?

# #website 최적화

 

"기술"에 관한 것이지만 100% 지수가 가능할 수 있지만 실제로는 불가능할 수 있습니다.

크롤러 예산과 같은 주제와 관련하여 역사적 진술은 항상 그랬습니다. 이는 높은 웹 사이트 (Google에 의해 수백만 개 이상의 웹 페이지로 분류)와 콘텐츠 변경 빈도를 가진 예약 중간 크기의 웹 사이트의 문제입니다.

그러나 최근 몇 달 동안 SEO 포럼과 트위터가 Google 직원에게 제기 한 주제가 더 일반적인 주제가되었습니다.

내 자신의 일화 경험에 따르면, 작년 이래로 스케일과 변화 주파수가 다른 웹 사이트는 그 어느 때보 다 Google 검색 콘솔 (Grab Statistics 및 Cover Reports)에서 변동과 보고서를 변경했습니다.

증인의 일부 주요 범위의 변화는 입증되지 않은 Google 업데이트의 높은 변동성과 SERP 센서/관찰자와 관련이 있습니다. 스택, 틈새 시장 및 기술적 인 문제에 너무 많은 웹 사이트가 없다는 사실을 고려할 때, 이는 대부분의 웹 사이트의 경우 100% 색인 (대부분)이 불가능하다는 것을 나타냅니다.

이것은 의미가 있습니다.

Google그들 자신의 문서에서개요 네트워크는 각 URL의 속도를 자체 능력과 캡처 (및 인덱스) 수단을 훨씬 초과하여 파악하고 있습니다.

동일한 문서에서 Google은 다음을 포함하여 수요를 잡고 잡는 능력에 영향을 미치는 몇 가지 요소를 설명합니다.

  • URL (및 컨텐츠)의 인기.
  • 그것은 낡았다.
  • 웹 사이트 응답 속도.
  • 당사 웹 사이트에서 URL에 대한 Google의 이해 (인식 된 재고).

트위터에서 Google의 John Mueller와의 대화에서 판단하면 URL의 인기는 브랜드 및/또는 도메인 이름의 영향을받지 않을 수 있습니다.

메인 게시자의 첫 경험을 가지고 있으며, 품질 임계 값보다 낮고 값이 충분하지 않은 경우 온라인으로 게시 된 유사한 컨텐츠의 독창성을 기반으로 컨텐츠를 색인하지 않았습니다.

그렇기 때문에 특정 척도 또는 유형을 처리하는 모든 웹 사이트 (예 : e -Commerce)를 처리 할 때 100% 인덱스가 첫날부터 항상 성공적인 지표가 아니라고 생각했습니다.

인덱스 레이어 및 샤드

Google은 인덱스의 작동 방식이 매우 열려있는 방법을 설명합니다.

그들은 계층화 된 인덱스 (더 나은 서버의 일부 컨텐츠를 사용하여 더 빠르게 액세스 할 수 있음)를 사용하고 여러 데이터 센터에 서비스 인덱스가 저장되어 있습니다.이 데이터 센터는 기본적으로 SERP에 제공된 데이터를 저장합니다.

추가 단순화 :

그런 다음 웹 페이지 (HTML 문서) 문서의 내용이 플레이트에 표시되고 저장되어 있으며, 샤드 자체는 특정 키워드를 더 빠르고 쉽게 쿼리하기 위해 (어휘 테이블과 같은) 색인화됩니다 (사용자가 검색 할 때).

여러 번 인덱싱 문제는 기술 검색 엔진의 최적화에 기인합니다. Google의 인덱싱 컨텐츠를 방지하기위한 색인 또는 문제 및 불일치가있는 경우 기술적이지만 일반적으로 가치가 없습니다. 이것은 가치 제안 문제입니다.

유익한 목적과 SERP에는 가치가 포함됩니다

가치 제안과 관련하여 Google 품질 평가 안내서 (QRG)의 두 개념을 나타냅니다.

  • 유용한
  • 페이지 품질

결합 된 이들이 SERP라고 부르는 것들에는 가치가 포함되어 있습니다.

이것은 일반적으로 웹 페이지가 "발견되지 않은 인덱스가 포함되지 않은 인덱스"범주를 Google 검색 콘솔의 적용 범위에있는 이유입니다.

QRG에서 Google은 다음과 같은 진술을했습니다.페이지에 유용한 용도가 부족한 경우 페이지의 요구에 관계없이 레벨 또는 페이지의 설계를 충족 해야하는 경우 항상 최소 페이지 품질로 평가해야합니다.

무슨 뜻인가요? 페이지는 올바른 키워드를 배치하고 올바른 상자를 확인할 수 있습니다. 그러나 일반적으로 다른 콘텐츠로 반복되고 부가가치가 부족한 경우 Google은 인덱스에 컴파일하지 않도록 선택할 수 있습니다.

이것은 우리가 Google의 품질 임계 값을 만나는 곳입니다. 이것은 색인에 필요한 "품질"을 충족시키는 페이지의 개념입니다.

이 품질 임계 값의 핵심 부분은 거의 실시간 시간과 흐름입니다.

Google의 Gary Illyes트위터이를 확인하면 URL 중 하나가 처음 발견되었을 때 인덱스에 통합 될 수 있으며, 새로운 (더 나은) URL을 찾을 때 및 GSC Essence에 수동으로 제출 된 경우에도 삭제되었습니다.

문제가 있는지 확인하십시오

가장 먼저 결정해야 할 것은 Google Search Console의 적용 범위 보고서에 페이지 수가 보고서에 포함 된 페이지 수를 포함하여 제외에서 페이지 수를 포함하는지 여부입니다.

차트 자체는 대부분의 마케팅 관심사의 관심을 끌기에 충분합니다.

그러나이 페이지에 대해 얼마나 신경 쓰나요? 이 페이지의 가치는 얼마입니까?

집단 데이터를 통해이를 식별 할 수 있습니다. 분석 플랫폼의 트래픽 및 소득/잠재 고객이 감소하는지 여부를 알 수 있습니다. 전체 시장 가시성과 순위를 잃고 있다면중국 및 세계 도구알아채다.

Google의 색인에서 인출하는 귀중한 페이지가 표시되면 다음 단계는 이유를 이해 한 다음 검색 콘솔이 제거 된 페이지를 더 많은 범주로 나눕니다. 이해하고 이해해야 할 주요 내용은 다음과 같습니다.

등반되었습니다 -색인에 통합되지 않았습니다

이것은 내가 다른 수직 산업보다 e -commerce와 부동산 분야에서 겪은 것입니다.

2021 년 미국의 새로운 상업용 응용 프로그램 수이전 기록을 깨뜨립니다더 많은 회사가 사용자와 경쟁하면서 많은 새로운 콘텐츠를 출시했지만 새롭고 고유 한 정보 나 의견이 많지 않을 수도 있습니다.

현재 통합 된 색인이 발견되지 않았습니다

인덱스 문제를 디버깅 할 때 웹 사이트에 많은 프로그래밍 방식을 배포하거나 한 번에 많은 페이지를 작성하고 많은 페이지를 게시하기 위해 많은 콘텐츠를 배포했습니다.

이 유형의 페이지의 주된 이유는 많은 콘텐츠와 새로운 URL을 방금 출시했으며 웹 사이트의 캡처 및 인덱싱 페이지 수가 기하 급수적으로 증가하고 Google의 크롤링 예산 이었기 때문에 크롤링 예산에 기인 할 수 있습니다. 결정. 귀하의 웹 사이트는 많은 페이지에 적합하지 않습니다.

당신은 이것에 영향을 미치기 위해 많은 일을 할 수 있습니다. 그러나 Google이 XML 사이트 맵, HTML 사이트 맵 및 우수한 내부 링크를 통해 중요한 (색인) 페이지에서 새 페이지로 페이지 순위를 전달하는 데 도움이 될 수 있습니다.

이 카테고리에 속할 수있는 두 번째 이유는 품질 문제입니다.이 문제는 프로그래밍 컨텐츠 또는 E- 컴퓨터 웹 사이트에서 매우 일반적입니다.이 웹 사이트에는 많은 제품 및 가변 제품과 유사한 제품 및 PDP가 포함되어 있습니다.

Google은 URL에서 모드를 식별 할 수 있습니다.이 페이지의 일부에 액세스하지만 값을 찾지 못하면 유사한 URL을 가진 HTML 문서가 동일 (낮은) 품질을 가질 수 있으며 선택하지 않을 수 있습니다. 그들을 잡지 말고, 본질

이 페이지들 중 다수는 고객을 확보하려는 목표에 의해 의도적으로 생성됩니다. 예를 들어 다른 프로그래밍 페이지와 비교할 때 충분히 고유하지 않으므로 다른 대안이 사용할 수 있으면 Google은 낮은 값 청구의 내용을 색인하지 않습니다.

이 경우 프로젝트 리소스 및 매개 변수에서 목표를 달성 할 수 있는지 여부를 평가하고 결정해야하며, 인터넷을 차단하는 과도한 페이지가없고 가치있는 것으로 간주되지 않습니다.

중복 컨텐츠

반복 콘텐츠는보다 직접적인 콘텐츠이며, 이는 전자 상거래, 게시 및 프로그래밍에서 일반적입니다.

값 주장이 포함 된 페이지의 기본 내용이 다른 웹 사이트 나 내부 페이지에서 반복되는 경우 Google은 컨텐츠 인덱싱에 리소스를 사용하지 않습니다.

이것은 또한 가치 제안의 개념과 유익한 목적과 관련이 있습니다. 나는 많은 예를 들었습니다. 대규모 권위있는 웹 사이트의 내용은 다른 컨텐츠와 동일하기 때문에 인덱스에 통합되지 않았습니다. 고유 한 견해 나 고유 한 가치 제안을 제공하지 않습니다.

행동을 취하다

대부분의 대형 웹 사이트 및 중간 크기의 중간 크기의 웹 사이트의 경우 Google은 네트워크의 모든 기존 및 새로운 컨텐츠를 처리해야하기 때문에 100% 인덱스가 더 어려워 질 것입니다.

귀중한 콘텐츠가 품질 임계 값보다 낮은 것으로 간주된다는 것을 알게되면 어떤 조치를 취해야합니까?

  • "High -Value"페이지의 내부 링크 향상: 반드시 반대 링크가 가장 큰 페이지를 의미하는 것은 아니지만 많은 키워드로 순위가 매겨지고 잘 보이는 페이지는 설명 앵커를 통해 다른 페이지에 양수 신호를 전달할 수 있습니다.
  • 낮은 품질 및 낮은 가치 컨텐츠를 가지 치기.인덱스에서 제외 된 값이 낮고 값 (예 : 포괄적 인보기 및 변환)을 가져 오지 않으면 트리밍해야합니다. 그들이 온라인으로 갈 수있게하면 선택할 때만 잡기 자원을 낭비 할 뿐이며, 이는 URL 기반 매칭 및 인벤토리 인식의 품질 가정에 영향을 줄 수 있습니다.

코멘트를 남겨주세요

이 사이트는 reCAPTCHA에 의해 보호되며, Google의 개인 정보 보호 정책 서비스 약관 이 적용됩니다.