Trung tâm Quản trị Trang web của Google

Câu hỏi Thường Gặp về Công cụ Quản trị Trang web

Sự cố với trang web và kết quả tìm kiếm của bạn

  1. Nhận trợ giúp
  2. Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm của Google
  3. Trang web có sự cố
  4. Yêu cầu xem xét lại trang web của bạn
  5. Nếu trang web của bạn bị tin tặc tấn công

Sử dụng Công cụ Quản trị Trang web

  1. Xác minh trang web của bạn trong Công cụ Quản trị Trang web
  2. Tạo và gửi Sơ đồ trang web

Tối ưu hoá trang web của bạn

  1. Geotargeting
  2. Tên miền ưa thích (có www hoặc không có www)
  3. Ngăn nội dung xuất hiện trong kết quả tìm kiếm của Google
  4. Chỉ định một phiên bản trang chuẩn của bạn

Sự cố với trang web và kết quả tìm kiếm của bạn

1. Nhận trợ giúp

Bạn có câu hỏi về Công cụ Quản trị Trang web? Thật may, có người đã trả lời câu hỏi này trong Diễn đàn Trợ giúp của chúng tôi.

Nguyên tắc Quản trị Trang web của chúng tôi đưa ra các hướng dẫn về cách tạo trang web thân thiện với Google, đồng thời Hướng dẫn dành cho Người mới làm quen với Tối ưu hoá Công cụ Tìm kiếm có các thông tin chi tiết về cách nâng cao hiệu suất cho trang web của bạn trong các công cụ tìm kiếm.

2. Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm của Google

Googlebot có bị nhà cung cấp dịch vụ lưu trữ trang web của bạn chặn không?

Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm, bạn có thể kiểm tra xem trang web có nằm trong chỉ mục của Google hay không bằng một trang web: tìm kiếm tên miền của bạn, giống như thế này: trang web:example.com. Nếu trang web của bạn không được liệt kê trong các kết quả thì Google đã không lập chỉ mục trang web này. Điều này thường xảy ra khi một nhà cung cấp dịch vụ lưu trữ trang web chặn Googlebot (Phần mềm thu thập dữ liệu web của Google). Nếu trang web của bạn không được lập chỉ mục và bạn nghi ngờ Googlebot đã bị chặn, chúng tôi khuyên bạn liên hệ với nhà cung cấp dịch vụ lưu trữ trang web của bạn và yêu cầu họ xác minh Googlebot bằng cách tiến hành tra cứu DNS ngược lại, xác minh tên nằm trong tên miền googlebot.com và sau đó tiến hành tra cứu DNS-tới-IP tương ứng bằng chính tên googlebot.com đó.

Ví dụ:

> host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.

> host crawl-66-249-66-1.googlebot.com
crawl-66-249-66-1.googlebot.com has address 66.249.66.1

Có sự cố với trang web của bạn?

Mục tiêu của Google là cung cấp những kết quả hay nhất và có liên quan nhiều nhất cho người dùng của chúng tôi. Để trang web của bạn có được thứ hạng cao trong trang kết quả tìm kiếm, bạn phải đảm bảo rằng Google có thể thu thập dữ liệu và lập chỉ mục chính xác trang web của bạn và đảm bảo rằng trang web của bạn chứa nội dung gốc, hữu ích. gửi trang web của bạn để được xem xét lại của chúng tôi chỉ ra một số biện pháp tốt nhất có thể giúp bạn tránh được các cạm bẫy phổ biến và nâng cao thứ hạng trang web của bạn.

Tuy nhiên, một số quản trị web sử dụng các biện pháp bất hợp pháp có thể dẫn đến việc trang web sẽ bị xoá hoàn toàn khỏi chỉ mục của Google hoặc nếu không, sẽ bị phạt. Nếu một trang web bị phạt, nó sẽ không còn được hiển thị trong phần kết quả tìm kiếm của Google.com hoặc bất kỳ trang web đối tác nào của Google. Một số biện pháp này được liệt kê dưới đây:

Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm, hãy xem lại trang web của bạn và khắc phục bất kỳ sự cố nào trong số các sự cố này. Bạn có thể xem lại phần Nguyên tắc Quản trị Trang web của chúng tôi để biết thêm thông tin. Khi bạn đã thực hiện thay đổi và chắc chắn rằng trang web của bạn không còn vi phạm các nguyên tắc của chúng tôi, hãy gửi trang web của bạn để được xem xét lại.

Văn bản và liên kết ẩn

Việc ẩn văn bản hoặc liên kết trong nội dung của bạn có thể làm cho trang web của bạn bị xem là không đáng tin vì nó hiển thị thông tin dành cho công cụ tìm kiếm khác với thông tin dành cho khách truy cập. Văn bản (ví dụ như văn bản có quá nhiều từ khoá) có thể bị ẩn theo một số cách, bao gồm:

  • Sử dụng văn bản trắng trên nền trắng
  • Bao gồm văn bản đằng sau một hình ảnh
  • Sử dụng CSS để ẩn văn bản
  • Đặt kích thước phông chữ là 0

Các liên kết ẩn là những liên kết sẽ được Googlebot thu thập dữ liệu nhưng con người không thể đọc được do:

  • Liên kết có chứa văn bản ẩn (ví dụ: màu văn bản và màu nền giống nhau).
  • CSS đã được sử dụng để tạo các siêu liên kết rất nhỏ, chỉ bằng một pixel.
  • Liên kết bị ẩn trong một ký tự nhỏ - ví dụ như, dấu gạch nối giữa đoạn.

Nếu trang web của bạn bị xem là có chứa văn bản và liên kết ẩn với mục đích lừa gạt, trang web của bạn có thể bị xoá khỏi chỉ mục của Google và sẽ không xuất hiện trong các trang kết quả tìm kiếm. Khi đánh giá trang web của bạn để xem nó có chứa văn bản hoặc các liên kết ẩn hay không, hãy tìm kiếm mọi thứ mà khách truy cập trang web của bạn không thể dễ dàng xem được. Có bất kỳ văn bản hoặc liên kết nào chỉ dành cho công cụ tìm kiếm chứ không phải dành cho khách truy cập không?

Nếu bạn đang sử dụng văn bản để thử mô tả điều gì đó mà công cụ tìm kiếm không thể truy cập được - ví dụ: Javascript, hình ảnh, hoặc các tệp Flash - hãy nhớ rằng nhiều người truy cập sử dụng trình đọc màn hình, trình duyệt trên điện thoại di động, trình duyệt không có trình cắm và kết nối chậm sẽ không thể xem nội dung đó. Sử dụng văn bản mô tả cho những mục này sẽ cải tiến khả năng truy cập trang web của bạn. Bạn có thể kiểm tra khả năng truy cập bằng cách tắt Javascript, Flash và hình ảnh trong trình duyệt của bạn, hoặc sử dụng một trình duyệt chỉ hỗ trợ văn bản như Lynx. Một số mẹo để làm cho trang web của bạn có thể truy cập được, bao gồm:

  • Hình ảnh: Sử dụng thuộc tính alt để cung cấp văn bản mô tả. Ngoài ra, chúng tôi khuyên bạn sử dụng chú thích mà con người có thể đọc được và văn bản mô tả xung quanh hình ảnh.
  • Javascript: Đặt cùng nội dung của Javascript vào một thẻ noscript. Nếu bạn sử dụng phương thức này, đảm bảo nội dung giống chính xác như những gì có trong Javascript và rằng nội dung này được hiển thị cho khách truy cập không kích hoạt Javascript trong trình duyệt của họ.
  • Video: Bao gồm văn bản mô tả về video trong HTML. Bạn cũng có thể xem xét việc cung cấp các bản ghi.

Nếu bạn tìm thấy văn bản hoặc các liên kết ẩn trên trang web của bạn, hãy xoá chúng hoặc nếu chúng thích hợp với khách truy cập trang web của bạn, hãy làm cho văn bản và các liên kết ẩn có thể dễ dàng xem được.

Quay lại đầu trang

Kỹ thuật che giấu, chuyển hướng Javascript ngầm và các trang ngõ

Kỹ thuật che giấu

Kỹ thuật che giấu đề cập đến thực tiễn hiển thị nội dung hoặc URL khác nhau cho người dùng và các công cụ tìm kiếm. Cung cấp các kết quả khác nhau dựa trên tác nhân người dùng có thể làm cho trang web của bạn bị xem là giả mạo và bị xoá khỏi chỉ mục của Google.

Một số ví dụ về kỹ thuật che giấu, bao gồm:

  • Cung cấp một trang có văn bản HTML cho công cụ tìm kiếm trong khi hiển thị một trang có hình ảnh hoặc Flash cho người dùng.
  • Cung cấp nội dung cho công cụ tìm kiếm khác với nội dung cho người dùng.

Nếu trang web của bạn có chứa các thành phần mà công cụ tìm kiếm không thể thu thập dữ liệu được (như các tệp đa phương tiện khác với Flash, JavaScript, hoặc hình ảnh), bạn không nên cung cấp nội dung được che giấu cho các công cụ tìm kiếm. Đúng hơn là, bạn cũng nên xem xét các khách truy cập trang web của mình những người không thể xem được các thành phần này. Ví dụ:

  • Cung cấp văn bản thay thế mô tả hình ảnh cho khách truy cập bằng trình đọc màn hình hoặc hình ảnh bị tắt trong trình duyệt của họ.
  • Cung cấp nội dung JavaScript nguyên bản trong một thẻ noscript.

Đảm bảo rằng bạn cung cấp nội dung giống nhau trong cả hai thành phần (ví dụ: cung cấp văn bản trong JavaScript giống như trong thẻ noscript). Bao gồm cả nội dung khác nhau đáng kể trong thành phần thay thế cũng có thể khiến Google can thiệp vào trang web đó.

Chuyển hướng JavaScript ngầm

Khi Googlebot lập chỉ mục một trang có chứa JavaScript, nó sẽ lập chỉ mục trang đó nhưng không thể đi theo hoặc lập chỉ mục bất kỳ liên kết bị ẩn nào trong chính JavaScript. Sử dụng JavaScript là việc sử dụng trang web hoàn toàn hợp pháp. Tuy nhiên, sử dụng JavaScript với ý định đánh lừa công cụ tìm kiếm thì không. Ví dụ: việc đặt văn bản trong JavaScript khác với văn bản trong thẻ noscript sẽ vi phạm nguyên tắc quản trị trang web của chúng tôi vì nó hiển thị nội dung cho người dùng (những người xem được văn bản dựa trên JavaScript) khác với nội dung cho công cụ tìm kiếm (công cụ tìm kiếm nhận biết được văn bản dựa trên thẻ noscript). Ngoài ra, sẽ là vi phạm các nguyên tắc quản trị trang web khi nhúng một liên kết vào JavaScript làm chuyển hướng người dùng tới một trang khác với mục đích hiển thị cho người dùng một trang khác với trang mà công cụ tìm kiếm nhận biết. Khi một liên kết chuyển hướng được nhúng vào JavaScript, công cụ tìm kiếm sẽ lập chỉ mục cho trang gốc chứ không đi theo liên kết đó, trái lại người dùng được dẫn tới đích chuyển hướng. Giống như kỹ thuật che giấu, ứng dụng này là giả mạo vì nó hiển thị nội dung khác nhau đối với người dùng và Googlebot và có thể dẫn khách truy cập tới một vị trí nào đó khác với vị trí định đến của họ.

Lưu ý rằng bản thân việc đặt các liên kết trong JavaScript không phải là giả mạo. Hãy cân nhắc ý định khi kiểm tra JavaScript trên trang web của bạn để đảm bảo trang web của bạn tuân thủ các nguyên tắc của chúng tôi.

Hãy nhớ rằng vì công cụ tìm kiếm thường không thể truy cập nội dung của JavaScript nên các liên kết hợp pháp trong JavaScript có khả năng không thể truy cập được (cũng như đối với khách truy cập không có trình duyệt được kích hoạt Javascript). Thay vào đó, bạn có thể đặt các liên kết bên ngoài JavaScript hoặc tái tạo các liên kết đó trong một thẻ noscript.

Các trang ngõ

Trang ngõ thường là tập hợp nhiều trang chất lượng thấp mà tại đó mỗi trang được tối ưu hoá cho một từ khoá hoặc một cụm từ cụ thể. Trong nhiều trường hợp, các trang ngõ được viết để xếp hạng cho một cụm từ riêng biệt và sau đó đưa người dùng tới một điểm đến riêng.

Cho dù được triển khai trên nhiều miền hoặc được thiết lập trong một miền, trang ngõ thường có xu hướng gây khó chịu cho người dùng và vi phạm các nguyên tắc quản trị trang web của chúng tôi.

Mục tiêu của Google là cung cấp cho người dùng kết quả tìm kiếm phù hợp và có giá trị nhất. Do đó, chúng tôi không tán thành với những ứng dụng được thiết kế để thao túng công cụ tìm kiếm và lừa gạt người dùng bằng cách chỉ hướng công cụ tìm kiếm và người dùng tới những trang web khác với những trang họ đã chọn và những ứng dụng cung cấp nội dung chỉ dành cho lợi ích của công cụ tìm kiếm. Google có thể can thiệp vào những trang web ngõ và các trang web khác đang sử dụng ứng dụng giả mạo này, kể cả việc xoá những trang web này khỏi chỉ mục của Google.

Quay lại đầu trang

Các sơ đồ liên kết

PageRank web của bạn trong kết quả tìm kiếm của Google phụ thuộc một phần vào cách phân tích các trang web có liên kết tới trang của bạn. Số lượng, chất lượng và mức độ phù hợp của các liên kết sẽ được tính vào xếp hạng của bạn. Các trang web liên kết tới trang web của bạn có thể cung cấp văn cảnh về nội dung trang web của bạn và có thể chỉ ra chất lượng và mức độ phổ biến của trang web. Tuy nhiên, nhiều quản trị web lại tìm cách tạo sơ đồ trao đổi liên kết và xây dựng những trang đối tác chỉ dành riêng cho việc liên kết chéo mà bỏ qua yếu tố chất lượng của các liên kết, các nguồn và ảnh hưởng lâu dài sẽ có trên các trang web của họ. Điều này là vi phạm nguyên tắc quản trị trang web của Google và có thể ảnh hưởng tiêu cực đến xếp hạng trang web của bạn trong kết quả tìm kiếm. Vài ví dụ về sơ đồ liên kết:

  • Liên kết nhằm thao túng PageRank
  • Liên kết đến các trang spammer hoặc các trang lân cận kém chất lượng
  • Liên kết hai chiều dày đặc hoặc trao đổi vô tội vạ các liên kết ("Liên kết tới tôi và tôi sẽ liên kết tới bạn.")
  • Các liên kết mua và bán đã đáp ứng được PageRank

Cách tốt nhất để có các trang web khác tạo liên kết phù hợp đến trang web của bạn là xây dựng nội dung thiết thực và duy nhất, có thể nhanh chóng phổ biến trong cộng động Internet. Nội dung của bạn càng hữu ích thì cơ hội để nhiều người tìm được nội dung có giá trị đối với độc giả của họ và liên kết tới trang web của bạn càng cao. Trước khi đưa ra bất kỳ quyết định nào, bạn cũng nên tự hỏi: Việc này có lợi cho khách truy cập trang của tôi không?

Không phải chỉ số lượng liên kết trỏ tới trang web của bạn, mà chất lượng và mức độ phù hợp của những liên kết đó cũng là những vấn đề cần quan tâm. Tạo được nội dung hấp dẫn sẽ mang lại thành công: Các liên kết thường được đưa ra bình chọn tham khảo ý kiến và cộng đồng blogger sôi động có thể là một nơi tuyệt vời để quảng bá bài viết và có được các liên kết tin cậy tới trang web của bạn.

Quay lại đầu trang

Truy vấn tự động

Điều khoản Dịch vụ của Google không cho phép gửi các truy vấn tự động thuộc bất kỳ loại nào tới hệ thống của chúng tôi mà không có sự cho phép rõ ràng từ trước của Google. Việc gửi các truy vấn tự động sẽ tiêu tốn tài nguyên và bao gồm việc sử dụng bất kỳ phần mềm nào (như WebPosition GoldTM) để gửi các truy vấn tự động tới Google nhằm xác định cách thức xếp hạng một trang web trong kết quả tìm kiếm của Google cho các truy vấn khác nhau.

Quay lại đầu trang

Bổ sung quá nhiều từ khoá

"Bổ sung quá nhiều từ khoá" đề cập tới hành động gán quá nhiều từ khoá cho một trang web nhằm thao túng xếp hạng của trang web trong kết quả tìm kiếm của Google. Việc gán các trang với các từ khoá sẽ tác động tiêu cực đến trải nghiệm của người dùng và có thể gây hại cho xếp hạng trang web của bạn. Chú trọng vào việc tạo nội dung giàu thông tin, hữu ích, sử dụng những từ khoá thích hợp và đúng ngữ cảnh.

Để khắc phục hiện tượng này, xem lại trang web của bạn để biết các từ khoá bị dùng sai. Theo đặc thù, đây sẽ là các danh sách hoặc các đoạn từ khoá, thường được lặp lại ngẫu nhiên. Hãy kiểm tra cẩn thận, vì các từ khoá có thể thường ở dạng văn bản ẩn, hoặc các từ khoá có thể bị ẩn trong các thẻ tiêu đề hoặc các thuộc tính alt.

Quay lại đầu trang

Nội dung trùng lặp

Nội dung trùng lặp thường đề cập đến các khối nội dung thực trong hoặc trên toàn miền, hoàn toàn khớp với nội dung khác hoặc rất giống với nội dung khác. Hầu như, về nguyên gốc, đây không phải nội dung giả mạo. Ví dụ về nội dung trùng lặp không gây hại có thể bao gồm:

  • Các diễn đàn thảo luận có thể tạo cả trang thông thường và trang cơ sở nhằm hướng đến các thiết bị di động
  • Các mục lưu trữ được hiển thị hoặc được liên kết thông qua nhiều URL riêng biệt
  • Các phiên bản trang web chỉ dành cho máy in

Nếu trang web của bạn chứa nhiều trang có nội dung giống hệt nhau, có nhiều cách để bạn có thể chỉ cho Google URL ưa thích của bạn. (Việc này được gọi là "chuẩn hoá".)

Tuy nhiên, trong một số trường hợp, nội dung bị trùng lặp trên toàn miền có chủ tâm nhằm thao túng khả năng xếp hạng của công cụ tìm kiếm hoặc để đạt được nhiều lưu lượng truy cập hơn. Những hành động giả mạo như vậy có thể dẫn đến việc không thoả mãn người dùng khi một khách truy cập xem được nội dung, về cơ bản, là giống nhau được lặp lại trong một loạt kết quả tìm kiếm.

Google đang nỗ lực để lập chỉ mục và hiển thị các trang với thông tin riêng biệt. Quá trình lọc này có nghĩa là: giả sử trang web của bạn có phiên bản của mỗi bài viết ở chế độ "thông thường" và "máy in" và không có phiên bản nào trong số này bị chặn trong robots.txt hoặc bằng thẻ meta ngăn lập chỉ mục, chúng tôi sẽ chọn một trong những phiên bản đó để liệt kê vào danh sách. Trong một số ít trường hợp mà Google nhận thấy rằng nội dung trùng lặp có thể được hiển thị với mục đích thao túng khả năng xếp hạng của chúng tôi và lừa gạt người dùng, chúng tôi cũng sẽ thực hiện những điều chỉnh phù hợp trong quá trình lập chỉ mục và xếp hạng các trang web có liên quan. Kết quả là, xếp hạng của trang web có thể bị ảnh hưởng hoặc trang web hoàn toàn có thể bị xoá khỏi chỉ mục của Google. Trong trường hợp đó, trang web sẽ không còn xuất hiện trong kết quả tìm kiếm.

Bạn có thể giải quyết trước vấn đề về nội dung trùng lặp theo một số bước và đảm bảo rằng khách truy cập sẽ xem được nội dung mà bạn muốn họ xem.

  • Xem xét việc chặn các trang khỏi quá trình lập chỉ mục: Ngoài việc để thuật toán của Google xác định phiên bản tài liệu "tốt nhất", bạn có thể trợ giúp khi dẫn chúng tôi tới được phiên bản ưa thích của mình. Ví dụ: nếu bạn không muốn chúng tôi lập chỉ mục cho phiên bản các bài viết trong trang web của bạn ở chế độ máy in, hãy không cho phép những thư mục đó hoặc sử dụng cụm từ thông thường trong tệp robots.txt của bạn.
  • Sử dụng 301s: Nếu bạn đã cấu trúc lại trang web của mình, hãy sử dụng chuyển hướng 301 ("RedirectPermanent") trong tệp .htaccess của bạn để chuyển hướng nhanh người dùng, Googlebot và các trình thu thập dữ liệu khác. (Trong Apache, bạn có thể thực hiện điều này bằng một tệp .htaccess; trong IIS, bạn có thể thực hiện điều này thông qua bảng điều khiển quản trị.)
  • Đồng nhất: Cố giữ liên kết nội bộ đồng nhất. Ví dụ: không liên kết tới http://www.example.com/page/ và http://www.example.com/page và http://www.example.com/page/index.htm.
  • Sử dụng các tên miền cấp cao: Để giúp chúng tôi cung cấp phiên bản tài liệu phù hợp nhất, hãy sử dụng các tên miền cấp cao bất cứ khi nào có thể để quản lý nội dung theo từng quốc gia. Ví dụ: Chúng tôi có nhiều khả năng biết rằng www.example.de có chứa nội dung tập trung vào tiếng Đức hơn là www.example.com/de hoặc de.example.com.
  • Thận trọng khi cung cấp nội dung: Nếu bạn cung cấp nội dung của mình cho nhiều trang web khác, Google sẽ luôn hiển thị phiên bản mà chúng tôi cho là phù hợp nhất đối với người sử dụng trong mỗi tìm kiếm định sẵn. Phiên bản này có thể là hoặc có thể không phải là phiên bản mà bạn ưa thích. Tuy nhiên, sẽ rất hữu ích khi đảm bảo rằng mỗi trang web được bạn cung cấp nội dung đều có chứa một liên kết quay trở lại bài viết gốc của bạn. Bạn cũng có thể yêu cầu những người sử dụng tài liệu do bạn cung cấp chặn phiên bản trên các trang web của họ bằng robots.txt.
  • Sử dụng Công cụ Quản trị Trang web để thông báo cho chúng tôi biết cách bạn muốn lập chỉ mục trang web của mình: Bạn có thể thông báo cho Google tên miền ưa thích của bạn (ví dụ: www.example.com hoặc http://example.com).
  • Giảm thiểu sự lặp lại mẫu trích: Ví dụ: thay vì đặt văn bản dài dòng về nội dung bản quyền ở cuối mỗi trang, hãy chèn một bản tổng hợp vắn tắt và sau đó liên kết tới một trang chi tiết hơn.
  • Tránh xuất bản những trang trống: Người dùng không muốn xem những trang "trống", do đó hãy tránh các trình giữ chỗ nếu có thể. Ví dụ: không được xuất bản các trang mà bạn chưa có nội dung thực. Nếu bạn đã tạo các trang giữ chỗ, hãy sử dụng robots.txt để chặn thu thập dữ liệu những trang này.
  • Hiểu được hệ thống quản lý nội dung của bạn: Đảm bảo rằng bạn biết rõ cách thức hiển thị nội dung trên trang web của bạn. Blog, diễn đàn và các hệ thống liên quan thường hiển thị cùng nội dung theo nhiều định dạng. Ví dụ: một mục nhập blog có thể xuất hiện trên trang chủ của một blog, trong một trang lưu trữ và trong một trang có những mục nhập khác với cùng nhãn.
  • Giảm thiểu nội dung tương tự nhau: Nếu bạn có nhiều trang tương tự nhau, hãy cân nhắc việc mở rộng mỗi trang hoặc hợp nhất các trang thành một. Ví dụ: nếu bạn có một trang web du lịch với các trang riêng biệt cho hai thành phố nhưng trên hai trang lại có cùng thông tin, bạn có thể nhập hai trang này thành một trang giới thiệu về cả hai thành phố hoặc bạn có thể mở rộng mỗi trang để nó có chứa nội dung duy nhất về mỗi thành phố.

Nội dung trùng lặp trên một trang web không phải là lý do để can thiệp vào trang web đó trừ khi mục đích rõ ràng của nội dung trùng lặp là để giả mạo và thao túng kết quả của công cụ tìm kiếm. Nếu trang web của bạn gặp phải vấn đề về nội dung trùng lặp và bạn không thực hiện theo tư vấn ở trên, chúng tôi sẽ chọn một phiên bản nội dung để hiển thị trong kết quả tìm kiếm của chúng tôi.

Nếu bạn phát hiện thấy một trang web khác đang sao lại nội dung của bạn bằng cách sao chép và biên tập lại (chiếm dụng và xuất bản lại) nội dung thì ít có khả năng điều này sẽ ảnh hưởng tiêu cực đến xếp hạng trang web của bạn trong các trang kết quả tìm kiếm của Google. Nếu bạn phát hiện ra một trường hợp đặc biệt gây khó chịu, bạn có thể gửi một yêu cầu DMCA để tuyên bố quyền sở hữu nội dung và yêu cầu loại bỏ trang web khác kia khỏi chỉ mục của Google.

Quay lại đầu trang

Nội dung thiếu hoặc không có nội dung gốc

Một trong những bước quan trọng nhất để cải thiện xếp hạng trang web của bạn trong kết quả tìm kiếm của Google là đảm bảo rằng trang web có nhiều thông tin phong phú, được sử dụng hợp lý, bao gồm các từ khoá phù hợp và chỉ ra chủ đề chính trong nội dung của bạn.

Tuy nhiên, nhiều quản trị web muốn cải thiện xếp hạng trang web của họ và thu hút khách truy cập bằng cách tạo các trang có nhiều từ nhưng thiếu nội dung hoặc không có nội dung xác thực. Google sẽ thực hiện hành động chống lại những tên miền cố để được xếp hạng cao hơn bằng cách chỉ hiển thị những trang được sao chép và biên tập lại hoặc những trang được tạo tự động khác mà không thêm bất kỳ giá trị nào cho người dùng. Các ví dụ bao gồm:

  • Các trang web liên kết cộng tác kinh doanh nhỏ: Những trang web này thu lợi nhuận theo kiểu trả tiền cho mỗi cú nhấp chuột (PPC) bằng cách đưa khách truy cập tới những trang web có các chương trình liên kết cộng tác kinh doanh trong khi cung cấp nội dung thiếu hoặc nội dung không có giá trị gia tăng hoặc dịch vụ không có giá trị gia tăng cho người dùng. Những trang web này thường không có nội dung gốc và có thể là các bản mẫu hoặc những trang web được tạo ra với cùng một mẫu không có nội dung duy nhất.
  • Các trang ngõ: Các trang được tạo ra chỉ dành cho công cụ tìm kiếm
  • Nội dung được tạo tự động: Nội dung được tạo theo hình thức lập trình. Thông thường, quá trình này sẽ bao gồm các đoạn văn bản ngẫu nhiên không có ý nghĩa với người đọc nhưng có thể có chứa các từ khoá tìm kiếm.
  • Nội dung bị sao chép và biên tập lại nhưng không khác về bản chất: Một số quản trị web sử dụng nội dung lấy từ các trang web khác đáng tin hơn khi giả định rằng việc làm tăng số lượng các trang web với nội dung ngẫu nhiên, không liên quan là một chiến lược ổn định lâu dài. Nội dung được sao chép và biên tập lại hoàn toàn nhưng không khác về bản chất, thậm chí từ những nguồn chất lượng cao, không thể không cung cấp bất kỳ giá trị gia tăng nào cho người dùng mà không có các dịch vụ hoặc nội dung hữu ích bổ sung do trang web của bạn cung cấp. Sẽ thật hữu ích khi dành thời gian tạo nội dung gốc dành riêng cho trang web của bạn. Điều này sẽ giữ khách truy cập của bạn tiếp tục quay trở lại và sẽ cung cấp kết quả tìm kiếm hữu ích.

Sẽ không có vấn đề gì trong việc trở thành một liên kết cộng tác miễn là bạn tạo ra một số giá trị gia tăng cho người dùng của bạn và tạo được nội dung có giá trị khiến người dùng có lý do ghé thăm trang web của bạn. Ví dụ: bạn có thể tạo các bài đánh giá sản phẩm, thứ hạng và các bài so sánh sản phẩm.

Quay lại đầu trang

Tên miền giữ chỗ

Một miền giữ chỗ là một trang giữ chỗ cho một tên miền chưa được phát triển thành một trang web. Thông thường, miền giữ chỗ này là hoàn toàn hợp pháp - ví dụ: một quản trị web có thể đặt trước một biển hiệu "Đang xây dựng" trong khi bản thân trang web đó đang được xây dựng.

Tuy nhiên, một số quản trị web lại đăng ký tên miền và đặt chỗ cho chúng nhằm kiếm lợi từ các trang đó. Điển hình, hành động này được thực hiện bằng cách đưa quảng cáo vào các trang với hy vọng đạt được doanh thu theo kiểu trả tiền cho mỗi cú nhấp chuột (PPC).

Những trang giữ chỗ này không cung cấp giá trị cho người tìm kiếm, vì vậy chúng tôi thường không trả lại những trang đó trong kết quả tìm kiếm của chúng tôi. Nếu bạn có miền giữ chỗ, hãy kích hoạt và lấp đầy những tên miền này bằng nội dung hữu ích để giúp chúng có đủ điều kiện được lập chỉ mục và trả lại trong kết quả tìm kiếm.

Quay lại đầu trang

Liên kết được trả tiền

Google và hầu hết các công cụ tìm kiếm khác đều sử dụng các liên kết để xác định uy tín. Xếp hạng của một trang web trong kết quả tìm kiếm của Google phụ thuộc một phần vào cách phân tích các trang web đó liên kết tới trang này. Phân tích dựa trên liên kết là phương thức cực kỳ hữu hiệu trong việc đánh giá giá trị của một trang web và cải thiện đáng kể chất lượng tìm kiếm web. Số lượng và quan trọng hơn, chất lượng của các liên kết đều ảnh hưởng đến thứ hạng này.

Tuy nhiên, một số Công ty Tối ưu hoá Công cụ Tìm kiếm (SEO) và nhiều quản trị web vẫn tham gia quá trình mua và bán các liên kết đã đáp ứng được PageRank mà bỏ qua yếu tố chất lượng liên kết, các nguồn và ảnh hưởng lâu dài sẽ có trên các trang web của họ. Việc mua hoặc bán các liên kết đã đáp ứng được PageRank là vi phạm các nguyên tắc quản trị trang web của Google và có thể ảnh hưởng tiêu cực đến xếp hạng của trang web trong kết quả tìm kiếm.

Không phải tất cả liên kết được trả tiền đều vi phạm nguyên tắc của chúng tôi. Việc mua và bán các liên kết là điều bình thường trong hoạt động kinh tế web khi việc mua - bán này được thực hiện vì mục đích quảng cáo chứ không phải để thao túng kết quả tìm kiếm. Những liên kết được mua để quảng cáo phải được thiết kế dành cho quảng cáo. Điều này có thể thực hiện được theo một số cách như:

  • Thêm một thuộc tính rel="nofollow" vào thẻ <a>
  • Chuyển hướng liên kết tới một trang trung gian bị chặn khỏi công cụ tìm kiếm bằng một tệp robots.txt

Google đang nỗ lực để đảm bảo giảm đáng kể những liên kết có mục đích thao túng kết quả của công cụ tìm kiếm, như trao đổi vô tội vạ các liên kết và các liên kết được mua đã đáp ứng được PageRank. Nếu bạn phát hiện thấy một trang web đang mua hoặc bán các liên kết đã đáp ứng được PageRank, hãy thông báo cho chúng tôi. Chúng tôi sẽ sử dụng thông tin của bạn để nâng cao khả năng phát hiện những liên kết như vậy bằng thuật toán.

Quay lại đầu trang

3. Trang web có sự cố

Nếu bạn tìm thấy thông tin trên web mà bạn cho rằng cần phải xoá (ví dụ: thông tin nhạy cảm, nội dung bất hợp pháp, hoặc liên kết gãy) thì dưới đây là đề xuất của chúng tôi.

  • Nếu trang web này là spam, hãy thông báo cho chúng tôi! Chúng tôi rất chú trọng tới spam và sẽ điều tra các trường hợp được báo cáo. Bạn có thể gửi báo cáo spam tại https://www.google.com/webmasters/tools/spamreport. Những báo cáo này được gửi trực tiếp đến nhóm xử lý spam trên web của chúng tôi và được dùng để đưa ra những giải pháp thích hợp chống lại spam. Nếu bạn chưa có tài khoản Công cụ Quản trị trang web bạn có thể gửi báo cáo spam cho chúng tôi ở đây: http://www.google.com.vn/contact/spamreport.html.

  • Nếu bạn cho rằng trang web có tham gia vào việc mua hoặc bán các liên kết đã đáp ứng được PageRank, hãy thông báo cho chúng tôi. Việc mua hoặc bán các liên kết đã đáp ứng được PageRank là vi phạm các nguyên tắc quản trị trang web của Google và có thể ảnh hưởng tiêu cực đến thứ hạng của trang web trong kết quả tìm kiếm.

  • Nếu bạn cho rằng nên xoá nội dung khỏi chỉ mục của Google do xâm phạm bản quyền, bạn nên gửi yêu cầu xoá theo DMCA. Không như yêu cầu xoá spam hoặc thông tin cá nhân, yêu cầu DMCA phải do chủ nhân của nội dung gửi đến.

  • Nếu bạn cho rằng trang web bị ảnh hưởng bởi phần mềm giả mạo hoặc độc hại, hãy báo cáo cho chúng tôi để chúng tôi có thể hành động nếu cần.

  • Nếu không phải là do một trong số các nguyên nhân này và bạn cảm thấy cần xoá nội dung, hãy liên hệ với quản trị trang web về yêu cầu của bạn. Khi quản trị web xoá trang hoặc thay đổi nội dung, kết quả tìm kiếm của chúng tôi sẽ tự động phản ánh thay đổi này sau lần thu thập dữ liệu tiếp theo và lập chỉ mục lại của chúng tôi.

  • Nếu quản trị web thực hiện những thay đổi này và bạn cần chúng tôi tiến hành xoá bản sao được lưu trong bộ nhớ cache, hoặc nếu quản trị web không thực hiện những thay đổi này và trang chứa thông tin cá nhân, bí mật, hãy gửi yêu cầu của bạn bằng cách sử dụng công cụ xoá URL trong Công cụ Quản trị Trang web.

  • Để thông báo cho Google về vấn đề xâm phạm bản quyền, phỉ báng hoặc các vấn đề pháp lý khác, vui lòng liên hệ với chúng tôi.

Quay lại đầu trang

Yêu cầu xem xét lại trang web của bạn

Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm của Google, hoặc hoạt động không tốt như trước đây (và bạn cho rằng trang web này không vi phạm các nguyên tắc quản trị trang web của chúng tôi), bạn có thể yêu cầu Google xem xét lại trang web của bạn.

Ngoài ra, nếu gần đây bạn mua một miền mà bạn cho rằng đã vi phạm các nguyên tắc của chúng tôi trước khi bạn làm chủ nó, bạn có thể sử dụng mẫu yêu cầu xem xét lại để thông báo cho chúng tôi về việc gần đây bạn đã mua trang web đó và bây giờ nó đã tuân theo các nguyên tắc. Yêu cầu xem xét lại trang web của bạn.

Quay lại đầu trang

5. Nếu trang web của bạn bị tin tặc tấn công

Chúng tôi muốn người dùng của mình cảm thấy an toàn khi họ tìm kiếm trên web và chúng tôi luôn nỗ lực để xác định các trang nguy hiểm và tăng khả năng bảo vệ người dùng. Google sử dụng thuật toán tự động và phản hồi của người dùng để biên dịch danh sách các trang web có thể gây nguy hiểm. Hai loại trang nguy hiểm chính trong danh sách của chúng tôi là trang lừa đảo và trang chứa phần mềm độc hại. Những danh sách này không thể bảo vệ người dùng khỏi mọi trang nguy hiểm trên web một cách hoàn hảo và một trang web an toàn luôn có khả năng bị xác định nhầm là trang web nguy hiểm, nhưng chúng tôi thường xuyên cập nhật các danh sách để giữ chúng càng đầy đủ càng tốt.

Lừa đảo

Lừa đảo, hoặc giả mạo, là một loại tấn công mà trong đó một trang yêu cầu bạn cung cấp thông tin cá nhân hoặc tài chính theo cách thức lừa đảo. Để biết thêm về lừa đảo, hãy ghé thăm Antiphishing.org.

Nếu bạn cho rằng chúng tôi đã bao gồm một trang không phải là trang lừa đảo vào danh sách, vui lòng gửi cho chúng tôi báo cáo nhầm lẫn về trang lừa đảo. Bạn có thể cho chúng tôi biết về trang lừa đảo nếu bạn phát hiện một trang mà chúng tôi bỏ sót.

Phần mềm độc hại

Phần mềm độc hại là một loại phần mềm tìm cách lấy cắp thông tin cá nhân của bạn hoặc dùng máy tính của bạn để thực hiện các việc mà bạn không định thực hiện. Các trang chứa phần mềm độc hại là các trang web chứa mã độc hại có thể tải xuống và cài đặt trên máy tính của bạn mà không cần sự đồng ý của bạn. Bạn có thể tìm hiểu thêm về nội dung web có hại bao gồm vi rút và phần mềm độc hại khác và cách bảo vệ máy tính của bạn tại StopBadware.org.

Bạn có thể biết trang web của mình có bị xác định là trang có thể lưu trữ hoặc phát tán phần mềm độc hại (một loại "phần mềm xấu") hay không bằng cách kiểm tra Bảng điều khiển Công cụ Quản trị Trang web. Công cụ Quản trị Trang web. (Lưu ý: bạn cần xác minh quyền sở hữu trang web để xem thông tin này.) Chúng tôi cũng gửi thông báo đến quản trị viên của các trang web bị ảnh hưởng theo địa chỉ email như sau đối với trang web:

  • abuse@
  • admin@
  • administrator@
  • contact@
  • info@
  • postmaster@
  • support@
  • webmaster@

Nhận dạng này dựa trên một phần nguyên tắc do StopBadware.org thiết lập. Tuy nhiên, Google sử dụng các tiêu chí, quy trình và công cụ riêng của mình để xác định các trang web lưu trữ hoặc phát tán phần mềm xấu. Trong một số trường hợp, bên thứ ba có thể thêm mã độc hại vào các trang hợp pháp làm chúng tôi phải hiển thị thông báo cảnh báo. Nếu bạn cảm thấy trang web của mình bị xác định nhầm, hoặc nếu bạn thay đổi trang web của mình để nó không lưu trữ hoặc phát tán phần mềm độc hại nữa và bạn giữ an toàn cho trang web của mình để nó không bị phần mềm xấu dễ dàng tấn công, bạn có thể yêu cầu chúng tôi xem xét lại trang web của mình (xem thông tin dưới đây).

Yêu cầu xem xét lại phần mềm độc hại trong trang web của bạn

Khi bạn đã xem xét lại trang web của mình và chắc chắn rằng nó không còn nguy hiểm, bạn có thể gửi yêu cầu xem xét lại. Hãy lưu ý rằng bạn sẽ phải xác minh quyền sở hữu trang web trước khi có thể yêu cầu xem xét lại trang web.

  1. Trên Trang chủ Công cụ Quản trị Trang web, hãy chọn trang web bạn muốn.
  2. Trong thông báo Các phần của trang web này có thể đang phát tán phần mềm độc hại, hãy nhấp Chi tiết khác.
  3. Nhấp Yêu cầu đánh giá.

Chúng tôi sẽ xem xét lại trang web của bạn và nếu chúng tôi xác định rằng trang web đó không lưu trữ hoặc phát tán phần mềm xấu, chúng tôi sẽ xoá nhận dạng của nó khỏi kết quả tìm kiếm.

Quay lại đầu trang

Sử dụng Công cụ Quản trị Trang web

1. Thêm và xác minh trang web của bạn trong Công cụ Quản trị Trang web

Thêm và xác minh trang web

Bạn có thể thêm tối đa 500 trang web, bao gồm các trang tin tức hoặc trang dành cho điện thoại di động vào tài khoản của mình. Ngoài ra, chúng tôi sẽ yêu cầu bạn xác minh trang web của mình. Điều này là do chúng tôi cần biết bạn sở hữu trang web trước khi chúng tôi hiển thị cho bạn thông tin nhất định về trang web hoặc cho phép bạn sử dụng các công cụ của chúng tôi. Xác minh không ảnh hưởng đến PageRank hoặc ảnh hưởng đến hiệu suất trang web của bạn trong kết quả tìm kiếm của Google. (Cũng có các hướng dẫn đặc biệt để thêm blog Blogger và các trang web được tạo bằng Google Sites.)

Nếu bạn tạo blog sử dụng Blogger, bạn có thể tự động thêm và xác minh các trang web bằng cách bật Công cụ Quản trị Trang web trực tiếp từ bảng điều khiển Blogger.

Để thêm và xác minh một trang web:

  1. Đăng nhập vào Công cụ Quản trị Trang web của Google bằng Tài khoản Google của bạn.
  2. Nhấp Thêm trang web và nhập URL của trang web bạn muốn thêm. Đảm bảo rằng bạn nhập toàn bộ URL, như http://www.example.com/
  3. Nhấp Tiếp tục. Trang Xác minh trang web sẽ mở ra.
  4. (Tuỳ chọn) Trong hộp Tên, nhập tên dành cho trang web của bạn (ví dụ: Blog của tôi).
  5. Chọn phương thức xác minh mà bạn muốn.
    • Thẻ meta: Chúng tôi sẽ đề nghị bạn thêm thẻ meta với giá trị duy nhất vào trang chủ trang web của bạn. Đây là giải pháp đơn giản nhất nếu việc chỉnh sửa HTML trang chủ của bạn dễ hơn việc tải tệp mới lên. Ngoài ra, giải pháp này cho phép bạn dễ dàng xác minh trang web bạn đã tạo bằng cách sử dụng Google Sites.
    • Tệp HTML: Chúng tôi sẽ đề nghị bạn tạo một tệp với tên cụ thể và tải tệp lên một thư mục cụ thể trên máy chủ web của bạn. Tệp có thể trống - Google chỉ quan tâm đến vị trí tệp, chứ không phải nội dung của tệp.

Tôi có thể thêm loại trang web nào?

Đây là danh sách các loại URL bạn có thể thêm làm trang web:

  • example.com
  • www.example.com
  • bar.example.com
  • foo.bar.example.com
  • www.example.com/foo
  • www.example.com/foo/bar
  • foo.bar.example.com/catalog/dresses

Dữ liệu và báo cáo của Công cụ Quản trị Trang web hoạt động tốt nhất ở cấp trang web. Ví dụ: nếu trang web của bạn www.example.com có các phần riêng cho các quốc gia khác nhau, bạn nên thêm mỗi trang web phụ hoặc thư mục con đó làm một trang web riêng. Ví dụ: nếu bạn có trang web về du lịch với các thư mục con cụ thể bao gồm Ireland, Pháp và Tây Ban Nha, bạn có thể thêm các trang web sau vào tài khoản Công cụ Quản trị Trang web của mình:

  • http://www.example.com
  • http://www.example.com/france
  • http://www.example.com/ireland
  • http://www.example.com/spain

Công cụ Quản trị Trang web hỗ trợ Quốc tế hoá Tên Miền trong các Ứng dụng (IDNA) khi thêm một trang web vào tài khoản của bạn. Chỉ cần nhập tên miền của bạn như thường lệ và nó sẽ xuất hiện chính xác trong Công cụ Quản trị Trang web. Ví dụ: nếu bạn nhập http://bücher.example.com trong hộp Thêm Trang web, nó sẽ xuất hiện chính xác. Điều này chỉ áp dụng cho tên miền lưu trữ (trong ví dụ này: bücher.example.com). Do đó, chúng tôi khuyên bạn nên tạo đường dẫn URL chỉ sử dụng các ký tự mã ASCII không cần thoát.

Nếu bạn đang gặp khó khăn trong việc xác minh trang web của bạn bằng một trong các phương thức trên,

Lỗi xác minh

Nếu bạn cố xác minh trang web của mình và gặp lỗi, hãy tìm lỗi đó trong danh sách bên dưới để biết nguyên nhân và giải pháp có thể.

Lỗi xác minh chung

  • Chúng tôi đã gặp lỗi khi tìm kiếm tên miền trang web của bạn.

    Chúng tôi đã thử truy cập tệp xác minh của bạn, nhưng không thể truy cập tên miền của bạn do lỗi DNS. Điều này có thể là do máy chủ của bạn bị gián đoạn, hoặc có sự cố xảy ra với quá trình định tuyến DNS tới tên miền của bạn. Hãy đảm bảo rằng tên miền của bạn đang hoạt động đúng cách và thử lại.

  • Chúng tôi đã gặp sự cố ngắt DNS khi tìm kiếm tên miền trang web của bạn.

    Chúng tôi đã thử truy cập tệp xác minh của bạn, nhưng không thể truy cập tên miền của bạn do lỗi DNS. Điều này có thể là do máy chủ của bạn bị gián đoạn, hoặc có sự cố xảy ra với quá trình định tuyến DNS tới tên miền của bạn. Hãy đảm bảo rằng tên miền của bạn đang hoạt động đúng cách và thử lại.

  • Chúng tôi không thể xác minh tệp của bạn do ngắt máy chủ.

    Chúng tôi không thể xác minh tệp của bạn vì chúng tôi gặp sự cố ngắt máy chủ. Điều này có thể là do máy chủ của bạn bị gián đoạn hoặc quá tải và phản hồi chậm. Đảm bảo rằng máy chủ của bạn đang phản hồi và thử lại.

Lỗi xác minh HTML

  • Chúng tôi không thể tìm tệp xác minh của bạn. Đảm bảo đặt đúng tên tệp và tải tệp lên đúng vị trí.

    Chúng tôi đã tìm kiếm tệp xác minh của bạn, nhưng không thể định vị được tệp. Kiểm tra các trường hợp sau đây và thử lại:

    • Phân biệt chữ hoa/thường: Bạn đã sử dụng cùng chữ hoa và chữ thường như được hiển thị trên trang?
    • Phần mở rộng của tệp: Tệp có phần mở rộng là .html? Đôi khi trình soạn thảo văn bản tự động thêm một phần mở rộng là .txt vào tệp. Nếu điều này xảy ra, hãy đặt lại tên tệp sao cho phần mở rộng là .html.
    • Vị trí: Bạn đã tải tệp lên thư mục được liệt kê bên cạnh nút Xác minh?

    Lỗi này còn có thể do một lý do khác là bạn đã thêm trang web vào tài khoản của mình nhưng nhập không chính xác. Do đó, bạn đã tải tệp xác minh của bạn lên đúng vị trí, tuy nhiên chúng tôi lại đang tìm ở một vị trí khác. Đảm bảo rằng trang web chúng tôi hiển thị là trang web của bạn. Nếu không phải, hãy xoá trang web đó và thêm trang web của bạn vào.

  • Chúng tôi không thể truy cập tệp xác minh do giới hạn trong robots.txt.

    Chúng tôi đã thử truy cập tệp xác minh của bạn nhưng không thể truy cập được do giới hạn robots.txt. Lỗi này có thể xảy ra do một số lý do. Ví dụ: tệp robots.txt của bạn có thể ngăn cấm Googlebot hoàn toàn; nó có thể ngăn cấm truy cập vào thư mục có chứa tệp xác minh của bạn, hoặc có thể ngăn cấm truy cập riêng vào tệp xác minh. Kiểm tra tệp robots.txt của bạn để xem liệu những tình trạng này hoặc bất kỳ tình trạng nào khác có thể đã ngăn Google truy cập tệp xác minh của bạn có tồn tại hay không. Sửa đổi tệp robots.txt nếu cần thiết và thử lại. Lưu ý rằng, thời gian để xử lý tệp robots.txt mới có thể kéo dài tối đa đến một ngày.

  • Trang web của bạn không trả lại mã trạng thái 4xx HTML cho những URL không tồn tại

    Nếu bạn đang sử dụng tệp xác minh HTML thì điều quan trọng là một URL không tồn tại sẽ trả lại mã trạng thái 4xx. Chúng tôi không thể xác minh các trang web được định cấu hình để trả lại các mã trạng thái khác (ví dụ: 2xx hoặc 5xx) cho những URL không tồn tại, vì điều này sẽ cho phép bất kỳ ai cũng có thể xác minh quyền sở hữu trang web của bạn. Bạn có thể thử phương thức xác minh thẻ meta của chúng tôi hoặc thay đổi cấu hình máy chủ của bạn.

    Cấu hình này để lộ rủi ro bảo mật khi xác minh trang web và do đó, chúng tôi không thể xác minh trang web của bạn. Nếu máy chủ web của bạn được định cấu hình để trả lại trạng thái 200 (tìm thấy) trong tiêu đề của những trang 404 (không tìm thấy) và chúng tôi cho phép bạn xác minh trang web của bạn bằng cấu hình này thì những người khác cũng có thể tận dụng được điều này và xác minh trang web của bạn. Nhằm đảm bảo rằng không ai có thể tận dụng được cấu hình này để xem số liệu thống kê đối với những trang web họ không sở hữu, chúng tôi chỉ xác minh những trang web trả lại trạng thái 404 trong tiêu đề của những trang 404.

    Nếu máy chủ của bạn được định cấu hình để trả lại mã trạng thái khác 404 cho những trang không tồn tại, hãy thử phương thức xác minh thẻ meta của chúng tôi hoặc thay đổi cấu hình máy chủ của bạn.

    Bạn có thể thay đổi cấu hình máy chủ web của bạn để trả lại trạng thái 404 trong tiêu đề của những trang 404 và vẫn cung cấp trang lỗi tuỳ chỉnh (xem Thông tin Apache và Thông tin IIS). Khi máy chủ web của bạn được định cấu hình chính xác, hãy thử xác minh lại trang web và chúng tôi sẽ kiểm tra lại cấu hình của bạn.

Lỗi xác minh thẻ meta

  • Chúng tôi không thể tìm thấy thẻ meta xác minh. Thẻ meta xác minh phải nằm trong phần <HEAD> của trang.

    Nếu bạn thấy lỗi này, hãy kiểm tra những thông tin sau:

    • Thẻ meta có nằm trên đúng trang không? Chúng tôi tìm kiếm thẻ meta trên trang chủ trang web của bạn. Đây là trang mà máy chủ của bạn trả lại khi ai đó yêu cầu trang web của bạn (ví dụ như: http://www.example.com/). Trang này thường được đặt tên là index.html hoặc index.htm, nhưng có thể được đặt tên khác đi, tuỳ thuộc vào cấu hình máy chủ của bạn.
    • Thẻ meta có nằm đúng vị trí trên trang không? Chúng tôi tìm kiếm thẻ meta trong phần ĐẦU của trang. Dưới đây là ví dụ về việc đặt đúng vị trí.
      <HTML>
      <HEAD>
      <TITLE>Your Title</TITLE>
      <META name="verify-v1" content="String_we_ask_for"> </HEAD> <BODY>
    • Nếu bạn đang sử dụng trình soạn thảo web hoặc trình soạn thảo WYSIWYG để chỉnh sửa trang của bạn, hãy đảm bảo rằng bạn đã chọn tuỳ chọn 'Chỉnh sửa HTML' hoặc chỉnh sửa mã nguồn của trang.
  • Thẻ meta xác minh của bạn phải là <META name="verify-v1" contents="String_we_ask_for">. Thẻ meta mà chúng tôi đã tìm thấy là <META name="verify-v1" contents="Incorrect_string">.

    Chúng tôi đã tìm thấy thẻ meta xác minh nhưng nội dung không chính xác. Đảm bảo rằng nội dung khớp chính xác với những gì chúng tôi yêu cầu.

Quay lại đầu trang

2. Tạo và gửi Sơ đồ trang web

Giới thiệu về Sơ đồ trang web

Nhìn chung, có hai loại sơ đồ trang web. Loại sơ đồ trang web thứ nhất là trang HTML liệt kê các trang trên trang web của bạn - thường theo mục - và được sử dụng để giúp người dùng tìm thông tin họ cần.

Sơ đồ trang web XML - thường được gọi là Sơ đồ trang web, với chữ S viết hoa - là một cách thức để bạn cung cấp thông tin trang web của bạn cho Google. Đây là loại Sơ đồ trang web mà chúng tôi sẽ thảo luận trong bài viết này.

Theo nghĩa đơn giản nhất, Sơ đồ trang web là một danh sách các trang trên trang web của bạn. Tạo và gửi Sơ đồ trang web giúp đảm bảo rằng Google hiểu rõ tất cả các trang trên trang web của bạn, bao gồm các URL có thể không thể phát hiện được do quy trình thu thập dữ liệu thông thường của Google.

Sơ đồ trang web đặc biệt hữu ích nếu:

  • Trang web của bạn có nội dung động.
  • Trang web của bạn có các trang mà Googlebot không dễ phát hiện trong quá trình thu thập dữ liệu - ví dụ: các trang được hỗ trợ AJAX hoặc Flash giàu tính năng.
  • Trang web của bạn mới và có một số liên kết đến trang web này. (Googlebot thu thập dữ liệu của bạn bằng cách theo dõi các liên kết từ trang này đến trang khác, vì vậy nếu trang web của bạn không được liên kết đúng, chúng tôi khó theo dõi trang web của bạn.)
  • Trang web của bạn có lưu trữ số lượng lớn các trang nội dung không được liên kết đúng với nhau hoặc không được liên kết với trang nào.

Bạn cũng có thể sử dụng Sơ đồ trang web để cung cấp cho Google các thông tin bổ sung về các trang của bạn, bao gồm:

  • Tần suất thay đổi của các trang trên trang web của bạn. Ví dụ: bạn có cập nhật trang sản phẩm của bạn mỗi ngày, nhưng cập nhật trang Giới thiệu về tôi chỉ mỗi tháng một lần.
  • Ngày mỗi trang được sửa đổi lần cuối.
  • Tầm quan trọng tương đối của các trang trên trang web của bạn. Ví dụ: trang chủ của bạn có thể có tầm quan trọng tương đối là 1.0, trang danh mục có tầm quan trọng là 0.8 và mục nhập blog cá nhân hoặc sản phẩm có tầm quan trọng là 0.5. Sự ưu tiên này chỉ cho thấy tầm quan trọng của các URL cụ thể trong tương quan với các URL khác trên trang web của bạn và không ảnh hưởng đến thứ hạng các trang của bạn trong kết quả tìm kiếm.

Sơ đồ trang web cung cấp các thông tin bổ sung về trang web của bạn cho Google, bổ sung cho các phương pháp thu thập dữ liệu web thông thường của chúng tôi. Chúng tôi hi vọng chúng sẽ giúp chúng tôi thu thập nhiều dữ liệu hơn về trang web của bạn và theo cách thức kịp thời hơn, nhưng chúng tôi không thể đảm bảo rằng các URL trong Sơ đồ trang web của bạn sẽ được thêm vào chỉ mục của Google. Các trang web không bao giờ bị phạt vì gửi Sơ đồ trang web.

Google tuân thủ Giao thức Sơ đồ trang web 0.9 như được xác định bởi sitemaps.org. Giao thức Sơ đồ trang web là một phương ngữ XML để tóm tắt thông tin Sơ đồ trang web có liên quan đến các trình thu thập dữ liệu web. Vì vậy, các Sơ đồ trang web do Google tạo sử dụng Giao thức Sơ đồ trang web 0.9 tương thích với các công cụ tìm kiếm khác áp dụng tiêu chuẩn của sitemaps.org.

Trong khi Sơ đồ trang web chuẩn hoạt động đối với hầu hết các trang web, bạn cũng có thể tạo và gửi các Sơ đồ trang web chuẩn đối với một số loại nội dung nhất định. Những định dạng Sơ đồ trang web này là đặc trưng của Google và không được sử dụng bởi các công cụ tìm kiếm khác. Định dạng Sơ đồ trang web bao gồm:

  • Sơ đồ trang web Video
  • Sơ đồ trang web di động
  • Sơ đồ trang web Tin tức
  • Sơ đồ trang web Tìm kiếm Mã
  • Sơ đồ trang web Geo

Quay lại đầu trang

Tạo Sơ đồ trang web

Sử dụng nguồn cấp dữ liệu RSS / Atom như một Sơ đồ trang web

Google chấp nhận nguồn cấp dữ liệu RSS (Dịch vụ cung cấp thông tin Cực kỳ Đơn giản) 2.0 và Atom 1.0. Nếu bạn có blog có nguồn cấp dữ liệu RSS hoặc Atom, bạn có thể gửi URL của nguồn cấp dữ liệu dưới dạng một Sơ đồ trang web. Hầu hết các phần mềm tạo blog tạo cho bạn nguốn cấp dữ liệu. Nếu trang web của bạn không có nguồn cấp dữ liệu, bạn có thể sử dụng Feedburner để tạo và xuất bản nguồn cấp dữ liệu. Lưu ý rằng nguồn cấp dữ liệu chỉ có thể cung cấp thông tin về các URL gần đây.

Tạo Sơ đồ trang web dựa trên tệp văn bản

Sơ đồ trang web nên chứa danh sách các URL trang web của bạn - tối đa 50.000 URL. Nếu bạn có trang web lớn với nhiều hơn 50.000 URL, bạn nên tạo nhiều Sơ đồ trang web và gửi tệp chỉ mục Sơ đồ trang web.

Bạn có thể cung cấp cho Google tệp văn bản đơn giản chứa một URL trong mỗi dòng. Ví dụ:

http://www.example.com/file1.html
http://www.example.com/file2.html

Để có kết quả tốt nhất, hãy làm theo các nguyên tắc sau:

  1. Bạn phải chỉ định đầy đủ các URL vì Google cố gắng thu thập dữ liệu về chúng chính xác như được cung cấp.
  2. Mỗi tệp văn bản có thể chứa tối đa 50.000 URL. Nếu trang web của bạn chứa hơn 50.000 URL, bạn có thể chia danh sách thành nhiều tệp văn bản và thêm từng tệp riêng.
  3. Tệp văn bản phải sử dụng mã UTF-8. Bạn có thể chỉ định mã này khi bạn lưu tệp (ví dụ: trong Notepad, mã này được liệt kê trong trình đơn Mã hoá của hộp thoại Lưu Dưới dạng).
  4. Tệp văn bản không nên chứa nội dung nào ngoài danh sách các URL.
  5. Tệp văn bản không nên chứa thông tin đầu trang hoặc chân trang.
  6. Bạn có thể đặt bất kỳ tên nào mà bạn muốn cho tệp văn bản. Google khuyến nghị cung cấp cho tệp phần mở rộng .txt để xác định đó là tệp văn bản (ví dụ: sodotrangweb.txt).

Bạn phải tải tệp văn bản lên máy chủ của mình. Sau khi bạn tạo tệp này, bạn có thể gửi tệp dưới dạng Sơ đồ trang web. Mặc dù quá trình này hoàn toàn thủ công nhưng nó là quá trình đơn giản nhất và có thể là tốt nhất nếu bạn không quen với việc tạo tập lệnh hoặc quản lý máy chủ web của mình.

Nếu bạn có nhiều trang web, bạn có thể đơn giản hoá quá trình tạo và gửi Sơ đồ trang web bằng cách tạo một hoặc nhiều Sơ đồ trang web chứa URL cho tất cả các trang web đã được xác minh của bạn và lưu Sơ đồ trang web đến một vị trí. Tất cả các trang web phải được xác minh trong Công cụ Quản trị Trang web.


Quay lại đầu trang

Gửi Sơ đồ trang web

Đây là lần đầu tiên bạn gửi Sơ đồ trang web đến Google, bạn phải gửi sơ đồ trang web bằng Công cụ Quản trị Trang web của Google. Việc này giúp Google cung cấp cho bạn thông tin thống kê và trạng thái hữu ích.

Từ tài khoản của bạn, bạn có thể xem có sự cố nào với Sơ đồ trang web của mình hoặc với bất kỳ URL nào được liệt kê trong đó hay không

Các bước này mô tả cách thêm Sơ đồ trang web chứa các URL cho nội dung không dành cho di động (gồm có hầu hết các trang web). Có các bước bổ sung cho Sơ đồ trang web dành cho Mobile.

Khi bạn có Sơ đồ trang web ở một trong các định dạng được hỗ trợ:

  1. Tải Sơ đồ trang web của bạn lên trang web của bạn: Các trang web sau phải được xác minh trong tài khoản Công cụ Quản trị Trang web của bạn:
    • trang web mà Sơ đồ trang web được đặt trên đó
    • (các) trang web mà URL của các trang web đó được tham chiếu trong Sơ đồ trang web
  2. Trên trang chủ Công cụ Quản trị Trang web, hãy nhấp vào trang web bạn muốn.
  3. Trong Cấu hình trang web, nhấp Sơ đồ trang web.
  4. Trong hộp văn bản, nhập đầy đủ đường dẫn vào Sơ đồ trang web của bạn (ví dụ: nếu Sơ đồ trang web của bạn nằm tại http://www.example.com/sitemap.xml, hãy nhập sitemap.xml).
  5. Nhấp vào Gửi Sơ đồ trang web.

Chúng tôi không thể dự đoán hoặc đảm bảo về thời gian hoặc liệu URL của bạn sẽ được thu thập dữ liệu hoặc được thêm vào chỉ mục của chúng tôi hay không. Sau một khoảng thời gian, chúng tôi mong muốn cả phạm vi và thời gian lập chỉ mục cải thiện khi chúng tôi tinh chỉnh quá trình của chúng tôi và hiểu rõ hơn nhu cầu của quản trị web.

Khi bạn thực hiện thay đổi Sơ đồ trang web của mình, bạn có thể gửi lại nó bằng tài khoản Công cụ Quản trị Trang web của Google hoặc bằng yêu cầu HTTP.

Lưu ý: Bạn cũng có thể thông báo cho Google và các công cụ tìm kiếm khác về Sơ đồ trang web của mình bằng cách đưa vị trí của Sơ đồ trang web vào tệp robots.txt của bạn. Chúng tôi vẫn khuyên bạn nên gửi Sơ đồ trang web của mình qua tài khoản Công cụ Quản trị Trang web vì vậy bạn có thể đảm bảo rằng Sơ đồ trang web được xử lý mà không có bất kỳ sự cố nào và nhận số liệu thống kê bổ sung về trang web của mình.

Quay lại đầu trang

Tối ưu hoá trang web của bạn

1. Geotargeting

Nếu trang web của bạn nhắm mục tiêu vào người dùng ở vị trí địa lý cụ thể, bạn có thể sử dụng công cụ đặt đích địa lý của chúng tôi nhằm cung cấp cho chúng tôi thông tin sẽ giúp chúng tôi xác định cách trang web của bạn xuất hiện trong các kết quả tìm kiếm của mỗi quốc gia và cũng cải thiện kết quả tìm kiếm của chúng tôi đối với các truy vấn địa lý. Dữ liệu này bổ sung thông tin hiện có của chúng tôi và việc đặt đích địa lý sẽ không ảnh hưởng đến giao diện của bạn trong các kết quả tìm kiếm trừ khi người dùng sử dụng Tìm kiếm Nâng cao nhằm hạn chế phạm vi tìm kiếm đến một quốc gia nhất định.

Bạn chỉ có thể sử dụng tính năng này cho trang web có tên miền cấp cao chung, như .com hoặc .org. Trang web có tên miền cấp cao mã quốc gia (như .ie) cđã được liên kết với một khu vực địa lý, trong trường hợp này là Ireland.

Nếu không có thông tin được nhập trong Công cụ Quản trị Trang web, chúng tôi sẽ tiếp tục tạo liên kết địa lý chủ yếu dựa trên tên miền cấp cao (ví dụ: co.uk hoặc .ca) và địa chỉ IP của máy chủ web từ ngữ cảnh được phục vụ.

Để đặt đích địa lý:

  1. Trên Trang chủ Công cụ Quản trị Trang web, nhấp vào trang web bạn muốn.
  2. Trong Cấu hình trang web, nhấp Cài đặt.
  3. Trong phần Đích địa lý, chọn tuỳ chọn bạn muốn.

Quay lại đầu trang

2. Thiết lập tên miền ưa thích

Tên miền ưa thích là tên miền mà bạn muốn sử dụng để lập chỉ mục các trang trong trang web của bạn (đôi khi tên miền này được gọi là tên miền chính). Các liên kết có thể hướng tới trang web của bạn bằng cả hai phiên bản URL có www và không có www (ví dụ: http://www.example.com và http://example.com). Tên miền ưa thích là phiên bản mà bạn muốn dùng cho trang web của mình trong kết quả tìm kiếm.

Khi bạn đã cho chúng tôi biết tên miền ưa thích, chúng tôi sẽ dùng thông tin đó cho tất cả những lần thu thập dữ liệu trên trang web của bạn và các lần làm mới lập chỉ mục sau này. Ví dụ: nếu bạn chỉ định tên miền ưa thích là http://www.example.com và chúng tôi tìm thấy liên kết tới trang web của bạn có định dạng là htttp://example.com, chúng tôi sẽ đi theo liên kết đó thay vì liên kết http://www.example.com. Ngoài ra, chúng tôi sẽ xem xét tên miền ưa thích của bạn khi hiển thị URL. Nếu bạn không chỉ định một tên miền ưu thích, chúng tôi có thể coi các phiên bản có www và không có www của tên miền là các tham chiếu riêng biệt tới các trang riêng biệt.

Để chỉ định tên miền ưa thích của bạn:

  1. Trên Trang chủ Công cụ Quản trị Trang web, nhấp vào trang web bạn muốn.
  2. Trong Cấu hình trang web, nhấp Cài đặt.
  3. Trong phần Tên miền ưa thích, hãy chọn tuỳ chọn bạn muốn.

Bạn có thể cần xác minh lại quyền sở hữu trang web của mình. Do việc đặt tên miền ưa thích ảnh hưởng đến thu thập dữ liệu và lập chỉ mục, chúng tôi cần đảm bảo rằng bạn sở hữu cả hai phiên bản. Thông thường, cả hai phiên bản đều hướng đến một vị trí thực, nhưng không phải lúc nào cũng xảy ra trường hợp này. Thông thường, khi bạn đã xác minh một phiên bản tên miền, chúng tôi có thể dễ dàng xác minh tên miền kia bằng cách tìm tệp HTLM xác minh hoặc thẻ meta. Tuy nhiên, nếu bạn đã xoá tệp hoặc thẻ meta, bạn sẽ phải lặp lại các bước xác minh.

Lưu ý: Khi bạn đã đặt tên miền ưa thích của mình, bạn có thể muốn sử dụng chuyển hướng 301 để chuyển hướng lưu lượng truy cập từ tên miền không ưa thích của bạn, nhờ đó các công cụ tìm kiếm khác và khách truy cập biết bạn ưa thích phiên bản nào.

Quay lại đầu trang

3. Ngăn nội dung xuất hiện trong kết quả tìm kiếm

Nếu bạn có các trang hoặc nội dung khác mà bạn không muốn xuất hiện trong kết quả tìm kiếm Google, bạn có nhiều tuỳ chọn.

  • Nếu bạn cần giữ nội dung bí mật trên máy chủ của mình, hãy lưu nó vào thư mục được bảo vệ bằng mật khẩu. Googlebot và các trình thu thập thông tin khác sẽ không thể truy cập nội dung. Đây là cách đơn giản và hiệu quả nhất để ngăn chặn Googlebot và các trình thu thập thông tin khác thu thập dữ liệu và lập chỉ mục nội dung trên trang web của bạn. Nếu bạn đang sử dụng Máy chủ Web Apache, bạn có thể chỉnh sửa tệp .htaccess của mình thành thư mục được bảo vệ bằng mật khẩu trên máy chủ. Có nhiều công cụ trên web cho phép bạn làm được việc này một cách dễ dàng.

  • Sử dụng tệp robots.txt để điều khiển quyền truy cập vào tệp và thư mục trên máy chủ của bạn. Tệp robots.txt giống biển báo điện tử Cấm vào. Nó thông báo cho Googlebot và các trình thu thập dữ liệu khác biết rằng tệp và thư mục nào trên máy chủ của bạn không được thu thập dữ liệu.

    Để sử dụng tệp robots.txt, bạn cần có quyền truy cập vào gốc máy chủ (nếu bạn không chắc, hãy kiểm tra thông qua nhà cung cấp dịch vụ lưu trữ trên web). Nếu bạn không có quyền truy cập vào gốc tên miền, bạn có thể giới hạn quyền truy cập bằng cách sử dụng thẻ meta của các rô bôt trên từng trang riêng lẻ.

    Điều quan trọng cần lưu ý là thậm chí nếu bạn sử dụng tệp robots.txt để chặn các trình thu thập thông tin không thu thập dữ liệu nội dung trên trang web của bạn, các trang web khác có thể vẫn liên kết tới nó. Kết quả là URL của trang và thông tin tiềm năng, hiển thị công khai khác như chuỗi ký tự liên kết trong các liên kết đến trang web hoặc tiêu đề từ Dự án Thư mục Mở, có thể xuất hiện trên kết quả tìm kiếm của Google. Ngoài ra, dù tất cả các robot tốt đều tuân thủ hướng dẫn trong tệp robots.txt nhưng một số robot có thể diễn giải các hướng dẫn theo cách khác. Tuy nhiên, robots.txt không thể thi hành và một số người gửi spam và những kẻ gây rối khác có thể bỏ qua nó. Vì lý do này, chúng tôi khuyến nghị các thông tin bí mật được bảo vệ bằng mật khẩu (xem bên trên).

    Bạn có thể sử dụng công cụ Tạo robots.txt trong Công cụ Quản trị Trang web để tạo tệp robots.txt và kiểm tra bằng công cụ Kiểm tra robots.txt.

  • Sử dụng thẻ meta ngăn lập chỉ mục để ngăn nội dung xuất hiện trong kết quả tìm kiếm của chúng tôi. Khi chúng tôi thấy thẻ meta ngăn lập chỉ mục trên một trang, Google sẽ loại bỏ hoàn toàn trang đó khỏi kết quả tìm kiếm, kể cả các trang khác liên kết tới nó. Nếu nội dung hiện có trong chỉ mục của chúng tôi, chúng tôi sẽ xoá nó sau lần thu thập dữ liệu tiếp theo của chúng tôi. (Để tiến hành xoá, sử dụng công cụ Xoá URL trong Công cụ Quản trị Trang web của Google.) Tuy nhiên, các công cụ tìm kiếm khác có thể diễn giải hướng dẫn này theo cách khác nhau. Kết quả là, liên kết tới trang có thể vẫn xuất hiện trong kết quả tìm kiếm của họ.

    Do chúng tôi phải thu thập dữ liệu trang web của bạn để xem thẻ ngăn lập chỉ mục nên ít xẩy ra khả năng Google sẽ không thấy và tôn trọng thẻ meta ngăn lập chỉ mục (ví dụ: nếu chúng tôi không thu thập dữ liệu trang vì bạn thêm thẻ).

    Để ngăn tất cả robot lập chỉ mục trang trên trang web của mình, bạn nên đặt thẻ meta sau vào phần <head> của trang:

    <meta name="robots" content="noindex">

    Để cho phép các robot khác lập chỉ mục trang trên trang web của bạn, chỉ chặn rô bôt của Google lập chỉ mục trang:

    <meta name="googlebot" content="noindex">

Quay lại đầu trang

4. Chỉ định phiên bản trang chuẩn của bạn

Trang chuẩn là phiên bản của một nhóm các trang được ưa thích có nội dung khá giống nhau.

Một trang web thường có nhiều trang liệt kê cùng nhóm sản phẩm. Ví dụ: một trang có thể hiển thị các sản phẩm được sắp xếp theo thứ tự bảng chữ cái trong khi các trang khác hiển thị sản phẩm giống như vậy được liệt kê theo giá cả hoặc xếp hạng. Ví dụ:

http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=price&sessionid=5678asfasdfasfd

Nếu Google biết rằng các trang này có cùng nội dung, chúng tôi có thể sẽ chỉ lập chỉ mục một phiên bản cho các kết quả tìm kiếm của chúng tôi. Thuật toán của chúng tôi chọn trang mà chúng tôi cho là các câu trả lời hay nhất cho truy vấn của người dùng. Tuy nhiên, hiện tại, người dùng có thể chỉ định một trang chuẩn cho các công cụ tìm kiếm bằng cách thêm phần tử <link> có thuộc tính rel="canonical" vào phần <head> của phiên bản trang không chuẩn. Thêm liên kết và thuộc tính này giúp cho chủ nhân trang web nhận diện được nhóm nội dung giống nhau và đề xuất với Google: "Trong số tất cả các trang có nội dung giống nhau này, trang này là hữu ích nhất. Hãy ưu tiên trang này trong các kết quả tìm kiếm".

Tôi làm cách nào để chỉ định một trang chuẩn?

Để chỉ định một liên kết chuẩn cho trang http://www.example.com/product.php?item=swedish-fish, tạo một phần tử <link> như sau:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

Sao chép liên kết này vào phần <head> của tất cả các phiên bản trang không chuẩn như http://www.example.com/product.php?item=swedish-fish&sort=price.

Nếu bạn xuất bản nội dung trên cả http://www.example.com/product.php?item=swedish-fish và https://www.example.com/product.php?item=swedish-fish, bạn có thể chỉ định phiên bản trang chuẩn. Tạo phần tử <link>:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

Thêm liên kết này vào phần <head> của https://www.example.comproduct.php?item=swedish-fish.

Nội dung trên một nhóm trang có phải giống nội dung trên phiên bản chuẩn không?

Có. Chỉ nên sử dụng thuộc tính rel="canonical" để chỉ định phiên bản ưa thích của nhiều trang có nội dung giống nhau (dù hơi khác một chút, như thứ tự sắp xếp, là được).

Ví dụ: nếu một trang web có một nhóm trang đề cập về cùng kiểu giày khiêu vũ, mỗi kiểu chỉ khác nhau ở màu sắc của chiếc giày như trong ảnh thì nên đặt trang nêu bật màu sắc phổ biến nhất làm phiên bản chuẩn để Google có nhiều khả năng hiển thị trang đó trong các kết quả tìm kiếm.

Có thể sử dụng rel="canonical" để đề xuất một url chuẩn trên một tên miền hoàn toàn khác không?

Không. Để di chuyển tới một tên miền hoàn toàn khác, các lần chuyển hướng (301) vĩnh viễn là phù hợp hơn. Hiện tại, Google sẽ đưa các đề xuất chuẩn hoá vào tài khoản trên các tên miền phụ (hoặc trong một tên miền), chứ không phải trên các tên miền. Do vậy chủ nhân trang web có thể chỉ định một trang chuẩn trên www.example.com từ một nhóm trang trên example.com hoặc help.example.com, nhưng không phải trên example-widgets.com.

Quay lại đầu trang