Bạn có câu hỏi về Công cụ Quản trị Trang web? Thật may, có người đã trả lời câu hỏi này trong Diễn đàn Trợ giúp của chúng tôi.
Nguyên tắc Quản trị Trang web của chúng tôi đưa ra các hướng dẫn về cách tạo trang web thân thiện với Google, đồng thời Hướng dẫn dành cho Người mới làm quen với Tối ưu hoá Công cụ Tìm kiếm có các thông tin chi tiết về cách nâng cao hiệu suất cho trang web của bạn trong các công cụ tìm kiếm.
Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm, bạn có thể kiểm tra xem trang web có nằm trong chỉ mục của Google hay không bằng một trang web: tìm kiếm tên miền của bạn, giống như thế này: trang web:example.com. Nếu trang web của bạn không được liệt kê trong các kết quả thì Google đã không lập chỉ mục trang web này. Điều này thường xảy ra khi một nhà cung cấp dịch vụ lưu trữ trang web chặn Googlebot (Phần mềm thu thập dữ liệu web của Google). Nếu trang web của bạn không được lập chỉ mục và bạn nghi ngờ Googlebot đã bị chặn, chúng tôi khuyên bạn liên hệ với nhà cung cấp dịch vụ lưu trữ trang web của bạn và yêu cầu họ xác minh Googlebot bằng cách tiến hành tra cứu DNS ngược lại, xác minh tên nằm trong tên miền googlebot.com và sau đó tiến hành tra cứu DNS-tới-IP tương ứng bằng chính tên googlebot.com đó.
Ví dụ:
> host 66.249.66.1 1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com. > host crawl-66-249-66-1.googlebot.com crawl-66-249-66-1.googlebot.com has address 66.249.66.1
Mục tiêu của Google là cung cấp những kết quả hay nhất và có liên quan nhiều nhất cho người dùng của chúng tôi. Để trang web của bạn có được thứ hạng cao trong trang kết quả tìm kiếm, bạn phải đảm bảo rằng Google có thể thu thập dữ liệu và lập chỉ mục chính xác trang web của bạn và đảm bảo rằng trang web của bạn chứa nội dung gốc, hữu ích. gửi trang web của bạn để được xem xét lại của chúng tôi chỉ ra một số biện pháp tốt nhất có thể giúp bạn tránh được các cạm bẫy phổ biến và nâng cao thứ hạng trang web của bạn.
Tuy nhiên, một số quản trị web sử dụng các biện pháp bất hợp pháp có thể dẫn đến việc trang web sẽ bị xoá hoàn toàn khỏi chỉ mục của Google hoặc nếu không, sẽ bị phạt. Nếu một trang web bị phạt, nó sẽ không còn được hiển thị trong phần kết quả tìm kiếm của Google.com hoặc bất kỳ trang web đối tác nào của Google. Một số biện pháp này được liệt kê dưới đây:
Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm, hãy xem lại trang web của bạn và khắc phục bất kỳ sự cố nào trong số các sự cố này. Bạn có thể xem lại phần Nguyên tắc Quản trị Trang web của chúng tôi để biết thêm thông tin. Khi bạn đã thực hiện thay đổi và chắc chắn rằng trang web của bạn không còn vi phạm các nguyên tắc của chúng tôi, hãy gửi trang web của bạn để được xem xét lại.
Việc ẩn văn bản hoặc liên kết trong nội dung của bạn có thể làm cho trang web của bạn bị xem là không đáng tin vì nó hiển thị thông tin dành cho công cụ tìm kiếm khác với thông tin dành cho khách truy cập. Văn bản (ví dụ như văn bản có quá nhiều từ khoá) có thể bị ẩn theo một số cách, bao gồm:
Các liên kết ẩn là những liên kết sẽ được Googlebot thu thập dữ liệu nhưng con người không thể đọc được do:
Nếu trang web của bạn bị xem là có chứa văn bản và liên kết ẩn với mục đích lừa gạt, trang web của bạn có thể bị xoá khỏi chỉ mục của Google và sẽ không xuất hiện trong các trang kết quả tìm kiếm. Khi đánh giá trang web của bạn để xem nó có chứa văn bản hoặc các liên kết ẩn hay không, hãy tìm kiếm mọi thứ mà khách truy cập trang web của bạn không thể dễ dàng xem được. Có bất kỳ văn bản hoặc liên kết nào chỉ dành cho công cụ tìm kiếm chứ không phải dành cho khách truy cập không?
Nếu bạn đang sử dụng văn bản để thử mô tả điều gì đó mà công cụ tìm kiếm không thể truy cập được - ví dụ: Javascript, hình ảnh, hoặc các tệp Flash - hãy nhớ rằng nhiều người truy cập sử dụng trình đọc màn hình, trình duyệt trên điện thoại di động, trình duyệt không có trình cắm và kết nối chậm sẽ không thể xem nội dung đó. Sử dụng văn bản mô tả cho những mục này sẽ cải tiến khả năng truy cập trang web của bạn. Bạn có thể kiểm tra khả năng truy cập bằng cách tắt Javascript, Flash và hình ảnh trong trình duyệt của bạn, hoặc sử dụng một trình duyệt chỉ hỗ trợ văn bản như Lynx. Một số mẹo để làm cho trang web của bạn có thể truy cập được, bao gồm:
Nếu bạn tìm thấy văn bản hoặc các liên kết ẩn trên trang web của bạn, hãy xoá chúng hoặc nếu chúng thích hợp với khách truy cập trang web của bạn, hãy làm cho văn bản và các liên kết ẩn có thể dễ dàng xem được.
Kỹ thuật che giấu đề cập đến thực tiễn hiển thị nội dung hoặc URL khác nhau cho người dùng và các công cụ tìm kiếm. Cung cấp các kết quả khác nhau dựa trên tác nhân người dùng có thể làm cho trang web của bạn bị xem là giả mạo và bị xoá khỏi chỉ mục của Google.
Một số ví dụ về kỹ thuật che giấu, bao gồm:
Nếu trang web của bạn có chứa các thành phần mà công cụ tìm kiếm không thể thu thập dữ liệu được (như các tệp đa phương tiện khác với Flash, JavaScript, hoặc hình ảnh), bạn không nên cung cấp nội dung được che giấu cho các công cụ tìm kiếm. Đúng hơn là, bạn cũng nên xem xét các khách truy cập trang web của mình những người không thể xem được các thành phần này. Ví dụ:
Đảm bảo rằng bạn cung cấp nội dung giống nhau trong cả hai thành phần (ví dụ: cung cấp văn bản trong JavaScript giống như trong thẻ noscript). Bao gồm cả nội dung khác nhau đáng kể trong thành phần thay thế cũng có thể khiến Google can thiệp vào trang web đó.
Khi Googlebot lập chỉ mục một trang có chứa JavaScript, nó sẽ lập chỉ mục trang đó nhưng không thể đi theo hoặc lập chỉ mục bất kỳ liên kết bị ẩn nào trong chính JavaScript. Sử dụng JavaScript là việc sử dụng trang web hoàn toàn hợp pháp. Tuy nhiên, sử dụng JavaScript với ý định đánh lừa công cụ tìm kiếm thì không. Ví dụ: việc đặt văn bản trong JavaScript khác với văn bản trong thẻ noscript sẽ vi phạm nguyên tắc quản trị trang web của chúng tôi vì nó hiển thị nội dung cho người dùng (những người xem được văn bản dựa trên JavaScript) khác với nội dung cho công cụ tìm kiếm (công cụ tìm kiếm nhận biết được văn bản dựa trên thẻ noscript). Ngoài ra, sẽ là vi phạm các nguyên tắc quản trị trang web khi nhúng một liên kết vào JavaScript làm chuyển hướng người dùng tới một trang khác với mục đích hiển thị cho người dùng một trang khác với trang mà công cụ tìm kiếm nhận biết. Khi một liên kết chuyển hướng được nhúng vào JavaScript, công cụ tìm kiếm sẽ lập chỉ mục cho trang gốc chứ không đi theo liên kết đó, trái lại người dùng được dẫn tới đích chuyển hướng. Giống như kỹ thuật che giấu, ứng dụng này là giả mạo vì nó hiển thị nội dung khác nhau đối với người dùng và Googlebot và có thể dẫn khách truy cập tới một vị trí nào đó khác với vị trí định đến của họ.
Lưu ý rằng bản thân việc đặt các liên kết trong JavaScript không phải là giả mạo. Hãy cân nhắc ý định khi kiểm tra JavaScript trên trang web của bạn để đảm bảo trang web của bạn tuân thủ các nguyên tắc của chúng tôi.
Hãy nhớ rằng vì công cụ tìm kiếm thường không thể truy cập nội dung của JavaScript nên các liên kết hợp pháp trong JavaScript có khả năng không thể truy cập được (cũng như đối với khách truy cập không có trình duyệt được kích hoạt Javascript). Thay vào đó, bạn có thể đặt các liên kết bên ngoài JavaScript hoặc tái tạo các liên kết đó trong một thẻ noscript.
Trang ngõ thường là tập hợp nhiều trang chất lượng thấp mà tại đó mỗi trang được tối ưu hoá cho một từ khoá hoặc một cụm từ cụ thể. Trong nhiều trường hợp, các trang ngõ được viết để xếp hạng cho một cụm từ riêng biệt và sau đó đưa người dùng tới một điểm đến riêng.
Cho dù được triển khai trên nhiều miền hoặc được thiết lập trong một miền, trang ngõ thường có xu hướng gây khó chịu cho người dùng và vi phạm các nguyên tắc quản trị trang web của chúng tôi.
Mục tiêu của Google là cung cấp cho người dùng kết quả tìm kiếm phù hợp và có giá trị nhất. Do đó, chúng tôi không tán thành với những ứng dụng được thiết kế để thao túng công cụ tìm kiếm và lừa gạt người dùng bằng cách chỉ hướng công cụ tìm kiếm và người dùng tới những trang web khác với những trang họ đã chọn và những ứng dụng cung cấp nội dung chỉ dành cho lợi ích của công cụ tìm kiếm. Google có thể can thiệp vào những trang web ngõ và các trang web khác đang sử dụng ứng dụng giả mạo này, kể cả việc xoá những trang web này khỏi chỉ mục của Google.
PageRank web của bạn trong kết quả tìm kiếm của Google phụ thuộc một phần vào cách phân tích các trang web có liên kết tới trang của bạn. Số lượng, chất lượng và mức độ phù hợp của các liên kết sẽ được tính vào xếp hạng của bạn. Các trang web liên kết tới trang web của bạn có thể cung cấp văn cảnh về nội dung trang web của bạn và có thể chỉ ra chất lượng và mức độ phổ biến của trang web. Tuy nhiên, nhiều quản trị web lại tìm cách tạo sơ đồ trao đổi liên kết và xây dựng những trang đối tác chỉ dành riêng cho việc liên kết chéo mà bỏ qua yếu tố chất lượng của các liên kết, các nguồn và ảnh hưởng lâu dài sẽ có trên các trang web của họ. Điều này là vi phạm nguyên tắc quản trị trang web của Google và có thể ảnh hưởng tiêu cực đến xếp hạng trang web của bạn trong kết quả tìm kiếm. Vài ví dụ về sơ đồ liên kết:
Cách tốt nhất để có các trang web khác tạo liên kết phù hợp đến trang web của bạn là xây dựng nội dung thiết thực và duy nhất, có thể nhanh chóng phổ biến trong cộng động Internet. Nội dung của bạn càng hữu ích thì cơ hội để nhiều người tìm được nội dung có giá trị đối với độc giả của họ và liên kết tới trang web của bạn càng cao. Trước khi đưa ra bất kỳ quyết định nào, bạn cũng nên tự hỏi: Việc này có lợi cho khách truy cập trang của tôi không?
Không phải chỉ số lượng liên kết trỏ tới trang web của bạn, mà chất lượng và mức độ phù hợp của những liên kết đó cũng là những vấn đề cần quan tâm. Tạo được nội dung hấp dẫn sẽ mang lại thành công: Các liên kết thường được đưa ra bình chọn tham khảo ý kiến và cộng đồng blogger sôi động có thể là một nơi tuyệt vời để quảng bá bài viết và có được các liên kết tin cậy tới trang web của bạn.
Điều khoản Dịch vụ của Google không cho phép gửi các truy vấn tự động thuộc bất kỳ loại nào tới hệ thống của chúng tôi mà không có sự cho phép rõ ràng từ trước của Google. Việc gửi các truy vấn tự động sẽ tiêu tốn tài nguyên và bao gồm việc sử dụng bất kỳ phần mềm nào (như WebPosition GoldTM) để gửi các truy vấn tự động tới Google nhằm xác định cách thức xếp hạng một trang web trong kết quả tìm kiếm của Google cho các truy vấn khác nhau.
"Bổ sung quá nhiều từ khoá" đề cập tới hành động gán quá nhiều từ khoá cho một trang web nhằm thao túng xếp hạng của trang web trong kết quả tìm kiếm của Google. Việc gán các trang với các từ khoá sẽ tác động tiêu cực đến trải nghiệm của người dùng và có thể gây hại cho xếp hạng trang web của bạn. Chú trọng vào việc tạo nội dung giàu thông tin, hữu ích, sử dụng những từ khoá thích hợp và đúng ngữ cảnh.
Để khắc phục hiện tượng này, xem lại trang web của bạn để biết các từ khoá bị dùng sai. Theo đặc thù, đây sẽ là các danh sách hoặc các đoạn từ khoá, thường được lặp lại ngẫu nhiên. Hãy kiểm tra cẩn thận, vì các từ khoá có thể thường ở dạng văn bản ẩn, hoặc các từ khoá có thể bị ẩn trong các thẻ tiêu đề hoặc các thuộc tính alt.
Nội dung trùng lặp thường đề cập đến các khối nội dung thực trong hoặc trên toàn miền, hoàn toàn khớp với nội dung khác hoặc rất giống với nội dung khác. Hầu như, về nguyên gốc, đây không phải nội dung giả mạo. Ví dụ về nội dung trùng lặp không gây hại có thể bao gồm:
Nếu trang web của bạn chứa nhiều trang có nội dung giống hệt nhau, có nhiều cách để bạn có thể chỉ cho Google URL ưa thích của bạn. (Việc này được gọi là "chuẩn hoá".)
Tuy nhiên, trong một số trường hợp, nội dung bị trùng lặp trên toàn miền có chủ tâm nhằm thao túng khả năng xếp hạng của công cụ tìm kiếm hoặc để đạt được nhiều lưu lượng truy cập hơn. Những hành động giả mạo như vậy có thể dẫn đến việc không thoả mãn người dùng khi một khách truy cập xem được nội dung, về cơ bản, là giống nhau được lặp lại trong một loạt kết quả tìm kiếm.
Google đang nỗ lực để lập chỉ mục và hiển thị các trang với thông tin riêng biệt. Quá trình lọc này có nghĩa là: giả sử trang web của bạn có phiên bản của mỗi bài viết ở chế độ "thông thường" và "máy in" và không có phiên bản nào trong số này bị chặn trong robots.txt hoặc bằng thẻ meta ngăn lập chỉ mục, chúng tôi sẽ chọn một trong những phiên bản đó để liệt kê vào danh sách. Trong một số ít trường hợp mà Google nhận thấy rằng nội dung trùng lặp có thể được hiển thị với mục đích thao túng khả năng xếp hạng của chúng tôi và lừa gạt người dùng, chúng tôi cũng sẽ thực hiện những điều chỉnh phù hợp trong quá trình lập chỉ mục và xếp hạng các trang web có liên quan. Kết quả là, xếp hạng của trang web có thể bị ảnh hưởng hoặc trang web hoàn toàn có thể bị xoá khỏi chỉ mục của Google. Trong trường hợp đó, trang web sẽ không còn xuất hiện trong kết quả tìm kiếm.
Bạn có thể giải quyết trước vấn đề về nội dung trùng lặp theo một số bước và đảm bảo rằng khách truy cập sẽ xem được nội dung mà bạn muốn họ xem.
Nội dung trùng lặp trên một trang web không phải là lý do để can thiệp vào trang web đó trừ khi mục đích rõ ràng của nội dung trùng lặp là để giả mạo và thao túng kết quả của công cụ tìm kiếm. Nếu trang web của bạn gặp phải vấn đề về nội dung trùng lặp và bạn không thực hiện theo tư vấn ở trên, chúng tôi sẽ chọn một phiên bản nội dung để hiển thị trong kết quả tìm kiếm của chúng tôi.
Nếu bạn phát hiện thấy một trang web khác đang sao lại nội dung của bạn bằng cách sao chép và biên tập lại (chiếm dụng và xuất bản lại) nội dung thì ít có khả năng điều này sẽ ảnh hưởng tiêu cực đến xếp hạng trang web của bạn trong các trang kết quả tìm kiếm của Google. Nếu bạn phát hiện ra một trường hợp đặc biệt gây khó chịu, bạn có thể gửi một yêu cầu DMCA để tuyên bố quyền sở hữu nội dung và yêu cầu loại bỏ trang web khác kia khỏi chỉ mục của Google.
Một trong những bước quan trọng nhất để cải thiện xếp hạng trang web của bạn trong kết quả tìm kiếm của Google là đảm bảo rằng trang web có nhiều thông tin phong phú, được sử dụng hợp lý, bao gồm các từ khoá phù hợp và chỉ ra chủ đề chính trong nội dung của bạn.
Tuy nhiên, nhiều quản trị web muốn cải thiện xếp hạng trang web của họ và thu hút khách truy cập bằng cách tạo các trang có nhiều từ nhưng thiếu nội dung hoặc không có nội dung xác thực. Google sẽ thực hiện hành động chống lại những tên miền cố để được xếp hạng cao hơn bằng cách chỉ hiển thị những trang được sao chép và biên tập lại hoặc những trang được tạo tự động khác mà không thêm bất kỳ giá trị nào cho người dùng. Các ví dụ bao gồm:
Sẽ không có vấn đề gì trong việc trở thành một liên kết cộng tác miễn là bạn tạo ra một số giá trị gia tăng cho người dùng của bạn và tạo được nội dung có giá trị khiến người dùng có lý do ghé thăm trang web của bạn. Ví dụ: bạn có thể tạo các bài đánh giá sản phẩm, thứ hạng và các bài so sánh sản phẩm.
Một miền giữ chỗ là một trang giữ chỗ cho một tên miền chưa được phát triển thành một trang web. Thông thường, miền giữ chỗ này là hoàn toàn hợp pháp - ví dụ: một quản trị web có thể đặt trước một biển hiệu "Đang xây dựng" trong khi bản thân trang web đó đang được xây dựng.
Tuy nhiên, một số quản trị web lại đăng ký tên miền và đặt chỗ cho chúng nhằm kiếm lợi từ các trang đó. Điển hình, hành động này được thực hiện bằng cách đưa quảng cáo vào các trang với hy vọng đạt được doanh thu theo kiểu trả tiền cho mỗi cú nhấp chuột (PPC).
Những trang giữ chỗ này không cung cấp giá trị cho người tìm kiếm, vì vậy chúng tôi thường không trả lại những trang đó trong kết quả tìm kiếm của chúng tôi. Nếu bạn có miền giữ chỗ, hãy kích hoạt và lấp đầy những tên miền này bằng nội dung hữu ích để giúp chúng có đủ điều kiện được lập chỉ mục và trả lại trong kết quả tìm kiếm.
Google và hầu hết các công cụ tìm kiếm khác đều sử dụng các liên kết để xác định uy tín. Xếp hạng của một trang web trong kết quả tìm kiếm của Google phụ thuộc một phần vào cách phân tích các trang web đó liên kết tới trang này. Phân tích dựa trên liên kết là phương thức cực kỳ hữu hiệu trong việc đánh giá giá trị của một trang web và cải thiện đáng kể chất lượng tìm kiếm web. Số lượng và quan trọng hơn, chất lượng của các liên kết đều ảnh hưởng đến thứ hạng này.
Tuy nhiên, một số Công ty Tối ưu hoá Công cụ Tìm kiếm (SEO) và nhiều quản trị web vẫn tham gia quá trình mua và bán các liên kết đã đáp ứng được PageRank mà bỏ qua yếu tố chất lượng liên kết, các nguồn và ảnh hưởng lâu dài sẽ có trên các trang web của họ. Việc mua hoặc bán các liên kết đã đáp ứng được PageRank là vi phạm các nguyên tắc quản trị trang web của Google và có thể ảnh hưởng tiêu cực đến xếp hạng của trang web trong kết quả tìm kiếm.
Không phải tất cả liên kết được trả tiền đều vi phạm nguyên tắc của chúng tôi. Việc mua và bán các liên kết là điều bình thường trong hoạt động kinh tế web khi việc mua - bán này được thực hiện vì mục đích quảng cáo chứ không phải để thao túng kết quả tìm kiếm. Những liên kết được mua để quảng cáo phải được thiết kế dành cho quảng cáo. Điều này có thể thực hiện được theo một số cách như:
Google đang nỗ lực để đảm bảo giảm đáng kể những liên kết có mục đích thao túng kết quả của công cụ tìm kiếm, như trao đổi vô tội vạ các liên kết và các liên kết được mua đã đáp ứng được PageRank. Nếu bạn phát hiện thấy một trang web đang mua hoặc bán các liên kết đã đáp ứng được PageRank, hãy thông báo cho chúng tôi. Chúng tôi sẽ sử dụng thông tin của bạn để nâng cao khả năng phát hiện những liên kết như vậy bằng thuật toán.
Nếu bạn tìm thấy thông tin trên web mà bạn cho rằng cần phải xoá (ví dụ: thông tin nhạy cảm, nội dung bất hợp pháp, hoặc liên kết gãy) thì dưới đây là đề xuất của chúng tôi.
Nếu trang web của bạn không xuất hiện trong kết quả tìm kiếm của Google, hoặc hoạt động không tốt như trước đây (và bạn cho rằng trang web này không vi phạm các nguyên tắc quản trị trang web của chúng tôi), bạn có thể yêu cầu Google xem xét lại trang web của bạn.
Ngoài ra, nếu gần đây bạn mua một miền mà bạn cho rằng đã vi phạm các nguyên tắc của chúng tôi trước khi bạn làm chủ nó, bạn có thể sử dụng mẫu yêu cầu xem xét lại để thông báo cho chúng tôi về việc gần đây bạn đã mua trang web đó và bây giờ nó đã tuân theo các nguyên tắc. Yêu cầu xem xét lại trang web của bạn.
Chúng tôi muốn người dùng của mình cảm thấy an toàn khi họ tìm kiếm trên web và chúng tôi luôn nỗ lực để xác định các trang nguy hiểm và tăng khả năng bảo vệ người dùng. Google sử dụng thuật toán tự động và phản hồi của người dùng để biên dịch danh sách các trang web có thể gây nguy hiểm. Hai loại trang nguy hiểm chính trong danh sách của chúng tôi là trang lừa đảo và trang chứa phần mềm độc hại. Những danh sách này không thể bảo vệ người dùng khỏi mọi trang nguy hiểm trên web một cách hoàn hảo và một trang web an toàn luôn có khả năng bị xác định nhầm là trang web nguy hiểm, nhưng chúng tôi thường xuyên cập nhật các danh sách để giữ chúng càng đầy đủ càng tốt.
Lừa đảo, hoặc giả mạo, là một loại tấn công mà trong đó một trang yêu cầu bạn cung cấp thông tin cá nhân hoặc tài chính theo cách thức lừa đảo. Để biết thêm về lừa đảo, hãy ghé thăm Antiphishing.org.
Nếu bạn cho rằng chúng tôi đã bao gồm một trang không phải là trang lừa đảo vào danh sách, vui lòng gửi cho chúng tôi báo cáo nhầm lẫn về trang lừa đảo. Bạn có thể cho chúng tôi biết về trang lừa đảo nếu bạn phát hiện một trang mà chúng tôi bỏ sót.
Phần mềm độc hại là một loại phần mềm tìm cách lấy cắp thông tin cá nhân của bạn hoặc dùng máy tính của bạn để thực hiện các việc mà bạn không định thực hiện. Các trang chứa phần mềm độc hại là các trang web chứa mã độc hại có thể tải xuống và cài đặt trên máy tính của bạn mà không cần sự đồng ý của bạn. Bạn có thể tìm hiểu thêm về nội dung web có hại bao gồm vi rút và phần mềm độc hại khác và cách bảo vệ máy tính của bạn tại StopBadware.org.
Bạn có thể biết trang web của mình có bị xác định là trang có thể lưu trữ hoặc phát tán phần mềm độc hại (một loại "phần mềm xấu") hay không bằng cách kiểm tra Bảng điều khiển Công cụ Quản trị Trang web. Công cụ Quản trị Trang web. (Lưu ý: bạn cần xác minh quyền sở hữu trang web để xem thông tin này.) Chúng tôi cũng gửi thông báo đến quản trị viên của các trang web bị ảnh hưởng theo địa chỉ email như sau đối với trang web:
Nhận dạng này dựa trên một phần nguyên tắc do StopBadware.org thiết lập. Tuy nhiên, Google sử dụng các tiêu chí, quy trình và công cụ riêng của mình để xác định các trang web lưu trữ hoặc phát tán phần mềm xấu. Trong một số trường hợp, bên thứ ba có thể thêm mã độc hại vào các trang hợp pháp làm chúng tôi phải hiển thị thông báo cảnh báo. Nếu bạn cảm thấy trang web của mình bị xác định nhầm, hoặc nếu bạn thay đổi trang web của mình để nó không lưu trữ hoặc phát tán phần mềm độc hại nữa và bạn giữ an toàn cho trang web của mình để nó không bị phần mềm xấu dễ dàng tấn công, bạn có thể yêu cầu chúng tôi xem xét lại trang web của mình (xem thông tin dưới đây).
Khi bạn đã xem xét lại trang web của mình và chắc chắn rằng nó không còn nguy hiểm, bạn có thể gửi yêu cầu xem xét lại. Hãy lưu ý rằng bạn sẽ phải xác minh quyền sở hữu trang web trước khi có thể yêu cầu xem xét lại trang web.
Chúng tôi sẽ xem xét lại trang web của bạn và nếu chúng tôi xác định rằng trang web đó không lưu trữ hoặc phát tán phần mềm xấu, chúng tôi sẽ xoá nhận dạng của nó khỏi kết quả tìm kiếm.
Bạn có thể thêm tối đa 500 trang web, bao gồm các trang tin tức hoặc trang dành cho điện thoại di động vào tài khoản của mình. Ngoài ra, chúng tôi sẽ yêu cầu bạn xác minh trang web của mình. Điều này là do chúng tôi cần biết bạn sở hữu trang web trước khi chúng tôi hiển thị cho bạn thông tin nhất định về trang web hoặc cho phép bạn sử dụng các công cụ của chúng tôi. Xác minh không ảnh hưởng đến PageRank hoặc ảnh hưởng đến hiệu suất trang web của bạn trong kết quả tìm kiếm của Google. (Cũng có các hướng dẫn đặc biệt để thêm blog Blogger và các trang web được tạo bằng Google Sites.)
Nếu bạn tạo blog sử dụng Blogger, bạn có thể tự động thêm và xác minh các trang web bằng cách bật Công cụ Quản trị Trang web trực tiếp từ bảng điều khiển Blogger.
Đây là danh sách các loại URL bạn có thể thêm làm trang web:
Dữ liệu và báo cáo của Công cụ Quản trị Trang web hoạt động tốt nhất ở cấp trang web. Ví dụ: nếu trang web của bạn www.example.com có các phần riêng cho các quốc gia khác nhau, bạn nên thêm mỗi trang web phụ hoặc thư mục con đó làm một trang web riêng. Ví dụ: nếu bạn có trang web về du lịch với các thư mục con cụ thể bao gồm Ireland, Pháp và Tây Ban Nha, bạn có thể thêm các trang web sau vào tài khoản Công cụ Quản trị Trang web của mình:
Công cụ Quản trị Trang web hỗ trợ Quốc tế hoá Tên Miền trong các Ứng dụng (IDNA) khi thêm một trang web vào tài khoản của bạn. Chỉ cần nhập tên miền của bạn như thường lệ và nó sẽ xuất hiện chính xác trong Công cụ Quản trị Trang web. Ví dụ: nếu bạn nhập http://bücher.example.com trong hộp Thêm Trang web, nó sẽ xuất hiện chính xác. Điều này chỉ áp dụng cho tên miền lưu trữ (trong ví dụ này: bücher.example.com). Do đó, chúng tôi khuyên bạn nên tạo đường dẫn URL chỉ sử dụng các ký tự mã ASCII không cần thoát.
Nếu bạn đang gặp khó khăn trong việc xác minh trang web của bạn bằng một trong các phương thức trên,
Nếu bạn cố xác minh trang web của mình và gặp lỗi, hãy tìm lỗi đó trong danh sách bên dưới để biết nguyên nhân và giải pháp có thể.
Chúng tôi đã thử truy cập tệp xác minh của bạn, nhưng không thể truy cập tên miền của bạn do lỗi DNS. Điều này có thể là do máy chủ của bạn bị gián đoạn, hoặc có sự cố xảy ra với quá trình định tuyến DNS tới tên miền của bạn. Hãy đảm bảo rằng tên miền của bạn đang hoạt động đúng cách và thử lại.
Chúng tôi đã thử truy cập tệp xác minh của bạn, nhưng không thể truy cập tên miền của bạn do lỗi DNS. Điều này có thể là do máy chủ của bạn bị gián đoạn, hoặc có sự cố xảy ra với quá trình định tuyến DNS tới tên miền của bạn. Hãy đảm bảo rằng tên miền của bạn đang hoạt động đúng cách và thử lại.
Chúng tôi không thể xác minh tệp của bạn vì chúng tôi gặp sự cố ngắt máy chủ. Điều này có thể là do máy chủ của bạn bị gián đoạn hoặc quá tải và phản hồi chậm. Đảm bảo rằng máy chủ của bạn đang phản hồi và thử lại.
Chúng tôi đã tìm kiếm tệp xác minh của bạn, nhưng không thể định vị được tệp. Kiểm tra các trường hợp sau đây và thử lại:
Lỗi này còn có thể do một lý do khác là bạn đã thêm trang web vào tài khoản của mình nhưng nhập không chính xác. Do đó, bạn đã tải tệp xác minh của bạn lên đúng vị trí, tuy nhiên chúng tôi lại đang tìm ở một vị trí khác. Đảm bảo rằng trang web chúng tôi hiển thị là trang web của bạn. Nếu không phải, hãy xoá trang web đó và thêm trang web của bạn vào.
Chúng tôi đã thử truy cập tệp xác minh của bạn nhưng không thể truy cập được do giới hạn robots.txt. Lỗi này có thể xảy ra do một số lý do. Ví dụ: tệp robots.txt của bạn có thể ngăn cấm Googlebot hoàn toàn; nó có thể ngăn cấm truy cập vào thư mục có chứa tệp xác minh của bạn, hoặc có thể ngăn cấm truy cập riêng vào tệp xác minh. Kiểm tra tệp robots.txt của bạn để xem liệu những tình trạng này hoặc bất kỳ tình trạng nào khác có thể đã ngăn Google truy cập tệp xác minh của bạn có tồn tại hay không. Sửa đổi tệp robots.txt nếu cần thiết và thử lại. Lưu ý rằng, thời gian để xử lý tệp robots.txt mới có thể kéo dài tối đa đến một ngày.
Nếu bạn đang sử dụng tệp xác minh HTML thì điều quan trọng là một URL không tồn tại sẽ trả lại mã trạng thái 4xx. Chúng tôi không thể xác minh các trang web được định cấu hình để trả lại các mã trạng thái khác (ví dụ: 2xx hoặc 5xx) cho những URL không tồn tại, vì điều này sẽ cho phép bất kỳ ai cũng có thể xác minh quyền sở hữu trang web của bạn. Bạn có thể thử phương thức xác minh thẻ meta của chúng tôi hoặc thay đổi cấu hình máy chủ của bạn.
Cấu hình này để lộ rủi ro bảo mật khi xác minh trang web và do đó, chúng tôi không thể xác minh trang web của bạn. Nếu máy chủ web của bạn được định cấu hình để trả lại trạng thái 200 (tìm thấy) trong tiêu đề của những trang 404 (không tìm thấy) và chúng tôi cho phép bạn xác minh trang web của bạn bằng cấu hình này thì những người khác cũng có thể tận dụng được điều này và xác minh trang web của bạn. Nhằm đảm bảo rằng không ai có thể tận dụng được cấu hình này để xem số liệu thống kê đối với những trang web họ không sở hữu, chúng tôi chỉ xác minh những trang web trả lại trạng thái 404 trong tiêu đề của những trang 404.
Nếu máy chủ của bạn được định cấu hình để trả lại mã trạng thái khác 404 cho những trang không tồn tại, hãy thử phương thức xác minh thẻ meta của chúng tôi hoặc thay đổi cấu hình máy chủ của bạn.
Bạn có thể thay đổi cấu hình máy chủ web của bạn để trả lại trạng thái 404 trong tiêu đề của những trang 404 và vẫn cung cấp trang lỗi tuỳ chỉnh (xem Thông tin Apache và Thông tin IIS). Khi máy chủ web của bạn được định cấu hình chính xác, hãy thử xác minh lại trang web và chúng tôi sẽ kiểm tra lại cấu hình của bạn.
Nếu bạn thấy lỗi này, hãy kiểm tra những thông tin sau:
<HTML>
<HEAD>
<TITLE>Your Title</TITLE>
<META name="verify-v1" content="String_we_ask_for"> </HEAD> <BODY>
Chúng tôi đã tìm thấy thẻ meta xác minh nhưng nội dung không chính xác. Đảm bảo rằng nội dung khớp chính xác với những gì chúng tôi yêu cầu.
Nhìn chung, có hai loại sơ đồ trang web. Loại sơ đồ trang web thứ nhất là trang HTML liệt kê các trang trên trang web của bạn - thường theo mục - và được sử dụng để giúp người dùng tìm thông tin họ cần.
Sơ đồ trang web XML - thường được gọi là Sơ đồ trang web, với chữ S viết hoa - là một cách thức để bạn cung cấp thông tin trang web của bạn cho Google. Đây là loại Sơ đồ trang web mà chúng tôi sẽ thảo luận trong bài viết này.
Theo nghĩa đơn giản nhất, Sơ đồ trang web là một danh sách các trang trên trang web của bạn. Tạo và gửi Sơ đồ trang web giúp đảm bảo rằng Google hiểu rõ tất cả các trang trên trang web của bạn, bao gồm các URL có thể không thể phát hiện được do quy trình thu thập dữ liệu thông thường của Google.
Sơ đồ trang web đặc biệt hữu ích nếu:
Bạn cũng có thể sử dụng Sơ đồ trang web để cung cấp cho Google các thông tin bổ sung về các trang của bạn, bao gồm:
Sơ đồ trang web cung cấp các thông tin bổ sung về trang web của bạn cho Google, bổ sung cho các phương pháp thu thập dữ liệu web thông thường của chúng tôi. Chúng tôi hi vọng chúng sẽ giúp chúng tôi thu thập nhiều dữ liệu hơn về trang web của bạn và theo cách thức kịp thời hơn, nhưng chúng tôi không thể đảm bảo rằng các URL trong Sơ đồ trang web của bạn sẽ được thêm vào chỉ mục của Google. Các trang web không bao giờ bị phạt vì gửi Sơ đồ trang web.
Google tuân thủ Giao thức Sơ đồ trang web 0.9 như được xác định bởi sitemaps.org. Giao thức Sơ đồ trang web là một phương ngữ XML để tóm tắt thông tin Sơ đồ trang web có liên quan đến các trình thu thập dữ liệu web. Vì vậy, các Sơ đồ trang web do Google tạo sử dụng Giao thức Sơ đồ trang web 0.9 tương thích với các công cụ tìm kiếm khác áp dụng tiêu chuẩn của sitemaps.org.
Trong khi Sơ đồ trang web chuẩn hoạt động đối với hầu hết các trang web, bạn cũng có thể tạo và gửi các Sơ đồ trang web chuẩn đối với một số loại nội dung nhất định. Những định dạng Sơ đồ trang web này là đặc trưng của Google và không được sử dụng bởi các công cụ tìm kiếm khác. Định dạng Sơ đồ trang web bao gồm:
Google chấp nhận nguồn cấp dữ liệu RSS (Dịch vụ cung cấp thông tin Cực kỳ Đơn giản) 2.0 và Atom 1.0. Nếu bạn có blog có nguồn cấp dữ liệu RSS hoặc Atom, bạn có thể gửi URL của nguồn cấp dữ liệu dưới dạng một Sơ đồ trang web. Hầu hết các phần mềm tạo blog tạo cho bạn nguốn cấp dữ liệu. Nếu trang web của bạn không có nguồn cấp dữ liệu, bạn có thể sử dụng Feedburner để tạo và xuất bản nguồn cấp dữ liệu. Lưu ý rằng nguồn cấp dữ liệu chỉ có thể cung cấp thông tin về các URL gần đây.
Sơ đồ trang web nên chứa danh sách các URL trang web của bạn - tối đa 50.000 URL. Nếu bạn có trang web lớn với nhiều hơn 50.000 URL, bạn nên tạo nhiều Sơ đồ trang web và gửi tệp chỉ mục Sơ đồ trang web.
Bạn có thể cung cấp cho Google tệp văn bản đơn giản chứa một URL trong mỗi dòng. Ví dụ:
http://www.example.com/file1.html
http://www.example.com/file2.html
Để có kết quả tốt nhất, hãy làm theo các nguyên tắc sau:
Bạn phải tải tệp văn bản lên máy chủ của mình. Sau khi bạn tạo tệp này, bạn có thể gửi tệp dưới dạng Sơ đồ trang web. Mặc dù quá trình này hoàn toàn thủ công nhưng nó là quá trình đơn giản nhất và có thể là tốt nhất nếu bạn không quen với việc tạo tập lệnh hoặc quản lý máy chủ web của mình.
Nếu bạn có nhiều trang web, bạn có thể đơn giản hoá quá trình tạo và gửi Sơ đồ trang web bằng cách tạo một hoặc nhiều Sơ đồ trang web chứa URL cho tất cả các trang web đã được xác minh của bạn và lưu Sơ đồ trang web đến một vị trí. Tất cả các trang web phải được xác minh trong Công cụ Quản trị Trang web.
Đây là lần đầu tiên bạn gửi Sơ đồ trang web đến Google, bạn phải gửi sơ đồ trang web bằng Công cụ Quản trị Trang web của Google. Việc này giúp Google cung cấp cho bạn thông tin thống kê và trạng thái hữu ích.
Từ tài khoản của bạn, bạn có thể xem có sự cố nào với Sơ đồ trang web của mình hoặc với bất kỳ URL nào được liệt kê trong đó hay không
Các bước này mô tả cách thêm Sơ đồ trang web chứa các URL cho nội dung không dành cho di động (gồm có hầu hết các trang web). Có các bước bổ sung cho Sơ đồ trang web dành cho Mobile.
Khi bạn có Sơ đồ trang web ở một trong các định dạng được hỗ trợ:
Chúng tôi không thể dự đoán hoặc đảm bảo về thời gian hoặc liệu URL của bạn sẽ được thu thập dữ liệu hoặc được thêm vào chỉ mục của chúng tôi hay không. Sau một khoảng thời gian, chúng tôi mong muốn cả phạm vi và thời gian lập chỉ mục cải thiện khi chúng tôi tinh chỉnh quá trình của chúng tôi và hiểu rõ hơn nhu cầu của quản trị web.
Khi bạn thực hiện thay đổi Sơ đồ trang web của mình, bạn có thể gửi lại nó bằng tài khoản Công cụ Quản trị Trang web của Google hoặc bằng yêu cầu HTTP.
Bạn chỉ có thể sử dụng tính năng này cho trang web có tên miền cấp cao chung, như .com hoặc .org. Trang web có tên miền cấp cao mã quốc gia (như .ie) cđã được liên kết với một khu vực địa lý, trong trường hợp này là Ireland.
Nếu không có thông tin được nhập trong Công cụ Quản trị Trang web, chúng tôi sẽ tiếp tục tạo liên kết địa lý chủ yếu dựa trên tên miền cấp cao (ví dụ: co.uk hoặc .ca) và địa chỉ IP của máy chủ web từ ngữ cảnh được phục vụ.
Để đặt đích địa lý:
Tên miền ưa thích là tên miền mà bạn muốn sử dụng để lập chỉ mục các trang trong trang web của bạn (đôi khi tên miền này được gọi là tên miền chính). Các liên kết có thể hướng tới trang web của bạn bằng cả hai phiên bản URL có www và không có www (ví dụ: http://www.example.com và http://example.com). Tên miền ưa thích là phiên bản mà bạn muốn dùng cho trang web của mình trong kết quả tìm kiếm.
Khi bạn đã cho chúng tôi biết tên miền ưa thích, chúng tôi sẽ dùng thông tin đó cho tất cả những lần thu thập dữ liệu trên trang web của bạn và các lần làm mới lập chỉ mục sau này. Ví dụ: nếu bạn chỉ định tên miền ưa thích là http://www.example.com và chúng tôi tìm thấy liên kết tới trang web của bạn có định dạng là htttp://example.com, chúng tôi sẽ đi theo liên kết đó thay vì liên kết http://www.example.com. Ngoài ra, chúng tôi sẽ xem xét tên miền ưa thích của bạn khi hiển thị URL. Nếu bạn không chỉ định một tên miền ưu thích, chúng tôi có thể coi các phiên bản có www và không có www của tên miền là các tham chiếu riêng biệt tới các trang riêng biệt.
Để chỉ định tên miền ưa thích của bạn:
Bạn có thể cần xác minh lại quyền sở hữu trang web của mình. Do việc đặt tên miền ưa thích ảnh hưởng đến thu thập dữ liệu và lập chỉ mục, chúng tôi cần đảm bảo rằng bạn sở hữu cả hai phiên bản. Thông thường, cả hai phiên bản đều hướng đến một vị trí thực, nhưng không phải lúc nào cũng xảy ra trường hợp này. Thông thường, khi bạn đã xác minh một phiên bản tên miền, chúng tôi có thể dễ dàng xác minh tên miền kia bằng cách tìm tệp HTLM xác minh hoặc thẻ meta. Tuy nhiên, nếu bạn đã xoá tệp hoặc thẻ meta, bạn sẽ phải lặp lại các bước xác minh.
Lưu ý: Khi bạn đã đặt tên miền ưa thích của mình, bạn có thể muốn sử dụng chuyển hướng 301 để chuyển hướng lưu lượng truy cập từ tên miền không ưa thích của bạn, nhờ đó các công cụ tìm kiếm khác và khách truy cập biết bạn ưa thích phiên bản nào.
Nếu bạn có các trang hoặc nội dung khác mà bạn không muốn xuất hiện trong kết quả tìm kiếm Google, bạn có nhiều tuỳ chọn.
Để sử dụng tệp robots.txt, bạn cần có quyền truy cập vào gốc máy chủ (nếu bạn không chắc, hãy kiểm tra thông qua nhà cung cấp dịch vụ lưu trữ trên web). Nếu bạn không có quyền truy cập vào gốc tên miền, bạn có thể giới hạn quyền truy cập bằng cách sử dụng thẻ meta của các rô bôt trên từng trang riêng lẻ.
Điều quan trọng cần lưu ý là thậm chí nếu bạn sử dụng tệp robots.txt để chặn các trình thu thập thông tin không thu thập dữ liệu nội dung trên trang web của bạn, các trang web khác có thể vẫn liên kết tới nó. Kết quả là URL của trang và thông tin tiềm năng, hiển thị công khai khác như chuỗi ký tự liên kết trong các liên kết đến trang web hoặc tiêu đề từ Dự án Thư mục Mở, có thể xuất hiện trên kết quả tìm kiếm của Google. Ngoài ra, dù tất cả các robot tốt đều tuân thủ hướng dẫn trong tệp robots.txt nhưng một số robot có thể diễn giải các hướng dẫn theo cách khác. Tuy nhiên, robots.txt không thể thi hành và một số người gửi spam và những kẻ gây rối khác có thể bỏ qua nó. Vì lý do này, chúng tôi khuyến nghị các thông tin bí mật được bảo vệ bằng mật khẩu (xem bên trên).
Bạn có thể sử dụng công cụ Tạo robots.txt trong Công cụ Quản trị Trang web để tạo tệp robots.txt và kiểm tra bằng công cụ Kiểm tra robots.txt.
Do chúng tôi phải thu thập dữ liệu trang web của bạn để xem thẻ ngăn lập chỉ mục nên ít xẩy ra khả năng Google sẽ không thấy và tôn trọng thẻ meta ngăn lập chỉ mục (ví dụ: nếu chúng tôi không thu thập dữ liệu trang vì bạn thêm thẻ).
Để ngăn tất cả robot lập chỉ mục trang trên trang web của mình, bạn nên đặt thẻ meta sau vào phần <head> của trang:
<meta name="robots" content="noindex">
Để cho phép các robot khác lập chỉ mục trang trên trang web của bạn, chỉ chặn rô bôt của Google lập chỉ mục trang:
<meta name="googlebot" content="noindex">
Trang chuẩn là phiên bản của một nhóm các trang được ưa thích có nội dung khá giống nhau.
Một trang web thường có nhiều trang liệt kê cùng nhóm sản phẩm. Ví dụ: một trang có thể hiển thị các sản phẩm được sắp xếp theo thứ tự bảng chữ cái trong khi các trang khác hiển thị sản phẩm giống như vậy được liệt kê theo giá cả hoặc xếp hạng. Ví dụ:
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd
http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=price&sessionid=5678asfasdfasfd
Nếu Google biết rằng các trang này có cùng nội dung, chúng tôi có thể sẽ chỉ lập chỉ mục một phiên bản cho các kết quả tìm kiếm của chúng tôi. Thuật toán của chúng tôi chọn trang mà chúng tôi cho là các câu trả lời hay nhất cho truy vấn của người dùng. Tuy nhiên, hiện tại, người dùng có thể chỉ định một trang chuẩn cho các công cụ tìm kiếm bằng cách thêm phần tử <link> có thuộc tính rel="canonical" vào phần <head> của phiên bản trang không chuẩn. Thêm liên kết và thuộc tính này giúp cho chủ nhân trang web nhận diện được nhóm nội dung giống nhau và đề xuất với Google: "Trong số tất cả các trang có nội dung giống nhau này, trang này là hữu ích nhất. Hãy ưu tiên trang này trong các kết quả tìm kiếm".
Để chỉ định một liên kết chuẩn cho trang http://www.example.com/product.php?item=swedish-fish, tạo một phần tử <link> như sau:
<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>
Sao chép liên kết này vào phần <head> của tất cả các phiên bản trang không chuẩn như http://www.example.com/product.php?item=swedish-fish&sort=price.
Nếu bạn xuất bản nội dung trên cả http://www.example.com/product.php?item=swedish-fish và https://www.example.com/product.php?item=swedish-fish, bạn có thể chỉ định phiên bản trang chuẩn. Tạo phần tử <link>:
<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>
Thêm liên kết này vào phần <head> của https://www.example.comproduct.php?item=swedish-fish.
Có. Chỉ nên sử dụng thuộc tính rel="canonical" để chỉ định phiên bản ưa thích của nhiều trang có nội dung giống nhau (dù hơi khác một chút, như thứ tự sắp xếp, là được).
Ví dụ: nếu một trang web có một nhóm trang đề cập về cùng kiểu giày khiêu vũ, mỗi kiểu chỉ khác nhau ở màu sắc của chiếc giày như trong ảnh thì nên đặt trang nêu bật màu sắc phổ biến nhất làm phiên bản chuẩn để Google có nhiều khả năng hiển thị trang đó trong các kết quả tìm kiếm.
Không. Để di chuyển tới một tên miền hoàn toàn khác, các lần chuyển hướng (301) vĩnh viễn là phù hợp hơn. Hiện tại, Google sẽ đưa các đề xuất chuẩn hoá vào tài khoản trên các tên miền phụ (hoặc trong một tên miền), chứ không phải trên các tên miền. Do vậy chủ nhân trang web có thể chỉ định một trang chuẩn trên www.example.com từ một nhóm trang trên example.com hoặc help.example.com, nhưng không phải trên example-widgets.com.