代码搜索 Sitemap 使用 Sitemap 协议,内含代码搜索专用的额外标记,其定义如下所示。 以下示例为使用代码搜索专用标记的代码搜索 Sitemap 条目:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:codesearch="http://www.google.com/codesearch/schemas/sitemap/1.0">
<url>
<loc>http://mysite.org/download/myfile.c</loc>
<codesearch:codesearch>
<codesearch:filetype>C</codesearch:filetype>
<codesearch:license>LGPL</codesearch:license>
</codesearch:codesearch>
</url>
<url>
<loc>http://mysite.org/download/myproject.tgz</loc>
<codesearch:codesearch>
<codesearch:filetype>archive</codesearch:filetype>
<codesearch:license>Apache</codesearch:license>
<codesearch:packagemap>packagemap.xml</codesearch:packagemap>
</codesearch:codesearch>
</url>
</urlset>
代码搜索 Sitemap 中的每个网址都可以指向存档文件或代码文件。
代码搜索专用标记的定义
<codesearch:filetype> |
必需 |
不区分大小写。 值"archive"表示文件是存档文件。 如果是源代码文件,则该值定义了源代码的语言。 比如说"C"、"Python"、"C#"、"Java"和"Vim"。 对于源代码语言,必须使用支持语言列表中所述的缩写形式。 值必须为可打印的 ASCII 字符,不能留空。
只有受支持的语言才会被纳入索引。 如果您代码的语言尚未获得支持,您也可以提交 Sitemap,Google 以后会将您的代码纳入索引。 支持的语言 |
<codesearch:license> |
可选 |
不区分大小写。 软件许可名称。 如果是存档文件,则表示存档中文件的默认许可。 比如说"GPL"、"BSD"、"Python"、"disclaimer"。 您一定要使用支持许可列表中所述的缩写形式。
如果其值不属于可识别的许可,我们会将该条目以"未知许可"纳入索引
。 支持的许可 |
<codesearch:filename> |
可选 |
实际文件的名称。 如果网址以类似 download.php?id=1234 的内容而不是实际文件名结尾,则该值非常实用。 名称中可以包含除"/"以外的任何字符。 如果是存档文件,则只有使用支持的存档后缀之一时才会被纳入索引。
支持的存档后缀
|
<codesearch:packageurl> |
可选 |
只有"codesearch:filetype"的值不是"archive"时使用。 网址从顶级目录截断以便打包。 例如,文件 http://path/Foo/1.23/bar/file.c 可以使用以下包网址:http://path/Foo/1.23 。一个包中的所有文件都应具有相同的包网址。 便于我们确定哪些文件是一起的。 |
<codesearch:packagemap> |
可选 |
区分大小写。 只有"codesearch:filetype"的值是"archive"时使用。 存档内 Packagemap 文件的名称。 就像 Sitemap 是网站中文件的列表一样,packagemap 是包中文件的列表。
Packagemap 定义。
|