Skip to content

让 GitHub 仓库的代码占比统计中包含 Markdown 文件

标签
网站/GitHub
开发/Git
命令行/git
个人知识管理/知识库
知识领域/文档工程
字数
887 字
阅读时间
4 分钟

背景

对于 Nólëbase 这样的使用 Git 作为版本管理和协作的知识库和其他众多的文档站点(比如 Kubernetes 文档站 kubernetes/website),默认配置的情况下,GitHub 可能会把仓库内的代码占比展示为下面这样:

可以观察到对于充斥着一定程度的 HTML 模板的仓库而言,即便实际仓库内包含的主要是 Markdown 文件,GitHub 也依然会把大量的 HTML 统计为占比最多的文件。

这是因为 GitHub

但殊不知,GitHub 其实是支持对 Markdown 文件类型进行统计计数的,只需要一点点额外的配置就能达到这样的效果:

上图是 Nólëbase 的主要仓库 nolebase/nolebase 的代码占比统计信息,可以看到在调整配置之后,Nólëbase 中的巨量 Markdown 文件就能被统计到占比中了。

如何实现

想要配置这样的功能其实很简单,在这一切背后,GitHub 使用了一个名为 Linguist 的组件来探测文件类型[1],这样的配置是通过在名为 .gitattributes 文件中实现的,你需要在根目录中创建一个名为

.gitattributes

的文件并且填充下面的内容

*.md linguist-vendored=false
*.md linguist-generated=false
*.md linguist-documentation=false
*.md linguist-detectable=true

就能实现对仓库内所有 .md 为拓展名结尾(Markdown)文件的配置。

这些配置选项具有这样的含义:

  • linguist-vendored=false 表示匹配到的文件不是外部代码,如果配置为 true,则将会被在占比统计中排除
  • linguist-generated=false 表示匹配到的文件不是生成的代码,如果配置为 true,则不仅会被在占比统计中排除,也会在 diff 中被排除
  • linguist-documentation=false 表示匹配到的文件不是文档类型的文件,如果配置为 true,则将会被在占比统计中排除
  • linguist-detectable=true 表示强制匹配到的文件纳入到占比统计中,即便文件是 prose(也就是 Linguist 认为的 Markdown 类型的文件)和 data(也就是 Linguist 认为的 SQL 这样的类型的文件)[2]

详细的配置选项介绍可以在 Overrides - Linguist supports a number of different custom override strategies for language definitions and file paths. · github-linguist/linguist 查阅到。

当然你也可以使用和 .gitignore 一样的 glob 语法来匹配目录:

docs/*.md linguist-vendored=false
docs/*.md linguist-generated=false
docs/*.md linguist-documentation=false
docs/*.md linguist-detectable=true

接下来你可以通过

shell
git check-attr -a <文件路>

这样的命令来测试文件所匹配得到的 attribute,就像这样:

shell
 git check-attr -a README.md
README.md: linguist-vendored: false
README.md: linguist-generated: false
README.md: linguist-documentation: false
README.md: linguist-detectable: true

参考资料

延伸阅读

贡献者

页面历史


  1. 在 GitHub 的讨论 Add markdown code portion counting 中,作者 @airtower-luna 介绍了 GitHub 所使用的 Linguist 的文件类型探测模块的配置文档。 ↩︎

  2. 在 Linguist 的 Issue #3964评论中提到的:「data (e.g. SQL) or prose (e.g. Markdown)」 ↩︎

撰写

布局切换

调整 VitePress 的布局样式,以适配不同的阅读习惯和屏幕环境。

全部展开
使侧边栏和内容区域占据整个屏幕的全部宽度。
全部展开,但侧边栏宽度可调
侧边栏宽度可调,但内容区域宽度不变,调整后的侧边栏将可以占据整个屏幕的最大宽度。
全部展开,且侧边栏和内容区域宽度均可调
侧边栏宽度可调,但内容区域宽度不变,调整后的侧边栏将可以占据整个屏幕的最大宽度。
原始宽度
原始的 VitePress 默认布局宽度

页面最大宽度

调整 VitePress 布局中页面的宽度,以适配不同的阅读习惯和屏幕环境。

调整页面最大宽度
一个可调整的滑块,用于选择和自定义页面最大宽度。

内容最大宽度

调整 VitePress 布局中内容区域的宽度,以适配不同的阅读习惯和屏幕环境。

调整内容最大宽度
一个可调整的滑块,用于选择和自定义内容最大宽度。

聚光灯

支持在正文中高亮当前鼠标悬停的行和元素,以优化阅读和专注困难的用户的阅读体验。

ON开启
开启聚光灯。
OFF关闭
关闭聚光灯。

聚光灯样式

调整聚光灯的样式。

置于底部
在当前鼠标悬停的元素下方添加一个纯色背景以突出显示当前鼠标悬停的位置。
置于侧边
在当前鼠标悬停的元素旁边添加一条固定的纯色线以突出显示当前鼠标悬停的位置。