JGit、SvnKit - 版本提交日志(1)提取
1、相关开源jar包
1》使用JGIT访问git项目
2》使用SVNkit访问svn
2、Git历史提交日志导出到文件
在项目根目录执行如下命令,将日志导出到指定位置:
- git log --name-status --date=iso --pretty=format:"%H ,%T ,%P ,%an ,%ae ,%cn ,%ce ,%cd ,%s" --since="100 day ago" >> C:/Users/lfy/Desktop/fyliu_commit.log
如果需要指定导出某些开发者的记录,可以使用grep过滤:
- git log --name-status --date=iso --pretty=format:"%H ,%T ,%P ,%an ,%ae ,%cn ,%ce ,%cd ,%s" --since="100 day ago" |grep "lfy" >> C:/Users/lfy/Desktop/lfy_commit.log
导出成Excel文件:
- git log --name-status --date=iso --pretty=format:'"%H","%T","%P","%an","%ae","%cn","%ce","%cd","%s"' >> C:/Users/lfy/Desktop/commit.csv
结果:
git log --pretty=format常用的选项
- %H: commit hash
- %h: 缩短的commit hash
- %T: tree hash
- %t: 缩短的 tree hash
- %P: parent hash
- %p: 缩短的 parent hash
- %an: 作者名字
- %aN: mailmap的作者名字 (.mailmap对应,详情参照git-shortlog()或者git-blame())
- %ae: 作者邮箱
- %aE: 作者邮箱 (.mailmap对应,详情参照git-shortlog()或者git-blame())
- %ad: 日期 (--date= 制定的格式)
- %aD: 日期, RFC2822格式
- %ar: 日期, 相对格式( day ago)
- %at: 日期, UNIX timestamp
- %ai: 日期, ISO 格式
- %cn: 提交者名字
- %cN: 提交者名字 (.mailmap对应,详情参照git-shortlog()或者git-blame())
- %ce: 提交者 email
- %cE: 提交者 email (.mailmap对应,详情参照git-shortlog()或者git-blame())
- %cd: 提交日期 (--date= 制定的格式)
- %cD: 提交日期, RFC2822格式
- %cr: 提交日期, 相对格式( day ago)
- %ct: 提交日期, UNIX timestamp
- %ci: 提交日期, ISO 格式
- %d: ref名称
- %e: encoding
- %s: commit信息标题
- %f: sanitized subject line, suitable for a filename
- %b: commit信息内容
- %N: commit notes
- %gD: reflog selector, e.g., refs/stash@{}
- %gd: shortened reflog selector, e.g., stash@{}
- %gs: reflog subject
- %Cred: 切换到红色
- %Cgreen: 切换到绿色
- %Cblue: 切换到蓝色
- %Creset: 重设颜色
- %C(...): 制定颜色, as described in color.branch.* config option
- %m: left, right or boundary mark
- %n: 换行
- %%: a raw %
- %x00: print a byte from a hex code
- %w([[,[,]]]): switch line wrapping, like the -w option of git-shortlog().
git log常用选项
选项 | 说明 |
-p | 按补丁格式显示每个更新之间的差异。 |
--stat | 显示每次更新的文件修改统计信息。 |
--shortstat | 只显示--stat中最后的行数修改添加移除统计。 |
--name-only | 仅在提交信息后显示已修改的文件清单。 |
--name-status | 显示新增,修改,删除的文件清单。 |
--abbrev-commit | 只显示SHA-1的前几个字符,而非所有的40个字符。 |
--relative-date | 使用较短的相对时间显示(比如,“2周前”)。 |
--graph | 显示ASCII图形表示的分支合并历史。 |
--pretty | 使用其他格式显示历史提交信息。可用的选项包括oneline,short,full,fuller和format(后跟指定格式)。 |
限制git log输出的选项
选项 | 说明 |
-(n) | 仅显示最近的n条提交 |
--since,--after | 仅显示指定时间之后的提交。 |
--until , --before |
仅显示指定时间之前的提交。 |
--author | 仅显示指定作者相关的提交。 |
--committer | 仅显示指定提交者相关的提交。 |
--grep | 仅显示含指定关键字的提交 |
-S | 仅显示添加或移除了某个关键字的提交 |
3、统计代码量
- //按照时间统计
git log --since="2019-09-05" --pretty=tformat: --numstat |gawk '{ add += $1 ; subs += $2 ; loc += $1 + $2 }
END { printf "added lines: %s removed lines : %s total lines: %s\n",add,subs,loc }'
- 查看git上个人代码量
- git log --author="username" --pretty=tformat: --numstat | awk '{ add += $1; subs += $2; loc += $1 - $2 }
- END { printf "added lines: %s, removed lines: %s, total lines: %s\n", add, subs, loc }' -
- 统计每个人的增删行数
- git log --format='%aN' | sort -u | while read name; do echo -en "$name\t"; git log --author="$name" --pretty=tformat: --numstat | awk '{ add += $1; subs += $2; loc += $1 - $2 } END { printf "added lines: %s, removed lines: %s, total lines: %s\n", add, subs, loc }' -; done
- 查看仓库提交者排名前
- git log --pretty='%aN' | sort | uniq -c | sort -k1 -n -r | head -n
- 贡献者统计:
- git log --pretty='%aN' | sort -u | wc -l
- 提交数统计:
- git log --oneline | wc -l
- 统计代码总行数:
- find . -name "*.m" -or -name "*.h" -or -name "*.xib" -or -name "*.c" |xargs grep -v "^$"|wc -l
- ---------------------------------
- ---------------------------------
- git log 参数说明:
- –author 指定作者
- –stat 显示每次更新的文件修改统计信息,会列出具体文件列表
- –shortstat 统计每个commit 的文件修改行数,包括增加,删除,但不列出文件列表:
- –numstat 统计每个commit 的文件修改行数,包括增加,删除,并列出文件列表:
- -p 选项展开显示每次提交的内容差异,用 - 则仅显示最近的两次更新
- 例如:git log -p -
- –name-only 仅在提交信息后显示已修改的文件清单
- –name-status 显示新增、修改、删除的文件清单
- –abbrev-commit 仅显示 SHA- 的前几个字符,而非所有的 个字符
- –relative-date 使用较短的相对时间显示(比如,“ weeks ago”)
- –graph 显示 ASCII 图形表示的分支合并历史
- –pretty 使用其他格式显示历史提交信息。可用的选项包括 oneline,short,full,fuller 和 format(后跟指定格式)
- 例如: git log –pretty=oneline ; git log –pretty=short ; git log –pretty=full ; git log –pretty=fuller
- –pretty=tformat: 可以定制要显示的记录格式,这样的输出便于后期编程提取分析
- 例如:git log –pretty=format:”“%h - %an, %ar : %s””
- 下面列出了常用的格式占位符写法及其代表的意义。
- 选项 说明
- %H 提交对象(commit)的完整哈希字串
- %h 提交对象的简短哈希字串
- %T 树对象(tree)的完整哈希字串
- %t 树对象的简短哈希字串
- %P 父对象(parent)的完整哈希字串
- %p 父对象的简短哈希字串
- %an 作者(author)的名字
- %ae 作者的电子邮件地址
- %ad 作者修订日期(可以用 -date= 选项定制格式)
- %ar 作者修订日期,按多久以前的方式显示
- %cn 提交者(committer)的名字
- %ce 提交者的电子邮件地址
- %cd 提交日期
- %cr 提交日期,按多久以前的方式显示
- %s 提交说明
- –since 限制显示输出的范围,
- 例如: git log –since=.weeks 显示最近两周的提交
- 选项 说明
- -(n) 仅显示最近的 n 条提交
- –since, –after 仅显示指定时间之后的提交。
- –until, –before 仅显示指定时间之前的提交。
- –author 仅显示指定作者相关的提交。
- –committer 仅显示指定提交者相关的提交。
- 一些例子: git log --until=.minute.ago // 一分钟之前的所有log
- git log --since=.day.ago //一天之内的log
- git log --since=.hour.ago //一个小时之内的log
- git log --since=`.month.ago --until=.weeks.ago //一个月之前到半个月之前的log
- 看看某一个文件的相关历史记录
- 例如:git blame index.html –date short
JGit、SvnKit - 版本提交日志(1)提取的更多相关文章
- SVN跨版本库迁移目录并保留提交日志
现在有一份代码code在版本库reposA/dirB/下,现在想把它移动到reposB/dirAA/下,本来打算交给SA做,没想到SA似乎 也不太懂的样子.于是,自己在VPS搭建了一个svnserve ...
- svn如何根据提交日志信息回退版本
问题场景: 1 记得提交的日志信息中包含openssl,但是不记得这次提交的版本号revesion,是svn初始化后中间的某次提交: 2 svn环境的操作系统平台为Fedora, 即命令行下:而且sv ...
- SVN服务器搭建之提交日志模版构建
SVN服务器搭建之提交日志模版构建 日志提交有两种 一种是自己客户端设置提交日志模版,这个只适用于自己,没办法强制性运用到项目中,只能依照每个人的自觉性来处理. 第二种方法是SVN服务器设置提交日志模 ...
- 多人开发的git项目如何保持提交日志为一条直线?
多人开发的git项目如何保持提交日志为一条直线? 一.Git的项目的git常用操作 a)Git clone 项目地址 从远程仓库克隆项目到本地 b)Git pull 从当前分支拉取更新代码 c)Git ...
- 修改Github上提交日志
bash: git rebase -i HEAD~5:假定你要修改的日志位于当前版本(HEAD)的前4次提交中. vi: pick -> reword:在自动打开的vi编辑器中,上下选择你要修改 ...
- VisualSVN:允许修改svn提交日志(pre-revpro-change hook)
有时候需要对之前版本提交的错误的日志信息进行修改或者进行补充描述: 1.在windows 7( 64位 )下使用TortoiseSVN客户端,选中代码目录,点击右键,选择<显示日志> 在出 ...
- 使用SVN钩子强制提交日志和限制提交文件类型
Subversion本身有很好的扩展性,用户可以通过钩子实现一些自定义的功能.所谓钩子实际上是一种事件机制,当系统执行到某个特殊事件时,会触发我们预定义的动作,这样的特殊事件在Subversion里有 ...
- svn查看指定版本提交信息的命令
通过svn命令查看指定版本提交的文件和日志信息 svn log -r ARG -v ARG :版本 可以是如下之一: NUMBER 版本号 '{' DATE '}' 在指定时间以后的版本 'HEAD' ...
- 海量日志数据提取某日访问百度次数最多的那个IP的Java实现
海量日志数据提取某日访问百度次数最多的那个IP的Java实现 前几天在网上看到july的一篇文章<教你如何迅速秒杀掉:99%的海量数据处理面试题>,里面说到百度的一个面试题目,题目如下: ...
随机推荐
- rsync+inotify实时数据同步单目录实战
rsync+inotify实时数据同步单目录实战 rsync+inotify实时数据同步单目录实战 inotify是一个强大的.细粒度的.异步的文件系统事件监控机制,linux内核从2.6.13起 ...
- default关键字
default关键字在JDK8中有两个用处. 1.在switch语句的时候使用default int gender = 3; String genderString; switch (gender) ...
- time时间库使用示例
time时间库主要有以下几个方法 1. 生成struct_time ,然后就可以很方便的获取到年月日,时分秒等信息 time.localtime() 2. 生成时间戳 time.time() 3. 将 ...
- Linux 系统磁盘空间占满,df 和 du 结果不一致
服务器运行一段时间后df查看磁盘剩余空间不足,通过du统计发现被几个文件占用,遂删除之.过了一段时间磁盘空间再次不足,通过du统计却找不到那么多大文件.搜索后才得知原因:文件删除后空间没有释放,du统 ...
- Spring Boot教程(十九)RESTful API单元测试
下面针对该Controller编写测试用例验证正确性,具体如下.当然也可以通过浏览器插件等进行请求提交验证. @RunWith(SpringJUnit4ClassRunner.class) @Spri ...
- Hive、Spark优化案例
一.Join原则 将条目少的表/子查询放在Join的左边.原因:在Join的reduce阶段,位于Join左边的表的内容会被加载进内存,条目少的表放在左边,可以减少发生内存溢出的几率. 小表关联大表: ...
- springboot 基于@Scheduled注解 实现定时任务
前言 使用SpringBoot创建定时任务非常简单,目前主要有以下三种创建方式: 一.基于注解(@Scheduled) 二.基于接口(SchedulingConfigurer) 前者相信大家都很熟悉, ...
- collection集合整体结构图
- gitblit 数据迁移(复制)
gitblit 数据迁移 完全拷贝方式: 将原服务器上的gitblit的安装目录.数据目录等相关目录拷到另一台服务器上即可,这样启动方式和使用端口及数据和原服务上的一模一样.(因为gitblit是不用 ...
- 【Spark机器学习速成宝典】基础篇02RDD常见的操作(Python版)
目录 引例入门:textFile.collect.filter.first.persist.count 创建RDD的方式:parallelize.textFile 转化操作:map.filter.fl ...