0%

概述

有时候我们在git commit后才发现,之前的一些提交有些问题,比如有些代码忘提交了或者有一些typo需要修改。如果要修改的地方是需要添加到最后一次提交上的,那么可以参考我的这篇博文修改,如果是在非最后一次提交上的,那么就需要用git rebase来操作。这里简单记录一下操作的过程。

TL;DR
操作命令简要来说是这样:

1
2
3
4
5
6
7
8
9
10
11
12
# 使用git log 查看历史提交,得到需要修改的那次提交的commit id
git log
# 执行rebase命令,注意<commit-id>后面有一个^,表示修改在此次提交前
git rebase -i '<commmit-hash>^' # 如果是修改第一次提交,使用 git rebase -i --root
# 修改代码
vim changed-file
# git add 添加更新后的文件
git add changed-file
# git commit 提交,注意需要使用后面三个选项,并且不需要加commit信息,因为会采用之前的commit信息
git commit --all --amend --no-edit
# 使用--continue来完成 git rebase
git rebase --continue

后面会使用一个具体的(假)例子来演示这个过程。

阅读全文 »

1. 概述

在我们使用Python中的dict时,常常需要判断某个关键字是否已经在dict中,如果不存在则创建,非空则进行另外的操作。例如统计一篇文章中所有单词出现次数的代码,大致写法如下:

1
2
3
4
5
6
7
words_num = {}

for word in words:
if word not in words_num.keys():
words_num[word] = 1
else:
words_num[word] += 1

这样写总是需要判断key是否在dict中,不是很优雅。

Python标准库collections中defaultdict类可以很好的解决这个问题。这个类使用与dict几乎一样,除了可以在初始化时设置key的默认类型和数值。类的声明格式为defaultdict(default_factory=None, /[, ...])default_factory是一个callable的变量。

别的使用与dict无异,正常使用即可。

阅读全文 »

有时候,在git commit后,我们会发现一些文件忘了提交了,或者需要修改,而且这些提交和修改是与上一次commit的主题一致的,这时候再执行一遍相同的git commit就会让提交记录显得比较冗余,有没有办法将修改后的文件加到最后一次的提交记录里面呢?搜索后发现这里给了一个解决办法,git add文件后调用git commit --amend -no-edit即可:

1
2
git add <file_path>
git commit --amend --no-edit

注意:如果之前的代码已经提交的话,需要执行git push --force来推送代码以替代之前的提交记录。

在Linux和Mac下,执行du -sh 来统计目录大小时,默认不统计以点开头的文件或者目录,比如.local,因此得到不准确的统计结果。从这里知道,要统计隐藏文件和目录,可以这么用:

1
2
3
4
5
# 只统计隐藏文件或者目录
du -sh .[^.]*

# 统计隐藏文件或者目录和常规文件
du -sh .[^.]* *

结合 sort -h,可以快速得到比较大的目录:

1
du -sh .[^.]* * |sort -h

1. 概述

今年我和团队成员一起组织了了ECCV上的一个学术比赛。从1.31日开始准备材料开始,到前两天(10.28日) 把奖金和奖状发给选手,活动结束,整个周期持续了近9个月,真的是出乎意料。整体流程包括Workshop Proposal编写和申请、Workshop合并(多个申请团队合并成一个Workshop),网站搭建,比赛数据和baseline准备,比赛平台搭建,比赛奖金申请,比赛宣传和选手招募、比赛论文评审、参加线上Workshop介绍比赛,奖金和证书颁发等等,第一次参与组织这种比赛,学到了挺多东西,这里记录备忘,下次参考。需要说明的是,这里的分享的都是个人观点,与我所在公司无关。

阅读全文 »

问题定义

假如有张1000x1000的图像,我们要将它切成20x20的小patch,该怎么处理呢?
最简单的方法就是采用两重for循环,每次计算小patch对应的下标,在原图上进行crop:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import numpy as np

size = 1000
ncols = 20
nrows = 20
img = np.random.rand(size, size)

patches = []

for i in range(size//ncols):
for j in range(size//nrows):
patch = img[ncols*i:ncols*(i+1), nrows*j:nrows*(j+1)]
patches.append(patch)

patches = np.array(patches)

但这样总共需要循环50*x50=2500次,而我们知道 Python 的 for 循环比较慢,因此整体开销还是比较大的,有没有更快的方式呢?

阅读全文 »

1. 概述

最近看技术论坛,发现提到 fly.io 的次数越来越多了。 fly.io 是一个容器化的部署平台,只需要一个Dockerfile文件就能部署代码到fly.io 的服务器上,同时还自动生成域名。其他的好处多多,我根据自己体验,我总结成了下面的这些条:

  • 有免费使用的额度。不填写信用卡信息可以创建一个App,完全不收费;填写信用卡信息后每月有一定额度的免费流量,超过额度会额外收费。所以想做个小demo完全可以不填信用卡试用。 目前已经不支持无信用卡使用了,参见这里的讨论

  • 自动生成域名。比如你创建一个名字叫my_demo的App,那么部署完成后,就会生成my_demo.fly.dev的域名,可以全球访问,不用自己单独买域名了。

  • 可以 SSH 连接进入服务器。部署完成后,可以通过flyctl ssh console 命令登录部署的服务器,所以相当于你有了一台免费的VPS,可以做你想做的任何事情。

  • 部署简单,采用flyctl 命令集合统一部署;支持各种语言的各种框架来搭建部署环境,能自动识别当前目录下代码所采用的是哪个框架,自动部署。

下面简单记录一下使用的流程和一些教程里面没提及的使用命令。

阅读全文 »

1. 概述

ctypes 是Python标准库中提供的外部函数库,可以用来在Python中调用动态链接库或者共享库中的函数,比如将使用大量循环的代码写在C语言中来进行提速,因为Python代码循环实在是太慢了。大致流程是通过 ctypes 来调用C函数,先将Python类型的对象转换为C的类型,在C函数中做完计算,返回结果到Python中。这个过程相对是比较容易的。

现在有个更复杂的情况,我想要在C代码中调用Python中的某些函数来完成C代码的计算,比如在C代码的sort函数中,采用Python中定义的函数来进行大小判断。这个在Python中定义的函数在 ctypes 中称为回调函数 (callback function)。也就是说需要把Python函数当作变量传给C语言,想想还是有些难度。 但调查以后发现 ctypes 提供了 CFUNCTYPE来方便地进行回调函数定义,而C语言本身也是支持函数指针的,因此这个功能实现还算简单,具体展开如下。

阅读全文 »