git 提交文件中的部分修改
VitPose 论文阅读
1. 概述
VitPose是最近出来的一篇用Transformer结构做人体2D关键点估计的论文,采用比较简单的Transformer结构就能在MS COCO 测试集上取得比较好的结果,挺吸引人的。论文不长,这周末读了一遍,感觉值得借鉴的地方挺多,这里我用自己的语言描述论文的细节,同时把自己的一些疑惑和思考写下来,欢迎讨论交流。
论文标题: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
论文地址:https://arxiv.org/abs/2204.12484
代码地址:https://github.com/ViTAE-Transformer/ViTPose
注:本文中框图和表格均来自原论文。
提高你的信息获取信噪比:RSS in 2022
Python 字符串的format用法
更新 (2023-09-29)
利用f-string可以简化当前日期str的构造,不需要使用strftime
等函数了:
1 | from datetime import datetime |
输出入下:
1 | 23-09-29-09:50:07 |
1. 引入
我有一个朋友,某天突然问我:你知道下面的Python语句什么含义,结果是多少吗?
1 | '{:😄^+#20_x}'.format(12345) |
我一看,十脸懵逼,吓得赶紧学了学Python的Format字符串的用法,总算明白了这个语句的含义。你想了解这个语句到底是什么鬼吗,欢迎跟我一起学。
python importlib用法小结
在使用Python的时候,大部分时候引入包,都是通过import
语句,比如import numpy as np
。有时候为了更复杂的需求,我们需要用程序化的方式来引入包 (Programmatic Importing), 比如根据输入不同,选择执行两个不同包里面的同名函数,这时候就需要用到importlib
这个库了。这里先从一个简单例子开始,逐渐深入地讲一下这个库的用法。
python的列表推导式和生成器表达式对比
全世界最准确的翻译DeepL到底有多强? 一个有意思的例子
- Deep Learning
- Translator
在知乎上偶然看到了一个基于深度学习的翻译器DeepL,实际体验了一下,确实发现比Google Translate, 百度翻译等工具好用,因此最近抛弃了之前的翻译工具,开始往DeepL切换,毕竟在阅读英文内容的过程中还是有很多单词和词组的意思不了解。最近在阅读DeepMind的一篇文章的时候,看到一段有意思的话,对比了一下,发现DeepL真的比竞品厉害,更加加速了我抛弃之前工具的速度。具体什么例子呢,如下细说。
Pytorch Apple Silicon GPU 训练与测评
今天中午看到Pytorch的官方博客发了Apple M1 芯片 GPU加速的文章,这是我期待了很久的功能,因此很兴奋,立马进行测试,结论是在MNIST上,速度与P100差不多,相比CPU提速1.7倍。当然这只是一个最简单的例子,不能反映大部分情况。这里详细记录操作的一步步流程,如果你也感兴趣,不妨自己上手一试。
C++的RAII到底指的是什么
RAII,全称 Resource Acquisition Is Initialization,中文翻译为资源获取即初始化。这是C++中一个比较不直观的术语,而RAII的缩写也时不时遇到,总给人一种很高深但不易掌握的感觉。实际上查了资料后发现,RAII这个技术的含义其实比较明确,这里简单汇总一下从资料中的得到的知识点。