说明:在工作中,会经常遇到需要标记数据第几次出现的情况,
之前我用Excel时 公式是这样写的【=count($b$1:b1,b1)】然后下拉,但是数据量超过20万,就要等10分钟以上。
于是我用python的for循环测试20万数据,每想到还是很慢,要5分钟左右。
但是我不甘心,我利用当时在表格中的技巧,自在python中,没想到1秒就完成了,我又测试了一下2000万数据,没错,是两千万,15秒完成,真是太高兴了
标记后的数据是这样的
{A:1,A:2,B:1,A:3,B:2}按每个字符第几次出现标
<qq_18101687> 在 上传 | 大小:14336