========================================
原创文章,欢迎转载,转载请注明出处。
如有任何疑问,欢迎留言交流探讨。
========================================
统计 python 列表中每种相同元素出现的次数
一、所需材料
二、操所过程
1. 创建一个常规多维数据列表,这里用
泰迪杯
数据挖掘挑战赛的数据举例:
>>> x=[10001, ['奔跑吧', '极限挑战 第三季', '摔跤吧!爸爸', '摔跤吧!爸爸', '超时空男臣', '超时空男臣', '超时空男臣', '超时空男臣', '超时空男臣', '超时空男臣'], ['无', '无', '尼特什·提瓦瑞', '尼特什·提瓦瑞', '罗永贤', '罗永贤', '罗永贤', '罗永贤', '罗永贤', '罗永贤'], ['无', '无', '阿米尔·汗,法缇玛·萨那·纱卡,桑亚·玛荷塔,阿帕尔夏克提·库拉那', '阿米尔·汗,法缇玛·萨那·纱卡,桑亚·玛荷塔,阿帕尔夏克提·库拉那', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛'], ['综艺娱乐', '综艺娱乐', '家庭影院', '家庭影院', '电视剧场', '电视剧场', '电视剧场', '电视剧场', '电视剧场', '电视剧场'], ['无', '无', '其他', '其他', '港台剧场', '港台剧场', '港台剧场', '港台剧场', '港台剧场', '港台剧场'], ['晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上']]
>>> x[0]
10001
>>> x[1]
['奔跑吧', '极限挑战 第三季', '摔跤吧!爸爸', '摔跤吧!爸爸', '超时空男臣', '超时空男臣', '超时空男臣', '超时空男臣', '超时空男臣', '超时空男臣']
>>> x[2]
['无', '无', '尼特什·提瓦瑞', '尼特什·提瓦瑞', '罗永贤', '罗永贤', '罗永贤', '罗永贤', '罗永贤', '罗永贤']
>>> x[3]
['无', '无', '阿米尔·汗,法缇玛·萨那·纱卡,桑亚·玛荷塔,阿帕尔夏克提·库拉那', '阿米尔·汗,法缇玛·萨那·纱卡,桑亚·玛荷塔,阿帕尔夏克提·库拉那', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛', '萧正楠,曹永廉,林夏薇,田蕊妮,何广沛']
>>> x[4]
['综艺娱乐', '综艺娱乐', '家庭影院', '家庭影院', '电视剧场', '电视剧场', '电视剧场', '电视剧场', '电视剧场', '电视剧场']
>>> x[5]
['无', '无', '其他', '其他', '港台剧场', '港台剧场', '港台剧场', '港台剧场', '港台剧场', '港台剧场']
>>> x[6]
['晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上', '晚上']
2. 使用标准库中的“Collections”:
import collections
dic = collections.Counter(x[3]) # 列表必须是 hashable type
for key in dic:
print(key,dic[key]) # key是元素,dic[key]是元素出现的次数
3. 结果
>>> dic = collections.Counter(x[3])
>>> for key in dic:
print(key,dic[key])
无 2
阿米尔·汗,法缇玛·萨那·纱卡,桑亚·玛荷塔,阿帕尔夏克提·库拉那 2
萧正楠,曹永廉,林夏薇,田蕊妮,何广沛 6