3 Star 0 Fork 0

曾杨龙/实习

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
music_analysis.py 1.01 KB
一键复制 编辑 原始数据 按行查看 历史
zyl 提交于 2023-09-16 21:28 . zyl-爬取网易云热评
# 1、分析热评最多的ID都有那些特征
'''
hist: 直方图
'''
import matplotlib.pyplot as plt
import pandas as pd
#中文乱码
plt.rcParams["font.sans-serif"] = ["SimHei"]
df = pd.read_csv('hot_Comments_Clear.csv')
# 按用户id分组
df2 = df.groupby('userid').count().sort_values(by = 'content',ascending = False)
print(df2.head(10))
# 热评最多的Id 是 1313672474
df3 = df[df['userid']==2084635322]
print(df3)
'''
bins: 条形数
density: bool 密度显示
'''
df4 = df3['likecount']
plt.hist(df4, bins = 200, density = True )
plt.xlim((0,60000))
plt.title('2084635322用户的点赞分布')
plt.savefig('start_2084635322.png',dpi = 100)
plt.show()
'''
看评论的长度分布
len(df3['content']) --- out: 133
显示的是这个series的长度
'''
print(len(df3['content']))
df4 = df3['content'].map(len) # map函数进行求取每一单元格个长度
plt.hist(df4,bins = 20, density = True)
plt.title('2084635322用户的评论长度分布')
plt.savefig('len_2084635322.png', dpi = 100)
plt.show()
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Java
1
https://gitee.com/zyl512/practice.git
[email protected]:zyl512/practice.git
zyl512
practice
实习
master

搜索帮助